canonical борется с дублированным содержанием

14.02.2009

Недавно Google, Yahoo и Microsoft объявили о введении нового тега для своих поисковых роботов.  Тег <canonical> призван определить какой из нескольких url адресов с одинаковым содержанием будет появляться в поисковом индексе Google. Помимо Google данный тег воспринимают также поисковики Yahoo и  Microsoft.
Ни для кого не секрет, что адрес одной и той же страницы может выглядеть по-разному. Особенно это касается динамических сайтов построенных на php, perl и т.д.
Например страницы могут иметь версию для печати или содержать идентификатор сессии или дополнительные параметры, но при этом иметь одно содержание. Чтобы избежать появления подобных страниц в результатах поиска и свести к минимуму возможные санкции за дублированный контент, Google рекомендует применять тег <canonical> в коде заголовка таких страниц.
Код выглядит следующим образом:

<link rel="canonical" href="http://www.example.com/somepost"/>

Код размещается между тегами

<head></head>

соответствующей страницы.
Стоит отметить, что применение данной конструкции особенно актуально для сайтов с наличием печатных версий документов, а так же онлайн магазинов с большим количеством товаров и возможностью поиска по разным параметрам.
Не смотря на недавно появившуюся возможность применения <canonical> уже появились плагины для wordpress и drupal автоматизирующие данную процедуру.

В Twitter!

{ 11 комментариев… читайте их ниже или добавьте свой }

seobag 15.02.09 в 12:20 Я на Delicious | Twitter

для примера:
адреса вида
http://seobag.ru/canonical/
http://seobag.ru/canonical/#comments
имеют одинаковое содержание, но после прописывания директивы «canonical» в индексе google будет только страница http://seobag.ru/canonical/
Пример использования можно посмотреть на этом блоге.

Wouche 15.02.09 в 17:24

Огромное человеческое спасибо!

donchenko (Dmitriy Donchenko) 19.02.09 в 15:32

А подробнее на русском про canonical еще написано здесь http://is.gd/k6Xf я хотел и сам написать, да писать особо нечего.

seobag 23.02.09 в 11:52 Я на Delicious | Twitter

Wordpress сообщество активно начало использовать данный тег:
на днях появился еще один плагин решающий проблему дублированного контента при помощи тега «canonical» – «SEO No Duplicate»
его основное отличие от ранее упомянутого wp-canonical в том, что он обладает большей гибкостью, за счет возможности использования в записях произвольного поля «canonical» позволяющего указать произвольный канонический url. http://wordpress.org/extend/plugins/seo-no-duplicate/screenshots/

usa 24.07.09 в 15:32

А как на счет robots.txt и запрета через него всех страниц типа «print» ?
Яндекс-то может и не понимать такого тега, а вот за дублированный контент по голове не погладит….

seobag 24.07.09 в 16:47 Я на Delicious | Twitter

Если почитать внимательней, то в статье написано, что данный тег поддерживают поисковики Google, Yahoo и Microsoft (Bing).

Yandex, на сколько я знаю, пока не поддерживает его.

Заводской раб 14.09.09 в 08:58

А как сделать так чтобы вордперсс сам проставлял этот тег где надо?

seobag 14.09.09 в 17:38 Я на Delicious | Twitter

в конце статьи есть ссылка на плагин для wordpress.

Дмитрий 15.09.09 в 04:07

не нашёл ссылку. Не открывается. нужен плагин как его скачать?

seobag 15.09.09 в 16:18 Я на Delicious | Twitter

плагины для wordpress, автоматически вставляющие тэг rel="canonical" в заголовки страниц:
Canonical URL’s
SEO No Duplicate

устанавливаются стандартным способом

ZavRab 26.10.09 в 09:29

Да увидел ссылку на плагин, он на блоге еста
спасибо за информацию

Оставьте Комментарий

Вы можете использовать эти HTML тэги и атрибуты: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong> <pre lang="" line="" escaped="">