Важность данного атрибута сложно переоценить. Благодаря использованию канонических ссылок стало возможным избежать появления страниц-дублей в индексе поисковых систем и улучшить ранжирование приоритетных страниц.

Поддержка тега <link> rel=canonical позволила существовать дублированному контенту на разных URL сайта (или даже на других доменах) без вреда для ранжирования основной предпочитаемой страницы.

В этой статье мы разберем все тонкости, связанные с использованием канонических ссылок и поймем почему rel=canonical занял столь важное место в чек-листе правильной внутренней оптимизации сайта.

Содержание:

 

Что такое HTML тег rel canonical

rel_canonical

12 февраля 2009 года компания Google официально анонсировала поддержку формата канонических страниц, предоставив тем самым мощный инструмент влияния на процесс индексирования сайта поисковыми системами.

Атрибут тега <link> rel="canonical" предназначен для указания канонической страницы, то есть страницы-первоисточника. Если на вашем сайте идентичный либо очень похожий контент доступен по разным URL адресам, то данный формат поможет указать предпочитаемую страницу для поисковых систем.

Проще говоря, вы помогаете поисковой системе понять какую из одинаковых страниц нужно ранжировать, а какую считать дополнительной. При этом все характеристики дополнительных (неканонических) страниц, например, поведение пользователей и ссылочный вес, передаются предпочитаемой (канонической) странице.


Что такое каноническая страница

Каноническая страница — это страница-оригинал или первоисточник. Канонической может являться практически любая страница сайта, если она доступна для индексирования роботами поисковых систем.

Преимущества для SEO от использования canonical URL

canonical_url

Поисковые системы крайне негативно относятся к дублированному контенту, будь то копирование информации с другого сайта или дубликаты страниц в рамках одного домена. Устранение проблемы дублей является ключевым аспектом грамотной внутренней оптимизации сайта.

Во многих случаях на помощь приходит 301 редирект, но что делать если необходимо оставить страницу-дубль доступной для посетителей сайта? Или использование редиректа недоступно в силу особенностей движка? Именно для таких случаев и был разработан формат канонических ссылок. По большому счету, установка rel=canonical обладает теми же свойствами, что и 301 редирект, но без фактического перенаправления пользователей.


Как настроить rel canonical

Существует несколько способов указания канонической страницы. Наиболее распространенный - это указание ссылки на первоисточник в блоке <head> текущей страницы.
Итак, страница с адресом http://example.com/no-canonical-link.html является копией страницы

http://example.com/canonical-link.html, следовательно канонический тег должен указывать на последнюю как на первоисточник.

В коде страницы http://example.com/no-canonical-link.html в блоке <head> должен содержаться следующий код:

Да, вот так просто. Всего одна строчка со ссылкой на оригинальную страницу может не просто уберечь ваш сайт от санкций за неуникальный контент, но и существенно улучшить рейтинг страницы-первоисточника.


Каноническая ссылка в заголовке HTTP

Google также поддерживает rel=canonical в HTTP заголовке страницы. Данный способ чаще всего используется для документов не HTML формата, например для файлов формата pdf. Таким образом, для альтернативного файла сервер должен отдавать в заголовке ссылку на файл-оригинал (канонический файл):

При использовании CDN сетей, когда содержимое сайта распределено на разных доменах, также возможно указывать канонический URL для таких файлов в заголовке сервера.


Как определить каноническую страницу

Допустим, на вашем сайте существует две страницы с одинаковым контентом, доступные для индексирования роботами поисковых систем. Все просто в случае, когда одна из них является производной от другой. Например, страница сортировки будет производной от страницы категории товаров:
http://example.com/dresses.html - каноническая страница
http://example.com/dresses&sort=15limit.html - неканоническая страница

Сложности при выборе канонической страницы возникают, когда в силу особенностей CMS системы сайта, несколько URL выглядят равнозначными.
В таком случае можно руководствоваться следующими факторами:
- количество внутренних ссылок на страницу
- количество внешних ссылок на страницу
- посещаемость страницы
В идеале, канонической должна стать более посещаемая страница с наибольшим количеством внутренних и внешних ссылок по сравнению с другими страницами-дублями.


Когда следует использовать канонические ссылки

В целом, канонические ссылки стоит использовать, когда есть необходимость оставить возможность для пользователей посещать страницы-дубли и вы четко понимаете природу их возникновения.

rel=canonical для страниц сортировки

Если товары в вашем интернет-магазине или каталоге можно сортировать по различным параметрам, то существует вероятность отображения этих параметров в URL страницы и возникновения дубля наподобие

http://example.com/dresses.html?sort=price

Необходимо со всех возможных вариантов сортировки проставить каноническую ссылку на основную категорию с сортировкой по умолчанию, адрес которой используется в меню сайта:


rel=canonical для страниц пагинации

Существуют разные подходы к работе со страницами пагинации. Google рекомендует использовать каноническую ссылку на страницу, где представлены все товары. То есть для каждого раздела необходимо создать страницу, на которой будут выведены абсолютно все товары, входящие в эту категорию.

Однако, на практике мы видим, что такой подход не всегда оправдан с точки зрения времени загрузки такой страницы и поведения пользователей. Реализовать такой функционал также не всегда представляется возможным.

Если вариант со страницей, где собраны все товары категории не подходит, то стоит использовать канонический URL в сочетании с тегами prev и next. При этом rel=canonical будет указывать сам на себя, что позволит обеспечить нормальное индексирование товаров на страницах пагинации.

Например, в коде страницы http://example.com/dresses.html?page=3 мы увидим канонический URL, указывающий на нее же:


rel=canonical для страницы печати и реферальных ссылок

В случае реализации страницы печати через дополнительный параметр, например:

http://example.com/blog/article.html?print=yes

стоит также использовать ссылку на каноническую страницу:

Подобная ситуация возникает и при использовании реферальных ссылок, например:

http://example.com/myblog.html?partner=12313

Для таких страниц необходимо проставить каноническую ссылку на оригинальную страницу:

В случае пренебрежения данным правилом, вы рискуете получить массу страниц-дублей в индексе поисковых систем (пропорционально количеству рефералов)


301 редирект или rel=canonical

301_redirect_or_canonical

Если нет факторов, мешающих внедрить 301 редирект, то используйте этот вариант. Помните, что указание канонической ссылки является рекомендательным для поисковых систем. Нередко в выдаче Google можно встретить ранжирующиеся неканонические страницы, при этом в коде страницы будет указана ссылка на первоисточник.

Алгоритм поисковика строится не только на поиске канонической ссылки в коде страницы, но и на массе других факторов — наличии внешних и внутренних ссылок, релевантности для пользователя и т.д. Поэтому у Google может быть другое мнение на счет того, какую же из страниц-дублей необходимо считать оригинальной.

Если же необходимо оставить страницы доступными для пользователей либо существуют технические сложности в реализации 301 редиректа на сайте — используйте rel=canonical


Канонический URL, указывающий на эту же страницу

self_canonical

Данная тема по сей день является предметом для споров seo-оптимизаторов. Дело в том, что большинство CMS без проблем позволяют добавлять параметры в URL адрес без изменения самого контента страницы. Поэтому мы в Q-SEO придерживаемся мнения, что добавление rel=canonical на всех страницах сайта со ссылкой на самих себя же, не только не повредит вашему сайту, а и обезопасит от потенциальных дублей.


rel=canonical на другой домен

15 декабря 2009 года Google заявил о поддержке канонических ссылок, указывающих на другой домен. В публикациях многих блогеров вы до сих пор можете встретить информацию о том, что указывать канонический URL на другой домен запрещено. Первоначально Google действительно занимал такую позицию, но через некоторое время добавил поддержку кросс-доменных канонических ссылок.

Данный метод позволяет вам публиковать интересный контент для своих пользователей, указывая при этом каноническую ссылку на первоисточник. В таком случае выигрывают оба сайта. Первый не рискует быть пессимизированным поисковыми системами за неуникальный контент и предоставляет своей аудитории интересный контент. Второй же получает прирост ссылочной массы и других характеристик от неканонической страницы на другом домене.

Основные ошибки использования rel=canonical

Канонические URL поддерживают большинство популярных поисковых систем: Google, Яндекс, Yahoo, Bing. Но вы все равно продолжаете видеть в индексе неканонические страницы вашего сайта? Первое что нужно сделать — проверить не была ли допущена ошибка при настройке rel=canonical. Ниже перечень наиболее распространенных ошибок:


Не индексируемая каноническая страница

Проверьте может ли робот поисковой системы проиндексировать страницу, на которую вы ссылаетесь как на каноническую. Удостоверьтесь, что:
- страница отдает ответ сервера 200
- на странице не установлен мета-тег robots со значением noindex
- страница не закрыта от индексирования в файле robots.txt


Разные канонические URL для одной страницы

Довольно часто устанавливаемые на сайт модули добавляют в код канонические ссылки. Это может привести в появлению нескольких rel=canonical на странице. Если ссылки в тегах указаны на разные URL, то, вероятнее всего, Google и другие поисковики просто проигнорируют ваши рекомендации.
Таким образом, все усилия по установке канонических страниц могут быть сведены на нет. Почаще проверяйте исходный код ваших страниц, чтобы убедиться в наличии только одной канонической ссылки.


Распространенной ошибкой является указание канонической ссылки без протокола http:// или https://, как показано на примере ниже:

Допустимо указывать относительные ссылки:

либо полный абсолютный путь с протоколом:

Для корректного восприятия поисковыми системами, особенно это касается Google, тег rel=canonical должен находиться в рамках области head кода вашей страницы. Кроме того, данный тег стоит размещать настолько близко к началу HTML кода, насколько это возможно.

Канонические ссылки со страниц пагинации на первую страницу

Такое решение вполне дееспособно для борьбы с дублями. Однако, может негативно повлиять на индексацию страниц, ссылки на которые как раз и расположены на страницах пагинации. Например на странице http://example.com/dresses.html?page=3 расположены ссылки на 20 товаров — они не будут проиндексированы поисковым роботом непосредственно по ссылкам с этой страницы.

Тег canonical при использовании hreflang

Если вы внедряете hreflang на своем проекте, то обязательно убедитесь, что все канонические ссылки указывают на страницы этой же языковой версии. Несоответствие этому правилу может привести как к проблемам с ранжированием языковых версий, так и к неправильному пониманию поисковиками приоритетных для ранжирования дублирующихся страниц.

Неканонические ссылки в sitemap.xml

Файл sitemap.xml помогает поисковому роботу понять какие страницы вашего сайта нужно индексировать и ранжировать в поисковой выдаче. Именно поэтому не стоит добавлять в карту сайта закрытые любым способом от индексирования либо неканонические страницы.

Использование rel=canonical для неидентичных страниц

Данный атрибут был разработан специально для указания приоритетной страницы среди страниц-дублей. Судя по всему, поисковики допускают определенную степень расхождения в контенте страницы. Но это абсолютно не значит, что можно ставить каноническую ссылку на просто схожую по тематике страницу.
Если Google заметит вас в неправильном использовании канонических ссылок, это может повлиять на его отношение к rel=canonical для всего вашего домена и тогда пострадают даже верно настроенные страницы.

list_canonical_url

Тег rel=canonical и социальные сети

Facebook и Twitter прекрасно понимают канонические ссылки. Когда пользователь делится неканонической статьей, то социальная сеть подтягивает данные именно по канонической ссылке, если иное не предусмотрено особенностями неканонической страницы.
Кроме того, счетчики лайков также будут подтягивать значение именно с канонической страницы.

Как проверить использование канонических ссылок на сайте

После завершения работ по настройке канонических страниц на сайте рекомендуем воспользоваться программой Screaming Frog SEO Spider.
На вкладке Directives вы найдете исчерпывающую информацию о том, на каких страницах установлен канонический тег и куда он ведет.

sepfog directives
Для постраничной проверки удобно пользоваться расширением для браузера от rds bar.
По клику на кнопку SEO кроме прочего появится и информация касательно канонической ссылки, если тег присутствует в коде страницы.

Заключение

Использование rel=canonical без сомнения стало must have в работе каждого seo-оптимизатора. Но как любой другой мощный инструмент требует умелого с ним обращения, так и данный атрибут подразумевает тщательное продумывание всех аспектов внедрения на сайт.
Надеемся, что в данной статье мы разъяснили все технические аспекты использования столь нужного для успешного seo инструмента.
Всем успешных проектов и не забывайте поделиться статьей с друзьями и коллегами, если она была полезна для вас!

+ Бонус

Канонические URL для Opencart

Многие модули для Opencart не учитывают того, что во время своей работы генерируют доступные для поисковых систем дубли страниц. Например, вы решили вывести на главную страницу блог с товарами «Хит продаж». Вполне вероятно, что при клике с главной страницы товар будет доступен по ссылке http://example.com/tovar.html, а при переходе из каталога будет доступен по ссылке, включающей название категории в URL, например http://example.com/category/tovar.html.

Наиболее распространенные проблемы, решаемые с помощью указания канонических страниц:
- доступность товара по нескольким URL адресам, например:

http://example.com/tovar.html
http://example.com/category/tovar.html
http://example.com/category/subcategory/tovar.html
http://example.com/novinki/tovar.html

Каноническим должен быть тот URL, который относится к основной категории товара.
Конечно, более правильным решением будет 301 редирект и фактическая замена ссылок на сайте. Если такой вариант недоступен, можно использовать канонические ссылки.

- доступность категорий по нескольким URL адресам, например:
http://example.com/category/subcategory/
http://example.com/category/subcategory/?min_price=170&max_price=990

Решить данную задачу можно модификацией файла header.tpl

В блоке head необходимо разместить данный код, который позволит для всех страниц, содержащих параметр ?min_price, указать каноническую ссылку на основную страницу самой категории:


Канонические URL для Битрикс

Для CMS системы Битрикс также актуальны дубли товаров, размещенных в разных категориях. Решается данная проблема с помощью канонической ссылки, добавленной в блок. Реализовать можно следующим способом: В свойствах инфоблока создаем свойство "Канонический URL", код свойства – CANONICAL, тип — строка. В шаблоне элемента каталога добавляем:

В header.php шаблона в области HEAD добавляем:

Естественно, вместо www.example.com нужно вставить название вашего сайта.
В результате, если в админпанели сайта в поле свойства указать адрес канонической ссылки, то сформированная ссылка выведется в блок head неканонической страницы.
Начиная с версии 15.5.0 весь процесс установки канонических адресов можно пройти в админпанели. Подробнее здесь.

Комментарии

Комментарии