Важность данного атрибута сложно переоценить. Благодаря использованию канонических ссылок стало возможным избежать появления страниц-дублей в индексе поисковых систем и улучшить ранжирование приоритетных страниц.
Поддержка тега <link> rel=canonical позволила существовать дублированному контенту на разных URL сайта (или даже на других доменах) без вреда для ранжирования основной предпочитаемой страницы.
В этой статье мы разберем все тонкости, связанные с использованием канонических ссылок и поймем почему rel=canonical занял столь важное место в чек-листе правильной внутренней оптимизации сайта.
Содержание:
Что такое HTML тег rel canonical
Преимущества для SEO от использования canonical URL
Как настроить rel canonical
Когда следует использовать канонические ссылки
Основные ошибки использования rel=canonical
- не индексируемая каноническая страница
- разные канонические URL для одной страницы
- неправильное использование абсолютных ссылок
- использование тега вне блока <head>
- канонические ссылки со страниц пагинации на первую страницу
- тег canonical при использовании hreflang
- неканонические ссылки в sitemap.xml
- использование rel=canonical для неидентичных страниц
Тег rel=canonical и социальные сети
Как проверить использование канонических ссылок на сайте
Заключение
- + Бонус
Канонические URL для Opencart
Канонические URL для Битрикс
Что такое HTML тег rel canonical
12 февраля 2009 года компания Google официально анонсировала поддержку формата канонических страниц, предоставив тем самым мощный инструмент влияния на процесс индексирования сайта поисковыми системами.
Атрибут тега <link> rel="canonical" предназначен для указания канонической страницы, то есть страницы-первоисточника. Если на вашем сайте идентичный либо очень похожий контент доступен по разным URL адресам, то данный формат поможет указать предпочитаемую страницу для поисковых систем.
Проще говоря, вы помогаете поисковой системе понять какую из одинаковых страниц нужно ранжировать, а какую считать дополнительной. При этом все характеристики дополнительных (неканонических) страниц, например, поведение пользователей и ссылочный вес, передаются предпочитаемой (канонической) странице.
Что такое каноническая страница
Каноническая страница — это страница-оригинал или первоисточник. Канонической может являться практически любая страница сайта, если она доступна для индексирования роботами поисковых систем.
Преимущества для SEO от использования canonical URL
Поисковые системы крайне негативно относятся к дублированному контенту, будь то копирование информации с другого сайта или дубликаты страниц в рамках одного домена. Устранение проблемы дублей является ключевым аспектом грамотной внутренней оптимизации сайта.
Во многих случаях на помощь приходит 301 редирект, но что делать если необходимо оставить страницу-дубль доступной для посетителей сайта? Или использование редиректа недоступно в силу особенностей движка? Именно для таких случаев и был разработан формат канонических ссылок. По большому счету, установка rel=canonical обладает теми же свойствами, что и 301 редирект, но без фактического перенаправления пользователей.
Как настроить rel canonical
Существует несколько способов указания канонической страницы. Наиболее распространенный - это указание ссылки на первоисточник в блоке <head> текущей страницы.
Итак, страница с адресом http://example.com/no-canonical-link.html является копией страницы
http://example.com/canonical-link.html, следовательно канонический тег должен указывать на последнюю как на первоисточник.
В коде страницы http://example.com/no-canonical-link.html в блоке <head> должен содержаться следующий код:
1 |
<link rel="canonical" href="http://example.com/canonical-link.html"/> |
Да, вот так просто. Всего одна строчка со ссылкой на оригинальную страницу может не просто уберечь ваш сайт от санкций за неуникальный контент, но и существенно улучшить рейтинг страницы-первоисточника.
Каноническая ссылка в заголовке HTTP
Google также поддерживает rel=canonical в HTTP заголовке страницы. Данный способ чаще всего используется для документов не HTML формата, например для файлов формата pdf. Таким образом, для альтернативного файла сервер должен отдавать в заголовке ссылку на файл-оригинал (канонический файл):
1 |
Link: <http://example.com/original-file.pdf>; rel="canonical" |
При использовании CDN сетей, когда содержимое сайта распределено на разных доменах, также возможно указывать канонический URL для таких файлов в заголовке сервера.
Как определить каноническую страницу
Допустим, на вашем сайте существует две страницы с одинаковым контентом, доступные для индексирования роботами поисковых систем. Все просто в случае, когда одна из них является производной от другой. Например, страница сортировки будет производной от страницы категории товаров:
http://example.com/dresses.html - каноническая страница
http://example.com/dresses&sort=15limit.html - неканоническая страница
Сложности при выборе канонической страницы возникают, когда в силу особенностей CMS системы сайта, несколько URL выглядят равнозначными.
В таком случае можно руководствоваться следующими факторами:
- количество внутренних ссылок на страницу
- количество внешних ссылок на страницу
- посещаемость страницы
В идеале, канонической должна стать более посещаемая страница с наибольшим количеством внутренних и внешних ссылок по сравнению с другими страницами-дублями.
Когда следует использовать канонические ссылки
В целом, канонические ссылки стоит использовать, когда есть необходимость оставить возможность для пользователей посещать страницы-дубли и вы четко понимаете природу их возникновения.
rel=canonical для страниц сортировки
Если товары в вашем интернет-магазине или каталоге можно сортировать по различным параметрам, то существует вероятность отображения этих параметров в URL страницы и возникновения дубля наподобие
http://example.com/dresses.html?sort=price
Необходимо со всех возможных вариантов сортировки проставить каноническую ссылку на основную категорию с сортировкой по умолчанию, адрес которой используется в меню сайта:
1 |
<link rel="canonical" href="http://example.com/dresses.html"/> |
rel=canonical для страниц пагинации
Существуют разные подходы к работе со страницами пагинации. Google рекомендует использовать каноническую ссылку на страницу, где представлены все товары. То есть для каждого раздела необходимо создать страницу, на которой будут выведены абсолютно все товары, входящие в эту категорию.
Однако, на практике мы видим, что такой подход не всегда оправдан с точки зрения времени загрузки такой страницы и поведения пользователей. Реализовать такой функционал также не всегда представляется возможным.
Если вариант со страницей, где собраны все товары категории не подходит, то стоит использовать канонический URL в сочетании с тегами prev и next. При этом rel=canonical будет указывать сам на себя, что позволит обеспечить нормальное индексирование товаров на страницах пагинации.
Например, в коде страницы http://example.com/dresses.html?page=3 мы увидим канонический URL, указывающий на нее же:
1 |
<link rel="canonical" href="http://example.com/dresses.html?page=3" /> |
rel=canonical для страницы печати и реферальных ссылок
В случае реализации страницы печати через дополнительный параметр, например:
http://example.com/blog/article.html?print=yes
стоит также использовать ссылку на каноническую страницу:
1 |
<link rel="canonical" href="http://example.com/blog/article.html"/> |
Подобная ситуация возникает и при использовании реферальных ссылок, например:
http://example.com/myblog.html?partner=12313
Для таких страниц необходимо проставить каноническую ссылку на оригинальную страницу:
1 |
<link rel="canonical" href="http://example.com/myblog.html"/> |
В случае пренебрежения данным правилом, вы рискуете получить массу страниц-дублей в индексе поисковых систем (пропорционально количеству рефералов)
301 редирект или rel=canonical
Если нет факторов, мешающих внедрить 301 редирект, то используйте этот вариант. Помните, что указание канонической ссылки является рекомендательным для поисковых систем. Нередко в выдаче Google можно встретить ранжирующиеся неканонические страницы, при этом в коде страницы будет указана ссылка на первоисточник.
Алгоритм поисковика строится не только на поиске канонической ссылки в коде страницы, но и на массе других факторов — наличии внешних и внутренних ссылок, релевантности для пользователя и т.д. Поэтому у Google может быть другое мнение на счет того, какую же из страниц-дублей необходимо считать оригинальной.
Если же необходимо оставить страницы доступными для пользователей либо существуют технические сложности в реализации 301 редиректа на сайте — используйте rel=canonical
Канонический URL, указывающий на эту же страницу
Данная тема по сей день является предметом для споров seo-оптимизаторов. Дело в том, что большинство CMS без проблем позволяют добавлять параметры в URL адрес без изменения самого контента страницы. Поэтому мы в Q-SEO придерживаемся мнения, что добавление rel=canonical на всех страницах сайта со ссылкой на самих себя же, не только не повредит вашему сайту, а и обезопасит от потенциальных дублей.
rel=canonical на другой домен
15 декабря 2009 года Google заявил о поддержке канонических ссылок, указывающих на другой домен. В публикациях многих блогеров вы до сих пор можете встретить информацию о том, что указывать канонический URL на другой домен запрещено. Первоначально Google действительно занимал такую позицию, но через некоторое время добавил поддержку кросс-доменных канонических ссылок.
Данный метод позволяет вам публиковать интересный контент для своих пользователей, указывая при этом каноническую ссылку на первоисточник. В таком случае выигрывают оба сайта. Первый не рискует быть пессимизированным поисковыми системами за неуникальный контент и предоставляет своей аудитории интересный контент. Второй же получает прирост ссылочной массы и других характеристик от неканонической страницы на другом домене.
Основные ошибки использования rel=canonical
Канонические URL поддерживают большинство популярных поисковых систем: Google, Яндекс, Yahoo, Bing. Но вы все равно продолжаете видеть в индексе неканонические страницы вашего сайта? Первое что нужно сделать — проверить не была ли допущена ошибка при настройке rel=canonical. Ниже перечень наиболее распространенных ошибок:
Не индексируемая каноническая страница
Проверьте может ли робот поисковой системы проиндексировать страницу, на которую вы ссылаетесь как на каноническую. Удостоверьтесь, что:
- страница отдает ответ сервера 200
- на странице не установлен мета-тег robots со значением noindex
- страница не закрыта от индексирования в файле robots.txt
Разные канонические URL для одной страницы
Довольно часто устанавливаемые на сайт модули добавляют в код канонические ссылки. Это может привести в появлению нескольких rel=canonical на странице. Если ссылки в тегах указаны на разные URL, то, вероятнее всего, Google и другие поисковики просто проигнорируют ваши рекомендации.
Таким образом, все усилия по установке канонических страниц могут быть сведены на нет. Почаще проверяйте исходный код ваших страниц, чтобы убедиться в наличии только одной канонической ссылки.
Неправильное использование абсолютных ссылок
Распространенной ошибкой является указание канонической ссылки без протокола http:// или https://, как показано на примере ниже:
1 |
<link rel="canonical" href="example.com/myblog.html"/> |
Допустимо указывать относительные ссылки:
1 |
<link rel="canonical" href="/myblog.html"/> |
1 |
<link rel="canonical" href="http://example.com/myblog.html"/> |
Использование тега вне блока head
Для корректного восприятия поисковыми системами, особенно это касается Google, тег rel=canonical должен находиться в рамках области head кода вашей страницы. Кроме того, данный тег стоит размещать настолько близко к началу HTML кода, насколько это возможно.
Канонические ссылки со страниц пагинации на первую страницу
Такое решение вполне дееспособно для борьбы с дублями. Однако, может негативно повлиять на индексацию страниц, ссылки на которые как раз и расположены на страницах пагинации. Например на странице http://example.com/dresses.html?page=3 расположены ссылки на 20 товаров — они не будут проиндексированы поисковым роботом непосредственно по ссылкам с этой страницы.
Тег canonical при использовании hreflang
Если вы внедряете hreflang на своем проекте, то обязательно убедитесь, что все канонические ссылки указывают на страницы этой же языковой версии. Несоответствие этому правилу может привести как к проблемам с ранжированием языковых версий, так и к неправильному пониманию поисковиками приоритетных для ранжирования дублирующихся страниц.
Неканонические ссылки в sitemap.xml
Файл sitemap.xml помогает поисковому роботу понять какие страницы вашего сайта нужно индексировать и ранжировать в поисковой выдаче. Именно поэтому не стоит добавлять в карту сайта закрытые любым способом от индексирования либо неканонические страницы.
Использование rel=canonical для неидентичных страниц
Данный атрибут был разработан специально для указания приоритетной страницы среди страниц-дублей. Судя по всему, поисковики допускают определенную степень расхождения в контенте страницы. Но это абсолютно не значит, что можно ставить каноническую ссылку на просто схожую по тематике страницу.
Если Google заметит вас в неправильном использовании канонических ссылок, это может повлиять на его отношение к rel=canonical для всего вашего домена и тогда пострадают даже верно настроенные страницы.
Тег rel=canonical и социальные сети
Facebook и Twitter прекрасно понимают канонические ссылки. Когда пользователь делится неканонической статьей, то социальная сеть подтягивает данные именно по канонической ссылке, если иное не предусмотрено особенностями неканонической страницы.
Кроме того, счетчики лайков также будут подтягивать значение именно с канонической страницы.
Как проверить использование канонических ссылок на сайте
После завершения работ по настройке канонических страниц на сайте рекомендуем воспользоваться программой Screaming Frog SEO Spider.
На вкладке Directives вы найдете исчерпывающую информацию о том, на каких страницах установлен канонический тег и куда он ведет.
Для постраничной проверки удобно пользоваться расширением для браузера от rds bar.
По клику на кнопку SEO кроме прочего появится и информация касательно канонической ссылки, если тег присутствует в коде страницы.
Заключение
Использование rel=canonical без сомнения стало must have в работе каждого seo-оптимизатора. Но как любой другой мощный инструмент требует умелого с ним обращения, так и данный атрибут подразумевает тщательное продумывание всех аспектов внедрения на сайт.
Надеемся, что в данной статье мы разъяснили все технические аспекты использования столь нужного для успешного seo инструмента.
Всем успешных проектов и не забывайте поделиться статьей с друзьями и коллегами, если она была полезна для вас!
+ Бонус
Канонические URL для Opencart
Многие модули для Opencart не учитывают того, что во время своей работы генерируют доступные для поисковых систем дубли страниц. Например, вы решили вывести на главную страницу блог с товарами «Хит продаж». Вполне вероятно, что при клике с главной страницы товар будет доступен по ссылке http://example.com/tovar.html, а при переходе из каталога будет доступен по ссылке, включающей название категории в URL, например http://example.com/category/tovar.html.
Наиболее распространенные проблемы, решаемые с помощью указания канонических страниц:
- доступность товара по нескольким URL адресам, например:
http://example.com/tovar.html
http://example.com/category/tovar.html
http://example.com/category/subcategory/tovar.html
http://example.com/novinki/tovar.html
Каноническим должен быть тот URL, который относится к основной категории товара.
Конечно, более правильным решением будет 301 редирект и фактическая замена ссылок на сайте. Если такой вариант недоступен, можно использовать канонические ссылки.
- доступность категорий по нескольким URL адресам, например:
http://example.com/category/subcategory/
http://example.com/category/subcategory/?min_price=170&max_price=990
Решить данную задачу можно модификацией файла header.tpl
В блоке head необходимо разместить данный код, который позволит для всех страниц, содержащих параметр ?min_price, указать каноническую ссылку на основную страницу самой категории:
1 2 |
<?php $canonical = explode('?min_price', $)SERVER['REQUEST_URI']); ?> <link rel="canonical" href="http://example.com<?php echo $canonical[0]; ?>" /> |
Канонические URL для Битрикс
Для CMS системы Битрикс также актуальны дубли товаров, размещенных в разных категориях. Решается данная проблема с помощью канонической ссылки, добавленной в блок. Реализовать можно следующим способом: В свойствах инфоблока создаем свойство "Канонический URL", код свойства – CANONICAL, тип — строка. В шаблоне элемента каталога добавляем:
1 2 3 4 5 |
<? if(!empty($arResult["PROPERTIES"]["CANONICAL"]["VALUE"])) { $APPLICATION->SetPageProperty('canonical', $arResult["PROPERTIES"]["CANONICAL"]["VALUE"].$arResult["CODE"] ); } ?> |
В header.php шаблона в области HEAD добавляем:
1 2 3 4 5 |
<?php function ShowCanonical() { global $APPLICATION; if ($APPLICATION->GetProperty("canonical")!="" && $APPLICATION->GetProperty("canonical")!=$APPLICATION->sDirPath){ return '<link rel="canonical" href="www.example.com'.$APPLICATION->GetProperty("canonical").'/" />'; } else {return false;} } $APPLICATION->AddBufferContent('ShowCanonical'); ?> |
Естественно, вместо www.example.com нужно вставить название вашего сайта.
В результате, если в админпанели сайта в поле свойства указать адрес канонической ссылки, то сформированная ссылка выведется в блок head неканонической страницы.
Начиная с версии 15.5.0 весь процесс установки канонических адресов можно пройти в админпанели. Подробнее здесь.