×
Каноническая ссылка: как правильно установить, ошибки при использовании
Вернуться к Блогу
8520

Время чтения: 16 минут

Нет времени читать?
Отправить материалы на почту

Каноническая ссылка: как правильно установить, ошибки при использовании

В ситуации выбора между дублями, страницами с похожим содержимым (например, сверстанными под мобильную и десктопную версии), и каноническими страницами поисковая система предпочтет последние. Эти страницы активно и регулярно, в отличие от остальных, сканируются поисковыми роботами (Google и «Яндекс») и попадают в поисковую выдачу. Чтобы правильно настроить каноническую страницу, веб-мастера используют такой инструмент, как каноническая ссылка.

Что означает каноническая ссылка

Каноническая ссылка является тем метатегом, с помощью которого поисковая система выбирает из многих доступных ей URL-адресов сайта один предпочтительный, чтобы проиндексировать его. Этот процесс выбора называется канонизацией.

Каноническая ссылка

Нехитрый поиск по тем или иным запросам в поисковике покажет, что на один сайт ведет более одной ссылки. Но канонический URL-адрес может быть только один. Прописав канонические ссылки на каждую из страниц сайта, веб-мастер может быть уверен, что дубликаты контента не окажутся в поисковой выдаче, а пользователи обязательно попадут на правильную страницу.

Тег rel = "canonical" был добавлен «Гуглом» сравнительно недавно, в 2016 году. Теперь веб-мастерам стало гораздо проще указывать, какая версия страницы сайта предпочтительна. Раньше приходилось перенаправлять каждую ссылку на предпочтительный URL, что зачастую было трудоемко и неудобно.

Канонические ссылки особое значение имеют для интернет-магазинов, где по каждому товару набирается до десятка страниц (в зависимости от того, как пользователь добирался до этого товара). Если каноническая страница не обозначена, то все ссылки на ее дубли не объединяются, а разбиваются и вероятны проблемы из-за дублирования одного и того же контента.

Несмотря на старания поисковиков в определении канонической страницы среди нескольких ее вариантов, они иногда ошибаются. Поэтому SEO-специалисты утверждают, что желательно иметь ссылки с атрибутом canonical.

Зачем нужны канонические ссылки

URL, имеющий атрибут canonical, имеет преимущество при индексации для поисковиков. Если у вас на сайте имеются дубли страниц, озаботьтесь настройкой канонических ссылок. Это типичная ситуация, вызванная особенностями работы некоторых CMS-систем: автоматически генерируется несколько страниц с разными URL’ами, но идентичным контентом.

Причинами этого могут быть:

  1. Одинаковый текст в различных рубриках блога (с большой вероятностью, появится еще одна страница с тем же содержанием).

  2. Компания владеет несколькими доменами (к примеру, http://blogs.example.com и http://article.example.com) и размещает свой контент на обоих сайтах одновременно. Разумеется, возникают дубли.

  3. Структура веб-ресурса недавно была обновлена, и ссылки на страницы тоже могли измениться.

Чтобы в поисковую выдачу не попали все эти копии страниц, проставляют канонические ссылки. Настроенный атрибут canonical подскажет поисковым роботам, какая из страниц является настоящей: ее они и будут индексировать.

Итак, для чего же необходимо прописывать канонические ссылки?

  1. Во избежание путаницы и захламления поисковой выдачи дублями, если контент на страницах вашего сайта полностью или местами схож.

  2. Для улучшения сбора статистики посещаемости (которую тоже затрудняет наличие идентичной информации).

Как канонические ссылки борются со «скрытыми» дублями

Вернемся на шаг назад. Предположим, что все страницы нашего сайта уникальны и контент специально нигде не дублировался. Это не отменяет возможного наличия некоторых «скрытых» копий ссылок (которые реально существуют, но с трудом обнаружимы для нас).

Вы будете удивлены, но поисковик все эти ссылки на страницы воспринимает как отдельные (притом, что контент на них выводится один и тот же):

Поэтому канонические ссылки, прописываемые в теге head, остро необходимы всем страницам вашего сайта. Обозначьте для поисковых систем, какую из версий всех этих URL’ов (и других, не упомянутых здесь, тоже) им следует просканировать.

Сразу определитесь с тем, будет или нет в ваших ссылках использоваться www. Стратегия в этом отношении должна быть единой как в рамках сайта, так и за его пределами. Об использовании www должны знать все, кто так или иначе применяет ваши ссылки, постит их у себя и т. д.: персонал компании, ваши контрагенты, каталоги, в которых фирма регистрируется, клиенты, ссылающиеся на вас.

Не меньшее значение имеет знак слеша в конце ссылки и https. Последний играет ключевую роль в обмене конфиденциальными данными (что происходит, например, при онлайн-банкинге и покупках по карте). Везде и всегда придерживайтесь единого варианта! И лучше выбирать наиболее употребимый, чтобы потом не переправлять множество ссылок.

Впрочем, если ваш сайт сделан на WordPress, основная масса этих проблем легко решаема. Для этого существуют различные плагины и прочие инструменты.

Но в других случаях (например, для сайтов на «Битрикс») канонические ссылки остаются незаменимым приемом.

Канонические ссылки в случае дублируемого контента блога

Предположим, вы публикуете на сайте новую статью и относите ее сразу к нескольким рубрикам, делая различные метки в CMS WordPress (это носит название таксономий). Так поступают многие блогеры и контент-менеджеры. Или, например, продукт в вашем интернет-магазине присутствует одновременно в нескольких товарных группах.

Избавляемся от дублей

В обоих случаях возникает проблема: контент оказывается доступен по разным ссылкам (это очень удобно для пользователя в плане навигации по сайту, но не полезно с точки зрения SEO):

Вам нужно, чтобы посетители вашего сайта видели эти шоколадные трюфели в обеих категориях – food и candy. С точки зрения пользовательского поведения это оправданно, но какую же из двух ссылок должны проиндексировать поисковики? Они могут проранжировать только одну из них, но не обе. Выбор должны сделать вы. И вот тут вам пригодятся канонические ссылки: они укажут поисковым системам, что контент на этих страницах идентичен, но индексировать надо какую-либо одну.

Имейте в виду, что поисковики вообще-то не обязаны подчиняться этой канонизации: если они сочтут ее неверной, то проигнорируют каноническую ссылку и будут действовать на свое усмотрение.

Использование перекрестных канонических ссылок при дублировании контента с других сайтов

Статьи и другой контент, опубликованный на сайте, часто перепечатывают и репостят на других ресурсах. Типичный пример – синдикация пресс-релизов.

Предположим, ваша фирма составляет и публикует на корпоративном сайте очередной пресс-релиз. Это рутинная процедура для отдела маркетинга, давно вошедшая в практику многих компаний. Природа пресс-релиза такова, что он предназначен для бесплатного копирования и распространения, то есть может и должен быть использован любыми СМИ или другими издателями контента. Существуют специальные сети синдикации, такие как PRWeb.

Таким образом, цитирование текста неизбежно, а это порождает сложности с SEO. Поисковый робот одинаково воспринимает текст пресс-релиза в любом источнике: как на корпоративном сайте, так и на новостных порталах. Как же вычислить оригинальный материал? Какую из версий показать в SERP (поисковой выдаче)? Его вы должны выбрать и указать при помощи канонического URL’а!

По умолчанию поисковики действуют в соответствии со своими алгоритмами и выбирают оригинал самостоятельно, если для них нет специальных указаний по этому поводу. Практика работы с пресс-релизами такова, что при их перепечатке (и переверстке для собственного веб-ресурса) мало кто вообще вспоминает о необходимости ссылаться на источник: релизов каждый день публикуются десятки, даже если речь идет о небольшом новостном портале.

Поэтому все заботы о том, чтобы первоисточник материала был указан, ложатся на вас. На корпоративном сайте рекомендуется прописывать каноническую ссылку на той странице, где размещен текст, а также давать ссылку на его публикацию в основной сети синдикации (куда был отправлен релиз для последующего распространения): например, страничку релиза на PRweb.com.

Кейс: VT-metall
Узнай как мы снизили стоимость привлечения заявки в 13 раз для металлообрабатывающей компании в Москве
Узнать как

Возможны ли ситуации, когда канонические ссылки на исходную страницу можно не создавать, даже если контент дублируется в других, внешних источниках?

Желательно, чтобы история компании или биография персоны, опубликованная на сайте, не состояла из тех же выражений и фраз, которыми они описываются в других источниках: иных сайтах, профилях соцсетей и т. п.

Использование единого описания всюду, от профиля в LinkedIn и бизнес-страницы GooglePlus до официального сайта – это явное дублирование текста. Поэтому не следует вставлять каноническую ссылку на страницу «О компании» и подлинковывать сюда же паблик фирмы в соцсети: страница сайта должна участвовать в ранжировании отдельно! Поэтому и контент на ней должен быть уникальным.

Когда лучше использовать канонические ссылки

  • Если создается каталог – перечень всех товаров.

Google называет оптимальным следующий способ канонизации статей или продуктов в каталоге: прописать ссылку на список всех товаров (статей с каждого из них). То есть в каждой категории (рубрике) должна присутствовать страница «Смотреть все», на которую ссылаются посредством канонического URL’а все страницы пагинации.

  • Страница версии для печати.

Если на сайте есть отдельные версии страниц для печати, вызываемые посредством дополнительного параметра вроде:

то нужно обязательно прописывать каноническую ссылку на веб-версию страницы:

<link rel="canonical" href="http://site.com/news-1.html&quot; />

  • Если на сайте используется реферальная система.

Сайты с партнерскими и реферальными программами особенно нуждаются в канонических ссылках для тех страниц, на которых могут содержаться аффилированные ссылки. В противном случае поисковые роботы найдут и проиндексируют все страницы, на которые попадут по внешним ссылкам, а это огромное число дубликатов, измеряемое в десятках и сотнях.

Чтобы этого избежать, на всех страницах с реферальными ссылками, например:

размещаем канонические ссылки следующего вида:

<link rel="canonical" href="http://site.com/dresses.html&quot; />

Кроме того, в сервисе GoogleWebmasters есть возможность указать все, что Google не должен индексировать с использованием параметров ссылки. В данном случае это партнерская программа: нужно настроить все так, чтобы ее наличие не влияло на содержимое страницы.

  1. При склейке индексного файла каталога.

Нельзя допускать дублирования файлов в каталоге index.html. Это может произойти, если два или более адресов одной страницы открыты для индексирования, например http://site.com/dresses/index.html и http://site.com/dresses/. Самое простое решение – добавить в http://site.com/dresses/index.html каноническую ссылку вида:

<link rel="canonical" href="http://site.com/dresses/&quot; />

  • Когда одно и то же содержимое присутствует в нескольких языковых версиях либо на различных доменах.

При создании аналогичных сайтов и языковых версий контент неизбежно будет повторяться в разных местах. Ссылку с атрибутом rel= «canonical» проставляют в основной версии публикации.

Как настроить канонические ссылки в WordPress

Проще всего сделать это с помощью плагина WordPress SEO, разработанного JoostDeValk.

Установив этот плагин на сайте, вы получите возможность легко управлять различными настройками SEO, включая канонические ссылки. Кроме ссылок, уделите внимание некоторым другим важным параметрам.

Как видно из скриншота, интерфейс редактирования записи либо страницы (с произвольными типами записей этот плагин тоже работает) в панели WordPress SEO содержит разнообразные поля и опции. Канонические URL-адреса, необходимые при работе с пресс-релизами или наличии дублей контента на сторонних сайтах, прописываются во вкладке Advanced.

Как настроить канонические ссылки в WordPress

С данным плагином простановка канонических ссылок значительно упрощается: достаточно лишь зайти в интерфейс редактирования нужной страницы и вставить абсолютную (но ни в коем случае не относительную!) ссылку на оригинал контента, размещаемого вами на сайте. То есть в канонической ссылке, расположенной на странице с копией контента, должен иметься (в теге head) полный URL-адрес первоисточника. Таким образом вы предупреждаете поисковых роботов, что ваш контент является копией.

Это общий принцип работы. Выше приводились примеры того, как оповестить поисковые системы о том, что контент был скопирован (даже если этого фактически не было), с целью упорядочить индексацию страниц. С пресс-релизами логика та же самая. Но можно выбрать в качестве канонической страницы не статью на своем сайте, а публикацию релиза в сети синдикации (и тогда ваш сайт стал бы напоминать эти синдикаторы).

Не все специалисты в области SEO согласны с таким принципом работы, поэтому он не является обязательным: прописывайте канонические ссылки тогда, когда это вам действительно необходимо. Google сообщает о том, что может проигнорировать эти подсказки и определить первоисточник контента самостоятельно, но они являются для него ценным дополнением.

Иногда в качестве канонической выступает страница вашего сайта, где размещена копия контента. Например, описание одного и того же товара может присутствовать на статичной странице в разделе «Оптовым клиентам» и одновременно – в интернет-магазине, предлагающем этот товар розничным покупателям. Выберите из этих двух страниц ту, которую вы хотите продвигать в поисковиках, и задайте каноническую ссылку, воспользовавшись плагином WordPress SEO.

При этом вам не придется прописывать для каждой страницы обе версии – с www и без. Плагин сделает это самостоятельно. Но если вдруг ваш контент разнесен по разным доменам или ссылки сильно различаются, можно настроить эти параметры вручную.

С помощью плагина WordPress SEO ваши возможности по применению канонических ссылок расширяются. Если на сайте используется, в коммерческих целях, SSL-сертификат, то в качестве канонических вы можете указывать https-адреса (даже если страница доступна как по https, так и по http). Для этого в разделе SEO найдите Permalinks и прокрутите страницу консоли вниз, пока не увидите Canonical Settings.

Canonical Settings

В выпадающем списке выбираете тип ссылки, которая станет канонической и будет указана в теге head на каждой странице сайта:

Тип ссылки

Другие способы, как и где установить каноническую ссылку

  • На текущей странице.

Канонические ссылки

Это главный способ установки канонических ссылок. В коде страницы в пределах тега head размещают вот такую вставку:

<link rel="canonical" href="http://site.com/canonical-link.html&quot;/&gt;

Если прописать эту инструкцию где-то в другом месте страницы, она не сработает – поисковики ее попросту проигнорируют.

  • В xml-карте.

В xml-файле карты сайта, который должен присутствовать на любом веб-ресурсе, можно прописывать канонические ссылки для любой из страниц. Однако на поисковые системы они не окажут воздействия.

  • В ответе сервера.

Данный метод неприменим для html-файлов и используется лишь для файлов других типов (pdf и т. д.). Каноническая ссылка добавляется в http-заголовок документа и на запрос файла-дубля сервер отреагирует следующим образом:

Link: <http://site.com/main-file.pdf&gt;; rel="canonical".

Учтите, что в настоящее время «Гуглом» эта часть заголовка поддерживается исключительно для веб-поиска.Как поправить URL-адрес для соответствия его с каноническим указателем

Выше уже говорилось о том, что необходимо определить одну версию ссылки, которая будет везде использоваться в качестве канонической. После этого еще нужно будет удалить или отредактировать все линки – как на самом сайте, так и во внешних источниках – чтобы там присутствовала только эта версия.

Предположим, вы решили применять ссылку без www. Не поленитесь осуществить проверку всех канонических ссылок, внешних и внутренних, на предмет соответствия этой версии. Все, что не соответствует, либо удаляем, либо исправляем.

Поиск и замена большого количества линков на сайте и других веб-ресурсах – задача не самая простая, но выполнить ее нужно обязательно. Для своего сайта можно использовать SearchReplace DB (если, конечно, вы обладаете достаточными навыками веб-мастера и понимаете, что и как следует делать).

В консоли WordPress существуют специальные плагины для этой цели. Найдя и заменив все неправильные версии URL’ов, сразу удалите любые привязки к вашей базе данных, дабы не подвергать сайт риску взлома.

С чисткой сайта от «мертвых» ссылок, накопившихся в записях и контенте страниц, отлично справляется плагин Redirection, который избавит вас от унылой монотонной работы.

После того, как все канонические ссылки проверены и актуализированы, убедитесь в том, что вы залогинены в аккаунте GoogleWebmasterTools и там тоже установлена предпочтительная ссылка для вашего веб-ресурса. Укажите в GoogleWebmasterTools оба варианта, с www и без, чтобы установить предпочтения.

Когда канонические ссылки не нужны

Использование канонических ссылок полностью исключается в двух случаях:

  • Когда делается 301 редирект.

Если нужно автоматически перекидывать пользователя с одной страницы на другую (например, того, кто пришел по старой или «мертвой» ссылке, на актуальную страницу), применяют 301 редирект, а не канонические ссылки. В SEO для этих целей иногда используют канонические ссылки, что неправильно.

Редирект – это принудительный перевод пользователя на определенную страницу, которая является единственным местом, где содержится нужный контент. Потребность в редиректе возникает, когда был перенесен на новый домен весь сайт или скорректирована его структура, вследствие чего изменились URL’ы и на старых местах уже нет искомых страниц.

Кроме того, с помощью 301 редиректа можно отправлять пользователя к версии без www или с ним (чтобы убедиться в том, что на сайт не будут пытаться зайти по неправильным ссылкам).

Канонические же ссылки позволяют иметь на сайте (и на сторонних ресурсах) одно и то же содержимое, причем все эти источники открыты для пользователя и доступны для просмотра, и при этом один из них назначается оригиналом, первоисточником.

В 2001 году Рэндом Фишкиным был проделан любопытный эксперимент с указанием канонического URL’а в тегах head на всех страницах старого домена. Он надеялся таким способом улучшить позиции новой версии сайта, размещенной на другом домене, и достиг своей цели. Об этом он рассказал в видеоролике, попутно объяснив, какую заметную роль играют канонические ссылки в кросс-доменной синдикации содержимого сайтов. Не факт, что вам удастся повторить удачный эксперимент Фишкина, но попробовать можно.

  • Когда необходимо закрыть страницу от поисковых систем.

Имейте в виду, что атрибут rel=«canonical» не решает всех проблем, связанных с копиями контента. Алгоритмы работы поисковиков сложны и многообразны. Во многих случаях оптимальным решением является запрет индексации тех или иных страниц сайта посредством файла robots. Кстати, в плагине WordPress SEO эта опция тоже есть.

SEO-специалисты в один голос советуют прописывать правило no-index для служебных страниц, не несущих полезной для пользователей информации, как-то: страницы входа в личный кабинет и админку, Termsand Conditions и т. п. Всего этого не должно быть в поисковой выдаче, надо сосредоточить усилия на продвижении действительно ценного контента: продающих страниц, описаний продуктов, статей в блоге.

Кроме того, закрывают от индексации страницы с мизерным количеством текста – они делают сайт пустым, недостаточно содержательным – и архивы, где дублируется контент: в CMS WordPress к таковым относятся архивы по авторам, датам и меткам (все их содержимое уже есть в архивах рубрик, не нужно плодить лишние сущности).

Отдельные архивы публикаций и некоторые их типы тоже желательно закрыть от поисковиков, если оригинального контента на них нет, только копии с прочих страниц сайта.

Скачайте полезный документ по теме:
Чек-лист: Как добиваться своих целей в переговорах с клиентами

Учтите, что все страницы, которые вы запретили индексировать в robots, нужно будет также убрать и из карты сайта. Если этого не сделать, возникнут ошибки в GoogleWebmasterTools.

Типичные ошибки использования канонических ссылок

  1. При пагинации.

    Когда пагинация организована в несколько серий страниц, то для каждой из страниц в серии канонической оказывается первая. Это неудачное решение: из-за такой канонизации не будут индексироваться остальные страницы серии.

  2. Не индексируется сама каноническая страница.

    Давая ссылку, особенно каноническую, для начала убедитесь, что страница проходит индексацию, иначе вероятна ситуация, когда каноническая страница по ссылке не найдена поисковиком.

    • Проверьте, что она дает 200 код серверного ответа и ошибок нет.

    • Посмотрите, не закрыта ли она от индексации в файле robots.txt или с помощью тега noindex.

    1. На странице встречается более одной ссылки с rel=«canonical».

      Не поленитесь осуществить проверку канонических ссылок: на каждой странице такой линк должен быть только один! Если их больше, поисковик учтет только первую инструкцию, пропустив прочие.

    2. Канонические ссылки не совпадают.

      Канонические ссылки в разных вариантах реализации (внутри самой страницы и, например, в xml-файле карты сайта) должны быть одинаковыми.

    3. Относительные ссылки использованы неправильно.

      Желательно, чтобы каноническая ссылка была абсолютной:

      <link rel="canonical" href="http://site.com/dresses.html&quot; />

      Если прописать относительную ссылку, это чревато ошибками в индексации:

      <link rel="canonical" href="site.com/dresses.html" />

      Такую инструкцию поисковые роботы проигнорируют, поскольку, с их точки зрения, она неправильная.

Облако тегов
Понравилась статья? Поделитесь:
Забрать гарантированный подарок
Полезные
материалы
для руководителей
Скачать 3,2 MB
Елена Койгородова
Елена Койгородова печатает ...