Короткое определение
Canonical, или rel="canonical", - это указание в HTML или HTTP-заголовке, которое сообщает поисковым системам предпочтительный URL для страницы или группы близких дублей.
Зачем нужен canonical
На реальных сайтах один и тот же контент часто появляется по разным адресам: с параметрами сортировки, UTM-метками, фильтрами, разными путями к карточке товара, слешем и без слеша, HTTP и HTTPS, старым и новым URL после миграции. Если не показать основную версию, поисковая система сама выберет URL, который считает каноническим. Этот выбор не всегда совпадает с бизнес-логикой сайта.
Canonical помогает склеивать сигналы дублей: внутренние ссылки, внешние ссылки, поведенческие данные и понимание основной страницы. Но он не чинит архитектуру сам по себе. Если сайт одновременно ссылается на дубль, добавляет его в sitemap и ставит canonical на другой URL, поисковик получает противоречивую картину.
Когда canonical особенно важен
Конфликты с sitemap, ссылками и редиректами
Самая частая проблема - canonical говорит одно, а остальные сигналы другое. Например, страница А указывает canonical на страницу Б, но в меню, хлебных крошках и sitemap лежит страница А. Формально тег есть, но поисковик видит конфликт и может проигнорировать рекомендацию.
Правильная схема выглядит проще: канонический URL отдает код 200, сам указывает canonical на себя, находится в sitemap, получает внутренние ссылки и содержит основной контент. Неканонические версии не должны получать больше веса, чем основная страница.
Canonical, noindex и robots.txt - не одно и то же
Canonical не удаляет страницу из индекса. Это рекомендация, какая версия предпочтительна. Noindex просит не индексировать страницу. Robots.txt ограничивает обход, но не всегда убирает URL из выдачи, если поисковик знает адрес из внешних ссылок. Редирект переносит пользователя и робота на другой URL.
Поэтому нельзя бездумно заменять одно другим. Если страница нужна пользователю, но не должна быть основной, может подойти canonical. Если страница не должна быть в индексе, чаще нужен noindex или закрытие сценария через архитектуру. Если URL окончательно переехал, нужен редирект, а не только canonical.
Пример
У интернет-магазина есть категория `/krossovki/` и версия `/krossovki/?sort=price`. Сортировка не создает новый поисковый интент, поэтому параметризованная страница может указывать canonical на основную категорию. При этом в sitemap должна быть только `/krossovki/`, а внутренние ссылки на категорию должны вести на канонический адрес.
Другой сценарий: фильтр `/krossovki/nike/` может быть самостоятельной посадочной, если у него есть спрос, уникальный ассортимент, текст, Title, H1 и внутренняя перелинковка. В таком случае каноникализировать его на общую категорию нельзя: вы потеряете страницу под отдельный интент.
Частые ошибки canonical
- ставить canonical на нерелевантную страницу только ради удаления дубля;
- каноникализировать страницы с отдельным поисковым интентом на общую категорию;
- оставлять в sitemap URL, которые указывают canonical на другие адреса;
- ставить canonical на URL с редиректом, ошибкой, noindex или другим canonical;
- использовать относительные адреса там, где CMS может собрать неправильный путь;
- не проверять canonical после редизайна, миграции, смены протокола или структуры URL;
- считать canonical жесткой командой, хотя поисковик может выбрать другую основную страницу.
Чек-лист проверки canonical
- Проверьте, что канонический URL отдает код 200 и не закрыт от индексации.
- Убедитесь, что важные индексируемые страницы имеют self-canonical.
- Сверьте canonical с sitemap.xml, внутренними ссылками, хлебными крошками и редиректами.
- Разделите дубли и отдельные поисковые интенты: не склеивайте страницы, которые должны ранжироваться отдельно.
- Проверьте фильтры, параметры, сортировки, пагинацию, карточки товара и старые URL после миграции.
- Проверьте шаблоны, а не только одну страницу: ошибка canonical часто размножается на сотни URL.
FAQ
Что такое canonical простыми словами?
Это указание поисковой системе, какой URL считать основной версией страницы, если есть дубли, параметры, сортировки или близкие варианты одного контента.
Canonical удаляет страницу из индекса?
Нет. Это сильная рекомендация, но не жесткий запрет. Для удаления страницы из индекса используют noindex, удаление URL или другие технические решения.
Когда canonical особенно важен?
Для фильтров, сортировок, параметров, карточек товара в разных категориях, UTM-версий, дублей после миграции и страниц с похожим содержанием.
Что должно быть в sitemap: canonical или дубль?
В sitemap должны попадать канонические индексируемые URL с кодом ответа 200. Дубли, редиректы, noindex и URL, которые каноникализируются на другие страницы, лучше не включать.
Что почитать дальше?
Посмотрите разбор дублей, canonical и фильтров, справку что такое sitemap.xml и страницу что такое noindex.