Канонизация — процесс обозначения «предпочтительного» URL, когда несколько URL обслуживают эквивалентный или похожий контент. Тег <link rel="canonical"> является основным механизмом — размещённый в <head> страницы, он сообщает Google: «это канонический URL для данного контента; консолидируйте здесь все ссылочные сигналы».
Канонизация влияет на индексацию, распределение PageRank и то, какой URL появляется в результатах поиска. Неправильная канонизация не создаёт сообщений об ошибках — она создаёт тихо неоптимальные позиции.
Почему канонизация существует
Один и тот же контент может быть доступен по нескольким URL по многим причинам:
https://example.com/page/иhttps://example.com/page(со слешем и без)https://www.example.com/page/иhttps://example.com/page/(www vs. non-www)https://example.com/page/иhttp://example.com/page/(HTTPS vs. HTTP)https://example.com/page/?utm_source=newsletter(параметры отслеживания)https://example.com/page/?sort=price(параметры сортировки/фильтрации)
Без канонизации Google может: разделить ссылочный капитал между URL (ослабляя все из них), проиндексировать «неправильную» версию, или расточать краулинговый бюджет на дублирующиеся варианты URL.
Синтаксис канонического тега
Самоканонизирующий тег (каждая страница должна включать этот):
<link rel="canonical" href="https://www.example.com/page/" />
Лучшие практики: каждая страница должна иметь канонический тег. Даже если у страницы нет известных дубликатов, самоканоникализация делает явным, какой URL является авторитетным.
Абсолютные URL, не относительные: Используйте https://www.example.com/page/, а не /page/. Относительные канонические URL могут вызвать проблемы, когда canonical наследуется в разных URL-контекстах.
Canonical должен указывать на ответ 200: Canonical, указывающий на перенаправленный URL или 404, недействителен. Указывайте canonicals непосредственно на финальный, живой канонический URL.
Canonical должен соответствовать предпочтительной версии домена: Если предпочтительный URL включает www, ваши canonicals должны включать www. Если предпочтительный URL использует HTTPS — canonicals должны использовать HTTPS.
Самоканонизация vs. межстраничная канонизация
Самоканонизация: Тег canonical указывает на собственный URL страницы. Сигнализирует: «это каноническая версия самой себя». Каждая страница должна иметь это по умолчанию.
Межстраничная канонизация: Тег canonical указывает на другой URL. Сигнализирует: «контент здесь является дубликатом или почти дубликатом; окончательная версия находится по [другому URL]». Используется для пагинации, вариантов с параметрами, синдицированного контента и консолидации URL.
Canonical для URL с фильтрами и параметрами
Параметры URL — наиболее распространённый случай использования канонизации. Для каждого варианта с параметром, генерирующего другой URL:
<!-- На https://example.com/products/?sort=price&color=blue -->
<link rel="canonical" href="https://example.com/products/" />
Это сигнализирует, что отсортированное/отфильтрованное представление не является независимо каноническим. Google обычно уважает это и индексирует только canonical.
Важно: если URL на основе параметра обслуживает подлинно другой контент, заслуживающий независимого ранжирования, он должен быть каноническим для самого себя, а не для родительского. Canonical — сигнал качества, а не только подавитель дубликатов.
Canonical в HTTP-заголовках
Для не-HTML ресурсов (PDF, XML-файлы) или ситуаций, где редактирование HTML <head> невозможно, canonical может быть указан в HTTP-заголовках ответа:
Link: <https://example.com/document.pdf>; rel="canonical"
Функционально эквивалентен тегу в <head>, но доступен через HTTP-ответ.
Типичные ошибки канонизации
Canonical, указывающий на неиндексируемую страницу: Если цель canonical имеет noindex, создаётся конфликт — вы говорите «это canonical», но также «не индексируй это». Google обычно уважает noindex и не индексирует ни одну версию.
Цепочка canonical: Страница A канонизирует на страницу B, которая канонизирует на страницу C. Google обычно следует цепочке до страницы C, но цепочки ненадёжны. Указывайте canonicals непосредственно на финальный канонический URL.
Конфликт canonical и блокировки robots.txt: Страница с canonical, указывающим на некраулируемый URL. Google не может обойти canonical для подтверждения корректности.
Ошибки canonical при миграции сайта: После миграции домена URL старого домена могут по-прежнему обслуживать канонические теги, указывающие на URL старого домена. Все canonicals должны быть обновлены на URL нового домена немедленно при миграции.
CMS, автогенерирующий некорректные canonicals: Некоторые CMS генерируют канонические теги на основе логики шаблонов, не учитывающей варианты URL с параметрами. Проверьте вывод канонических тегов вашей CMS, обойдя URL с параметрами и проверив canonical в отрендеренном HTML.
Canonical vs. Редирект: что когда использовать
Используйте canonical, когда: Альтернативный URL имеет ценность для пользователя (пользователи законно приходят туда по ссылкам или навигации), но вы хотите консолидировать поисковый капитал на предпочтительный URL.
Используйте редирект, когда: Альтернативный URL вообще не должен быть доступен — нет пользовательской причины для его существования. Редирект объединяет SEO-сигнал с исправлением UX.