sitemap.xml / индексация / структура URL

Проверка sitemap.xml онлайн

Введите домен сайта. Инструмент проверит карту сайта sitemap.xml, определит тип XML, посчитает записи, найдет дубли, битые и внешние URL, а также просмотрит выборку страниц из карты.

по домену без регистрации выборка URL

Быстрая проверка

Домен сайта

sitemap

Проверка читает публичную карту сайта и смотрит ограниченную выборку URL из sitemap.

Что проверяем

Sitemap.xml должен вести к индексируемым URL, а не просто существовать

Карта сайта нужна не для галочки. Если в ней лежат битые URL, noindex-страницы, неканонические адреса или мусорные параметры, поисковик получает неверный сигнал о том, что именно вы считаете важными страницами.

ДоступностьHTTP-статус sitemap.xml, базовый XML-формат, тип карты: urlset или sitemapindex.
СоставКоличество записей, наличие lastmod, дубли URL, некорректные адреса и чужие хосты.
ВыборкаПроверка части URL из sitemap: коды ответа, noindex, canonical на другой хост, пустой Title и тонкие страницы.
ПриоритетСписок первых задач, которые стоит исправить до глубокой ручной проработки индексации.

Приоритеты

Какие ошибки sitemap.xml исправлять первыми

Сначала убирают все, что ломает доверие к карте сайта: пустой файл, битый XML, 404 и 301 URL, noindex-страницы и адреса, которые canonical-ом указывают на другой хост. Уже потом чистят дубли, `lastmod` и второстепенные несоответствия.

P0 - критичноФайл sitemap.xml не открывается, не похож на XML или не содержит записей.
P1 - важноВ выборке есть 404, 500, редиректы, noindex-страницы или URL с canonical на другой домен.
P2 - порядокВ карте сайта есть дубли, чужие хосты, мусорные параметры или неясная структура разделов.
P3 - контрольПосле релизов, переезда или массовой генерации страниц sitemap.xml нужно перепроверять вместе с robots.txt.

Методика

Как читать результат проверки карты сайта

Наличие sitemap.xml не гарантирует правильную индексацию. Важно, чтобы карта сайта содержала только те URL, которые должны участвовать в ранжировании: канонические, открытые для индексации и доступные по 200 OK.

Если файл выступает как `sitemapindex`, этого тоже недостаточно. Нужно следить, чтобы дочерние карты не вели к удаленным разделам, старым каталогам, параметрам фильтрации или дублям шаблонных страниц.

После проверки

  • Уберите из sitemap все URL с ошибками ответа и редиректами.
  • Оставьте только канонические индексируемые страницы.
  • Проверьте согласованность sitemap.xml, robots.txt и canonical.
  • Пересоберите карту после крупных изменений структуры сайта.
  • Перепроверьте выборку в Яндекс.Вебмастере и Google Search Console.

FAQ

Вопросы про проверку sitemap.xml

Что проверяет sitemap.xml checker?

Инструмент проверяет доступность sitemap.xml, XML-формат, тип карты, количество записей, дубли URL, некорректные адреса, внешние хосты и выборку страниц из карты сайта.

Нужен ли sitemap.xml небольшому сайту?

Да, в большинстве случаев sitemap.xml полезен даже для небольшого сайта. Он помогает поисковикам быстрее находить важные страницы и понимать структуру разделов.

Можно ли держать noindex-страницы в sitemap?

Лучше нет. Карта сайта должна содержать страницы, которые вы хотите индексировать. Если URL закрыт noindex или не является каноническим, его обычно убирают из sitemap.

Чем sitemap.xml отличается от robots.txt?

Sitemap.xml показывает поисковикам список важных URL для обхода и индексации, а robots.txt ограничивает или направляет обход. Эти файлы работают вместе, но решают разные задачи.

Какие URL нельзя оставлять в sitemap.xml?

В sitemap не стоит оставлять 404, 301, noindex, дубли, технические страницы, URL с чужим canonical и адреса, которые не должны участвовать в индексации.

Когда нужно перепроверять sitemap.xml?

Проверка sitemap.xml нужна после редизайна, переезда, смены CMS, правок шаблонов, запуска новых разделов, падения индексации или массовых изменений URL.