Семантика / Wordstat / структура сайта

Семантическое ядро: как собрать СЯ для сайта с нуля в 2026

Семантическое ядро — это не «список ключевых слов в Excel», а скелет всего сайта. От того, как собрано СЯ, зависит, какие страницы будут созданы, какая структура каталога, какие тексты напишут копирайтеры и какой пользователь в итоге придёт из поиска. Этот гайд проводит через весь путь: от Wordstat и поисковых подсказок до кластеризации и карты релевантности, в которой каждая страница знает, под какие запросы она работает.

Что такое семантическое ядро и зачем оно нужно

Семантическое ядро — это структурированный, привязанный к страницам список поисковых запросов, по которым сайт планирует ранжироваться. Каждый запрос в СЯ имеет тип (информационный, коммерческий, транзакционный, навигационный), частотность, признак геозависимости и, главное, посадочную страницу. Если у запроса нет страницы — это либо задача на её создание, либо повод исключить запрос из ядра.

В простонародном SEO часто путают «семантическое ядро» и «список ключевых слов». Список ключей — это только сырьё. СЯ начинается тогда, когда сырьё разложено по кластерам, кластеры привязаны к страницам, страницы покрывают логически целостные интенты, и в итоге появляется план: сколько страниц нужно создать, какие переписать, какие удалить или объединить. Без этого SEO быстро превращается в «накидаем побольше текста и посмотрим».

Большая ошибка стартующих сайтов — попытка сразу подобрать «топ-10 запросов с большой частотой» и заточить под них главную. На главную и так попадают по бренду, навигационным запросам и широким интентам. Реальные деньги дают средне- и низкочастотные запросы, разнесённые по десяткам и сотням посадочных страниц. Этот эффект называют «длинным хвостом», и весь смысл семантического ядра — в том, чтобы организованно поймать этот хвост.

Хорошее СЯ закрывает три вопроса одновременно. Первый — где спрос (какие запросы реально вводят пользователи и с какой частотой). Второй — какова конкуренция (сколько и каких сайтов уже борются за топ-10 по этим запросам). Третий — какие интенты стоят за запросами (что человек хочет — узнать, сравнить, выбрать, купить или дойти до бренда). Из этих трёх параметров складывается приоритет работы: какие страницы оптимизировать первыми, какие создать с нуля, какие отложить.

Поисковый интент и типы запросов

До того как смотреть на цифры частотности, важно понять, что стоит за каждым запросом. Это и есть поисковый интент — намерение пользователя, которое в современной выдаче Яндекса определяет всё: какой шаблон страницы попадёт в топ, какие сниппеты сработают, какой формат контента считается релевантным.

Условно выделяют четыре типа запросов. Информационные — пользователь хочет узнать что-то новое или разобраться: «что такое семантическое ядро», «как собрать сайт», «зачем нужен canonical». Коммерческие — пользователь сравнивает и выбирает: «лучшие SEO-агентства Москвы», «стоимость SEO-продвижения». Транзакционные — пользователь готов действовать: «заказать SEO-аудит», «купить базу ЛПР», «отправить заявку». Навигационные — пользователь ищет конкретный бренд, сайт или ресурс: «yandex webmaster войти», «1с битрикс кабинет».

На практике запрос редко лежит ровно в одной категории. «SEO-аудит сайта» — это и информационный (что входит в аудит), и коммерческий (кто делает), и иногда транзакционный (заказать). Поэтому опытные SEO-специалисты смотрят не только на формулировку запроса, но и на текущий топ-10 Яндекса по этому запросу. Если в топе сидят коммерческие лендинги — Яндекс считает запрос коммерческим, даже если по форме он кажется информационным. Это и есть «реальный» интент, под который придётся затачивать страницу.

В нашей справке про семантическое ядро есть короткий разбор, как отличить интенты. На практике рабочий способ — при сборе СЯ сразу проставлять колонку «тип запроса» и колонку «тип сайтов в топе». Это помогает не тратить часы на запросы, по которым физически нельзя выйти в коммерческий топ-10.

Сбор через Яндекс Wordstat

Wordstat — главный бесплатный инструмент для оценки спроса в Яндексе. Это статистика запросов, которые пользователи реально вводили в поиск за последние 30 дней. Сервис показывает три полезных слоя: точное число показов по фразе с операторами, словосочетания, в которых встречалась фраза, и запросы, которые вводили те же пользователи.

Базовая работа выглядит так. Открываете Wordstat (wordstat.yandex.ru), вбиваете самый общий, «маточный» запрос вашей ниши — например, «SEO-продвижение». Сервис покажет общее число показов в месяц и список более детальных запросов с этой фразой: «SEO-продвижение сайта», «SEO-продвижение Москва», «SEO-продвижение цена» и так далее. Это базовый слой расширения. Дальше вы прокликиваете каждый дочерний запрос и углубляетесь — Wordstat показывает уже его внутреннюю структуру.

Чтобы цифры частотности не вводили в заблуждение, нужно знать операторы. Без кавычек запрос «SEO-продвижение» показывает все словосочетания, в которые входит эта фраза — частотность сильно завышена. В двойных кавычках «"SEO-продвижение"» — только запросы из этих двух слов в любых формах. С восклицательным знаком «"!seo-продвижение"» — точная форма без склонений и числа. Скобки и плюсы дают сложные операторы. Без операторов вы не увидите реальный спрос — все цифры будут «жирные», но непрактичные для планирования.

Wordstat также показывает географию (по регионам и городам) и сезонность (помесячная динамика за два года). Эти вкладки часто игнорируют, но именно они помогают понять, нужно ли создавать отдельные региональные страницы и в какой месяц запускать SEO под пик спроса. Например, для туристической ниши пик «отдых в Геленджике» приходится на май-июль — оптимизировать страницу зимой смысл всё равно есть, но контент-план под обновления стоит строить с учётом сезона.

Главное ограничение Wordstat — он не показывает запросы, которые ввели меньше определённого порога (обычно 5-7 показов в месяц), и сильно занижает данные для очень узких ниш. Поэтому Wordstat — это только база. Дальше нужны другие источники.

Поисковые подсказки

Поисковые подсказки — это те фразы, которые Яндекс автоматически предлагает дописать, когда вы начинаете вводить запрос в поисковую строку. По сути, это коллективная семантика: подсказки формируются на основе того, что пользователи на самом деле вводят чаще всего. Многие низкочастотные запросы, которые Wordstat округлил до нуля, всё равно попадают в подсказки — и именно они часто дают трафик.

Способ собирать подсказки бесплатно — открывать инкогнито-окно (чтобы подсказки не были «персонализированы»), последовательно вводить базовый запрос с каждой буквой алфавита на конце и руками записывать выпадающий список. Например, «SEO-аудит а», «SEO-аудит б», «SEO-аудит в»… Метод трудоёмкий, но даёт реальный срез пользовательских формулировок, которых нет в Wordstat.

В платных парсерах есть автоматический сбор подсказок — это многоуровневый процесс. Сначала собираются подсказки первого уровня, затем по каждой из них — второго уровня, потом третьего. На выходе вы получаете сотни и тысячи свежих вариаций, многие из которых имеют конкретные хвосты («…цена», «…в Москве», «…отзывы», «…2026»). Такие запросы — золото для длинного хвоста, потому что под них почти не бывает уникальных страниц у конкурентов.

Внимание к подсказкам особенно важно в нишах, где Wordstat показывает мало данных, но реальный спрос есть: молодые сервисы, узкие B2B-услуги, нишевые продукты. Например, для сбора базы ЛПР под B2B-продажи подсказки показывают десятки реальных формулировок — «база ЛПР по отраслям», «база ЛПР для холодных звонков», «база ЛПР с email», — которые в Wordstat теряются.

Парсеры и платные сервисы

Когда ниша становится шире одной страницы, ручной сбор семантики перестаёт работать. На сайт услуг с десятком направлений и тремя городами нужно тысячи запросов — руками это собрать невозможно. Здесь подключаются специализированные парсеры.

В Рунете де-факто стандартом много лет был Key Collector. Это десктопное приложение, которое одновременно работает с Wordstat, поисковыми подсказками, ЯндексДирект, Google, конкурентами и десятком других источников. Через KC удобно собирать огромные ядра, чистить, кластеризовать и выгружать в Excel. Минусы — высокий порог входа и необходимость покупать прокси для Wordstat.

Букварикс и Rush Analytics — облачные альтернативы. Они хороши тем, что не требуют локальной настройки и сразу выдают результаты по облаку. Букварикс особенно сильно в подборе подсказок и быстрых выгрузках. Rush Analytics — в кластеризации запросов на основе анализа топа Яндекса (то есть алгоритм смотрит, на каких страницах ранжируются разные запросы в текущей выдаче и группирует их).

Just Magic и Topvisor — менее популярны, но дают точные данные по конкурентам и историческую динамику позиций. Хорошо подходят для крупных проектов с длинной перспективой.

Для сайтов, где SEO — побочный канал, а не основной, можно обойтись связкой Wordstat + бесплатные базы подсказок (например, Bukvarix Free) + ручной анализ топа. Это медленнее на 3-5 раз, но не требует подписки. Для коммерческого SEO платный парсер окупается за первый же проект.

Семантика конкурентов

Самый недооценённый источник — это запросы, по которым уже ранжируются ваши конкуренты. Подход называется «реверс-инжиниринг семантики». Логика простая: если конкурент уже в топ-10 по сотне запросов и зарабатывает, значит, он уже сделал часть вашей работы — нашёл рабочую семантику.

Технически анализ делается через сервисы: Serpstat, SimilarWeb, SEMrush, Ahrefs, отечественные Rookee, Sape, SE Ranking, Topvisor. Вы вводите домен конкурента — сервис показывает список запросов, по которым этот домен присутствует в топ-100 Яндекса или Google, с позициями, частотой и оценкой потенциального трафика.

На что смотреть в первую очередь. Во-первых, запросы, по которым конкурент в топ-3 — это его «золотая» семантика, под которую заточены сильные страницы. Скорее всего, эти же запросы будут вашими целевыми. Во-вторых, запросы в позициях 11-30 — это запросы, по которым конкурент тоже борется, но ещё не выиграл. На них стоит обратить внимание, потому что здесь конкурентный барьер ниже. В-третьих, запросы, которые есть у двух-трёх конкурентов одновременно — это «золотая середина», подтверждённая ниша.

Опасная ошибка — слепо копировать всю семантику одного лидера. Чужой топ часто построен на ссылочной массе, возрасте домена и истории — повторить это технически нельзя за один квартал. Поэтому конкурентная семантика — это вдохновение и валидация ниши, а не план работ. Чтобы сравнить себя с конкурентами тематически, у нас есть отдельный инструмент анализа SEO-конкурентов — он показывает базовые срезы без подписки.

LSI-фразы и тематические соседи

LSI — это сокращение от Latent Semantic Indexing (латентно-семантическое индексирование). Изначально это академический термин из 1990-х годов, описывающий статистический метод выявления тематических связей между словами. В современном SEO «LSI-фразы» — это общеупотребительный, не вполне точный термин для «тематически близких слов и словосочетаний», которые делают текст полнее с точки зрения поисковой системы.

Современные алгоритмы (YATI у Яндекса, BERT и MUM у Google) понимают тему не через прямое совпадение ключевых слов, а через «семантическое поле» — какие термины, понятия и контексты появляются вокруг основной темы. Если страница про «SEO-аудит» содержит только фразу «SEO-аудит» десять раз, без упоминания смежных понятий (мета-теги, индексация, скорость, ошибки, отчёт, приоритеты), алгоритм считает страницу поверхностной.

LSI-фразы можно собирать несколькими способами. Сервисы вроде MegaIndex, Just Magic, Rush Analytics анализируют топ-10 Яндекса по основному запросу и выделяют слова, которые встречаются у большинства документов в топе. Эти слова — те самые «обязательные тематические соседи». Бесплатный способ — открыть 5-10 страниц из топа по своему запросу и руками выписать повторяющиеся понятия и формулировки. Это менее точно, но даёт хорошее интуитивное понимание темы.

На практике достаточно простого правила: если на странице про «семантическое ядро» ни разу не упомянуты Wordstat, кластеризация, частотность, минусовка, поисковый интент и хвост запросов — страница не закрывает тему полностью. Это сразу видно поисковику, и текст ранжируется хуже, чем у конкурентов, где эти понятия есть.

Минусовка: что отрезать и почему

Собрать «много запросов» — половина работы. Вторая половина — отрезать всё, что не относится к вашему бизнесу. Это называется минусовка, или минусация. Без неё ядро превращается в мусорку, в которой 20-40% строк забивают приоритеты ложными цифрами частотности.

Типовые категории минус-слов. Информационные хвосты, если ваша страница чисто коммерческая: «бесплатно», «своими руками», «самостоятельно», «инструкция», «как сделать», «реферат», «курсовая». Конкурентные навигационные запросы: упоминания брендов конкурентов («SEO-аудит ашманов», «продвижение пиксельплюс»). Чужая региональность: если вы работаете только по Москве, минусуете остальные города. Не-целевые типы контента: «отзывы», «вакансии», «работа», «зарплата», если у вас не страница отзывов или вакансий. Случайные подгонки темы: «SEO для детского сада», если ваш продукт — корпоративные сайты.

Технически в Key Collector и облачных парсерах есть удобные функции «отметить по списку минус-слов» — вы готовите файл со словами-стопами, и парсер автоматически помечает все строки, где они встречаются. После проверки помеченные строки удаляются из ядра одной кнопкой.

Минусовка делается итерационно: сначала первая большая зачистка, потом сбор подсказок и LSI, потом ещё одна минусовка, потом кластеризация. На зрелом ядре после двух-трёх проходов отсеивается обычно 30-50% исходного объёма — это нормальный показатель, а не «потеря данных».

Частотность и сезонность

В русскоязычном SEO принято делить запросы по частоте на три условные категории: высокочастотные (от 1000 показов в месяц по «!запросу» с восклицательным знаком), среднечастотные (от 100 до 1000), низкочастотные (до 100). Эти границы не зафиксированы официально — в крупных нишах планка ВЧ может начинаться от 10 000 показов, в узких B2B-нишах ВЧ — это уже 200 показов.

Важный нюанс: высокочастотные запросы редко напрямую приводят к покупке. По «SEO» в месяц десятки тысяч показов, но реальный спрос «заказать SEO-продвижение» — на порядок меньше. По узким и длинным запросам — наоборот, низкая частота, но высокая конверсия в заявку. Поэтому ВЧ-запросы хороши для главных и обзорных страниц, а СЧ и НЧ — для коммерческих посадочных и подразделов услуг.

Сезонность — отдельный слой, который многие игнорируют. Wordstat во вкладке «История запросов» показывает помесячные показы за последние два года. Это позволяет увидеть пики и провалы спроса: туризм пиково в мае-июле, юридические услуги стабильны, B2B-услуги часто проседают в декабре-январе, образовательные продукты пиково в августе-сентябре. Понимание сезонности влияет на план: что и когда оптимизировать, под какие месяцы наращивать контент, как распределять бюджеты.

В коммерческом SEO принято смотреть не только среднюю частотность, но и точную (с операторами) — она почти всегда в 2-5 раз меньше, чем «голая» цифра без операторов. Именно точная частотность реально показывает, сколько раз пользователи вводили именно эту фразу. Подробнее про то, как трактовать цифры — у нас в справке что такое SEO-ключи.

Кластеризация запросов

Кластеризация — это группировка похожих запросов в кластеры, каждый из которых будет оптимизироваться под одну страницу. Цель — не создавать отдельную страницу под каждый запрос (это плохо), а собрать запросы, которые пользователи воспринимают как варианты одного и того же интента.

Базовый пример. Запросы «SEO-аудит сайта», «технический SEO-аудит», «SEO-аудит онлайн», «SEO-аудит цена» — это варианты одного интента и должны жить на одной странице (с одной страницей в коммерческой выдаче, с одним H1 и расширенным TF-IDF). А запросы «SEO-аудит» и «SEO-проверка сайта» — это уже два разных кластера: топ Яндекса по ним показывает разные сайты, разные форматы выдачи, и в результате нужно две посадочные.

Существует два подхода к кластеризации. Лингвистический — запросы группируются по схожести написания (есть общие слова или нет). Просто, быстро, но часто ошибается на синонимах. Поисковый (по топу) — запросы группируются на основе того, ранжируются ли по ним одни и те же страницы в текущей выдаче Яндекса. Это самый точный способ — если по двум запросам в топе сидят одни и те же сайты с одними и теми же URL, значит, поисковик считает их одним кластером.

Поисковая кластеризация поддерживается всеми крупными платными сервисами (Rush Analytics, Key Collector с модулем кластеризации, Topvisor, Serpstat). Стандартный порог — «топ-10 пересекается на 3-5 URL». Можно настраивать жёстче (5 URL — крупные кластеры, надёжные) или мягче (3 URL — детальные кластеры, больше страниц).

После кластеризации каждый кластер получает «маркер» — самый частотный или самый показательный запрос внутри. Этот маркер обычно становится H1 и Title целевой страницы. Остальные запросы кластера — основа Description, мета-keywords (если ещё используются), подзаголовков H2 и тематического содержания текста.

Карта релевантности: привязка запросов к страницам

Финальный документ при сборе СЯ — это карта релевантности (или «структура запроса-страница»). По сути, это таблица: запрос — частотность — тип — кластер — посадочная страница. Карта релевантности нужна для трёх вещей. Первое — она превращает СЯ в план действий: становится понятно, какие страницы создавать с нуля, какие переоптимизировать, какие удалять или объединять. Второе — она позволяет копирайтерам писать тексты под конкретные запросы, а не «про тему вообще». Третье — она помогает в работе с разработкой: если страницы нет в карте, её нужно создать.

Типовая структура карты выглядит как таблица. В первой колонке — запрос. Во второй — точная частотность с восклицательным знаком. В третьей — тип запроса. В четвёртой — кластер. В пятой — URL посадочной (существующий или планируемый). В шестой — текущая позиция в Яндексе по запросу. В седьмой — приоритет (A — критично, B — важно, C — на потом).

Карта релевантности — живой документ. Она пересматривается раз в квартал: какие позиции выросли, какие просели, какие новые запросы добавить, какие потеряли актуальность. Без этого СЯ через год-полтора превращается в музейный артефакт, который никто не открывает.

Если сайт большой (магазин, маркетплейс, агрегатор), карту удобно вести не в Excel, а в специализированном инструменте: Topvisor, Rush Analytics, Allpositions. Эти системы автоматически снимают позиции по карте раз в неделю и показывают, какие кластеры растут, а какие падают. Подробнее про то, как превращать позиции в трафик и заявки, у нас есть отдельная справка про конвертацию SEO-позиций в трафик.

Частые ошибки сбора СЯ и анти-паттерны

Большинство «не сработавших СЯ» проваливаются по одним и тем же причинам.

  • Сбор без минусовки. Получается список на 5000 строк, из которых 40% — мусор. Менеджер видит большую цифру, бизнес платит за оптимизацию, эффекта нет.
  • Игнор интента. Запрос «SEO-аудит» заточили под информационную статью, а в топе — коммерческие лендинги. Страница не ранжируется не из-за текста, а из-за неправильного формата.
  • Слишком крупная кластеризация. Объединили «SEO-аудит» и «SEO-анализ» в один кластер — а Яндекс показывает по ним разные сайты. Одна страница тянет за собой обе темы, ни одну не закрывает на топ.
  • Слишком мелкая кластеризация. Каждый микро-запрос получил свою страницу. У сайта 800 страниц-однолистов с дублирующимся контентом, и Яндекс начинает их фильтровать как тонкий контент.
  • Семантика собрана один раз и забыта. Через год выдача поменялась, появились новые формулировки, конкуренты добавили подкластеры — а старое СЯ продолжает использоваться. Сайт постепенно теряет позиции.
  • Карта релевантности не привязана к структуре сайта. Запросы есть, страниц нет. Менеджер пишет «нужно создать», но никто не создаёт — потому что в задаче не сформулирован URL, шаблон, H1 и приоритет.
  • СЯ под только высокочастотные запросы. Бьются за «SEO-продвижение» (десятки тысяч показов) и не работают с «SEO-продвижение интернет-магазина одежды Москва» (50 показов, но конкретный коммерческий интент). Длинный хвост — ваш реальный заработок.

Чек-лист сбора семантического ядра

  1. Определить «маточные» запросы ниши — 5-15 самых широких слов.
  2. Расширить их через Wordstat: каждый маточный запрос разобрать на дочерние, проконтролировать частоту с операторами.
  3. Собрать поисковые подсказки по каждой маточной фразе (вручную или через парсер).
  4. Подтянуть семантику конкурентов: 3-5 ближайших, выбрать запросы с топ-30, привязанные к деньгам.
  5. Расширить через LSI-фразы и тематических соседей.
  6. Прогнать минусовку: убрать информационные хвосты в коммерции и наоборот, бренды конкурентов, не-целевые гео и тематики.
  7. Кластеризовать через топ Яндекса (или вручную для малых ниш).
  8. Привязать каждый кластер к посадочной странице (существующей или новой).
  9. Зафиксировать карту релевантности: запрос → частота → тип → кластер → URL → текущая позиция → приоритет.
  10. Поставить план: какие страницы создавать, какие переписывать, в каком порядке.

После всего этого начинается собственно SEO-работа: тексты, мета-теги, перелинковка, технический аудит, ссылочное. Но без проработанной семантики все эти работы похожи на стрельбу из ружья по воробьям — попасть можно, но эффект случаен. Если хотите проверить, насколько ваша текущая структура сайта совпадает с реальным спросом — это входит в обычный технический и контентный SEO-аудит.

Семантика под задачу

Помогу собрать СЯ и карту релевантности под ваш сайт

Подберу маточные запросы, расширю через Wordstat, подсказки и конкурентов, кластеризую и привяжу к существующим и новым страницам. На выходе — рабочий документ с приоритетами под план SEO-работ.

Заказать SEO-аудит Сгенерировать ТЗ на страницу