— Как-то странно про автоматические кластеризаторы сказано, потому что это вспомогательный инструмент. Он не принимает на себя окончательное решение о распределении запросов, там часто приходится отправлять результаты руками. Я про эту тему и на вебинаре рассказывал, и статью написал большую. Кластеризатор в данном случае выступает как вспомогательный инструмент, который предварительно может запросы сгруппировать по принципу выдачи серпа. А ты дальше уже смотришь, что, например, вот в этой группе вроде серп схожий, но она реально слишком большая, и я ее вручную почистил. Или смотришь, что вот эти две группы похожи, однотипные запросы — раскидал в разные, посмотрел, что семантическая близость достаточная, что конкуренция не особая, и объединил их в одну. То есть вот такие действия надо выполнять, нельзя копипастом заниматься. А логика — это абсолютно неприменимый путь просто потому, что логично смартфон и смартфоны продвигать на одной странице. Это разнотипные запросы. Смартфоны вообще даже геонезависимые. Когда ты пишешь «логика», нужно пояснять, в чем логика заключается, потому что обычно люди логически распределяют так: (посмотрел на запросы) «Так, вот это сюда, это сюда, а это — сюда». Дело в том, что люди, когда пользуются логикой, намного больше ошибок в распределении запросов допускают, чем кластеризаторы. Самое эффективное — это человек + кластеризатор. Наборы даже в 100 запросов очень сложно распределить, если делать это руками. Это огромный объем работы, поэтому нужно кластеризовать и снять типы запросов.
А такая информация, как количество главных страниц по запросу, есть ли витальные ответы, очень важна, потому что это ни разу не очевидно: может собирать витальный ответ типа «отзывы об отеле». Или, наоборот, сайт отеля может не являться витальным по запросу, и его можно с этого места потеснить. И выдается тематика запроса для того, чтобы можно было быстро принять решение, запрос про то или не про то.
На самом деле, даже в таких очевидных тематиках очень сложно сориентироваться. Например, «виолончель»: подойдет ли этот запрос для магазина музыкальных инструментов. Я, например, не смогу сразу ответить на этот вопрос. Соответственно, математическая классификация позволяет это все дело определять автоматически и разделять. Потом еще мы добавим геозависимость. Там просто сложнее реализация алгоритма, мы пока не успели его сделать. Следующее — оптимизация страницы, запросы. Здесь уже кластеризаторы вообще никак не помогут. Потому что кластеризатор максимум может дать информацию о том, по каким URL у тебя было посещение. И то, если он кластеризует по хард-методу. Потому что если он кластеризует по софт, кластеризует как Rush, у тебя в группе может не быть ни одного URL между двумя запросами. Это недостаток софт-метода кластеризации, из-за чего я его не использую. Здесь нужно работать при помощи текстового анализатора, потому что он за тебя анализирует топ и говорит, какие есть закономерности. А ты уже на основании этих данных принимаешь решение по оптимизации страниц. Вот как это работает.