Заглянем за ширму? Обратная сторона сниппетов или устройство поисковых систем

Заглянем за ширму? Обратная сторона сниппетов или устройство поисковых систем

В предыдущих статьях, посвященных теме поискового продвижения, была подробно раскрыта тема сниппетов, кратких рекламных объявлений, из которых состоит страница поисковой выдачи. Сниппеты – первое, что видит пользователь после того, как ввел свой запрос в строку поиска.

Идем дальше! Что там, за ширмой сниппетов?

Сегодня поисковые роботы умеют анализировать и обрабатывать более десятка тысяч запросов в секунду. Давайте же попытаемся разобраться в самой сути поисковых систем – их логическом устройстве. На визуальном, физическом плане, любая поисковая система – это довольно сложное образование из сотен тысяч, а то и более, физических серверов. По всему миру располагаются центры данных, между которыми распределяется надежно защищенная информация. Совсем еще недавно, в нашей стране, в 90-е годы, обработкой обращений занимался всего один (!) сервер, который располагался в кабинете у одного из учредителей поисковой системы Яндекс. Любой современный домашний компьютер в наши дни многократно превосходит его мощности. Шло время, серверов становилось все больше и больше, пока не возникла необходимость формировать дата-центры, в каждом из которых располагались тысячи серверов. Все центры, соответственно, объединялись в единую поисковую Сеть, что позволяло значительно ускорить поиск и выдачу необходимой информации по запросу и своевременно справляться с волной посетителей сервиса. Не лишним будет заметить, что за один месяц работы через поисковую систему проходит около 30 млн. человек.

Логические составляющие поисковых систем

Желая найти необходимую информацию по своему запросу, пользователь вводит слово или фразу в строку поиска. Первый в системе, кто встречает запрос пользователя – это балансировщик. Так называемый балансировщик нагрузки перераспределяет запросы пользователей по наименее загруженным секторам сервера или кластерам, что позволяет с большей эффективностью использовать имеющиеся вычислительные мощности. Работа балансировщика осуществляется автоматически, согласно заданным алгоритмам.

Следующим шлюзом, через который проходит запрос пользователя, является зона метапоиска. Сложная система уже имеющихся метаданных, расположенная в базе того или иного дата-центра, определяет, к какому типу данных относится конкретный запрос. Здесь осуществляется проверка орфографии, определение региона, из которого запрос пришел, и является ли данный запрос настолько значимым, чтобы выдавать по нему страницы региональных сайтов.

Запросы

Далее, уже в зоне метапоиска, осуществляется проверка на наличие идентичных обращений к системе за последнее время. В связи с определенными событиями, такими как значимые новостные происшествия, смена рекламной кампании крупной фирмой, появление нового бренда и т.п. многие запросы в этот период получают особенную популярность.

Есть и такие запросы, которые популярны постоянно (как правило, они связаны с соцсетями). Чтобы сократить нагрузку в такие периоды, ПС кэширует ответы на частые запросы и, в случае повторного обращения, выдает уже готовый результат, а не ищет ответы снова.

Но в случае, если ответ в кэше системой не обнаружен, то запрос передается далее на сервер, в базовый поиск, для формирования нового ответа. Пресловутая индексация начинается именно тут. Именно здесь, в зоне поиска по базам и расположен индекс, который разделен на отдельные фрагменты и распределен по другим серверам, поскольку поиск по частям осуществляется гораздо быстрее.

Каждый сервер, в свою очередь, имеет определенное количество копий, что позволяет сохранить информацию и снизить нагрузку. Такая мера предпринята в связи с тем, что некоторая информация может быть слишком востребованной в конкретный период, нагрузка на основной сервер значительно возрастает, и тут подключается рабочая копия основного сервера.

И только на этом этапе, когда каждым сервером базового поиска возвращены в зону метапоиска результаты, имеющие прямое отношение к запросу пользователя, включается алгоритм ранжирования. Алгоритм ранжирования распределяет, на какую позицию в странице поисковой выдачи поставить ту или иную ссылку.

Роботы поисковых систем

Все вышеперечисленные процессы, каждый из которых по-своему интересен и уникален, осуществляются так называемыми поисковыми машинами или роботами, которые условно классифицируются по типам. Из превеликого разнообразия существующих в наши дни поисковых роботов выделяют четыре основные категории:

– робот, осуществляющий индексацию

– робот, классифицирующий изображения

– робот, работающий с зеркалами (копиями) сайтов

– робот, анализирующий юзабилити и общую работоспособность страницы

Конечно же, существует довольно много и других категорий роботов, осуществляющих индексацию, и надо понимать, что, несмотря на невероятную работоспособность поисковых машин, процесс индексации, тем не менее, довольно длительный. Мало того, за ним, как правило, начинается не менее длительный процесс обновления индексных баз по всем серверам. Любые изменения, внесенные на сайт, становятся видимыми для поисковиков только лишь через 1-2 недели. Поэтому, как только ваша страница или сайт готовы, их тут же нужно запускать на индексацию. Чем раньше вы это сделаете, тем быстрее ваш сайт окажется в верхних позициях страницы поисковой выдачи.

Не менее важным фактором в поисковой оптимизации является и скорость оперативного вмешательства. Зачастую код многих сайтов приходится оптимизировать под поисковые системы, чтобы сайты быстрее индексировались и, соответственно, попадали в ТОП.

Вы всегда можете доверить это непростое дело специалистам Родины Линков, чем гарантированно сэкономите и финансовые расходы, и время.

Автор , на 3 ноября 2013 г. в SEO исследования и тенденции.

Расскажите друзьям:


Комментарии

Комментирование отключено.

Услуги
Спецпредложения

Подписка на блог

без спама, не чаще одного раза в неделю

Кто победит?

Google

Yandex