Ранжирование страниц: алгоритмы, апдейты и сбои в работе

Ранжирование страниц: алгоритмы, апдейты и сбои в работе

Ранжирование – весьма сложный алгоритм работы поисковых машин, в котором учтены десятки тысяч всевозможных факторов, влияющих на сортировку страниц Интернета в порядке снижения их значимости для пользователей.

Процесс ранжирования условно подразделяется на два основных этапа:

  • определение страницы, которая лучше остальных соответствует запросу;
  • вычисление коэффициента соответствия для каждой страницы

Как правило, на одном ресурсе может располагаться несколько страниц, которые предлагают различные ответы на запрос пользователя. Из этих страниц робот выберет только одну, наиболее релевантную запросу.

Несколько страниц с одного сайта на запрос пользователя в поисковой выдаче можно увидеть крайне редко. Такие чудеса доступны лишь настоящим профессионалам поисковой оптимизации.

Коэффициент соответствия вычисляется роботом при помощи сложных каскадных формул с учетом всевозможных факторов и их комбинаций. Самым главным параметром оценки соответствия на сегодняшний день является релевантность контента введенному запросу с привязкой к региональной принадлежности ресурса.

Страницы, которые «просочились» сквозь сито первого фильтра впоследствии попадают под более пристальное рассмотрение и подвергаются более жесткому отбору. Чем выше коэффициент соответствия, тем больше фильтров участвует в процессе ранжирования, тем точнее становится итоговая оценка страницы.

При вычислении коэффициента релевантности поисковые машины руководствуются несколькими группами факторов. Давайте рассмотрим основные:

  • Группа статических факторов страницы. Число ссылок на страницу, возраст домена, возраст сайта, поведенческий фактор, юзабилити и т.п.
  • Группа факторов запроса. Признаки, способствующие уточнению запроса, факторы, влияющие на сортировку по типу запросов: коммерческий запрос, геопривязанный, транзакция, навигационный и т.п.
  • Группа динамических факторов. Это те факторы, которые связаны и с группой факторов запроса и с группой факторов страницы, как например: слова запроса в тексте страницы, количество и расположение слов запроса, наличие анкоров, их количество, объем общей информации на сайте по конкретному запросу.

Кроме факторов, которые положительно влияют на ранжирование страницы, способствующих увеличению релевантности, существуют еще и так называемые факторы пессимизации или намеренное, санкционированное занижение позиции в странице поисковой выдачи. Это, как раз те самые фильтры, которые из-за каких-либо серьёзных нарушений могут быть наложены на страницу или сайт.

После вычисления коэффициента соответствия, отобранные страницы сортируются между собой. Чем больше показатель релевантности, тем выше она окажется в выдаче по запросу.

Но в Сети, пожалуй, ежеминутно создаются новые страницы, информация на них обновляется, переносится на другие площадки и так далее.

Даже высокоинтеллектуальным поисковым роботам не угнаться за всеми изменениями. Таким образом, Поисковая Система вынуждена накапливать все происходящие изменения в своей базе. Затем, заархивированные изменения индексируются, и только после этого перенаправляются в базовый поиск. Весь процесс называют коротким словом – АПДЕЙТ.

Апдейты в разных системах поиска могут происходить с различной периодичностью, но, как правило, это случается примерно два раза в неделю, а в некоторых системах даже ежедневно.

Поисковая Система при обновлении своей базы данных учитывает несколько типов апдейтов, поочередно реализовывая каждый из них. Рассмотрим основные:

  • апдейт текстовой информации. Здесь учитываются изменения в тексте исходной страницы, переопределяется коэффициент релевантности. Такой апдейт связан с зачислением в индекс новых страниц или документов;
  • апдейт ссылок. Здесь происходит перерасчет веса проставленных ссылок. Учитываются новые ссылки, индексация новых ссылок;
  • апдейт региональных факторов;
  • апдейт поведенческих факторов;
  • апдейт тематического индекса цитирования (ТИЦ), где происходит его перерасчет для всех ресурсов. Такой апдейт, как правило, осуществляется один раз в два-три месяца.
  • апдейт поисковой выдачи. Такой апдейт происходит ежедневно с учетом всех возможных факторов, как внешних, так и внутренних.
  • апдейт показателей авторитета. Здесь учитывается ТИЦ, возраст, количество ссылок на страницу за определенный период, показатель PR.

Еще одним, существенным фактором, влияющим на позицию страницы в поисковой выдаче, является периодическое внесение изменений в алгоритмы ранжирования поисковых машин, когда начинают учитываться либо какие-то новые факторы, либо старые, но уже как-то иначе, по-новому. После таких изменений страница поисковой выдачи существенно изменяется, что не может не расстроить владельцев сайтов.

Наряду с вышеперечисленными факторами, влияющими на позицию страницы в ТОПе, имеют место и всевозможные сбои, способные неожиданно для всех занизить или завысить ранг сайта. К сбоям относятся:

  • сбои в работе серверов;
  • сбои в работе алгоритмов, проблемы с запуском алгоритма, недоработанный алгоритм;
  • сбои, связанные с внешними проблемами, потеря части данных при передаче, повреждение данных при переносе на базовый поиск и другие.

В случае если сбой имеет место, сразу же происходит откат выдачи. Другими словами, в выдачу запускается последняя сохраненная удачная конфигурация. В период сбоя все страницы возвращаются в индекс Поисковой Системы в течение двух недель.

Зная основные принципы ранжирования сайтов и некоторые признаки существующих сбоев в работе Поисковых Систем, вы значительно повысите свою производительность в области поисковой оптимизации. Дополнительное время, полученное по причине неожиданного перерасчета факторов ранжирования Поисковой системой, благоразумно и без паники используете для оптимизации своего сайта под новые требования. Продвигайтесь вместе с Родиной Линков!

Автор , на 12 ноября 2013 г. в Аналитика.

Расскажите друзьям:


Комментарии

Комментирование отключено.

Услуги
Спецпредложения

Подписка на блог

без спама, не чаще одного раза в неделю

Кто победит?

Google

Yandex