Особенности создания карты сайта Sitemap. xml

Особенности создания карты сайта Sitemap. xml

Начнем с аргументов

Одно интересное исследование, которое можно наблюдать в таблице ниже, показывает список типичных ошибок при продвижении интернет – проектов.

ошибки сайта

Обратите внимание, что после неуникального контента, на втором месте расположилась карта Sitemap. Точнее, ее отсутствие или неправильная организация. Только потом, в списке ошибок названы отсутствие файла robots.txt, настройка зеркал и другие факторы.

Такое исследование показывает насколько важно для любого проекта иметь карту Sitemap. Кстати, название может быть и другим, суть от этого не меняется.

Исследование приведены для того, чтобы не утверждать голословно насколько необходима вашему сайту карта.

В качестве аргументов можно привести и другие факторы. Вспомните, как выглядели саты лет 5 – 10 назад. Это был наборы html файлов, в которых находилось все содержимое статей. Тогда, поисковые роботы просто заходили на сайт и индексировали все его содержимое, которое практически полностью состояло из текстового содержимого.

На сегодняшний день везде используются системы управления контентом CMS, поэтому поисковый робот уже при установке будет видеть тысячи файлов, хотя статей на сайте еще нет. Кстати, и само текстовое содержимое в таких CMS храниться в базе данных, а не в файлах, поэтому напрямую проиндексировать поисковик его не сможет. Это не говорит о том, что индексироваться ваш сайт не будет, конечно будет, вот насколько быстро и полно, это другой вопрос.

Решением в сложившейся ситуации и стало создание на сайте файлов robots.txt и карты Sitemap.xml. О первом файле мы говорили в предыдущих статьях, с его помощью вы можете закрыть ненужный контент от индексации, а вот при помощи второго файла вы ясно можете указать, где на вашем файле находиться контент поисковикам Яндекса и Гугла. Кстати, время, которое поисковые роботы тратят на индексацию не безгранично, и создание карты поможет им проиндексировать то, что нужно и не забыть ничего на задворках вашего сайта.

Отличие карты Sitemap.xml от Sitemap.html

Этот абзац будет коротким. Карта в формате html может находится в определенном пункте меню и представляет из себя обычный список всех материалов сайта, который доступен любому пользователю. Что касается карты в xml формате, то она скрыта от глаз посетителей и предназначена для поисковых роботов, которым указывает нужные для индексации страницы. Для создания такой карты используется специальный, понятный поисковым машинам синтаксис, где мы указываем материалы по степени важности (priority), дате последнего обновления(lastmod), частоте изменения(changefreq). Если отличия понятны, перейдем непосредственно к созданию карты сайта.

Создание карты Sitemap в формате xml

Обычно данный файл, в отличие от robots.txt, создают автоматическим способом. Нужные расширения в различных CMS существуют давно, ибо нереально при большом количестве страниц создать такую карту вручную. Кроме того, существуют специальные решения для создания Sitemap, в виде онлайн генераторов. Об этом будет следующий пост, сегодня же, разберем особенности создания самой карты.

Где находиться карта Sitemap? Вы можете найти ее по классическому адресу http://www.site.ru/sitemap.xml.

Где можно создать карту сайта? Сделать это можно на сайте http://www.sitemaps.org/ru/.

Создать карту вы можете в любом текстовом редакторе. Стандартная часть файла выглядить так:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

Далее, идет описательная часть сайта, которая заключается в теги «url». Обязательной здесь является только строка с адресом страниц сайта, которые необходимо проиндексировать, заключенная в теги

<loc>http://rodinalinkov.ru/</loc>

В описательном блоке может быть дата последнего обновления страницы:

<lastmod>2014-02-12T19:23:30+00:00</lastmod>

А также, частота ее обновления и приоритет индексации:

<changefreq>daily</changefreq>
<priority>0.5</priority>

Приоритет варьируется от 0 до 1. Если страниц много, с помощью указания приоритета можно обозначить те страницы, которые необходимо проиндексировать в первую очередь.

Что касается общего размера файла sitemap.xml, то он не должен весить больше 10 Мб и содержать более 50 000 ссылок. По идее, карту в 1000 ссылок уже стараются разбить на несколько файлов. В этом случае, поступают следующим образом: в robots.txt указывают индексный файл sitemap, где проставлены ссылки на остальные файлы карт.

Если опустить стандартный блок, см. выше, то выглядеть этот процесс будет так:

<sitemap>
<loc>http:// rodinalinkov.ru/sitemap.xml.gz</loc>
<lastmod>2014-02-12T19:23:30+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http:// rodinalinkov.ru/sitemap2.xml.gz</loc>
<lastmod>2014-02-12T19:23:30+00:00</lastmod>
</sitemap>

На сегодня все. О создании карты сайта на движках WordPress и Joomla, о плагинах в помощь веб мастеру будет следующий пост. Следите за обновлениями!

Автор , на 21 марта 2014 г. в Внутренняя оптимизация.

Расскажите друзьям:


Комментарии

Комментирование отключено.

Услуги
Спецпредложения

Подписка на блог

без спама, не чаще одного раза в неделю

Кто победит?

SEM

SMM