Как обнаружить дубли страниц на сайте?

Как обнаружить дубли страниц на сайте?

Дубли страниц присутствуют практически на каждом сайте. У вас их нет? Давайте, проверим. Для начала, обозначим саму проблему:

Чем опасны дубли страниц?

Прежде всего, можно говорить об ухудшении индексации сайта, т.к дубли здорово раздувают его содержимое. Если на вашем сайте 100 статей, каждая из которых имеет хотя бы один дубль, то это увеличивает объем ресурса в два раза! А если статей у вас несколько тысяч, и дублируется каждая из них по несколько раз, в таком случае, ухудшение индексации закономерный процесс.

Дубли страниц влияют на показатели страницы. Трафик на основную страницу может быть совсем маленьким, а как пользователи будут заходить на ее клона, соответственно, весь трафик будет оседать там.

Кроме того, из – за дублей страниц, вы можете лишиться части естественных ссылок. Если информация стоящая, пользователь может поставить ссылку на страницу, если это будет страница – дубль, то ссылку вы потеряете.

Еще с одной неприятной ситуацией могут столкнуться «счастливые» обладатели страниц – клонов. Если поисковик посчитает дубль более подходящим под текущий запрос пользователя, он вполне может сменить каноническую страницу в выдаче на ее дубль.

Ситуация не из приятных, в этом случае страница может сильно просесть в выдаче.

Как обнаружить дубли страниц у себя?

Если вы добавили сайт в Google Webmasters, перейдите в панель инструментов – Вид в поиске – Оптимизация html. На картинке найдете интересующую вас информацию о повторяющихся мета - тегах и title:

панель веб

Советуем периодически делать такую проверку, чтобы всегда иметь информацию о дублях страниц.

Кроме того, вы можете увидеть совпадающие заголовки, если не являетесь владельцем ресурса. Даже когда доступа к панели инструментов у вас нет, на помощь придет seobuilding.ru. Кроме заголовков, можно посмотреть множество различных параметров. Для аудита, вбейте в строку поиска Google следующую фразу:

site: имя вашего сайта intitle:анализ сайтов.

У нас это выглядело так:

site: rodinalinkov.ru intitle:анализ сайтов

Оператор «site» поможет нам получить весь список проиндексированных страниц. Введите «site: имя вашего сайта», и можете проанализируйте выдачу. Если на вашем сайте настроены ЧПУ, а вы наблюдаете страницы с идентификаторами на конце, вероятно, это и есть дубль.

А если страниц на сайте слишком много, и проанализировать выдачу достаточно сложно? Здесь на помощь может прийти программа Xenu.

Очень сложно обнаружить дубли, когда статья попадает в несколько категорий. В панели Google Webmasters такие дубли вы не увидите, можете пропустить их и при анализе выдачи. В этом случае, лучше всего подойдет анализ части текста, при помощи «расширенного поиска», который присутствует и в Яндексе и в Гугле. Чтобы произвести такой анализ в Google, перейдите на страницу http://www.google.ru/advanced_search.

поиск

Если страниц на сайте слишком много, разбейте их для анализа по категориям и выберите из каждой по несколько страниц для анализа.

Что касается борьбы с дублями страниц на сайте, мы подробно обсуждали как это сделать при помощи robots.txt, мета тега robots, 301 редиректа в статье1 и статье2.

Еще остались вопросы по дублям страниц? Спрашивайте в комментариях.

Автор , на 20 февраля 2014 г. в Технические вопросы.

Расскажите друзьям:


Комментарии

Комментирование отключено.

Услуги
Спецпредложения

Подписка на блог

без спама, не чаще одного раза в неделю

Кто победит?

Яндекс.Браузер

Chrome