Что такое дубли страниц и как они влияют на поисковое продвижение?
Здравствуйте, уважаемые читатели моего блога. Сегодня у меня для вас очень важная статья. В статье я расскажу что такое дубли страниц, как они появляются, как дубли страниц влияют на ранжирование блога в поисковых системах, как их найти и удалить.
То есть если на вашем блоге есть две страницы с одинаковым содержимым, но с разным адресом, это дубли. Точно так же дублями страниц будут считаться две страницы с разным содержимым, но с одинаковым URL адресом.
Как дубли страниц влияют на ранжирование в поисковых системах
Поисковые системы жестко борются с дублями страниц на сайте, и как правило, сайты содержащие дубликаты страниц, теряют свои позиции в поисковиках. Но здесь есть одна особенность, Яндекс мягче относится к сайтам, содержащим дубли, и обычно дубликаты просто склеиваются и вылетают из поиска, не особо вредя всему сайту. С Google дело намного сложнее.
Западный поисковик намного быстрее индексирует новые страницы и очень негативно относится к дублям страниц. Сайты, которые содержат большое количество дублей могут ранжироваться значительно ниже.
Google может добавлять новые страницы как в основной, так и в дополнительный индекс. Основной индекс это как раз то, что должно быть в выдаче. А вот дополнительный индекс или как его еще называют сопливый индекс (Supplemental Index) содержит дубли страниц.
Поэтому мой вам совет: избавляйтесь от таких страниц!
Как появляются дубли страниц
Появляются дубли страниц по двум причинам:
1. Невнимательность вебмастера. Если у вас много страниц, вы можете по ошибке прописать одинаковые Title и Description, можно даже случайно одну статью опубликовать дважды.
2. Особенность CMS (движка блога). Любой движок имеет недостатки и способен генерировать дубли страниц и запрет таких страниц в robots.txt не гарантирует их отсутствие в индексе.
Дубли страниц в WordPress
Самые распространенные дубли в вордпресс это:
1. Страницы пагинации.
2. Страницы архивов и меток.
3. Страницы вложений attachment.
4. Страницы дублей комментариев – comments, replytocom.
5. Страницы RSS – feed.
Как я уже заметил выше, закрытие подобных страниц в robots.txt не гарантирует отсутствие их в выдаче. Но удалить их ведь как-то нужно. Как это сделать я обязательно расскажу чуть ниже. Но для начала нужно узнать есть ли подобные дубли страниц у вас на блоге.
Как найти дубли страниц
Самый простой и верный способ найти дубли страниц – ручной. Для этого введите в поисковую строку комбинацию:
Для Яндекс — host:sait.ru | host:www. sait.ru
Для Google — site:nazyrov.ru -site:nazyrov.ru/&
В появившейся выдаче нужно вручную посмотреть какие страницы присутствуют. Если увидите страницы, которых не должно быть в индексе, значит это дубли, убедиться в этом вы можете перейдя по такой ссылке.
Вот примеры дублированных страниц в выдаче:
В первом случае это дубли replytocom, во втором – страницы вложения attachment.
Как удалить дубли страниц WordPress
Удалить дубли страниц можно двумя способами:
1. Поставить в head дубля мета-тег <meta name=”robots” content=”noindex, nofollow”/>, a на правильную страницу прописать атрибут rel=”canonical”.
2. Поставить 301 редирект со страницы дубля на каноническую.
Я подробно сейчас не буду описывать как устранить каждый из дублей. Все это не поместится в одной статье. В будущем я это напишу а здесь размещу ссылки на инструкции.
Андрей приветствую! Читал я эту информацию, хорошая не спорю. А вот совсем не давно нашел еще решение проблемы дублей. Это решение плагином, но у меня к сожалению он не захотел работать. Вот скоро поставлю тестовый блог и там буду пробовать рекомендации Борисова.
Интересно, а что за плагин?
Скорее всего это плагин про который писал Борисов, в своей статье, который помогает отвечать на комменты других с помощью java скрипта!
Тот плагин решает только проблему дублей replytocom, но не скроет дубли — feed, category и т д.
Я вот тоже про дубли страниц прочитала статью у Борисова Александра. Я пока не делала ничего, просто отключила древовидные комментарии, не очень красиво смотрится, но это временно.) Курс этот буду 100% покупать, но не сегодня. Скидка хорошая у тебя.))
Очень люблю сестер Олсен, как увидела картинку, сразу фильмы с их участием поглядеть захотелось.)))
На молодом блоге приостанавливать конкурсы опасно.)) Даже большие блоги до сих пор делают конкурс, я имею ввиду комментаторов. Но ради эксперимента интересно будет поглядеть, что выйдет из этого.)
Я тоже думаю, что приостановка конкурса скорее всего негативно скажется, просто хочу проверить )))
Андрей, rich-energy.ru разве Дианы?
Может и мне сайт Сергея Стрелкова вписать URL как собственный?
Иван, я тоже не знаю почему Диана оставляет ссылку на блог Сергея Стрелкова. Может у нее спросим?
Иван, зачем Вы простите одно и тоже пишите везде, Вас задевает, что я ставлю ссылку Сергея???
Я уже Вам отвечала, что я работаю с Сергеем, и я его помощница! Неужели с первого раза Вам это было непонятно?))))) Так вот ответила еще раз! А это уже Ваше дело чью ссылку втыкивать…не надо меня провоцировать Иван, я Вам один раз ответила, зачем по 1000 раз об этом говорить?))
Андрей, ты еще не знаешь. Ссылку Сергея ставлю, потому что я работаю с ним, я его помощница.) Вот и все. Разве конкурс противоречит этому? По-моему любую ссылку можно ставить, не так ли??)) Это ведь мое право и только мне решать правда ведь?)
Не знаю что так этого Ивана цепляет, везде мне тычет какую ссылку ставлю, а мое дело какую ссылку ставить, понятно Вам Иван??? Приставучий какой 😀
Андрей прости, накипело просто, ну не понимает человек.)
Конечно это не противоречит правилам конкурса.
Надеюсь больше никогда и нигде Вы не будете задавать таких вопросов! Надеюсь теперь я доходчиво объяснила! Я живу в свободной стране, какую хочу ссылку такую и ставлю! Так то вот.))
Не будете*
Андрей исправь плиз ошибку, пишу быстро, на работе просто, клиенты ходят.)
Иван, кстати, раз Вам так хочется, тоже ставьте ссылку Сергей, нам же лучше будет. 😀
Как раз борюсь с дублями =)
Убрал из Robots.txt директивы с этим элементом — «?», из индекса Яндекса дубли выпали, а вот в Гугле пока держатся. Думал редактированием Роботса обойдусь, похоже что ещё потребуются некоторые действия…
Олег, одним роботсом здесь не обойтись, в примере роботса, который показывает Борисов, ты наоборот разрешаешь индексировать практически все на блоге, а запрещаешь уже на самой странице дубля. То есть если просто изменить роботс, это наоборот увеличит количество дублей страниц.
Я этот курс изучал, курс просто супер) Но у меня очень много было дублей и покамест все еще не убрались. Нужно много времени.
да, требуется время, чтобы дубли вылетели из индекса.
Я сделал все по инструкции как у Борисова на сайте написано. Где-то с месяц назад. Ничего так решение. Потихоньку дубли начали выпадать из индекса, сейчас еще репликонтов закрою и тогда можно включать древовидные комментарии будет.
P.S лиж-бы были эти комменты )))
🙂 Будут, главное качественный контент и общение с читателями.
Да, дубли страниц — это серьёзная головная боль начинающего блогера. Вроде не думаешь о них, хочется на потом проблему отложить, а они всё дублируются и дублируются прямо пропорционально растущим комментариям на блоге. Вот так, и наступает момент, что ищешь решение и исправляешь всё. Сейчас у меня в Гугле в половину меньше страниц, чем было, и это радует:)))
Стараюсь.
Кстати, сейчас проверил, дублей практически не осталось. Хорошо что почти в самом начале работы сайта сразу закрыл дубли. Месяц назад было дублей в три раза больше, чем записей на сайте. Теперь нету. Пойду ко я еще к Борисову схожу и включу наконец комменты с разветвлениями.
Спасибо за ссылку на урок, Андрей. Почти не разбираюсь в этой теме, а с дублями под фильтры угодить раз плюнуть. Так что пойду учиться!
Удачного обучения!
Тоже читала статью Александра Борисова, за что ему особая благодарность и установила плагин для формы комментариев. Раньше тоже показывало дубли, меня это тоже удивляло откуда они появляются. Александр помог в этом разобраться. По прочтении статьи сразу всё исправила.
Вообще дубли плохая вещь, было в практике такое что поисковики потом могут вместе с дублями и страницы со статей выкидывать из выдачи и тут уж приходиться побегать как следует
Важная информация. Когда узнал об этой проблеме, стал искать дубли в Maxsite CMS, но не нашёл.