Всем привет, сегодня мы поговорим о дублях и к чему приводит их наличие.
Что такое дубли на сайте
Дубли страниц – это повторяющиеся html-страницы, как правило не отличающиеся содержанием (контентом), но имеющие разные URL-адреса. Например, к дублям можно отнести пагинацию на сайте.
Пример дублей главной страницы:
Site.ru
Site.ru/index.html
Чем опасны дубли страниц
Жили бы себе спокойно сайты с дублями и все, но поисковые системы Яндекс и Google не учитывают такой тип документов. Почему? Во многом потому что пользователи не хотят видеть однотипную информацию. Соответственно многие документы могут просто не появится выдачи.
Откуда берутся дубли
Большая часть дублей возникает в CMS системах, в частности Joomla, OpenCart. У меня был опыт работы с сайтом на CMS Opencart, если честно, то ничего хуже я не видел. Правда нужно понимать, что в проекте стояла старая версия 1.5 и в обновленной версии якобы этих проблем уже не должно было быть. На примере Joomla в обновленных версиях они избавились от этих проблем.
Приведу пример дублей на Opencart:
Site.ru/category/tovar1/
Site.ru/category/obuv/tovar1/
Site.ru/category/112/tovar1
Что касается других популярных платформ CMS Wordpress и Битрикс дубли не встречались.
Пользователь может создать дубль, т.е. одинаковый контент, но с разным URL адресом. Этот вид дублей тоже негативно сказывается на сайте в поисковой выдаче.
Как найти дубли на сайте
Яндекс Вебмастер
Чтобы увидеть все проиндексированные дубли необходимо зайти во вкладку Индексирование-> Страницы в поиске. Далее выбираем Исключенные страницы.
Мы видим, что подавляющее большинство дублей появляется из-за UTM-меток и счетчиков сервиса K50. В принципе это не так критично, необходимо просто прописать в Disallow определенный параметр, но об этом чуть позже.
Читайте в нашем блоге: Rel Canonical – как правильно использовать
Google Search Console
Сервис от Google так же стоит использовать при нахождении дублей. Для этого заходим в Search Console выбираем вкладку Вид в поиске -> Оптимизация HTML.
Дубли метаописания тегов Description и Title разбиты на отдельные вкладки что позволяет нам разово посмотреть на все ошибки.
Итак, чтобы посмотреть дубли по метоописанию кликаем на соответствующую ссылку.
При нажатии на Метоописание увидим сколько всего дублей по Description встречается на сайте.
Как убрать дубли
Избавиться от дублей можно только поняв откуда они идут. В большинстве случаев это ошибки со стороны CMS. Поэтому давайте разберем несколько вариантов решения проблемы.
301 редирект
Применим в том случае, если у нас небольшое количество дублирующих страниц. Для этого нам понабодится файл htaccess, где мы и пропишем редиректы с дублей на трастовые страницы.
Robots.txt
Многие дубли имеют шаблонную структуру особенно это касается CMS OpenCart. До тех пор, пока ошибки платформы не будут исправлены, закрыть это дело можно через robots.txt прописав Disallow.
Rel Canonical
Этот метод применим при пагинации на страницах категории в интернет-магазинах.
Исправить ошибки в CMS
В любом случае описанные выше методы носят непостоянный характер и необходимо разбираться с платформой на которой находится ваш сайт. Для этого при создании сайта необходимо подойти подготовленным к выбору CMS учесть все за и против с точки зрения SEO. Лично я советую использовать Wordpress и Bitrix (для ИМ).
Читайте в нашем блоге: Разработка сайта под дальнейшее SEO-продвижение
Частые вопросы
Будет ли являться ссылка вида site.ru/page1/#blok1 дублем site.ru/page/ ?
Ответ: Нет не будет, так как хэштег # не воспринимается Поисковой системой как за дубль.
Заключение
Удаление дублей на сайте важная составляющая технической оптимизации сайта. Поэтому постарайтесь уделить особое внимание к выбору платформы, в дальнейшем это сэкономит вам деньги и время. Пишите в комментариях, если кому что не понятно.