Контакты

Как избавиться от дублей страниц wordpress. Как избавиться от дублей WordPress. Используем плагин Yoast SEO

» я рассказывал, что такое дубли и как их можно найти. В этой статье я хотел бы осветить тему того, как можно убрать дубли с Вашего сайта, воспользовавшись рядом плагинов или обычным кодом. Сразу хотелось бы сказать, что индексацией дублей в основном страдает поисковая система (ПС) Google, даже не смотря на то, что они запрещены в файле robots.txt . ПС Яндекс работает по своему алгоритму и меньше воспринимает подобный контент. Итак, приступим.

Дубли ответов на комментарии — replytocom

Самые распространенные дубли в WordPress — это так называемый replytocom , который появляется, когда на сайте включены древовидные комментарии. Если приглядеться на ссылку «Ответить на комментарий», то можно проследить наличие данного вида дублей. С одной стороны это удобно, ведь пользователь может ответить на чей либо комментарий и видеть структуру ответов. С другой стороны это очень пакостная вещь, поскольку replytocom порождает ни один, а как правило несколько дублей. К примеру, на Вашем сайте есть 500 комментариев, значит имеется как минимум 500 дублей.

Для того, чтобы убедиться в наличие дублей replytocom , можно перейти по следующему URL адресу: http://sitename.ru/название_поста?replytocom=какое_то_число. Теперь в адресной строке можно наблюдать что то подобное этому: http://sitename.ru/название_поста/#comment=какое_то_число.

Кроме того, в WordPress существуют еще ряд дублей, к которым относятся:

  • feed;
  • page;
  • comment-page;
  • attachment;
  • attachment_id;
  • category;
  • trackback.

Каждый вид дублей соответствует техническим возможностям движка. Проверить их можно при помощи оператора site , о котором написано в .

Убираем дубли при помощи плагинов

На моей практике, мне приходилось пользоваться 3-я видами плагинов, которые помогают избавиться от дублей в WordPress.:

  • All in One Seo Pack . После установки в разделе Общие настройки нужно поставить галочку Канонические Url .
  • Yoast Seo . В настройках плагина ставим галочку Убрать replytocom ;
  • Ark hidecommentslinks . Данный плагин позволяет закрыть ссылки на сайты комментаторов, а также убрать replytocom из ссылки ответа на комментарий. Не имеет настроек.

Убираем дубли при помощи кода

Чтобы убрать дубли при помощи кода нужно отредактировать 3 файла — robots.txt , .htaccess и functions.php . Для тех кто не знает, первые два файла находятся в корне сайта, а третий файл лежит в папке с активной темой.

В статье « » я писал о том, как его правильно настроить. Некоторые же оптимизаторы советуют изменить содержимое robots.txt на следующее:

User-agent: * Host: sitename.ru Disallow: /wp-feed Disallow: /wp-includes Disallow: /wp-content/cache Disallow: /wp-content/plugins Disallow: /wp-content/themes Sitemap: http://sitename.ru/sitemap.xml User-agent: YandexImages Allow: /wp-content/uploads/ User-agent: Googlebot-Image Allow: /wp-content/uploads/

Вместо sitename.ru должен быть прописан домен Вашего сайта.

На следующем шаге открываем файл.htaccess и после строки RewriteRule ^index\.php$ - [L] добавляем следующий код:

RewriteCond %{QUERY_STRING} ^replytocom= RewriteRule (.*) $1? RewriteRule (.+)/feed /$1 RewriteRule (.+)/attachment /$1 RewriteRule (.+)/comment-page /$1 RewriteRule (.+)/comments /$1 RewriteRule (.+)/trackback /$1 RewriteCond %{QUERY_STRING} ^attachment_id= RewriteRule (.*) $1?

Теперь, что еще осталось сделать, это добавить следующий код в файл functions.php:

Function add_meta_noindex_nofollow () { if (is_paged()) { echo "".""."\n"; } } add_action("wp_head", "add_meta_noindex_nofollow", 3);

Код вешаем на хук wp_head , и теперь на страницах с пагинацией будет выводиться meta-тег, запрещающий их индексацию.

Избавимся от дублей страниц!

Есть два способа избавиться от дублей WordPress

Избавиться от дублей в отдельном шаблоне
1. От якоря «more» избавляемся через добавление функции в шаблон сайта.
Для этого, заходим в корневой каталог сайта

2. От якоря «more» избавляемcя через добавление функции — в WordPress (этот способ хорош тем, что данная функция действует, вне зависимости от того, какой шаблон используется на сайте)
Через файл post-template.php

$output .= ‘ link\»>$more_link_text»;
Заменить эту строку на
$output .= ‘ link\»>$more_link_text»;

Вот, собственно, и вся работа по избавлению от дублированных страниц (анонса, дублированного контента). Но есть еще и другой вид дубляжа: черновики, копии страниц, которые создаются каждый раз при редактировании записей, копии страниц с комментариями. Все это и многое другое, все дублированные страницы висят мертвым грузом на сайте — этот баласт нужно сбрасывать!

Есть плагин-чистильщик! Плагин «WP-Optimize»
Установите его на блог. Он настроек не требует — прост в обращении.

Плагин уберёт любой мусор из блога, как только вы ему это поручите. Он очень хороший чистильщик! Когда он удалит все «завалы» из таблиц и баз, так сайт сразу повеселеет. Удаляет этот Оптимизатор всю накопившуюся свалку одним кликом мышкой по нему. В открывшемся окошке плагина расставляете птички-галочки и жмете на кнопку «Очистить».

На удаление дублированных страниц у плагина уходит всего несколько секунд. После чего, в верхнем левом углу появляется запись, сколько и чего было удалено за одно действие.

Уборку помещений делать необходимо, с этим никто никогда не спорит. Делать уборку своих сайтов тоже периодически необходимо. Избавляться от дублей и расчищать территорию от мусора — это по-сути, одно и тоже.

P.S. Поделись со мной своими мыслями вслух, оставь свой комментарий! Мне кажется, что если сейчас эта проблема «лишнего баласта» перед сайтом остро не стоит, то это только до поры — до времени. Наступает момент, когда сервер станет перегруженным «дальше некуда» и сайт начнет работать неповоротливо, а загрузка страниц будет происходить всё медленнее. В один, не самый прекрасный день, вы получите уведомление от вашего хостинг-провайдера, что лимит базы исчерпан и нужно расширять DNS, менять тарифы. Мы с вами знаем, что есть иной способ — Сайт можно оптимизировать, облегчить.

  1. Для этого нужно, во-первых, избавиться от дублированных страниц, дублированного контента.
  2. А, во-вторых, оптимизировать сайт при помощи кеширования его содержимого — текстовых и графических файлов.

Майя Славская

Привет всем! Вы наверное слышали о дублей страниц на сайте? Возможно даже кто-то знает, что из-за него можно получить бан от Яндекса и вляпаться в АГС, из которого выйти тяжеловато. Сейчас расскажу и покажу как убрать дубли страниц wordpress на своих сайтах и как провести SEO оптимизацию своего блога. Также в комментариях разыграем 200 рублей среди читателей, читаем статью:

Предисловие

Многие хотят получить сверх результаты в SEO, протолкать свой блог в ТОП-10. Всё это реально и очень просто, если у вас уже оптимизирован сайт под seo и контент отличного качества и он также оптимизирован. Если про контент я достаточно много говорил , а как оптимизировать , то сейчас разговор пойдет про оптимизацию блога.

Как убрать дубли

Шаг-1

Для начала нам нужно будет создать файл robots.txt и настроить его, я про это уже писал, поэтому сейчас переходим на статью " " и внедряем информацию.

Шаг-2

Создать карту сайта , вот . Для этого нам нужно будет установить плагин... Блин, очень долго объяснять куда тыкать, кликать и т.д., лучше посмотрите мой скринкаст и выполните задание:).

Шаг-3

Скачать плагин "SEO всё в одном ", возможно он уже есть у вас, ибо это базовый плагин, должен стоять на каждом блоге!

Переходим в настройки плагина и ищем нужные нам галочки и отмечаем их:

Формула :

  • Заголовок : "Название сайта - КС" или слоган, или "КС - название сайта"
  • Описание : "КС + фигня. Фигня + КС"
  • КС : "КС, КС, КС..." Только которые встречаются на сайте, не более 20-ти.

КС - ключевое слово, к примеру "раскрутка блога", ищем на wordstat.yandex.ru

Фигня - слова, которые не встречаются на вашем сайте, их еще IDF называют.

P.S. Ключевое слово для главной страницы желательно выбирать популярное и высокочастотное.

Шаг-4

Дубли страниц мы уже убрали, но давайте улучшим результаты. Прописываем нижнее меню:

У меня лично это прописано в Подвале footer.php , пример:

Шаг-5

Чтобы окончательно добить, припишем к каждой странице и статье нашего блога ссылку на главную, пример:

Использую плагин Wp-Insert для интеграции кода, там же можно исключить ненужные статьи и страницы (контакты, курсы и т.д.), через него выведены социальные кнопки

Но последние 3-4 статьи я использую Социальный замок , он превзошел все мои ожидания и поэтому нужно сейчас мне переделывать пол блога под него и добавлять в каждую статью, чтобы заново включить плагин или простой найти второй.

Очень важно : не забывайте перед тем как что-то сделать на блоге - создать резервную копию сайта!!! Чтобы в случае непредвиденного можно было вернуть всё назад.

Как это всё сделать за 1 минуту?

Некоторые мою информацию поймут с полу слова, ибо делать тут нечего, раз и всё :). Но это для тех, кто уже в теме, кто создает сайты и хоть как-то в них разбираться. Если у вас время - внедряйте все 5 шагов и будьте счастливы, не так трудно разобраться, пишите в комментариях если что-то не смогли сделать или в чем-то не разобрались - поможем.

Но дело не в этом, недавно мне написала моя клиентка, текст был примерно следующий: "Здравствуйте, Михаил, купила вашу книжку по защите сайта, но что-то не получается, или просто не хочу. Мне нужно сделать всё что там написано + убрать дубли и оптимизировать сайт, сколько стоит?".

За 1000 рублей я полностью защитил ей сайт, оптимизировал его под SEO и убрал дубли, также мелкие доработки по сайту. Много это ли мало? Я думаю, что мало.

Сами представьте, если вы совсем не понимаете что и куда тыкать, то на внедрение может уйти неделя, а то и больше. Да, во мне также просыпается "всё сделаю сам", но после ряда ошибок я заказываю специалиста, который за 10 минут решает мои проблемы. Где-то уже писал про то, как я три дня Wi-Fi настраивал:).

Хотите ли вы закрыть все технические проблемы с Вашим сайтом? Чтобы далее не читать "как настроить...", "как защитить wordpress", "как ускорить wordpress", "как настроить плагин....", "как...".

А уже сейчас развивать проект в нужном русле, создавать и публиковать контент, создавать рассылки и набирать подписчиков, которым вы можете предложить свои услуги и заработать?

Обратиться к специалисту, который сделает всё в лучшем виде, который на этой оптимизации собаку съел:). Для которого будет в кайф помочь вам, ибо это его любимая работа.

Что будет сделано? Если проще - закрою все ваши технические проблемы на wordpress сайте: защита сайта, ускорение, убрать дубли, seo оптимизация и если нужно что-то еще - сделаю.

Цена: 1000 рублей за проект, если нужно будет еще что-то эдакое сделать - цена немного выше.

Кто будет делать? Два персонажа: я и мой напарник, который постоянно мешает, ест, спит, а потом грызет мне ногу:

Куда обратиться - либо в

Всем привет! На днях обнаружил баг в WordPress, который создает бесчисленное множество дублей страниц. Проблема касается всех, у кого есть сайты на этой CMS. Да-да, многими любимый движок может создать большое количество идентичных документов.

Напугал? Не переживайте =) . Баг, действительно, серьезный, но исправить его можно достаточно просто. Ниже я расскажу, что это за зверь и как от него избавиться.

И вот, зайдя в статистику для блога, был неприятно шокирован - сотни дублей несуществующих документов.

Оказывается, если к любому посту в блоге добавить любые цифры, то WordPress создаст такую страницу - она будет идентична основной записи. Баг с постраничной навигацией отдельных постов - сотни или тысячи вероятных дублей.

На таких страницах нет мета-тега robots и есть canonical, который в качестве канонического документа указывает именно дубль.

Проверьте, у вас также?

Усугубляет ситуацию связь с плагином All in one SEO pack, который дополнительно дает ссылку на предыдущую запись: поисковый робот не только заходит, по сути, на несуществующую страницу, но и начинает ходить по другим таким же. Добавлялось и удалялось сотни подобных "постов".

Я начал копать глубже и создал топик на wordpress.org. Оказалось, что еще в 2014 был баг при создании многостраничных постов с помощью тега . Тогда также создавались несуществующие документы, но canonical для 2-й, 3-й или последующих страниц, наоборот, указывали всегда на первую, то есть не индексировались.

Начиная с WordPress 4.4 баг с canonical убрали (у каждой "пагинированной" страницы поста появился свой каноникал), а вот ошибку с созданием несуществующих документов не убрали. Поэтому сейчас индексируется больше, чем нужно .

Что делать и как убрать дубли?

Сперва, хочу сказать, что в одной из ближайших версий вордпресса этот баг постараются исправить.

Пока же нам придется убирать его, так называемыми, "костылями" . Существует 2 варианта.

1) Плагин After Last Page Fix от Белотицкого Юрия. Скачать можно . Установка в один клик, настроек нет. Скрипт вместо создания множества дублированных документов отдает 404-ошибку. На мой взгляд, самый удачный вариант. Недостатки:

  • плагин добавляет дубль rel="canonical";
  • и shortlink.

2) Дополнительная настройка All in One SEO Pack. Разработчики этого плагина, скорее всего, оказались в курсе данного бага и в новых версиях появились дополнительные чекбоксы.

Несуществующие записи будут создаваться, но в них будет указан мета-тег robots, запрещающий их индексирование.

В других SEO-плагинах для wordpress не смотрел. Вероятно, в Yoast SEO или подобных будут такие же настройки. UPD . Да, действительно, в плагине от Yoast прописывается каноникал на основную запись.

Вот и все ! Баг достаточно серьезный, но исправляется, можно сказать, в один клик. Вам остается проверить, создаются ли у вас подобные страницы. Если да, то выбрать один из вариантов решения проблемы.

Получается, что, обновляясь на новую версию wordpress, не только устраняешь старые ошибки CMS, но можешь и получить новые. Интересно, какая у вас версия движка и создаются ли такие несуществующие посты? Поделитесь статистикой в комментариях .

Понравилась статья? Поделитесь ей