Главная » Блог » Похожие URL-адреса могут стать причиной исключения страниц из индекса Google

Похожие URL-адреса могут стать причиной исключения страниц из индекса Google

12.03.2021

Ольга Коцофанэ, главный редактор блога Webpromo


5 марта на официальном YouTube-канале Google Search Central состоялась видеовстреча Google SEO. На ней была вновь затронута тема дублированного контента. Так, Джон Мюллер рассказал о методе прогнозирования, который Google использует для обнаружения дублей. Он заключается в том, что поисковая система осуществляет поиск дубликатов путем сравнения шаблонов URL. Это позволяет Google сэкономить ресурсы на этапе индексации и сканирования страниц. Однако есть один недостаток такого широкого подхода к поиску дублей. Если URL-адреса нескольких страниц на вашем сайте будут похожи, роботы могут расценить их как дубли и исключить из индекса Google, несмотря на то, что контент на самих страницах будет уникален.

Похожие URL-адреса могут стать причиной исключения страниц из индекса Google

 

Вот, что говорит Джон Мюллер о методе прогнозирования для поиска дублей:

«С нашей стороны есть несколько уровней, когда мы пытаемся понять, есть ли на сайте дублированный контент. Во-первых, когда мы смотрим на содержимое страницы напрямую и видим, что одна страница имеет одно содержимое, а другая страница — другое содержимое, мы должны рассматривать их как отдельные страницы. Другая вещь — это своего рода более широкий прогностический подход, когда мы смотрим на структуру URL-адресов веб-сайта. Ранее мы видели, что URL-адреса, которые выглядят похожими, имели одинаковое содержание. Затем мы, по сути, изучили шаблон и подтвердили, что URL-адреса, которые выглядят так, совпадают с URL-адресами, которые выглядят вот так.

Теперь даже не глядя на отдельные URL-адреса, мы иногда можем избавить себя от сканирования и индексации и просто сосредоточится на этих предполагаемых или очень вероятных случаях дублирования. И я видел, как это происходило с такими вещами, как города. Наши системы распознают, что то, что вы указываете в качестве названия города, не так актуально для фактических URL-адресов. И обычно мы изучаем такую ​​схему, когда сайт предоставляет много одного и того же контента с альтернативными названиями».



 

Что делать, если на разных URL-адресах находится дублированный контент?

В качестве ситуации с дублированным контентом, который вынужденно появился на разных URL-адресах, Джон Мюллер из Google привел такой пример:

«Может случиться так, что вы возьмете один город, а затем другой город в одном километре от первого, и страницы событий которые вы показываете для первого города будут точно такими же как и для второго, потому что одни и те же события актуальны для обоих этих мест. Также вы берете город, может быть, в пяти километрах отсюда, и снова показываете точно такие же события. И с нашей стороны, это может легко закончиться ситуацией, когда мы скажем, что мы проверили 10 URL-адресов событий, и этот параметр, который выглядит как название города, на самом деле не имеет значения, потому что мы проверили 10 из них, и он показал тот же контент. Тогда наши системы могут сказать, что, может быть, название города в целом не имеет значения, и мы можем просто проигнорировать его.»

В качестве потенциального решения этой проблемы Джон Мюллер из Google предлагает максимально ограничивать подобные ситуации с наличием дублированного контента.

«Итак, что я бы попытался сделать в таком случае? Посмотреть, есть ли у вас такого рода ситуации, когда присутствует сильное дублирование контента, и попытаться найти способы максимально ограничить это. Это можно сделать, используя что-то вроде rel canonical на странице и сказав: ну, этот маленький город, который находится прямо за пределами большого города; я установлю каноническое значение для большого города, потому что он показывает точно такой же контент.»



 

Полный ответ Джона Мюллера на видеовстрече:

 

Выводы

Джон Мюллер подытожил, что не считает описанный аспект дублированного контента большой проблемой. Также он отметил, что за дублированный контент нет никаких штрафов и он не относится к отрицательным сигналам ранжирования. В лучшем случае Google просто не проиндексирует повторяющийся контент. Однако большое количество дублированного контента, которое не связано с локализацией или спецификой темы, все-таки нежелательно.

 

Также читайте другие статьи в блоге Webpromo:

И подписывайтесь на наш Telegram-канал про маркетинг.

Последние материалы рубрики

Новости Google

Новости и планы Google на 2022 год: MUM, искусственный интеллект и...

Технологии, которые Google планирует использовать в ближайшем будущем. Краткий обзор, что нужно знать об изменениях,

Популярность мобильных приложений

Исследование: как развивается рынок мобильных приложений?

Анализ мобильного рынка показывает, сколько сегодня пользователи тратят на покупку мобильных приложений. Какую сумму расходов...

Ключевые слова как фактор ранжирования Googl

Как Google ранжирует сайты? Ключевые слова как фактор

Насколько важно для Google наполнение ключевыми словами? Обновления Google, изменившие принципы SEO и критерии ранжирования сайтов

Статистика Social commerce

Статистика: как быстро растет популярность Social commerce?

Отчет Accenture прогнозирует, сколько процентов дохода будет поступать от Social commerce. Кто покупает в социальных сетях, а также самые...

Остались вопросы?
Наши эксперты готовы ответить на них

Свяжитесь по указанному ниже телефону с нашим менеджером или воспользуйтесь услугой «Перезвонить мне». Мы свяжемся с вами в ближайшее время.

Каждый участник — мастер своего дела
Ценю Webpromo за гибкость
Команда Webpromo, как продолжение нашего отдела маркетинга
Спокоен за продвижение своих проектов в интернете