Главная » Блог » Похожие URL-адреса могут стать причиной исключения страниц из индекса Google

Похожие URL-адреса могут стать причиной исключения страниц из индекса Google

12.03.2021

Ольга Коцофанэ, главный редактор блога Webpromo


5 марта на официальном YouTube-канале Google Search Central состоялась видеовстреча Google SEO. На ней была вновь затронута тема дублированного контента. Так, Джон Мюллер рассказал о методе прогнозирования, который Google использует для обнаружения дублей. Он заключается в том, что поисковая система осуществляет поиск дубликатов путем сравнения шаблонов URL. Это позволяет Google сэкономить ресурсы на этапе индексации и сканирования страниц. Однако есть один недостаток такого широкого подхода к поиску дублей. Если URL-адреса нескольких страниц на вашем сайте будут похожи, роботы могут расценить их как дубли и исключить из индекса Google, несмотря на то, что контент на самих страницах будет уникален.

Похожие URL-адреса могут стать причиной исключения страниц из индекса Google

 

Вот, что говорит Джон Мюллер о методе прогнозирования для поиска дублей:

«С нашей стороны есть несколько уровней, когда мы пытаемся понять, есть ли на сайте дублированный контент. Во-первых, когда мы смотрим на содержимое страницы напрямую и видим, что одна страница имеет одно содержимое, а другая страница — другое содержимое, мы должны рассматривать их как отдельные страницы. Другая вещь — это своего рода более широкий прогностический подход, когда мы смотрим на структуру URL-адресов веб-сайта. Ранее мы видели, что URL-адреса, которые выглядят похожими, имели одинаковое содержание. Затем мы, по сути, изучили шаблон и подтвердили, что URL-адреса, которые выглядят так, совпадают с URL-адресами, которые выглядят вот так.

Теперь даже не глядя на отдельные URL-адреса, мы иногда можем избавить себя от сканирования и индексации и просто сосредоточится на этих предполагаемых или очень вероятных случаях дублирования. И я видел, как это происходило с такими вещами, как города. Наши системы распознают, что то, что вы указываете в качестве названия города, не так актуально для фактических URL-адресов. И обычно мы изучаем такую ​​схему, когда сайт предоставляет много одного и того же контента с альтернативными названиями».



 

Что делать, если на разных URL-адресах находится дублированный контент?

В качестве ситуации с дублированным контентом, который вынужденно появился на разных URL-адресах, Джон Мюллер из Google привел такой пример:

«Может случиться так, что вы возьмете один город, а затем другой город в одном километре от первого, и страницы событий которые вы показываете для первого города будут точно такими же как и для второго, потому что одни и те же события актуальны для обоих этих мест. Также вы берете город, может быть, в пяти километрах отсюда, и снова показываете точно такие же события. И с нашей стороны, это может легко закончиться ситуацией, когда мы скажем, что мы проверили 10 URL-адресов событий, и этот параметр, который выглядит как название города, на самом деле не имеет значения, потому что мы проверили 10 из них, и он показал тот же контент. Тогда наши системы могут сказать, что, может быть, название города в целом не имеет значения, и мы можем просто проигнорировать его.»

В качестве потенциального решения этой проблемы Джон Мюллер из Google предлагает максимально ограничивать подобные ситуации с наличием дублированного контента.

«Итак, что я бы попытался сделать в таком случае? Посмотреть, есть ли у вас такого рода ситуации, когда присутствует сильное дублирование контента, и попытаться найти способы максимально ограничить это. Это можно сделать, используя что-то вроде rel canonical на странице и сказав: ну, этот маленький город, который находится прямо за пределами большого города; я установлю каноническое значение для большого города, потому что он показывает точно такой же контент.»



 

Полный ответ Джона Мюллера на видеовстрече:

 

Выводы

Джон Мюллер подытожил, что не считает описанный аспект дублированного контента большой проблемой. Также он отметил, что за дублированный контент нет никаких штрафов и он не относится к отрицательным сигналам ранжирования. В лучшем случае Google просто не проиндексирует повторяющийся контент. Однако большое количество дублированного контента, которое не связано с локализацией или спецификой темы, все-таки нежелательно.

 

Также читайте другие статьи в блоге Webpromo:

И подписывайтесь на наш Telegram-канал про маркетинг.

Последние материалы рубрики

Раздел Insights в Google Ads теперь доступен рекламодателям во...

Бета-версия страницы Insights в рекламном кабинете Google Ads была запущена в ноябре 2020 года для рекламодателей четырех стран. С 14 апреля 2021...

5 целей маркетинговых исследований: какие бизнес-задачи они решают

5 целей маркетинговых исследований: какие бизнес-задачи...

Что такое маркетинговое исследование, какие цели преследует и какие бизнес-задачи решает? В этой статье мы расскажем о пяти актуальных...

Бьюти-индустрия: 10 актуальных диджитал-трендов

Бьюти-индустрия: 10 актуальных диджитал-трендов

В этом статье мы подытожим диджитал-тренды на рынке бьюти-товаров — расскажем о 10 самых актуальных тенденциях, которые помогут...

Как подготовить реальный прогноз по органическому трафику

Как подготовить реальный прогноз по органическому трафику?

Перед тем как вкладывать деньги в продвижение сайта, важно просчитать плановые финансовые показатели и понять, выгодно ли бизнесу...

Остались вопросы?
Наши эксперты готовы ответить на них

Свяжитесь по указанному ниже телефону с нашим менеджером или воспользуйтесь услугой «Перезвонить мне». Мы свяжемся с вами в ближайшее время.

Каждый участник — мастер своего дела
Ценю Webpromo за гибкость
Команда Webpromo, как продолжение нашего отдела маркетинга
Спокоен за продвижение своих проектов в интернете