Главная » Блог » Похожие URL-адреса могут стать причиной исключения страниц из индекса Google

Похожие URL-адреса могут стать причиной исключения страниц из индекса Google

12.03.2021

Ольга Коцофанэ, главный редактор блога Webpromo


5 марта на официальном YouTube-канале Google Search Central состоялась видеовстреча Google SEO. На ней была вновь затронута тема дублированного контента. Так, Джон Мюллер рассказал о методе прогнозирования, который Google использует для обнаружения дублей. Он заключается в том, что поисковая система осуществляет поиск дубликатов путем сравнения шаблонов URL. Это позволяет Google сэкономить ресурсы на этапе индексации и сканирования страниц. Однако есть один недостаток такого широкого подхода к поиску дублей. Если URL-адреса нескольких страниц на вашем сайте будут похожи, роботы могут расценить их как дубли и исключить из индекса Google, несмотря на то, что контент на самих страницах будет уникален.

Похожие URL-адреса могут стать причиной исключения страниц из индекса Google

 

Вот, что говорит Джон Мюллер о методе прогнозирования для поиска дублей:

«С нашей стороны есть несколько уровней, когда мы пытаемся понять, есть ли на сайте дублированный контент. Во-первых, когда мы смотрим на содержимое страницы напрямую и видим, что одна страница имеет одно содержимое, а другая страница — другое содержимое, мы должны рассматривать их как отдельные страницы. Другая вещь — это своего рода более широкий прогностический подход, когда мы смотрим на структуру URL-адресов веб-сайта. Ранее мы видели, что URL-адреса, которые выглядят похожими, имели одинаковое содержание. Затем мы, по сути, изучили шаблон и подтвердили, что URL-адреса, которые выглядят так, совпадают с URL-адресами, которые выглядят вот так.

Теперь даже не глядя на отдельные URL-адреса, мы иногда можем избавить себя от сканирования и индексации и просто сосредоточится на этих предполагаемых или очень вероятных случаях дублирования. И я видел, как это происходило с такими вещами, как города. Наши системы распознают, что то, что вы указываете в качестве названия города, не так актуально для фактических URL-адресов. И обычно мы изучаем такую ​​схему, когда сайт предоставляет много одного и того же контента с альтернативными названиями».



 

Что делать, если на разных URL-адресах находится дублированный контент?

В качестве ситуации с дублированным контентом, который вынужденно появился на разных URL-адресах, Джон Мюллер из Google привел такой пример:

«Может случиться так, что вы возьмете один город, а затем другой город в одном километре от первого, и страницы событий которые вы показываете для первого города будут точно такими же как и для второго, потому что одни и те же события актуальны для обоих этих мест. Также вы берете город, может быть, в пяти километрах отсюда, и снова показываете точно такие же события. И с нашей стороны, это может легко закончиться ситуацией, когда мы скажем, что мы проверили 10 URL-адресов событий, и этот параметр, который выглядит как название города, на самом деле не имеет значения, потому что мы проверили 10 из них, и он показал тот же контент. Тогда наши системы могут сказать, что, может быть, название города в целом не имеет значения, и мы можем просто проигнорировать его.»

В качестве потенциального решения этой проблемы Джон Мюллер из Google предлагает максимально ограничивать подобные ситуации с наличием дублированного контента.

«Итак, что я бы попытался сделать в таком случае? Посмотреть, есть ли у вас такого рода ситуации, когда присутствует сильное дублирование контента, и попытаться найти способы максимально ограничить это. Это можно сделать, используя что-то вроде rel canonical на странице и сказав: ну, этот маленький город, который находится прямо за пределами большого города; я установлю каноническое значение для большого города, потому что он показывает точно такой же контент.»



 

Полный ответ Джона Мюллера на видеовстрече:

 

Выводы

Джон Мюллер подытожил, что не считает описанный аспект дублированного контента большой проблемой. Также он отметил, что за дублированный контент нет никаких штрафов и он не относится к отрицательным сигналам ранжирования. В лучшем случае Google просто не проиндексирует повторяющийся контент. Однако большое количество дублированного контента, которое не связано с локализацией или спецификой темы, все-таки нежелательно.

 

Также читайте другие статьи в блоге Webpromo:

И подписывайтесь на наш Telegram-канал про маркетинг.

Последние материалы рубрики

Конверсия продаж онлайн и офлайн: простая формула + пример расчета

Конверсия продаж онлайн и офлайн: простая формула + пример...

Определение понятия конверсии продаж. Как правильно делать расчет и повысить эффективность маркетинговой стратегии?

Как оптимизировать изображения на сайте: практические рекомендации от названия до микроразметки

Как оптимизировать изображения на сайте: практические...

Уверены, что знаете как оптимизировать картинки на сайте? Какие основные требования поисковых систем к изображениям на сайте? Как...

Модель аукциона первой цены: нововведение от Google AdSense

Модель аукциона первой цены: нововведение от Google AdSense

Модель аукциона первой цены от Google AdSense упростит процесс покупки рекламных мест на сервисе.

Google Analytics 4 обновился: интеграция с Search Console, атрибуция на основе данных и достижение маркетинговых целей

Google Analytics 4 обновился: интеграция с Search Console, атрибуция на...

Что обновили в Google Analytics 4? Как интегрировали Search Console, изменили модель атрибуции, а также какие представили новые две модели машинного...

Остались вопросы?
Наши эксперты готовы ответить на них

Свяжитесь по указанному ниже телефону с нашим менеджером или воспользуйтесь услугой «Перезвонить мне». Мы свяжемся с вами в ближайшее время.

Каждый участник — мастер своего дела
Ценю Webpromo за гибкость
Команда Webpromo, как продолжение нашего отдела маркетинга
Спокоен за продвижение своих проектов в интернете