Как Google находит дублированный контент без сканирования веб-страниц

Дата публикации: 2018-03-13

От автора: Джон Мюллер рассказал, как Google может определять наличие дублированного контента еще до прохода публикаций сайта поисковым роботом. При этом учитывается одинаковые параметры URL веб-страниц и производится анализ атрибутов разметки.

Во время очередной видеоконференции с вебмастерами представителю Google был задан вопрос о том, как поисковик расценивает страницы с одинаковым контентом, продублированном на разных языках. Например, может ли англоязычная версия публикации, оригинал которой выполнен на французском, расцениваться как дублированный контент.

На что Джон Мюллер сообщил, что поисковик может определять дубляж еще до сканирования содержимого веб-страницы. Это осуществляется с помощью анализа языковых атрибутов. А также по URL-адресам. Например, если страницы содержат в URL одинаковые параметры. При этом алгоритмы Google учитывают, что адреса могут совпадать и у веб-страниц, содержащих разный контент.

Также Мюллер отметил, что проблему совпадающих URL можно решить, если настроить корректную генерацию адресов на сайте. Благодаря чему Google сможет правильно идентифицировать оригинальный и дублированный контент.

Источник: //www.searchengines.ru/

Редакция: Команда webformyself.

Метки: новости