Как Google находит дублированный контент без сканирования веб-страниц

Как Google находит дублированный контент без сканирования веб-страниц

От автора: Джон Мюллер рассказал, как Google может определять наличие дублированного контента еще до прохода публикаций сайта поисковым роботом. При этом учитывается одинаковые параметры URL веб-страниц и производится анализ атрибутов разметки.

Во время очередной видеоконференции с вебмастерами представителю Google был задан вопрос о том, как поисковик расценивает страницы с одинаковым контентом, продублированном на разных языках. Например, может ли англоязычная версия публикации, оригинал которой выполнен на французском, расцениваться как дублированный контент.

На что Джон Мюллер сообщил, что поисковик может определять дубляж еще до сканирования содержимого веб-страницы. Это осуществляется с помощью анализа языковых атрибутов. А также по URL-адресам. Например, если страницы содержат в URL одинаковые параметры. При этом алгоритмы Google учитывают, что адреса могут совпадать и у веб-страниц, содержащих разный контент.

Также Мюллер отметил, что проблему совпадающих URL можно решить, если настроить корректную генерацию адресов на сайте. Благодаря чему Google сможет правильно идентифицировать оригинальный и дублированный контент.

Источник: https://www.searchengines.ru/

Современные тенденции и подходы в веб-разработке

Узнайте алгоритм быстрого профессионального роста с нуля в сайтостроении

Узнать подробнее

Редакция: Команда webformyself.

Современные тенденции веб-разработки

За ближайшие 5 дней мы составим ваш пошаговый алгоритм профессионального роста с нуля в сайтостроении...

Получить

Метки:

Похожие статьи:

Комментарии Вконтакте:

Комментарии Facebook:

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Можно использовать следующие HTML-теги и атрибуты: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Я не робот.

Spam Protection by WP-SpamFree