<стр>Джон Мюллер из Google объясняет нюансы работы инструмента удаления URL-адресов в контексте последствий хакерской атаки.

<п>Джон Мюллер из Google ответил на вопросы об удалении неработающих URL-адресов из индекса. Он объяснил, как убрать сайты из результатов поиска, а затем обсудил нюансы решения именно этой ситуации.

Удаление неработающих страниц из результатов поиска Google’

Человек, задавший вопрос, стал жертвой японской хакерской атаки, названной так потому, что злоумышленники создают сотни или даже тысячи мошеннических веб-страниц на японском языке. Кто-то решил проблему и удалил спам-страницы, оставив 404 страницы по-прежнему упоминаемыми в результатах поиска Google.

Теперь они хотят удалить их из поискового индекса Google, чтобы сайт больше не ассоциировался с этими страницами.

<п>Они спросили: <блоковая цитата><п>“Недавно мой сайт подвергся атаке со стороны Японии. Однако я перенес этот сайт к новому хостинг-провайдеру и удалил оттуда все данные.

Однако факт заключается в том, что многие японские URL-адреса были проиндексированы.

Как мне деиндексировать эти тысячи URL-адресов моего сайта?”

<п>Вопрос отражает распространенную проблему после японской хакерской атаки, когда скомпрометированные страницы упорно остаются в индексе еще долгое время после удаления. Это указывает на то, что после удаления вредоносного контента восстановление сайта не завершено; Поисковому индексу Google необходимо очистить страницы, и это может занять очень много времени.

Как удалить страницы японских хакерских атак из Google

Джон Мюллер из Google рекомендует использовать инструмент удаления URL-адресов в Search Console. Вопреки тому, что следует из названия инструмента, он не удаляет URL-адрес из поискового индекса; он просто быстрее удаляет его из результатов поиска Google, если контент уже был удален с сайта или заблокирован для веб-сканера Google. В обычных обстоятельствах Google удалит страницу из результатов поиска после того, как она была просканирована и признана заблокированной или исчезнувшей (ответ ошибки 404).

Три обязательных условия для использования инструмента удаления URL-адресов

<ол>

  • Страница удалена и возвращает код ответа сервера 404 или 410.
  • <ли>URL-адрес заблокирован от индексации метатегом robots: <meta name=”robots” content=”noindex”>

  • Файл robots.txt не позволяет сканировать URL-адрес.
  • Мюллер из Google ответил:

    “Вы можете использовать инструмент удаления URL-адресов в консоли поиска для отдельных URL-адресов (даже если все URL-адреса начинаются с одинакового). Я бы использовал это для особо заметных проблем (проверьте отчет о производительности, 24 часа).

    Это не удаляет их из индекса, а скрывает на день. Если страницы сейчас недействительны/404, они также со временем исчезнут, но инструмент удаления означает, что вы можете «немедленно» прекратить их видимость. (Оба перенаправления 404 являются нормальными, технически 404 — правильный код ответа)”

    Мюллер объяснил, что инструмент удаления URL-адресов не удаляет URL-адреса из индекса Google, а вместо этого скрывает их из результатов поиска быстрее, чем это могло бы сделать при естественном повторном сканировании. Его объяснение является напоминанием о том, что этот инструмент имеет временный эффект видимости при поиске и не является способом окончательного удаления URL-адреса из базы данных Google&rsquo; сам индекс. Фактическое удаление из поискового индекса происходит после того, как Google проверит, что страница действительно исчезла или заблокирована от сканирования или индексирования.