<стр.>Глубоко погрузитесь во взаимосвязь между общими данными сканирования и обзорами AI.

После моего первого анализа +546 000 обзоров искусственного интеллекта я углубился в три вопроса:

<ол>

  • Как связаны общие данные сканирования и обзоры AI?
  • Как изменяется намерение пользователя. Обзор ШИ?
  • Как распределяются первые 20 позиций для доменов, которые занимают место в обычном поиске и цитируются в AIO?
  • Как связаны общие данные сканирования и обзоры ШИ?

    Включение общего сканирования не влияет на видимость AIO так сильно, как обычный трафик.

    Common Crawl, некоммерческая организация, которая бесплатно сканирует Интернет и предоставляет данные , является крупнейшим источником данных для генеративного обучения ИИ.

    Некоторые сайты, такие как Blogspot, размещают гораздо больше страниц, чем другие, и возникает вопрос, дает ли это им преимущество в ответах на LLM.

    Результат: Мне было интересно, сайты, которые предоставляют больше страниц, чем другие, также будут видеть больше видимости в обзорах AI. Это оказалось неправдой.

    Я сравнил 500 самых популярных доменов по количеству страниц в Common Crawl из 30 000 самых популярных доменов в моем наборе данных и обнаружил слабую корреляцию 0,179.

    Причина заключается в том, что Google, вероятно, полагается не на Common Crawl для обучения и информирования AI Overviews, а на собственный индекс.

    AI On Innovation [Part 2]: More Insights From +546,000 AI Overviews

    Автор изображения: Кевин Индиг

    Потом я проанализировал связь между 3000 самыми популярными доменами по органическому трафику из Semrush и 30000 самых популярных доменов в моем наборе данных и обнаружил сильную связь 0,714.

    Другими словами, домены, получающие много органического трафика, имеют высокую вероятность быть очень заметными в обзорах AI.

    Кажется, AIO все больше вознаграждает то, что работает в обычном поиске, но некоторые критерии все еще очень отдельные.

    Важно отметить, что некоторые сайты искажают отношения.

    При фильтрации Википедии и YouTube соотношение снижается до 0,485 – все еще сильный, но ниже, чем у двух бегемотов.

    Соотношение не меняется, когда изымаем большие сайты, подтверждая то, что работающее в обычном поиске имеет большое влияние на обзоры AI.

    Как я писал в своей предыдущей публикации:

    Высший рейтинг в результатах поиска, безусловно, увеличивает шансы быть видимыми в AIO, но это далеко не единственный фактор.

    Как следствие, компании могут исключить бота Common Crawl's в файле robots.txt, если они не хотят  появляться в общедоступных наборах данных (и Gen AI, таких как Chat GPT ), и все равно быть очень видимы в Google’s AI Overviews.

    Как намерение пользователя изменяет обзор ШИ?

    Намерение пользователя формирует форму и содержимое AIO.
    В своем предварительном анализе я пришел к выводу, что точное соответствие запросу почти не имеет значения:

    Данные показывают, что только 6% AIO содержат поисковый запрос.

    Это число чуть выше у SGE, 7%, и ниже в живых AIO, 5,1%. Как следствие, соответствие намерениям пользователя в содержимом гораздо важнее, чем мы могли предположить. Это не должно быть неожиданностью, поскольку пользовательские намерения были ключевым требованием к рейтингу в SEO в течение многих лет, но увидеть данные шокирует.

    Вычисление точных (доминирующих) намерений пользователя для всех 546 000 запросов было бы чрезвычайно интенсивным, поэтому я рассмотрел общие абстракции&информационные, локальные и транзакционные.

    Абстракции менее полезны при оптимизации содержимого, но они уместны при просмотре совокупных данных.

    I кластерный:

    • Информационные запросы вокруг таких вопросительных слов, как “что,” “почему,” “когда,” и т.д.
    • Трансакционные запросы относительно таких терминов, как “купить,” “скачать,” “заказ,” и т.д.
    • Локальные запросы вокруг “рядом,” “близко,” или “рядом со мной.”

    AI On Innovation [Part 2]: More Insights From +546,000 AI Overviews

    Автор изображения: Кевин Индиг

    <сильный>Результат:Различия в намерениях пользователей отображаются в форме и функциях. Средняя длина (количество слов) почти одинакова для всех намерений, кроме локальных, что имеет смысл, поскольку пользователи хотят список мест вместо текста.

    Подобным образом AIO для покупок часто являются списками продуктов с определенным контекстом, если это не вопросы, связанные с покупками.

    Локальные запросы имеют наибольшее количество точного совпадения между запросом и ответом; информационные запросы имеют самый низкий.

    Понять и удовлетворить намерения пользователя по вопросам труднее, но также важнее быть видимыми в AIO, чем, например, в Featured Snippets.

    Как распределяются 20 лучших органических позиций?

    В ходе последнего анализа я обнаружил, что почти 60% URL-адресов, которые появляются в AIO и обычных результатах поиска, занимают позиции вне топ-20.

    Для этого Меморандума я разобрал 20 лучших ниже, чтобы понять, будут ли AIO чаще цитировать URL-адреса на высших позициях, или нет.

    AI On Innovation [Part 2]: More Insights From +546,000 AI Overviews

    Автор изображения: Кевин Индиг

    <сильный>Результат:Обнаруживается 40% URL-адресов в AIO занимают позиции 11-20, и только половина (21,9%) занимает первые 3 места.

    Большинство, 60% URL-адресов, которые цитируются в AIO, все еще занимают первую страницу обычных результатов, подкрепляя тезис, что высший органический рейтинг, как правило, приводит к более высоким шансам быть цитируемыми в AIO.

    Однако данные также показывают, что очень невозможно присутствовать в AIO с низшим органическим рангом.

    AI On Innovation [Part 2]: More Insights From +546,000 AI Overviews

    Где 20 самых популярных доменов, видимых в AIO и результатах поиска (автор изображения: Кевин Индиг)

    Сценарии

    Я буду работать со своими клиентами, чтобы соответствовать намерениям пользователей AIO’, предоставлять уникальную информацию и адаптировать формат. Я вижу варианты прогресса обзора искусственного интеллекта, которые я буду отслеживать и подтверждать данными в последующие месяцы и годы.

    Вариант 1: AIO больше полагаются на самые высокие органические результаты и удовлетворяют больше информационных намерений, прежде чем пользователям нужно будет переходить на веб-сайты. Большинство кликов на сайтах будут поступать от пользователей, которые рассматривают или намерены купить.

    Вариант 2: AIO продолжают предоставлять ответы из разнообразных результатов и оставляют небольшую вероятность того, что пользователи все равно перейдут к результатам наивысшего рейтинга, хотя у значительно меньших количествах.

    На какой сценарий вы ставите?