Пять вопросов о данных Google, на которые вам сейчас нужны ответы
60~p>Во время праздников в Соединенных Штатах было опубликовано несколько сообщений о возможной утечке данных, связанных с рейтингом Google. Первые публикации об истоках сосредотачивались на “подтверждении” убеждение, которое давно придерживался Рэнд Фишкин, но не уделялось много внимания контексту информации и тому, что она на самом деле означает.
Контекст имеет значение: Документ AI Warehouse
Слившийся документ относится к публичной платформе Google Cloud под названием Document AI Warehouse, которая используется для анализа, организации, поиска и хранения данных. Эта общедоступная документация называется Document AI Warehouse overview. В сообщении на Facebook говорится о том, что “утечка” данные являются “внутренней версией” Общедоступной документации Document AI Warehouse. Это контекст этих данных.
Снимок экрана: Документ AI Warehouse
@DavidGQuaid твитнул:
“Думаю, понятно, что это внешний API для создания хранилища документов, как следует из названия”
Кажется, это сбрасывает воду на мысль о том, что “утечка” данные представляют внутреннюю информацию поиска Google.
Насколько нам известно на данный момент, “утечка данных” имеет сходство с тем, что находится на общедоступной странице Document AI Warehouse.
Утечка данных внутреннего поиска?
Оригинальная публикация на SparkToro не говорит, что данные исходят из Поиска Google. В нем сказано, что это заявление было сделано лицом, которое прислало данные Рэнду Фишкину.
в своем написании, особенно когда речь идет об оговорках. Рэнд четко отмечает, что именно лицо, предоставившее данные, утверждает, что данные исходят из Поиска Google. Нет доказательств, только претензии.
Он пишет:
“Я получил электронное письмо от лица, которое утверждало, что имеет доступ к большой утечке документации API из отдела поиска Google”
Сам Фишкин не утверждает, что бывшие сотрудники Google подтвердили, что данные исходят из поиска Google. Он пишет, что лицо, которое отправило данные по электронной почте, заявило об этом.
“Далее в электронном письме утверждалось, что бывшие сотрудники Google подтвердили подлинность этих утечек документов и что эти бывшие сотрудники и другие лица поделились дополнительной частной информацией о поисковых операциях Google& ”
Фишкин пишет о следующей видеовстрече, на которой автор утечки рассказал, что его контакт с бывшими работниками Google был в контексте встречи с ними на мероприятии поисковой отрасли. Опять же, нам придется поверить вытекающим о бывших сотрудниках Google и том, что они сказали после тщательного просмотра данных, а не неофициальный комментарий.
Фишкин пишет, что связался по этому поводу с тремя бывшими сотрудниками Google. Примечательно, что эти бывшие сотрудники Google не подтвердили прямо, что данные являются внутренними для поиска Google. Они лишь подтвердили, что данные похожи на внутреннюю информацию Google, а не на то, что они происходят из Поиска Google.
Фишкин пишет то, что ему сказали бывшие сотрудники Google:
- “У меня не было’доступа к этому коду, когда я там работал. Но это точно выглядит законно.”
- “Он имеет все признаки внутреннего API Google.”
- “Это’API на основе Java. А кто-то потратил много времени на соблюдение собственных внутренних стандартов Google по документации и именам.
- “Мне’нужно бы больше времени, чтобы убедиться, но это соответствует внутренней документации, с которой я’знакомый.”
- “Ничего, что я увидел в кратком обзоре, нельзя утверждать, что это не законно.”
Сказать, что что-то происходит из Поиска Google, и сказать, что это происходит из Google, — это две разные вещи.
Будьте открытыми
Важно быть открытым к данным, поскольку многие о них неподтверждены. Например, неизвестно, это внутренний документ Search Team. Поэтому, пожалуй, не стоит принимать что-то из этих данных как действенный совет по SEO.
Кроме того, не рекомендуется анализировать данные, чтобы конкретно подтвердить давние убеждения. Вот как человек попадает в ловушку Confirmation Bias.
Определение смещения подтверждения:
“Предупреждение подтверждения — это склонность искать, интерпретировать, отдавать предпочтение и упоминать информацию таким образом, чтобы подтверждать или поддерживать предыдущие убеждения или ценности .”
Предупреждение подтверждения приведет к тому, что человек будет отрицать то, что эмпирически правдиво. К примеру, существует десятилетняя идея, согласно которой Google автоматически удерживает новый сайт от рейтинга, эта теория называется «песочницей». Люди каждый день сообщают, что их новые сайты и новые страницы почти сразу попадают в первую десятку поиска Google.
Но если вы закоренелый верующий в «Песочницу», то такой реальный наблюдаемый опыт будет отклонен, независимо от того, сколько людей наблюдают противоположный опыт.
Бренда Мелоун, внештатный старший технический стратег SEO и веб-разработчик (профиль LinkedIn), послала мне сообщения о претензиях относительно песочницы:< /p>
“Из личного опыта я знаю, что теория песочницы является ошибочной. Я только через два дня проиндексировал личный блог с двумя публикациями. Согласно теории песочницы, небольшой сайт с двумя сообщениями не должен был индексироваться.~~~~~~~~~~~
Вывод здесь заключается в том, что если окажется, что документация происходит из Поиска Google, неправильным способом анализа данных будет искать подтверждение давних убеждений.
О чем говорится в утечке данных Google?
Есть пять вещей, которые следует учитывать относительно утечки данных:
<ол>
Контекст утечки информации неизвестен. Это связано с Поиском Google? Или для других целей? Назначение данных. Была ли информация использована для фактических результатов поиска? Или она использовалась для внутреннего управления данными или манипуляций? Бывшие сотрудники Google не подтвердили, что эти данные касаются только Поиска Google. Они лишь подтвердили, что это, кажется, пришло от Google. Будьте открытыми. Если вы идете на охоту, чтобы подтвердить давние убеждения, догадайтесь, что вы найдете их повсюду. Это называется смещением подтверждения. Доказательства свидетельствуют о том, что данные связаны с внешним API для создания хранилища документов. Что говорят другие об “утечке” Документы
Райан Джонс, человек, который не только имеет глубокий опыт поисковой поисковой системы, но имеет прекрасное понимание информатики, поделился несколькими разумными наблюдениями относительно так называемой утечки данных.
Райан твитнул:
<цитата>
“Мы не’не знаем, это ли для производства или для тестирования. Я предполагаю, что это в основном для тестирования потенциальных изменений.
Мы не знаем, что’используется для Интернета или других отраслей. Некоторые вещи могут использоваться только для дома Google или новостей и т.д.
Мы не знаем, что они являются входными данными для алгоритма ML, а что используется для обучения. Я предполагаю, что клики не являются прямым вводом, а используются для обучения модели, как предусмотреть кликабельность. (За пределами трендовых усилений)
Я’я также предполагаю, что некоторые из этих полей применяются только к учебным наборам данных, а не ко всем сайтам.
Разве я говорю, что Google не лгал? Вовсе нет. Но давайте рассмотрим эту утечку с возражениями, а не с предвзятым предупреждением. написал в Twitter:
“Мы также не’не знаем, это ли для поиска Google или поиска документов в облаке Google
интерфейсы API выбирают & выбрать – это не то, как я ожидаю, чтобы алгоритм работал – что если инженер захочет пропустить все эти проверки качества – похоже, я хочу создать программу хранилища содержимого для своей корпоративной базы знаний&~~~~~~~~~~~~~~~~~~~~
Или “утечка” Данные, связанные с поиском Google?
Сейчас нет веских доказательств того, что эта “утечка” данные фактически из поиска Google. Существует множество неоднозначности по назначению данных. Примечательно, что есть намеки на то, что эти данные являются только “внешним API для создания хранилища документов, как следует из названия” и никак не связаны с рейтингом веб-сайтов в Поиске Google.
Вывод о том, что эти данные не происходят из Поиска Google, пока не является окончательным, но это, похоже, направление, в котором дует ветер доказательств.