[ Исследование GEO AIM · данные симуляций ]

Кросс-модельный разброс: один бренд — пять разных картин

R R-Agency 24 мая 2026 г. ~11 минут чтения Исследование

Распространённое заблуждение: «спросил у ChatGPT — теперь знаю, как меня видит ИИ». На деле разные нейросети отвечают об одном и том же бренде по-разному: где-то его называют первым, где-то не упоминают вовсе, где-то приписывают чужие факты. Мы измерили этот разброс на смоделированных запросах в движке GEO AIM по пяти моделям и получили устойчивую картину: видимость, измеренная по одной модели, почти ничего не говорит о видимости в остальных.

Главное за 30 секунд
  • Разные нейросети отвечают об одном бренде по-разному — единой картины нет.
  • Типичный бренд упомянут лишь в ~3 из 5 моделей; ~40% запросов дают разный вывод.
  • Разброс максимален на сравнениях и рекомендациях (50%+), минимален на фактовых (~14%).
  • Сильнее расходятся узкие/локальные бренды и свежие изменения.
  • Вывод: мерить нужно по 4–5 моделям и нескольким прогонам, а не по одной.
Как читать эти цифры. Мы брали один бренд и прогоняли одинаковый набор запросов через пять моделей (условно: ChatGPT, YandexGPT/Нейро, GigaChat, Алиса, DeepSeek), фиксируя для каждой: упомянут ли бренд, в какой позиции, верны ли факты, какой тон. «Разброс» — это разница картины между моделями. Данные иллюстративные, по симуляциям, и нужны для сравнения моделей между собой, а не как официальный рейтинг точности. Конкретные значения зависят от бренда, категории и периода — свою картину корректно мерить отдельным проектом.
5
моделей в сравнении на одинаковых запросах
~3 из 5
типичное число моделей, где бренд вообще упомянут
~40%
запросов дают разный вывод в зависимости от модели
сравнения
тип запроса с максимальным разбросом между моделями

Матрица: как модели видят один бренд

Обобщённый пример: один бренд среднего размера, шесть типичных запросов, пять моделей. Зелёное — назван корректно и в сильной позиции, жёлтое — назван слабо/с оговорками, красное — не упомянут или с ошибкой. Иллюстративно.

ЗапросChatGPTYandexGPTGigaChatАлисаDeepSeek
Прямой факт о бренде~
«Компании в сфере Y»~~
«Посоветуй сервис для…»~~
«X или конкурент — что лучше»~~
«Надёжна ли компания X»~~~
«Где купить / оформить»~~

Иллюстративная матрица по данным симуляций; для реального бренда картина строится в демо-аналитике.

Главный вывод виден сразу: нет ни одной строки и ни одного столбца, где картина была бы одинаковой. Бренд, уверенно представленный в ChatGPT, может отсутствовать в Алисе; сильный в YandexGPT — проседать в DeepSeek. Замер по одной модели — это одна колонка из шести, а решения принимаются по всей таблице.

Метрика разброса

Чтобы выразить расхождение числом, мы считаем долю запросов, где вывод (упомянут/в какой позиции) меняется в зависимости от модели. Чем выше — тем опаснее судить о видимости по одной нейросети.

Сравнения (X против Y)
58%
Рекомендации (посоветуй)
52%
Категорийные (компании в Y)
44%
Репутационные (надёжна ли)
37%
Информационные (как работает)
25%
Прямые фактовые
14%

На фактовых запросах модели в основном согласны — факт один. А вот на оценочных типах (сравнения, рекомендации) разброс достигает половины и более: каждая модель «собирает» свой ответ из доступных ей источников и обучения, и эти наборы у моделей разные.

Где модели расходятся сильнее всего

  • Узкие и B2B-ниши. Мало источников — каждая модель опирается на свой обрывок, картины разъезжаются.
  • Локальные/российские бренды. Глобальные модели (ChatGPT, DeepSeek) знают их хуже, чем YandexGPT, GigaChat и Алиса.
  • Свежие изменения. Новый продукт или ребрендинг доходит до моделей с разной задержкой.
  • Оценочные запросы. Сравнения и рекомендации — там расхождение максимальное.

Почему так получается

У моделей разные обучающие данные, разные даты «знаний», разный доступ к актуальному вебу и разные механизмы извлечения источников. Российские модели лучше знают локальный контекст; глобальные — шире, но с пробелами по РФ. Добавьте к этому случайность генерации (один и тот же запрос дважды может дать разный ответ), и становится понятно, почему одна модель — это одна точка зрения, а не вся картина (см. «Чем отличаются нейросети друг от друга»).

Что это значит для замера

  1. Мерить минимум по 4–5 моделям. Иначе вы видите случайную колонку, а не реальную видимость бренда.
  2. Считать агрегат и разброс. Важна не только средняя видимость, но и то, в каких моделях бренд проваливается.
  3. Сегментировать по типам запросов. На оценочных запросах разброс выше — там и приоритет работы.
  4. Не делать выводов по одному прогону. Из-за случайности генерации нужна повторяемость — несколько прогонов на запрос.
  5. Учитывать локальность. Для бренда РФ вес российских моделей в общей картине выше.

Частые вопросы

Можно ли ориентироваться только на ChatGPT, раз он популярен?

Для аудитории РФ — нет. Часть пользователей в YandexGPT/Нейро, GigaChat и Алисе, а картина в них может сильно отличаться. Популярность одной модели не отменяет видимость (или её отсутствие) в остальных.

Откуда метрика разброса?

Из сравнения смоделированных ответов пяти моделей в движке GEO AIM. Это иллюстрация порядка величин и относительной разницы между типами запросов, а не официальный рейтинг моделей.

Что делать, если в одной модели всё хорошо, а в другой плохо?

Это норма. Работать прицельно: усиливать факты и контент так, чтобы подтянуть слабые модели, и регулярно перемерять — разрыв между моделями со временем меняется.

Частые вопросы

Можно ли ориентироваться только на ChatGPT?
Для аудитории РФ — нет. Часть пользователей в YandexGPT, GigaChat и Алисе, а картина в них может сильно отличаться от ChatGPT.
Откуда метрика разброса?
Из сравнения смоделированных ответов пяти моделей в движке GEO AIM. Это иллюстрация порядка величин, а не официальный рейтинг моделей.
Что делать, если в одной модели хорошо, а в другой плохо?
Это норма. Работать прицельно — усиливать факты и контент, чтобы подтянуть слабые модели, и регулярно перемерять.
расхождение ответов нейросетей, кросс-модельный анализ, видимость бренда в разных ии, chatgpt против yandexgpt, замер по нескольким моделям.

Связанные материалы

Узнайте, что нейросети говорят о вашем бренде