[ Исследование GEO AIM · данные симуляций ]

Частота галлюцинаций о брендах: по категориям

R R-Agency 24 мая 2026 г. ~10 минут чтения Исследование

«Галлюцинация» нейросети — это уверенно поданный, но неверный факт: выдуманная цена, несуществующая услуга, перепутанный адрес или приписанный бренду чужой продукт. Для компании это прямой репутационный и коммерческий риск. Мы прогнали через движок GEO AIM тысячи запросов о брендах в разных отраслях и посчитали, как часто ответ содержит фактическую ошибку. Оказалось, что риск сильно зависит от категории.

Главное за 30 секунд
  • В среднем ~17% ответов о брендах содержат фактическую ошибку; разброс по отраслям — до 2,5×.
  • Выше всего риск в финансах и медицине, ниже всего — в FMCG и ритейле.
  • Почти 40% галлюцинаций — это устаревшие данные, а не «фантазии»; такой риск управляем.
  • Снижают риск: единый источник фактов, свежесть, Schema.org, мониторинг.
  • Цифры иллюстративны; точность по своему бренду надо мерить отдельно.
Как читать эти цифры. «Галлюцинацией» мы считали ответ, где есть хотя бы один проверяемо неверный факт о бренде (цена, услуга, локация, принадлежность, статус). Доли посчитаны на смоделированных запросах в движке GEO AIM по девяти укрупнённым категориям. Это иллюстративная сводка по симуляциям для сравнения категорий между собой, а не официальный замер точности конкретных нейросетей. Абсолютные значения зависят от модели, периода и набора запросов — свою картину корректно мерить отдельным проектом.
~17%
средняя доля ответов с фактической ошибкой
~2,5×
разрыв между самой «чистой» и самой рискованной категорией
финансы
выше всего риск — много меняющихся условий и тарифов
FMCG
ниже всего — простые, стабильные факты о продукте

Доля галлюцинаций по отраслям

От самых рискованных (вверху) к самым «чистым». Значения иллюстративные, по данным симуляций.

Финансы, лизинг, страхование
27%
Медицина и клиники
24%
Недвижимость и девелопмент
21%
Телеком и тарифы
19%
B2B-услуги и ПО
17%
Образование
15%
Туризм и HoReCa
13%
E-commerce и ритейл
12%
FMCG и потреб. товары
11%

Картина логичная: чем сложнее, изменчивее и «дороже ошибки» факты в категории, тем чаще модель ошибается. В финансах и медицине условия меняются часто, формулировки регулируются, а данные на сайтах нередко противоречивы — модели есть на чём «спотыкаться». В FMCG факт о продукте простой и стабильный, поэтому ошибок меньше.

Из чего складываются ошибки

Разметка типов галлюцинаций по всему массиву проблемных ответов (а не внутри одной категории):

38% — устаревшие цены, тарифы, условия
29% — выдуманная или искажённая услуга/продукт
18% — перепутанная локация / контакты / статус
15% — приписан чужой факт / смешение с конкурентом

Доли — внутри массива ответов с фактической ошибкой; иллюстративно, по симуляциям.

Почти 40% галлюцинаций — это устаревшие данные, а не «фантазии на пустом месте». Модель опирается на то, что когда-то попало в её обучение или нашлось в открытых источниках, и не знает, что цена или условие уже изменились. Это хорошая новость: такой риск управляем — он лечится свежими, однозначными фактами на сайте.

Почему в одних нишах врут чаще

Фактор рискаГде сильнееПочему повышает галлюцинации
Часто меняющиеся условияФинансы, телекомМодель «помнит» старую версию тарифа
Регулируемые формулировкиМедицина, финансыОсторожные источники → модель домысливает
Противоречивые данные в сетиНедвижимость, B2BНет единого источника правды о бренде
Сложный состав продукта/услугиB2B-ПО, девелопментЛегко перепутать комплектации и опции
Простой стабильный фактFMCG, ритейлМеньше поводов ошибиться

Что снижает риск

  1. Единый источник правды на сайте. Один выверенный набор фактов (цены, услуги, условия), машиночитаемо размеченный — модели проще взять верное (см. «Единый источник фактов о бренде»).
  2. Свежесть данных. Главный источник ошибок — устаревшее; держите ключевые факты актуальными и датированными.
  3. Структурированная разметка. Schema.org для цен, услуг, организации снижает риск «домысливания».
  4. Мониторинг и алертинг. Регулярная проверка ответов ловит новую галлюцинацию до того, как её увидят клиенты (см. «Бренд-алертинг»).
  5. Замер по своей категории. Если вы в зоне риска (финансы, медицина, недвижимость) — мерить точность стоит регулярно, а не разово.

Частые вопросы

Можно ли вообще убрать галлюцинации полностью?

Полностью — нет, это свойство генеративных моделей. Но долю ошибок о конкретном бренде можно заметно снизить, дав ИИ выверенные и свежие факты и убрав противоречия в открытых источниках. Цель — не «ноль теоретически», а минимум практически.

Откуда взялись проценты?

Из разметки смоделированных ответов в движке GEO AIM. Это сравнительная иллюстрация по категориям, не официальная метрика точности нейросетей и не гарантия конкретного результата для отдельного бренда.

Мы в «чистой» категории — можно расслабиться?

Низкая средняя по категории не значит, что у вашего бренда всё хорошо: ошибки часто концентрируются вокруг конкретных продуктов или устаревших данных. Это проверяется только замером по вашему бренду.

Частые вопросы

Можно ли убрать галлюцинации полностью?
Полностью нет — это свойство генеративных моделей. Но долю ошибок о конкретном бренде можно заметно снизить выверенными свежими фактами и устранением противоречий в источниках.
Откуда взялись проценты?
Из разметки смоделированных ответов в движке GEO AIM. Это сравнительная иллюстрация по категориям, не официальная метрика точности нейросетей.
Мы в «чистой» категории — можно расслабиться?
Нет. Низкая средняя по категории не значит, что у вашего бренда всё хорошо — ошибки часто концентрируются вокруг конкретных продуктов; проверяется только замером.
частота галлюцинаций ии о брендах, неверные факты нейросети, точность ии по отраслям, как убрать галлюцинации о компании, устаревшие данные в ии.

Связанные материалы

Узнайте, что нейросети говорят о вашем бренде