Андрагогика Bloom: Analyze ⏱ 9 мин основы LLM

Галлюцинации: уверенный правдоподобный мусор

🧊 Won't Have 💧 Could Have ☀️ Should Have 🔥 Must Have
🔥 Must Have
Главная причина дорогих ошибок с AI. Без этой темы ты будешь верить уверенному тону там, где надо проверять.

🤔 Зачем это читать

Юрист готовит возражение в суд и просит AI подобрать судебную практику. Получает три ссылки на дела: номера, даты, цитаты из решений — всё выглядит безупречно. Он вставляет это в документ и подаёт. На заседании выясняется: двух дел не существует вовсе, а третье — про совсем другое. Реальная история, и не одна: юристов в нескольких странах уже штрафовали именно за такое. Человек не проверил не потому, что глупый. А потому, что ответ звучал ровно так же уверенно, как настоящая справка.

Знакомо ощущение? Или ближе к твоей работе: попросил собрать квартальный отчёт, модель вставила красивую цифру роста — «+18% к прошлому периоду». Цифра ниоткуда: в данных её не было, модель собрала правдоподобное число. Ты не заметил, отправил начальнику, начальник озвучил на совете директоров. А цифра — выдумка.

Оба раза сработала одна и та же ловушка. Мы привыкли, что уверенный, складный, по форме правильный ответ — это признак знания. У людей так и есть: кто плавает в теме, обычно мямлит. А модель плавает и мямлит никогда: она с одинаково ровным лицом подаёт и факт, и выдумку. Это явление называется галлюцинацией (уверенной выдумкой), и пока ты не видишь, где она почти неизбежна, ты будешь регулярно на неё попадаться.

После этой темы ты сможешь заранее разглядеть, где модель почти наверняка сочиняет, а где ей можно доверять — и где цена ошибки такая, что проверка человеком обязательна, чего бы это ни стоило. Это не про страх перед AI. Это про то, чтобы пользоваться им, не подставляясь.

Задержись на 10 секунд. Вспомни последний раз, когда AI выдал тебе что-то конкретное — цифру, цитату, ссылку, название, факт — и ты это куда-то переслал или на это сослался, не перепроверив. Что это было и кому ушло? Держи эту сцену в голове: к концу страницы ты поймёшь, насколько ты тогда рисковал.

🍽 Блюдо, которого нет в меню

Помнишь из темы 2.2 — Как агент «думает», что под капотом модель не достаёт факт из хранилища, а собирает ответ слово за словом — прикидывает, что обычно идёт дальше? Галлюцинация — это не сбой этого механизма. Это тот же самый механизм, работающий ровно как задумано, просто в ситуации, где правды модель не знает.

Представь опытного повара. Гость спрашивает: «А у вас есть такое блюдо — севиче из лобстера с манговой пеной?». Такого в меню нет, повар его в глаза не видел. Но он не говорит «нет, у нас такого не готовят». Он по насмотренности мгновенно прикидывает: севиче — это сырое, под цитрусом; лобстер — морепродукт; манговая пена — модно, сладко-кисло. И уверенно, с серьёзным лицом, описывает блюдо, которого не существует: «Да, конечно, нежнейший лобстер в лаймовом маринаде, воздушная пена из спелого манго…». Звучит как настоящая позиция из меню. А её нет.

Вот это и есть галлюцинация. Модель не «врёт» — врать значит знать правду и говорить обратное. Модель правды не знает и знать не пытается. Её работа — собрать правдоподобное продолжение, и она его собирает всегда, даже когда опереться не на что. И собирает тем же спокойным, складным тоном, что и про настоящие вещи. Тон одинаковый — потому что для модели нет разницы между фактом и выдумкой. И то и другое для неё — просто вероятное продолжение фразы.

Один и тот же тон — два разных ответа
🍽
Настоящее блюдо
«Есть стейк рибай, прожарка на выбор» — и он действительно в меню. Тон спокойный, уверенный.
=
🫥
Выдуманное блюдо
«Конечно, севиче из лобстера с манго» — а его не существует. Тон ровно тот же, спокойный и уверенный.
Вывод для тебя: по тону отличить нельзя. Уверенность ответа не несёт никакой информации о его правдивости — это надо держать в голове всегда.

🧯 Это не глюк железа и не злой умысел

Тут важно разобрать два ходовых заблуждения, потому что они мешают принимать верные решения.

Заблуждение первое: «это баг, его починят следующей версией». Нет. Галлюцинация — не поломка, которую забыли залатать. Это прямое следствие того, как модель устроена в принципе. Способность собирать правдоподобное продолжение из насмотренности — это ровно то, что делает модель полезной и гибкой (вспомни из 2.2: она и гениальна, и сочиняет — из одного и того же свойства). Нельзя забрать сочинительство, не убив гибкость. Новые версии галлюцинируют реже и аккуратнее — но полностью это не лечится, потому что лечить пришлось бы саму природу модели. Планируй с тем, что галлюцинации есть и будут.

Заблуждение второе: «модель меня обманывает». Обман предполагает намерение и знание правды. У модели нет ни того ни другого. Она не «решает соврать» — у неё нет внутреннего переключателя «сейчас говорю правду / сейчас выдумываю». Для неё всё — один процесс сборки вероятного текста. Это важно не для того, чтобы её оправдать, а чтобы правильно с ней обращаться: бесполезно «ловить её на лжи» или «требовать честности». Полезно — заранее знать, где она почти наверняка сочиняет, и там подстилать соломку.

🆕 Отдельная ловушка: модель не знает свежего

Есть особый вид галлюцинации, на который попадаются даже осторожные люди. Повара обучили на блюдах, которые он застал до какого-то момента — у каждой модели есть дата, после которой она мира не видела (это называют датой обучения, или по-английски training cutoff — момент, на котором знания обрываются). Что произошло в мире после — она не застала.

И вот тут засада. Спроси модель про вчерашнюю новость, свежий курс валюты, последнее изменение в законе или цену, которая поменялась на той неделе, — и она, как правило, не скажет «я не в курсе, это после моей даты». Она по привычке соберёт правдоподобный ответ: назовёт похожую цифру, опишет «как обычно бывает». Складно и неверно. Самое коварное — что про старое, которое она реально знает, и про свежее, которого знать не может, она отвечает одинаково уверенно.

Чтобы повар знал свежее, ему надо это свежее принести — отдельным механизмом: либо дать актуальные данные прямо в запрос, либо подключить к нему «кладовую» со справочниками и свежими источниками. Это отдельная большая тема впереди (повар идёт в кладовую за справочником, а не выдумывает из головы). Сейчас держи в голове правило: если вопрос про свежее или про конкретный факт из твоих данных — модель сама по себе этого знать не может, и любой её уверенный ответ здесь под подозрением.

🎯 Где галлюцинация почти неизбежна, а где её мало

Теперь главное, ради чего написана страница, — научиться заранее чуять опасные зоны. Галлюцинации не равномерны: есть задачи, где модель сочиняет почти гарантированно, и есть, где риск мал. Разница — в том, опирается ли ответ на точный факт, которого у модели может не быть.

Красная зона — высокий риск выдумки. Точные цифры и статистика, которых не было в твоём запросе. Конкретные номера: статей закона, ГОСТов, договоров, артикулов. Цитаты, ссылки, источники, имена, даты. Всё свежее (после даты обучения). Узкие специальные факты из твоей отрасли. Здесь модель чаще всего и подаёт «блюдо, которого нет в меню».

Зелёная зона — риск мал. Переформулировать текст, сделать его короче или вежливее. Собрать черновик письма или структуру документа. Обобщить длинный текст, который ты сам ей дал в запросе. Предложить варианты, накидать идеи, разложить мысль по полочкам. Здесь модель работает с тем, что у неё перед глазами или с языком как таковым — выдумывать особо нечего.

Карта риска: где проверять обязательно
🚩 Красная зона · проверяй
  • Точные цифры и статистика
  • Номера статей, ГОСТов, договоров
  • Цитаты, ссылки, источники
  • Имена, даты, факты
  • Всё свежее, после даты обучения
✅ Зелёная зона · риск мал
  • Переформулировать, сократить
  • Черновик письма, структура
  • Обобщить текст, что ты сам дал
  • Накидать варианты и идеи
  • Разложить мысль по полочкам
Сложи две оси. Красная зона + высокая цена ошибки = проверка человеком обязательна. Зелёная зона + низкая цена = можно опереться почти не глядя.

И поверх зоны риска накладывается вторая ось — цена ошибки. Одно дело — модель приврала в наброске поста для соцсетей: заметишь — поправишь, никто не пострадал. Другое дело — выдуманная статья закона в иске, несуществующая цифра в отчёте совету директоров, ложный медицинский факт. Тут одна пропущенная выдумка стоит репутации, денег или хуже. Чем выше цена ошибки, тем меньше у тебя права полагаться на уверенный тон — и тем обязательнее живая проверка человеком или нормальным инструментом.

Псевдокод · твоё правило перед тем, как опереться на ответ # это НЕ настоящий код, а логика на человеческом языке

# шаг 1 — это факт или формулировка?
если ответ содержит точную_цифру / номер / цитату / дату / свежее:
  зона = «красная»  # риск выдумки высокий
иначе:
  зона = «зелёная»

# шаг 2 — сколько стоит ошибка?
если зона == «красная» И цена_ошибки высокая:
  → проверить у человека / в источнике ОБЯЗАТЕЛЬНО, до отправки
иначе если зона == «красная»:
  → перепроверить хотя бы бегло
иначе:
  → можно опереться, тон тут не обманет
# уверенность ответа в этом правиле НИГДЕ не участвует — она ничего не значит

🛡 Как снизить (но не обнулить) галлюцинации

Ты как владелец кухни AI не обречён просто бояться. Риск выдумки можно заметно сбить — двумя способами, оба будут отдельными темами впереди, тут только назову, чтобы у тебя сложилась картина.

И вот что критично понять: оба способа снижают риск, но не обнуляют его. Кладовая может достать не тот документ, рассуждение может стройно прийти к неверному выводу. Так что финальный рубеж в дорогих задачах — всё равно человек. Не «AI плюс слепое доверие», а «AI плюс проверка там, где цена ошибки этого требует».

Прежде чем идти к тренажёру — притормози на секунду. Дальше будут пять рабочих ситуаций, и в каждой стоит мысленно прокрутить те же две оси: где тут точный факт, который модель могла выдумать, и сколько стоит ошибка. Не угадывай — жми кнопку уже с готовым ответом в голове.

🎮 Проверять или можно довериться?

Пять рабочих ситуаций. В каждой модель что-то выдала уверенным тоном. Твоя задача в два шага: сначала реши, надо ли тут обязательно проверять или риск выдумки мал и можно опереться, — а потом, до того как откроешь разбор, назови сам себе конкретный элемент в ответе, который делает зону такой: что именно тут модель могла выдумать (точная цифра? номер? свежая дата?) — или, наоборот, почему выдумывать ей тут нечего. Жми кнопку — и сверь свой разбор с моим. Это не экзамен, а тренировка чутья: важна не кнопка, а то, почему ты её нажал.

📖 Ключевые понятия

Галлюцинация (уверенная выдумка)
Когда модель уверенно и складно выдаёт правдоподобную неправду. Повар описывает блюдо, которого нет в меню, с тем же серьёзным лицом, что и настоящее. Это не баг и не обман, а прямое следствие того, что модель всегда собирает вероятное продолжение — даже когда правды не знает.
Дата обучения (training cutoff)
Момент, на котором знания модели обрываются: что произошло в мире после — она не застала. Поэтому про свежее (новости, курсы, последние изменения) она сама по себе знать не может, но честно «не в курсе» почти никогда не говорит — собирает правдоподобный ответ.
Красная и зелёная зона
Простая рамка для оценки риска. Красная — точные факты, цифры, номера, цитаты, свежее: высокий риск выдумки. Зелёная — переформулировать, обобщить данный тебе текст, накидать идеи: выдумывать почти нечего. Поверх накладывается цена ошибки.
Верификация (проверка человеком или инструментом)
Сверка ответа модели с настоящим источником или живым человеком до того, как на него опереться. Обязательна там, где красная зона встречается с высокой ценой ошибки. Финальный рубеж, который не заменяют никакие умные надстройки.

🛡️ Частые заблуждения

«Галлюцинации — это баг, в следующей версии их починят»

Не починят полностью — это не поломка, а следствие самого устройства модели (разобрали выше). Новые версии ошибаются реже и аккуратнее, но обнулить выдумки нельзя. Планируй с тем, что они есть и будут.

«Если модель ответила так уверенно и подробно — наверное, это правда»

Уверенность и подробность не несут информации о правдивости. У людей мямленье выдаёт незнание, у модели — нет: она с одинаково ровным тоном подаёт и факт, и выдумку. Чем складнее и убедительнее звучит фактический ответ, тем сильнее, а не слабее повод его проверить.

«Можно просто спросить модель: „ты уверена? это точно правда?“ — и она признается, если выдумала»

Не сработает надёжно. Модель и на это соберёт правдоподобный ответ — нередко так же уверенно подтвердит выдумку или, наоборот, начнёт сомневаться в верном. У неё нет внутреннего датчика «вот это я знаю, а вот это сочинил». Проверять надо снаружи: источником или человеком, а не переспросом у самой модели.

🧠 AI-чутьё (AI Judgment)

Уверенный тон ≠ правда. Где цена ошибки высока — проверка обязательна

Если из всей темы унести одну фразу, пусть будет эта: уверенность ответа — это не сигнал. Совсем. Мы инстинктивно читаем уверенный, складный, по форме грамотный текст как признак знания, потому что у людей так и есть. С моделью этот инстинкт работает против тебя: он заставляет доверять ровно там, где доверять опаснее всего, — когда выдумка звучит безупречно.

Рабочая рамка — две оси, и ты уже умеешь их складывать. Первая: это точный факт/цифра/свежее (красная зона) или работа с языком и данными, что у модели перед глазами (зелёная)? Вторая: сколько стоит ошибка, если выдумка пройдёт дальше? На пересечении «красная зона × высокая цена» проверка человеком или нормальным источником — не опция и не перестраховка, а обязательный шаг, который нельзя пропустить под давлением сроков.

И помни про арсенал. Кладовая со справочниками и «рассуждающие» модели снижают риск выдумки и стоят того, чтобы их применять. Но ни то ни другое не отменяет последнего рубежа: где цена ошибки высока, между ответом модели и реальным действием всегда стоит человек, который сверил. Не потому, что AI плохой, — а потому, что ты понимаешь, как он устроен. Это и есть разница между владельцем, который понимает кухню, и тем, кого подставили.

🎯 Практика

Одно задание на пять-семь минут — увидеть галлюцинацию своими глазами, чтобы образ закрепился не на словах, а на опыте.

  1. Открой любой привычный AI-чат и задай ему намеренно «красный» вопрос из своей сферы, который ты сможешь проверить: точный номер документа или нормы, конкретную свежую цифру, имя автора и название узкой статьи или книги. Что-то специальное и желательно свежее.
  2. Получи ответ и обрати внимание на тон: почти наверняка он будет уверенным, складным, с деталями. Запомни это ощущение «звучит как настоящая справка».
  3. Теперь перепроверь в нормальном источнике. Совпало — хорошо. Выдумано или перевёрнуто — вот она, галлюцинация во плоти: тон был тот же, что у правды, а содержание ложное.
  4. Бонус-проверка инстинкта: спроси у модели «ты уверена, что это точно так?». Понаблюдай, как она отреагирует. Убедись сам, что переспрос — не способ проверки: она и тут соберёт правдоподобный ответ.

Помнишь ту сцену из начала — где ты переслал или сослался на что-то от AI, не перепроверив? Теперь видно, насколько ты рисковал: если это была красная зона с высокой ценой, ты пронёс выдумку дальше на одном лишь уверенном тоне. В следующий раз сработает рамка — и ты остановишься на проверке.

🔗 Что дальше

Ты разобрал, почему модель сочиняет и где это особенно опасно. Дальше по курсу — два механизма, которыми этот риск снижают на практике: «рассуждающие» модели (повар думает на бумаге перед готовкой) и кладовая-RAG (повар отвечает по справочникам, а не из головы). А пока — вернись к фундаменту, на котором стоит вся эта тема.

Связанные темы: