Что такое модель (ML): повар по насмотренности
🤔 Зачем это читать
Бухгалтер задаёт ChatGPT вопрос про конкретный пункт налогового кодекса. Получает чёткий, уверенный ответ: номер статьи, формулировка, даже ссылка на письмо ведомства. Звучит безупречно. Через две недели на проверке выясняется: статьи с таким номером не существует, письмо выдумано, а компании выписали штраф. И это не наивность — он просто доверился уверенному тону, как доверились бы почти все. Раз машина ответила так складно — значит, она это знает.
Знакомо? Или другой вариант: на совещании кто-то роняет фразу «мы обучили модель на наших договорах, теперь она их все помнит» — и все кивают, представляя себе что-то вроде умного архива, который выдаёт нужный документ по запросу. А потом эта «модель» путает суммы, придумывает контрагентов и ссылается на пункты, которых в договорах не было.
Оба провала растут из одного корня. Люди думают, что модель — это база данных, которая запомнила факты и выдаёт их. Как библиотекарь, который точно знает, на какой полке лежит нужная книга. На самом деле модель устроена совсем иначе, и пока ты этого не понял, у тебя будут неверные ожидания: ты будешь верить ей там, где надо проверять, и пугаться там, где всё нормально.
После этой темы ты будешь понимать, что такое модель и почему она одновременно гениальна и врёт. Это снимает магию — а вместе с магией уходят и дорогие ошибки. Один образ в голове сэкономит тебе и нервы, и деньги.
Задержись на 10 секунд. Вспомни последний раз, когда AI ответил тебе так уверенно, что ты не стал перепроверять. Или когда при тебе сказали «нейросеть знает» / «модель помнит» — и ты принял это как должное. Что это была за ситуация? Держи её в голове: к концу страницы ты на неё посмотришь иначе.
🧑🍳 Откуда вообще берётся повар
Помнишь из прошлой темы (0.2 — Программа, данные, файл) разницу между рецептом и продуктами? Обычная программа — это рецепт: жёсткая последовательность шагов, написанная человеком. «Если сумма больше 100 000 ₽ — пометь красным». Каждый шаг кто-то прописал руками.
Модель машинного обучения (ML, от англ. machine learning — машинное обучение) появляется по-другому. Её никто не прописывает по шагам. Представь молодого повара. Ему не дают толстую книгу с инструкцией «возьми ровно 3 г соли, нагрей до 64 градусов, мешай 90 секунд». Вместо этого ему показывают тысячи готовых блюд — снова, и снова, и снова. Он смотрит, пробует, замечает закономерности: к рыбе чаще идёт лимон, тесто после соли поднимается лучше, к острому просят что-то прохладное. Никто не диктовал ему правила. Он натренировался на примерах.
Вот это «показать тысячи примеров вместо того, чтобы прописать правила» — и есть машинное обучение. Отсюда и слово «обучили»: модель не запрограммировали, её натаскали на данных, как повара на блюдах.
👀 Насмотренность — это не память
Вот самое важное, ради чего написана вся эта страница. Кажется, что повар, насмотревшийся тысяч блюд, просто помнит их все — как огромный фотоальбом в голове. Спросил его про блюдо — он достал нужную фотографию и описал. Это и есть та самая ошибка про «базу данных».
На деле никакого фотоальбома нет. Повар не хранит блюда. Он впитал из них общее ощущение: какие вкусы дружат, что за чем обычно идёт, как примерно собирается тарелка. Когда ты просишь его приготовить, он не вспоминает конкретное блюдо номер 4 712 из обучения. Он собирает новое на ходу — по чутью, натренированному на тех тысячах примеров.
Если совсем честно, то под капотом модель делает одну простую вещь: предсказывает, что обычно идёт дальше. Ты дал ей начало фразы — она прикидывает, какое слово вероятнее всего следующее, исходя из всего, что «навидалась». Потом следующее. И так слово за словом собирается ответ. Не «достала факт из памяти», а «угадала продолжение по насмотренности».
Чувствуешь, в чём подвох? Библиотекарь, если книги нет, скажет «нет такой». Повар по насмотренности почти никогда не говорит «не знаю» — он собирает правдоподобное продолжение в любом случае, потому что его работа именно в этом. И собирает уверенно, тем же ровным тоном, что и про настоящие вещи.
💡 Почему она и гениальна, и врёт
Теперь смотри, как из одного устройства вытекают сразу две стороны модели — и обе перестают быть магией.
Почему гениальна. Раз повар не привязан к жёстким рецептам, а готовит по чутью, он справляется с тем, чего раньше в глаза не видел. Попроси «сделай как обычно, но без молочного» — и он сообразит, хотя именно такого блюда ему не показывали. Эта способность обобщать, собирать новое из уловленных закономерностей, и делает модель такой полезной. Обычная программа-рецепт так не умеет: шаг влево от инструкции — и сбой.
Почему врёт. Ровно та же способность — собирать правдоподобное продолжение — означает, что модель соберёт его и тогда, когда правды не знает. Спросил про несуществующую статью кодекса — она не полезет в архив проверять, есть ли такая. Она прикинет, как обычно выглядят такие статьи, и выдаст похожее. Складно, уверенно и неправильно. У этого даже есть имя — галлюцинации, и им посвящена отдельная тема дальше в курсе. Пока запомни главное: уверенный тон ответа ничего не говорит о его правдивости. Повар одинаково спокойно подаёт и настоящее блюдо, и выдуманное.
И ещё одно следствие. Повара обучили на блюдах, которые он видел до какого-то момента. Что приготовили в мире после — он не застал. Поэтому про свежие события сам по себе он не в курсе: спросишь про вчерашнюю новость — либо честно спасует, либо, что хуже, придумает правдоподобную. Чтобы он знал свежее, ему надо принести эти продукты — отдельным механизмом. Это тоже отдельная тема впереди (повар идёт в кладовую за справочником). Сейчас важно одно: модель сама по себе не знает свежего, и это не баг, а следствие того, как её обучали.
запрос = «Какая статья кодекса штрафует за …?»
# модель НЕ делает так:
# найти_в_архиве(запрос) → вернуть точный факт
# модель делает так:
пока ответ не закончен:
следующее_слово = «что обычно идёт дальше по насмотренности»
дописать(следующее_слово)
# → получается складно и уверенно, но это догадка, а не справка
🍽 Что это значит для тебя как владельца
Ты тут не повар у плиты, а владелец кухни AI: твоё дело — понимать, чего от этого повара ждать. Если держишь в голове образ «повар по насмотренности», а не «энциклопедия» — у тебя сразу появляются здравые ожидания. Три практических вывода.
- Не относись к модели как к справочнику. Для фактов, цифр, юридических формулировок, конкретных дат — перепроверяй или подключай нормальный источник. Повар отлично формулирует и обобщает, но не годится на роль архива.
- Уверенность ответа — не доказательство. Чем складнее и спокойнее звучит ответ, тем сильнее хочется поверить. Это и есть ловушка. Отдели тон от истины: спрашивай себя «а откуда он это взял и что будет, если он ошибся?».
- Используй её там, где она сильна. Переформулировать, собрать черновик, обобщить длинный текст, предложить варианты — здесь насмотренность работает на тебя. Это её родная стихия, а не зубрёжка фактов.
По сути всё сводится к одной фразе, которую стоит повесить в голове: модель не знает — модель угадывает, что обычно идёт дальше. Гениально угадывает. Но угадывает.
🎮 Верно или миф?
Пять утверждений про модель. Реши по каждому: это правда про устройство модели или распространённый миф. Жми кнопку — и сразу увидишь разбор. Это не экзамен, а проверка, уложился ли образ «повара по насмотренности».
📖 Ключевые понятия
- Модель (ML)
- Главный обитатель кухни AI. Повар, которого «натаскали» на тысячах примеров, и который теперь готовит по насмотренности — обобщает закономерности, а не следует жёсткому рецепту. ML — это machine learning, машинное обучение: способ получить программу не написанием правил, а показом примеров.
- Насмотренность (обобщение)
- То, чем модель отличается от базы данных. Она, как правило, не хранит примеры дословно, а впитывает из них общие закономерности и собирает новое на ходу. Поэтому справляется с непривычным — но поэтому же может уверенно сочинить то, чего не было.
- Предсказание продолжения
- Что модель делает под капотом: слово за словом угадывает, что обычно идёт дальше, исходя из всего «навиденного». Не «достаёт факт», а «собирает вероятное продолжение». Один этот образ объясняет почти всё поведение модели.
- Обучить модель
- Не «запрограммировать по шагам», а показать множество примеров, на которых она уловит закономерности. Как повар учится не по инструкции, а по тысячам приготовленных блюд.
🛡️ Частые заблуждения
«Модель — это умная база данных: она запомнила факты и выдаёт их по запросу»
Нет. База данных хранит и достаёт точные записи, а на отсутствующее честно отвечает «нет такого». Модель, как правило, не достаёт текст дословно — она собирает правдоподобное продолжение по насмотренности и почти никогда не говорит «не знаю». Отсюда вся разница в том, как ей доверять.
«Если нейросеть ответила уверенно — значит, она это знает»
Уверенность и правдивость — разные вещи. Повар подаёт настоящее и выдуманное блюдо одинаково спокойным тоном, потому что для него и то и другое — просто «вероятное продолжение». Складность ответа не повышает его точность ни на грамм.
«Раз модель такая умная, ей точно известны последние новости и цены»
Сама по себе — нет. Повар обучен на том, что застал до определённого момента; свежее ему надо отдельно «принести». Без этого механизма он про вчерашнее либо спасует, либо сочинит. Это не поломка, а прямое следствие того, как модель устроена.
🧠 AI-чутьё (AI Judgment)
Почему модель и гениальна, и врёт — из одного устройства
Вот мысль, которая стоит того, чтобы её запомнить надолго: гениальность модели и её вранье — это не два разных свойства, а одно и то же свойство, повёрнутое разными сторонами. Способность собирать правдоподобное продолжение из насмотренности делает её и невероятно гибкой, и склонной уверенно сочинять. Нельзя забрать второе, не убив первое.
Для тебя как владельца это переводится в простое рабочее правило. Перед тем как опереться на ответ модели, мысленно спроси: «Это задача на формулировку и обобщение — или на точный факт?» На первое модель сильна, ей можно доверять почти не глядя. На второе — относись как к черновику от способного, но не всегда точного помощника: проверяй или подкрепляй источником.
И не борись с природой модели, а используй её. Она не библиотекарь — не требуй от неё справочной точности на голом месте. Она повар по насмотренности — поручай ей то, в чём насмотренность и есть сила. Тогда она работает на тебя, а не подставляет.
🎯 Практика
Одно задание на пять минут, чтобы образ «повара по насмотренности» закрепился на собственном опыте.
- Открой любой привычный AI-чат и задай ему проверяемый фактический вопрос из твоей сферы: точный номер документа, конкретная цифра, дата, имя. Бухгалтеру — про статью кодекса, владельцу магазина — про норму остатка или сколько товара заказать к сезону. Что-то, что ты сможешь сам перепроверить.
- Получив ответ, обрати внимание на тон: насколько уверенно и складно он звучит. Запомни это ощущение «звучит убедительно».
- А теперь перепроверь факт в нормальном источнике. Совпало? Отлично. Не совпало или выдумано? Вот тебе живая иллюстрация: тон был тот же, а правда — нет. После одного такого опыта ты уже не спутаешь повара с библиотекарем.
Помнишь ту сцену из начала — где AI ответил так уверенно, что ты не стал перепроверять? Теперь видно, что там произошло: повар собрал правдоподобное продолжение, а не достал факт. Тон был тот же, что и у правды, — потому он и убедил.