Андрагогика Bloom: Evaluate ⏱ 10 мин кухня изнутри факты с датой

Reasoning-модели: когда «дать подумать» окупается

🧊 Won't Have 💧 Could Have ☀️ Should Have 🔥 Must Have
☀️ Should Have
Не фундамент, но прямо влияет на счёт за AI. Тема, на которой легко переплатить, сам того не заметив.

🤔 Зачем это читать

Конец месяца, тебе приносят счёт за AI-помощника, которого вы подключили в отдел. Сумма в три раза выше, чем планировали, и при этом сотрудники жалуются: «отвечает медленно, ждём по десять секунд каждую мелочь». Открываете настройки — а там стоит галка «режим глубокого рассуждения», и стоит она на всех запросах подряд. И на «переформулируй это письмо повежливее», и на «разнеси эти 200 платежей по категориям». За обдумывание простых задач вы платили как за сложные. Деньги и время сгорели на пустом месте.

Бывает и зеркальная история. Вы, наоборот, боитесь «дорогого режима» как огня и держите всё на самой быстрой и дешёвой настройке. А потом выясняется, что AI накосячил ровно там, где цена ошибки была высокой: запутался в многоступенчатом расчёте скидок, неверно свёл договор, выдал план с дырой в логике. Там «дать ему подумать» окупилось бы стократно — а вы из экономии не дали.

Корень обеих историй один: появился новый класс моделей — reasoning-модели (модели с «рассуждением»), которые перед ответом тратят дополнительное «обдумывание». И есть ручка, которой это обдумывание регулируют. Кто не понимает, как она работает, крутит её наугад — и либо переплачивает, либо недодаёт там, где надо.

После этой темы ты сможешь сам решать, где «режим размышления» окупается, а где это деньги и секунды на ветер. Не по наитию, а по понятному правилу. Это прямая экономия на счёте за AI — и страховка от тупых ошибок в важных задачах.

Задержись на 10 секунд. Вспомни задачу, которую ты недавно поручал AI. Простая она была или с подвохом — много шагов, где легко запутаться? А теперь честно: ты вообще задумывался, сколько ему «думать» над ней? Скорее всего, нет — настройка стояла по умолчанию. Держи эту задачу в голове: к концу страницы ты прикинешь, верный ли режим на ней стоял.

🧑‍🍳 Повар, который сначала думает, потом готовит

Вернёмся к нашему повару. В теме 2.3 — Токены и контекстное окно мы говорили, что модель собирает ответ кусочками — токенами (токен — это кусочек текста, примерно слог или короткое слово). Обычная модель работает как повар на потоке: услышал заказ — сразу начал готовить, выдаёт блюдо без паузы.

А теперь представь повара перед сложным банкетом на 50 персон. Хороший повар не кидается сразу к плите. Он сначала садится и мысленно прогоняет всё по шагам: какая очерёдность блюд, что готовить заранее, где узкое место, что с чем подать. Делает заготовки в голове, ловит ошибку до того, как она попала в тарелку. Только потом встаёт к плите. Эти несколько минут раздумий — не безделье. Это и есть то, что спасает банкет.

Reasoning-модель (от англ. reasoning — рассуждение) работает ровно так же. Перед тем как дать тебе ответ, она сначала прогоняет задачу «на бумаге»: разбивает на шаги, прикидывает варианты, проверяет себя, отбрасывает тупиковые ходы. И только потом выдаёт чистовой ответ. Технически это называют test-time compute (дополнительные вычисления в момент ответа) — но тебе важна суть: модель тратит силы на обдумывание, а не сразу болтает.

Два способа подать ответ
Обычная модель
Услышал заказ — сразу готовит. Быстро, дёшево. На простом — то что надо.
vs
🧠
Reasoning-модель
Сначала продумывает по шагам «на бумаге», потом готовит. Медленнее и дороже — но точнее на сложном.
Главное: «подумать» — это не бесплатно. Это всегда обмен: ты платишь временем и деньгами за точность. Вопрос только в том, стоит ли блюдо этой паузы.

💸 За «раздумья» ты платишь, хотя их не видишь

Вот что не очевидно и где зарыты деньги. Когда повар думает над банкетом — ты этих мыслей не слышишь, в тарелку они не попадают. Так же и тут: то самое обдумывание модель проводит в скрытых «думающих» токенах (thinking-токены). Тебе их обычно не показывают — ты видишь только чистовой ответ. Но — и вот ключевое — платишь ты за них тоже. Причём «раздумья» тарифицируются как самая дорогая часть счёта.

Дам тебе порядок цифр, на момент весны 2026.

Запомни этот образ: скрытые «раздумья» — как счётчик такси, который тикает, пока повар стоит и размышляет. На сложном маршруте это окупается. Стоять с включённым счётчиком, чтобы намазать бутерброд, — просто жечь деньги.

🎚 Ручка «бюджет на размышление»

Хорошая новость: думать «всегда по максимуму» тебя никто не заставляет. У reasoning-моделей есть ручка — «бюджет на размышление» (по-английски её обычно зовут reasoning effort, то есть «усилие на рассуждение»). Ей ты говоришь модели, насколько глубоко обдумывать ответ перед тем, как его дать.

На момент весны 2026 у флагманских моделей эта ручка стала стандартом и обычно имеет несколько ступеней — что-то вроде «не думать / чуть-чуть / средне / по максимуму». А некоторые модели умеют сами решать, сколько думать над конкретным запросом: пришла мелочь — отвечают сразу, прилетела головоломка — притормаживают и обдумывают.

Это и есть рычаг в твоих руках как владельца. Одной и той же моделью можно покрыть и дешёвые быстрые задачи, и дорогие точные — надо лишь крутить ручку под задачу, а не оставлять её в одном положении на всё подряд. В псевдокоде логика владельца выглядит так:

Псевдокод · как решать, сколько «думать» # это НЕ настоящий код, а логика на человеческом языке

если задача = «простая и проверяемая» (переформулировать, разнести по категориям):
  бюджет_на_размышление = «не думать / минимум»  # быстро и дёшево

иначе если цена_ошибки = «высокая» (расчёт, разбор договора, план):
  бюджет_на_размышление = «по максимуму»  # пусть подумает, оно того стоит

иначе:
  бюджет_на_размышление = «средне»  # золотая середина

# вопрос не «модель умная или нет», а «стоит ли ЭТА задача паузы и денег»

⚖️ Где пролегает граница окупаемости

Соберём всё в одно рабочее правило, потому что именно по нему ты будешь принимать решения. Граница простая: «раздумья» окупаются там, где есть над чем думать и где ошибка дорого стоит.

Окупается (включай побольше думать): многоступенчатые расчёты, разбор юридических и финансовых документов, сложное планирование, проверка чужой логики на дыры, глубокое исследование вопроса. Всё, где один неверный шаг тянет за собой цепочку и где лучше подождать минуту, чем потом разгребать. Это банкет — повар обязан продумать.

Не окупается (держи минимум): классификация и сортировка, короткие однозначные ответы, переформулировка текста, быстрый чат с клиентом, где важна мгновенная реакция. Тут думать не над чем — модель и так знает ответ, а пауза только злит клиента и жжёт бюджет. Это бутерброд — раздумья над ним выглядят глупо.

И держи в голове предупреждение из глоссария: больше «размышления» — не всегда лучше. Это не та ручка, которую полезно выкрутить на максимум «на всякий случай». Выкрученная без нужды, она бьёт по двум вещам сразу — по счёту и по терпению пользователя. А выигрыша не даёт, если думать было не над чем.

Прежде чем крутить ручку — выскажи гипотезу. Сейчас в тренажёре ты будешь двигать «бюджет на размышление» для разных задач. Прикинь заранее: как, по-твоему, поведут себя точность и цена, если на простой задаче выкрутить размышление на максимум? А на сложной оставить минимум? Где, по твоему чутью, лежит «золотая середина»? Запомни свои ставки — а потом проверь их на ползунке.

🎮 Покрути бюджет на размышление

Три задачи разной сложности. Выбери задачу, двигай ползунок «бюджет на размышление» — и смотри, как меняются точность, цена и время. Найди для каждой задачи положение, где это окупается. Подсказка-эксперта появится, как только сдвинешь ползунок.

Задача
Сейчас разбираем
Бюджет на размышление
🎯 Точность
💸 Цена
⏱ Время

📖 Ключевые понятия

Reasoning-модель (модель с «рассуждением»)
Модель, которая перед ответом сначала прогоняет задачу по шагам — как повар, продумывающий сложный банкет «на бумаге» до того, как встать к плите. Точнее на сложных задачах, но медленнее и дороже обычной.
«Думающие» токены (thinking-токены)
Скрытое обдумывание модели. Тебе его обычно не показывают — ты видишь только чистовой ответ. Но платишь ты за него тоже, причём дороже всего остального в счёте. Как мысли повара: в тарелку не попадают, а в зарплату — да.
Бюджет на размышление (reasoning effort)
Ручка, которой ты задаёшь, насколько глубоко модели обдумывать ответ — от «не думать» до «по максимуму». Главный твой рычаг: одной моделью покрыть и быстрое-дешёвое, и точное-дорогое.
Test-time compute (вычисления в момент ответа)
Техническое название того, что происходит: модель тратит дополнительные силы не во время обучения, а прямо когда отвечает тебе. Тебе важна не механика, а следствие — за это обдумывание идут время и деньги.

🛡️ Частые заблуждения

«Reasoning-модель умнее — значит, надо ставить её на все задачи»

Нет, и это самая дорогая ошибка в теме. На простых задачах думать не над чем — точность не растёт, зато счёт и задержки взлетают. «На всё подряд» — прямой путь к тройному счёту в конце месяца. Включай размышление там, где над задачей действительно есть что обдумывать.

«Раз раздумий модели не видно, они и не стоят денег»

Стоят, и обычно дороже всего. Скрытые «думающие» токены тарифицируются как самая дорогая часть запроса — просто их тебе не показывают. Это как счётчик такси, который тикает, пока повар молча размышляет на кухне.

«Выкрутишь размышление на максимум — получишь максимум точности»

Отдача нелинейна. Втрое больше раздумий не даёт втрое больше точности — на момент весны 2026 на сложной задаче это добавляет, по разным оценкам, лишь несколько процентных пунктов, а на простой не даёт ничего. «Средне» часто выгоднее, чем «по максимуму».

🧠 AI-чутьё (AI Judgment)

Когда «дать подумать» окупается, а когда это переплата

Свернём всё в одну рабочую установку, которую стоит держать в голове каждый раз, когда настраиваешь AI под задачу: вопрос не в том, умная модель или нет, а в том, стоит ли ИМЕННО ЭТА задача паузы и денег. Размышление — это не «премиум-качество, которое всегда лучше». Это обмен: ты покупаешь точность за время и деньги. Иногда сделка отличная, иногда грабительская.

Простой тест перед тем, как включить «глубокое рассуждение»: задай себе два вопроса. Первый — «есть ли тут над чем думать?» (много шагов, развилки, скрытые ловушки — или ответ очевиден). Второй — «дорого ли стоит ошибка?» (пропущенная ловушка в договоре — дорого; неидеально вежливое письмо — нет). Два «да» — давай думать по максимуму. Два «нет» — держи минимум и не переплачивай.

И помни про обратную ошибку, не только про переплату. Скупиться на размышление там, где цена ошибки высокая, — экономия, которая выходит боком. Сэкономленные центы не стоят запоротого договора. Хороший владелец не выкручивает ручку в крайнее положение «навсегда» — он крутит её под задачу. Кстати, эта мысль — частный случай большой темы про то, как держать счёт за AI под контролем, не теряя в качестве; к ней мы ещё вернёмся отдельно.

🎯 Практика

Одно задание на пять минут — превратить правило в привычку на твоих реальных задачах.

  1. Выпиши три задачи, которые ты (или твой отдел) регулярно поручаете AI. Реальные, из рабочей недели.
  2. Для каждой задай два вопроса из AI-чутья: «есть ли тут над чем думать?» и «дорого ли стоит ошибка?». Отметь каждую как «бутерброд» (минимум размышления), «обычное блюдо» (середина) или «банкет» (по максимуму).
  3. Теперь сходи в настройки своего AI-инструмента и проверь, на каком режиме он сейчас работает по умолчанию. Совпадает ли он с тем, что нужно твоим задачам? Если на всё подряд стоит «глубокое рассуждение» — ты, скорее всего, переплачиваешь. Если самый дешёвый режим, а среди задач есть «банкеты» — рискуешь качеством там, где не стоило бы.
  4. А теперь самое важное. Выбери из своих трёх задач самую спорную — ту, где два вопроса AI-чутья тянут в разные стороны (например, чат с VIP-клиентом: и скорость важна, и цена ошибки высока). Прими по ней решение и защити его в двух-трёх фразах — так, будто обосновываешь режим перед человеком, который держит бюджет: что перевесило и почему ты готов заплатить именно эту цену за именно эту точность. Тут нет «эталонного» ответа — есть твоё взвешенное решение.

Помнишь задачу, которую ты держал в голове в начале? Прогони её через те же два вопроса. Бутерброд или банкет? И стоял ли на ней верный режим — или ты, сам того не зная, либо переплачивал, либо недодавал там, где надо было дать подумать?

🔗 Что дальше

Следующий шаг: 11.10 — Стоимость и скорость: как держать счёт за AI под контролем (этот модуль ещё впереди). Бюджет на размышление — лишь одна из ручек, которыми регулируют цену и скорость AI. Там собраны все остальные: какую модель на какую задачу, как не переплачивать на потоке, где экономия бьёт по качеству, а где безопасна.

Связанные темы: