Универсальный Bloom: Analyze ⏱ ~12 мин + практика 10 контроль

Цель + термощуп: SMART-цели и мониторинг

🧊 Won't Have 💧 Could Have ☀️ Should Have 🔥 Must Have

☀️ Should Have

Без проверяемой цели автономный агент бесполезен: он бодро «достигает» того, чего ты не просил. Это твой руль и тормоз над ним.

🤔 Зачем это читать

Ты дал агенту задачу: «подготовь анализ конкурентов к понедельнику». Через час он рапортует: всё готово, отчёт собран, ссылки приложены. Ты выдыхаешь, открываешь в понедельник на встрече — а там половина конкурентов не те, цены за позапрошлый год, а главного игрока вообще нет. Агент честно сделал шаги. Просто шаги вели не туда. И заметил ты это в самый неудачный момент — когда поправить уже поздно.

Знакомо? Это не про то, что агент «глупый». Это про то, что ты дал ему размытую задачу — и он добросовестно нашёл свой способ её «выполнить». «Анализ конкурентов» для него — это что угодно, что похоже на анализ конкурентов. Откуда ему знать, что тебе нужны пять конкретных игроков, актуальные цены и сравнение по трём параметрам, если ты этого не сказал? Он не телепат. Он повар, которому крикнули «пожарь что-нибудь» — вот он и пожарил.

И вторая половина боли — даже хорошую задачу мало поставить один раз и уйти. Пока агент работает час, два, десять шагов подряд, он может тихо съехать с рельсов на третьем шаге, а ты узнаешь об этом только в конце. Нужен способ проверять по ходу, а не только на финише.

После этой темы ты сможешь отличить проверяемую цель от размытой и разобрать, где в работе агента нужно поставить контрольные точки, чтобы он не «успешно делал не то». Это два простых инструмента менеджера — чёткая цель и проверка по ходу, — перенесённые на автономного работника, который не человек.

Задержись на 10 секунд. Вспомни задачу, которую ты однажды поставил человеку — стажёру, подрядчику, новому сотруднику — и получил совсем не то, что ждал. Не потому что он схалтурил, а потому что понял тебя по-своему. Что в той постановке было размыто? Держи этот случай в голове: с агентом ровно та же ловушка, только агент переспрашивать не станет.

🍳 «Пожарь что-нибудь» против тикета с термощупом

В прошлой теме (9.1 — Вы говорите ЧТО, агент решает КАК) мы договорились: ты ставишь что нужно получить, а как к этому прийти — агент придумывает сам, строя план на лету (планирование / planning — это когда агент сам строит путь к цели, а не идёт по заранее прописанному сценарию). Отлично. Но тут вылезает скрытая дыра: если «что» сформулировано размыто — вся свобода агента в выборе «как» работает против тебя. Он сам решит, что считать выполненной задачей. И решит не так, как ты думал.

Представь два тикета, которые приходят повару на кухню. Первый: «Пожарь что-нибудь». Повар жарит. Технически — задача выполнена, на тарелке что-то есть. Но это лотерея: может, стейк, а может, яичница, а может, то, что у него под рукой завалялось. Второй тикет: «Стейк, прожарка medium, внутри 57 °C, подать за 12 минут». Тут повар не гадает. Цель проверяемая: воткнул термощуп, увидел 57 — попал, увидел 64 — пережарил, переделывай. Есть с чем сверить результат.

Вот вся идея этой темы в одной картинке. Размытая цель оставляет «выполнено» на усмотрение исполнителя. Проверяемая цель задаёт критерий, по которому видно — попал или мимо. Для человека-новичка это разница между провальным и нормальным заданием. Для агента — между «он успешно сделал не то» и «он сделал то, что нужно».

Два тикета на одну кухню

🤷

«Пожарь что-нибудь»

Что считать «готово» — решает повар. Сверить не с чем. На тарелке лотерея.

🌡️

«Стейк medium, 57 °C, 12 мин»

Есть термощуп. Попал или мимо — видно по числу. Не лотерея, а критерий.

Свобода агента в выборе «как» полезна, только если «что» задано так, что результат можно проверить.

🎯 SMART — пять кнопок, которые превращают «хорошо» в проверяемое

Хорошая новость: тебе не надо придумывать новый инструмент. Менеджеры уже лет сорок ставят задачи людям по простой рамке — SMART-цель (конкретная, измеримая, достижимая, релевантная, со сроком). Та же рамка отлично работает и для агента, потому что чинит ровно ту дыру, о которой мы говорим: убирает простор для вольной трактовки «выполнено». Разберём по буквам на нашем «анализе конкурентов».

S — конкретная (Specific). Не «анализ конкурентов», а «сравни пять компаний: вот их список».
M — измеримая (Measurable). Не «сравни», а «по трём параметрам: цена, сроки доставки, гарантия». Теперь видно, готово или нет.
A — достижимая (Achievable). Реально ли это сделать тем, что у агента есть? Если данные о ценах закрыты, «сравни цены» — недостижимо, и он начнёт их выдумывать.
R — релевантная (Relevant). Эта цель правда решает твою задачу? Сравнение по цвету логотипа измеримо, но тебе не нужно.
T — со сроком (Time-bound). «К понедельнику, 10:00». Без срока агент может уйти в бесконечное «копну ещё чуть-чуть».

Сравни сам. «Подготовь анализ конкурентов» — повар жарит что-нибудь. «К понедельнику 10:00 сравни пять компаний из списка по цене, срокам доставки и гарантии; если по позиции нет открытых данных — пометь "нет данных", не выдумывай» — это тикет с термощупом. Заметь, последняя оговорка — это и есть честная «достижимость»: ты заранее сказал, что делать, когда дотянуться не получается. Иначе агент закроет дыру выдумкой (привет галлюцинациям из 2.5 — Галлюцинации — повар с уверенным лицом подаёт блюдо, которого нет в меню).

SMART — пять проверок одной цели

Конкретная. Что именно? «Пять компаний из списка», не «конкуренты».

Измеримая. По чему сверять? «Цена, сроки, гарантия» — три числа.

Достижимая. Хватает ли данных и инструментов? Нет — выдумает.

Релевантная. Эта цель решает твою задачу, а не соседнюю?

Со сроком. «К понедельнику 10:00» — иначе агент копает бесконечно.

🌡️ Термощуп: проверять по ходу, а не только на финише

Чёткая цель — половина дела. Вторая половина — мониторинг (наблюдение за работой по ходу, а не только проверка результата в конце). Хороший повар не ставит стейк на огонь и не уходит курить на 12 минут. Он тыкает термощупом по дороге: 30 °C... 45... 57 — снимай. И если на полпути что-то идёт не так — мясо подгорает по краю, плита скачет, — он замечает это сейчас, а не когда блюдо уже на столе у гостя.

С агентом — то же самое, и именно потому, что он автономный. Он делает не один шаг, а цепочку: нашёл компании → собрал по ним цены → свёл в таблицу → сравнил. Если он на втором шаге притащил не тех конкурентов, то добросовестно построит идеальную таблицу по неправильным данным. Без контрольных точек ты узнаешь это в конце. С контрольными точками — ловишь на втором шаге, пока цена ошибки — минута, а не сорванная встреча.

А что делать, когда термощуп показал отклонение? Тут вступает третий инструмент — эскалация (передать ход человеку, когда что-то пошло не по плану). Повар, у которого не привезли заявленную рыбу, не подаёт молча курицу вместо неё и не выдумывает блюдо — он зовёт шефа: «рыбы нет, что делаем?». Агент должен уметь так же: уткнулся в препятствие, которое сам безопасно не разрулит, — остановись и позови человека. Это не слабость агента. Это разница между «тихо налажал» и «вовремя предупредил».

Цель → работа с проверками по ходу → результат

🎯

SMART-цель: что и по чему сверять

→

🌡️

Мониторинг: термощуп на каждом шаге

→

✅

Результат, сверенный с целью

🔔 Термощуп показал отклонение, которое агент сам не разрулит → эскалация: остановись и позови шефа-человека. Не подавай молча не то.

🔁 Как это выглядит изнутри (на пальцах)

Ниже та же тройка — цель, термощуп, эскалация — собрана в одну логику, псевдокодом. Это не настоящий код, а человеческий язык по шагам (пролистай, если суть уже ясна из повара).

Псевдокод (на пальцах) · цель + термощуп + эскалация # это НЕ настоящий код, а логика на человеческом языке

# 1. ставим ПРОВЕРЯЕМУЮ цель — с критериями, а не «сделай хорошо»
цель = «5 компаний из списка, по цене / срокам / гарантии, к Пн 10:00»
критерий_готово = «все 5 закрыты по 3 параметрам, нет выдуманных чисел»

# 2. агент работает шагами и СВЕРЯЕТСЯ по ходу (мониторинг)
пока цель не достигнута:
    результат_шага = агент делает следующий шаг
    термощуп = сверить результат_шага с целью и критерием

    # 3. отклонение, которое сам не разрулит → зови человека
    если термощуп показал отклонение И агент не может исправить сам:
        эскалация → остановись, опиши проблему, позови шефа-человека
# без критерия_готово шаг «сверить» проверять НЕ с чем — и весь контроль рассыпается

Заметь главное: вся конструкция держится на одной строчке — критерий_готово. Нет проверяемого критерия — и «сверить с целью» становится пустым жестом, термощуп тыкать не во что. Поэтому SMART-цель не отдельная бюрократия «до», а фундамент, без которого мониторинг и эскалация не работают вообще. И ещё: всё это — не про «агент стал умнее». Это про то, что ты дал ему с чем сверяться и когда звать на помощь. Контроль — твой, не его.

🎮 Размыто, проверяемо — или где ставить термощуп?

Шесть карточек с работы. В каждой — формулировка цели для агента или вопрос про контроль по ходу. Реши, к какой полке её отнести. Сначала прикинь про себя, потом жми и сверяйся — разбор появится сразу. Это не экзамен, это тренировка глаза на проверяемость.

Держи три ярлыка перед глазами: 🤷 Размытая цель — «выполнено» решает сам агент. 🌡️ Проверяемая (SMART) цель — есть с чем сверить результат. 🔔 Точка контроля по ходу — момент, где надо тыкнуть термощупом или позвать человека, не дожидаясь финала.

📖 Ключевые понятия

SMART-цель: Рамка постановки задачи: конкретная, измеримая, достижимая, релевантная, со сроком. Превращает «сделай хорошо» в тикет с термощупом, по которому видно — попал результат или мимо. Знакома любому менеджеру по работе с людьми; для агента работает так же и закрывает простор для вольной трактовки «выполнено».
Мониторинг (monitoring): Наблюдение за работой агента по ходу, а не только проверка результата в конце. Повар тыкает термощупом на каждом шаге, а не уходит на 12 минут. Контрольные точки ловят съезд с рельсов, пока цена ошибки — минута, а не сорванная встреча.
Эскалация (escalation): Передать ход человеку, когда термощуп показал отклонение, которое агент сам безопасно не разрулит. Повар, у которого не привезли рыбу, зовёт шефа, а не подаёт молча курицу и не выдумывает блюдо. Альтернатива эскалации — перестроить план самому, если это в его власти (рыбы нет — переиграть меню на курицу). Это не слабость агента, а разница между «тихо налажал» и «вовремя предупредил».
«Выполнил шаги» ≠ «достиг цели»: Главная ловушка автономных агентов: агент может добросовестно сделать все шаги и бодро отчитаться, но привести не к тому результату — потому что цель была размытой. Шаги — это «как», цель — это «что». Без проверяемого «что» успешное «как» ничего не гарантирует.

🛡️ Частые заблуждения

«SMART — это бюрократия для людей, агенту хватит пары слов»

Ровно наоборот. С живым сотрудником пара слов проходит: он переспросит, додумает по контексту, увидит твоё лицо на встрече и сам поймёт, что промахнулся. Агент ничего из этого не делает — он не переспрашивает и не чувствует, что съехал. Поэтому те самые пять букв, которые человеку и правда часто избыточны, для агента становятся единственным способом задать ему критерий «готово». Это не бумажная формальность «до», а тот самый термощуп, без которого мониторинг и эскалация дальше не на что опереть.

«Чем умнее модель, тем меньше нужны чёткие цели — она сама догадается, что мне нужно»

Наоборот: чем агент автономнее и «способнее», тем дороже стоит размытая цель, потому что он энергичнее уйдёт в свою трактовку. Модель не телепат и переспрашивать сама не станет. Чёткая цель — не костыль для слабой модели, а руль для любой. Умному исполнителю плохая постановка задачи вредит даже сильнее.

«Хватит проверить результат в конце — зачем дёргать агента по ходу»

Затем, что проверка только на финише — это узнать о пожаре, когда дом уже сгорел. Если агент съехал на втором шаге из шести, оставшиеся четыре он идеально обработает по неправильным данным. Контроль по ходу ловит ошибку, пока её цена — минута. Особенно дёшево проверить план агента до того, как он вообще начал выполнять.

🧠 AI-чутьё (AI Judgment)

Измеримая цель плюс проверка по ходу — это и есть твой реальный контроль над автономным агентом

Вот мысль, ради которой стоит запомнить тему: автономность агента ценна ровно настолько, насколько ты можешь проверить, что он сделал то, что нужно. Дал размытую цель и ушёл — получил красивый отчёт о выполнении не той задачи, и узнал об этом поздно. Дал проверяемую цель и поставил пару контрольных точек — получил рычаг управления, не стоя у плиты. SMART плюс мониторинг — это не бюрократия, это руль и тормоз над автономным работником, который не человек и переспрашивать не будет.

И тут хорошая новость для тебя как для владельца: оба инструмента ты уже знаешь. Чёткая постановка задачи и проверка по ходу — это ровно то, чем ты управляешь живыми сотрудниками и подрядчиками. Ничего нового учить не надо, надо перенести знакомый менеджерский навык на нечеловеческого исполнителя. Поэтому к любому предложению «давайте дадим агенту автономную задачу» прикладывай два вопроса: «по какому проверяемому критерию я пойму, что он сделал то, что нужно?» и «в какой момент по ходу я увижу, что он съезжает, — и кого он позовёт, если упрётся?». Нет ответов на оба — автономии нет, есть лотерея с уверенным отчётом в конце.

Держи нить вперёд. Дальше в модуле 9 эта линия разворачивается: 9.1 — Вы говорите ЧТО, агент решает КАК — про саму границу «что» и «как»; 9.2 — Главный вопрос: КАК уже известно или его надо открыть — где первый из этих двух вопросов («по какому критерию пойму, что сделал то, что нужно?») превращается в развилку: если «как» известно заранее — планирующий агент вообще не нужен, хватит обычного workflow (заранее прописанного сценария), который дешевле и надёжнее на рутине. А термощуп и эскалация из этой темы — частный случай большой темы «как ловить и обрабатывать сбои у агента», к которой курс ещё вернётся.

🎯 Практика

Десять минут — и «термощуп» из метафоры станет твоим рабочим чек-листом перед тем, как доверить агенту автономную задачу.

Вспомни ту размытую задачу из начала — которую ты однажды поставил человеку и получил не то. Запиши её исходную формулировку в одну строку.
Перепиши её как SMART-цель: пройди по пяти буквам и закрой каждую. Что конкретно (S)? По чему сверять результат (M)? Хватает ли данных и инструментов, чтобы это вообще сделать (A)? Решает ли это твою настоящую задачу (R)? К какому сроку (T)? Особенно честно проверь A — самая частая дыра, через которую агент уходит в выдумку.
Теперь поставь две контрольные точки: где по ходу ты захочешь сверить промежуточный результат с целью (термощуп) — и сформулируй одним предложением, при каком отклонении агент должен остановиться и позвать тебя (эскалация), а не молча подать «курицу вместо рыбы».

Помнишь «подготовь анализ конкурентов», который пришёл мимо в понедельник? Теперь видно, почему: это был тикет «пожарь что-нибудь», без критерия и без проверок по ходу. Тикет с термощупом — «5 компаний из списка, по цене / срокам / гарантии, к Пн 10:00, нет данных — пометь, не выдумывай», плюс сверка плана до старта и середины по ходу — пришёл бы тем, что нужно.

🔗 Что дальше

Следующая тема: 9.4 — Deep Research: агент сам обходит рынок за ~5 минут вместо часов ручной работы. Самый наглядный пример всего модуля: агент-исследователь (Deep Research) сам строит план, обходит источники и приносит готовую сводку — и почему перед таким стоит сверить план до старта и проверять цитаты на выходе (ровно термощуп из этой темы в деле).

Связанные темы (уже готовы):

5.1 — Цикл ReAct: как агент думает шагами — тот самый цикл «сделал → посмотрел → решил, что дальше», в который мы и встраиваем термощуп-проверку на каждом витке.
1.2 — Workflow vs Agent: кто решает следующий шаг — развилка, от которой всё пляшет: если путь известен заранее, планирующий агент с SMART-целью не нужен — хватит дешёвого и надёжного сценария.
2.5 — Галлюцинации — почему недостижимая цель толкает агента выдумывать данные с уверенным лицом, и зачем в постановке прямо писать «нет данных — так и пометь».

Соседи по модулю 9 (планирование и декомпозиция):

9.1 — Вы говорите ЧТО, агент решает КАК — про саму границу «что» (твоё) и «как» (агента); прямой фундамент под этой темой.
9.2 — Главный вопрос: КАК уже известно или его надо открыть — честная развилка, нужен ли тут вообще планирующий агент или для рутины хватит обычного сценария.