Цель + термощуп: SMART-цели и мониторинг
🤔 Зачем это читать
Ты дал агенту задачу: «подготовь анализ конкурентов к понедельнику». Через час он рапортует: всё готово, отчёт собран, ссылки приложены. Ты выдыхаешь, открываешь в понедельник на встрече — а там половина конкурентов не те, цены за позапрошлый год, а главного игрока вообще нет. Агент честно сделал шаги. Просто шаги вели не туда. И заметил ты это в самый неудачный момент — когда поправить уже поздно.
Знакомо? Это не про то, что агент «глупый». Это про то, что ты дал ему размытую задачу — и он добросовестно нашёл свой способ её «выполнить». «Анализ конкурентов» для него — это что угодно, что похоже на анализ конкурентов. Откуда ему знать, что тебе нужны пять конкретных игроков, актуальные цены и сравнение по трём параметрам, если ты этого не сказал? Он не телепат. Он повар, которому крикнули «пожарь что-нибудь» — вот он и пожарил.
И вторая половина боли — даже хорошую задачу мало поставить один раз и уйти. Пока агент работает час, два, десять шагов подряд, он может тихо съехать с рельсов на третьем шаге, а ты узнаешь об этом только в конце. Нужен способ проверять по ходу, а не только на финише.
После этой темы ты сможешь отличить проверяемую цель от размытой и разобрать, где в работе агента нужно поставить контрольные точки, чтобы он не «успешно делал не то». Это два простых инструмента менеджера — чёткая цель и проверка по ходу, — перенесённые на автономного работника, который не человек.
Задержись на 10 секунд. Вспомни задачу, которую ты однажды поставил человеку — стажёру, подрядчику, новому сотруднику — и получил совсем не то, что ждал. Не потому что он схалтурил, а потому что понял тебя по-своему. Что в той постановке было размыто? Держи этот случай в голове: с агентом ровно та же ловушка, только агент переспрашивать не станет.
🍳 «Пожарь что-нибудь» против тикета с термощупом
В прошлой теме (9.1 — Вы говорите ЧТО, агент решает КАК) мы договорились: ты ставишь что нужно получить, а как к этому прийти — агент придумывает сам, строя план на лету (планирование / planning — это когда агент сам строит путь к цели, а не идёт по заранее прописанному сценарию). Отлично. Но тут вылезает скрытая дыра: если «что» сформулировано размыто — вся свобода агента в выборе «как» работает против тебя. Он сам решит, что считать выполненной задачей. И решит не так, как ты думал.
Представь два тикета, которые приходят повару на кухню. Первый: «Пожарь что-нибудь». Повар жарит. Технически — задача выполнена, на тарелке что-то есть. Но это лотерея: может, стейк, а может, яичница, а может, то, что у него под рукой завалялось. Второй тикет: «Стейк, прожарка medium, внутри 57 °C, подать за 12 минут». Тут повар не гадает. Цель проверяемая: воткнул термощуп, увидел 57 — попал, увидел 64 — пережарил, переделывай. Есть с чем сверить результат.
Вот вся идея этой темы в одной картинке. Размытая цель оставляет «выполнено» на усмотрение исполнителя. Проверяемая цель задаёт критерий, по которому видно — попал или мимо. Для человека-новичка это разница между провальным и нормальным заданием. Для агента — между «он успешно сделал не то» и «он сделал то, что нужно».
🎯 SMART — пять кнопок, которые превращают «хорошо» в проверяемое
Хорошая новость: тебе не надо придумывать новый инструмент. Менеджеры уже лет сорок ставят задачи людям по простой рамке — SMART-цель (конкретная, измеримая, достижимая, релевантная, со сроком). Та же рамка отлично работает и для агента, потому что чинит ровно ту дыру, о которой мы говорим: убирает простор для вольной трактовки «выполнено». Разберём по буквам на нашем «анализе конкурентов».
- S — конкретная (Specific). Не «анализ конкурентов», а «сравни пять компаний: вот их список».
- M — измеримая (Measurable). Не «сравни», а «по трём параметрам: цена, сроки доставки, гарантия». Теперь видно, готово или нет.
- A — достижимая (Achievable). Реально ли это сделать тем, что у агента есть? Если данные о ценах закрыты, «сравни цены» — недостижимо, и он начнёт их выдумывать.
- R — релевантная (Relevant). Эта цель правда решает твою задачу? Сравнение по цвету логотипа измеримо, но тебе не нужно.
- T — со сроком (Time-bound). «К понедельнику, 10:00». Без срока агент может уйти в бесконечное «копну ещё чуть-чуть».
Сравни сам. «Подготовь анализ конкурентов» — повар жарит что-нибудь. «К понедельнику 10:00 сравни пять компаний из списка по цене, срокам доставки и гарантии; если по позиции нет открытых данных — пометь "нет данных", не выдумывай» — это тикет с термощупом. Заметь, последняя оговорка — это и есть честная «достижимость»: ты заранее сказал, что делать, когда дотянуться не получается. Иначе агент закроет дыру выдумкой (привет галлюцинациям из 2.5 — Галлюцинации — повар с уверенным лицом подаёт блюдо, которого нет в меню).
🌡️ Термощуп: проверять по ходу, а не только на финише
Чёткая цель — половина дела. Вторая половина — мониторинг (наблюдение за работой по ходу, а не только проверка результата в конце). Хороший повар не ставит стейк на огонь и не уходит курить на 12 минут. Он тыкает термощупом по дороге: 30 °C... 45... 57 — снимай. И если на полпути что-то идёт не так — мясо подгорает по краю, плита скачет, — он замечает это сейчас, а не когда блюдо уже на столе у гостя.
С агентом — то же самое, и именно потому, что он автономный. Он делает не один шаг, а цепочку: нашёл компании → собрал по ним цены → свёл в таблицу → сравнил. Если он на втором шаге притащил не тех конкурентов, то добросовестно построит идеальную таблицу по неправильным данным. Без контрольных точек ты узнаешь это в конце. С контрольными точками — ловишь на втором шаге, пока цена ошибки — минута, а не сорванная встреча.
А что делать, когда термощуп показал отклонение? Тут вступает третий инструмент — эскалация (передать ход человеку, когда что-то пошло не по плану). Повар, у которого не привезли заявленную рыбу, не подаёт молча курицу вместо неё и не выдумывает блюдо — он зовёт шефа: «рыбы нет, что делаем?». Агент должен уметь так же: уткнулся в препятствие, которое сам безопасно не разрулит, — остановись и позови человека. Это не слабость агента. Это разница между «тихо налажал» и «вовремя предупредил».
🔁 Как это выглядит изнутри (на пальцах)
Ниже та же тройка — цель, термощуп, эскалация — собрана в одну логику, псевдокодом. Это не настоящий код, а человеческий язык по шагам (пролистай, если суть уже ясна из повара).
# 1. ставим ПРОВЕРЯЕМУЮ цель — с критериями, а не «сделай хорошо»
цель = «5 компаний из списка, по цене / срокам / гарантии, к Пн 10:00»
критерий_готово = «все 5 закрыты по 3 параметрам, нет выдуманных чисел»
# 2. агент работает шагами и СВЕРЯЕТСЯ по ходу (мониторинг)
пока цель не достигнута:
результат_шага = агент делает следующий шаг
термощуп = сверить результат_шага с целью и критерием
# 3. отклонение, которое сам не разрулит → зови человека
если термощуп показал отклонение И агент не может исправить сам:
эскалация → остановись, опиши проблему, позови шефа-человека
# без критерия_готово шаг «сверить» проверять НЕ с чем — и весь контроль рассыпается
Заметь главное: вся конструкция держится на одной строчке — критерий_готово. Нет проверяемого критерия — и «сверить с целью» становится пустым жестом, термощуп тыкать не во что. Поэтому SMART-цель не отдельная бюрократия «до», а фундамент, без которого мониторинг и эскалация не работают вообще. И ещё: всё это — не про «агент стал умнее». Это про то, что ты дал ему с чем сверяться и когда звать на помощь. Контроль — твой, не его.
🎮 Размыто, проверяемо — или где ставить термощуп?
Шесть карточек с работы. В каждой — формулировка цели для агента или вопрос про контроль по ходу. Реши, к какой полке её отнести. Сначала прикинь про себя, потом жми и сверяйся — разбор появится сразу. Это не экзамен, это тренировка глаза на проверяемость.
Держи три ярлыка перед глазами: 🤷 Размытая цель — «выполнено» решает сам агент. 🌡️ Проверяемая (SMART) цель — есть с чем сверить результат. 🔔 Точка контроля по ходу — момент, где надо тыкнуть термощупом или позвать человека, не дожидаясь финала.
📖 Ключевые понятия
- SMART-цель
- Рамка постановки задачи: конкретная, измеримая, достижимая, релевантная, со сроком. Превращает «сделай хорошо» в тикет с термощупом, по которому видно — попал результат или мимо. Знакома любому менеджеру по работе с людьми; для агента работает так же и закрывает простор для вольной трактовки «выполнено».
- Мониторинг (monitoring)
- Наблюдение за работой агента по ходу, а не только проверка результата в конце. Повар тыкает термощупом на каждом шаге, а не уходит на 12 минут. Контрольные точки ловят съезд с рельсов, пока цена ошибки — минута, а не сорванная встреча.
- Эскалация (escalation)
- Передать ход человеку, когда термощуп показал отклонение, которое агент сам безопасно не разрулит. Повар, у которого не привезли рыбу, зовёт шефа, а не подаёт молча курицу и не выдумывает блюдо. Альтернатива эскалации — перестроить план самому, если это в его власти (рыбы нет — переиграть меню на курицу). Это не слабость агента, а разница между «тихо налажал» и «вовремя предупредил».
- «Выполнил шаги» ≠ «достиг цели»
- Главная ловушка автономных агентов: агент может добросовестно сделать все шаги и бодро отчитаться, но привести не к тому результату — потому что цель была размытой. Шаги — это «как», цель — это «что». Без проверяемого «что» успешное «как» ничего не гарантирует.
🛡️ Частые заблуждения
«SMART — это бюрократия для людей, агенту хватит пары слов»
Ровно наоборот. С живым сотрудником пара слов проходит: он переспросит, додумает по контексту, увидит твоё лицо на встрече и сам поймёт, что промахнулся. Агент ничего из этого не делает — он не переспрашивает и не чувствует, что съехал. Поэтому те самые пять букв, которые человеку и правда часто избыточны, для агента становятся единственным способом задать ему критерий «готово». Это не бумажная формальность «до», а тот самый термощуп, без которого мониторинг и эскалация дальше не на что опереть.
«Чем умнее модель, тем меньше нужны чёткие цели — она сама догадается, что мне нужно»
Наоборот: чем агент автономнее и «способнее», тем дороже стоит размытая цель, потому что он энергичнее уйдёт в свою трактовку. Модель не телепат и переспрашивать сама не станет. Чёткая цель — не костыль для слабой модели, а руль для любой. Умному исполнителю плохая постановка задачи вредит даже сильнее.
«Хватит проверить результат в конце — зачем дёргать агента по ходу»
Затем, что проверка только на финише — это узнать о пожаре, когда дом уже сгорел. Если агент съехал на втором шаге из шести, оставшиеся четыре он идеально обработает по неправильным данным. Контроль по ходу ловит ошибку, пока её цена — минута. Особенно дёшево проверить план агента до того, как он вообще начал выполнять.
🧠 AI-чутьё (AI Judgment)
Измеримая цель плюс проверка по ходу — это и есть твой реальный контроль над автономным агентом
Вот мысль, ради которой стоит запомнить тему: автономность агента ценна ровно настолько, насколько ты можешь проверить, что он сделал то, что нужно. Дал размытую цель и ушёл — получил красивый отчёт о выполнении не той задачи, и узнал об этом поздно. Дал проверяемую цель и поставил пару контрольных точек — получил рычаг управления, не стоя у плиты. SMART плюс мониторинг — это не бюрократия, это руль и тормоз над автономным работником, который не человек и переспрашивать не будет.
И тут хорошая новость для тебя как для владельца: оба инструмента ты уже знаешь. Чёткая постановка задачи и проверка по ходу — это ровно то, чем ты управляешь живыми сотрудниками и подрядчиками. Ничего нового учить не надо, надо перенести знакомый менеджерский навык на нечеловеческого исполнителя. Поэтому к любому предложению «давайте дадим агенту автономную задачу» прикладывай два вопроса: «по какому проверяемому критерию я пойму, что он сделал то, что нужно?» и «в какой момент по ходу я увижу, что он съезжает, — и кого он позовёт, если упрётся?». Нет ответов на оба — автономии нет, есть лотерея с уверенным отчётом в конце.
Держи нить вперёд. Дальше в модуле 9 эта линия разворачивается: 9.1 — Вы говорите ЧТО, агент решает КАК — про саму границу «что» и «как»; 9.2 — Главный вопрос: КАК уже известно или его надо открыть — где первый из этих двух вопросов («по какому критерию пойму, что сделал то, что нужно?») превращается в развилку: если «как» известно заранее — планирующий агент вообще не нужен, хватит обычного workflow (заранее прописанного сценария), который дешевле и надёжнее на рутине. А термощуп и эскалация из этой темы — частный случай большой темы «как ловить и обрабатывать сбои у агента», к которой курс ещё вернётся.
🎯 Практика
Десять минут — и «термощуп» из метафоры станет твоим рабочим чек-листом перед тем, как доверить агенту автономную задачу.
- Вспомни ту размытую задачу из начала — которую ты однажды поставил человеку и получил не то. Запиши её исходную формулировку в одну строку.
- Перепиши её как SMART-цель: пройди по пяти буквам и закрой каждую. Что конкретно (S)? По чему сверять результат (M)? Хватает ли данных и инструментов, чтобы это вообще сделать (A)? Решает ли это твою настоящую задачу (R)? К какому сроку (T)? Особенно честно проверь A — самая частая дыра, через которую агент уходит в выдумку.
- Теперь поставь две контрольные точки: где по ходу ты захочешь сверить промежуточный результат с целью (термощуп) — и сформулируй одним предложением, при каком отклонении агент должен остановиться и позвать тебя (эскалация), а не молча подать «курицу вместо рыбы».
Помнишь «подготовь анализ конкурентов», который пришёл мимо в понедельник? Теперь видно, почему: это был тикет «пожарь что-нибудь», без критерия и без проверок по ходу. Тикет с термощупом — «5 компаний из списка, по цене / срокам / гарантии, к Пн 10:00, нет данных — пометь, не выдумывай», плюс сверка плана до старта и середины по ходу — пришёл бы тем, что нужно.