Почему LLM сам ничего не делает
🤔 Зачем это читать
Менеджер по закупкам открывает ChatGPT и пишет: «Какая сейчас цена на нержавейку у нашего поставщика? Сравни с прошлым месяцем». Ответ приходит — складный, с цифрами, с процентом изменения. Он берёт эти цифры в служебную записку. А потом выясняется: модель ни на какой сайт не ходила, ни в какой прайс не заглядывала. Она просто придумала правдоподобные числа, потому что её об этом попросили. Записка ушла наверх с выдумкой.
Знакомо? Или другой вариант, ровно наоборот. На совещании предлагают: «Давайте подключим ChatGPT, чтобы он сам разбирал входящие письма и складывал вложения в нужные папки». Кто-то возражает: «Так он же не умеет лазить по почте». И спор повисает, потому что никто за столом не знает точно — умеет модель сама ходить в почту или нет. А ведь это вопрос на 4 000 000 ₽ бюджета.
Оба раза причина одна. Люди не отделяют то, что умеет сама модель, от того, что вокруг неё приделали разработчики. И поэтому либо ждут от голой модели того, чего она не может (и нарываются на выдумку), либо наоборот не верят, что что-то реально, хотя это решается одной добавкой. И то и другое — дорогие ошибки на ровном месте.
После этой темы ты будешь чётко различать: вот это делает сам «мозг», а вот это — «руки», которые ему приделали. Один этот разрез снимает половину маркетингового тумана про AI и кладёт фундамент под всё, что в курсе дальше — инструменты, агенты, память.
Задержись на 10 секунд. Вспомни последний раз, когда ты видел, как AI «сходил в интернет», «открыл файл» или «нарисовал картинку». Ты ведь думал, что это делает сама модель, да? Подержи эту сцену в голове — к концу страницы ты поймёшь, кто там на самом деле работал руками.
👨🍳 Сначала — одна сцена с кухни
В теме про устройство агента ты уже видел «мозг» и «руки» рядом — как две из частей агента. Теперь разберём вплотную, почему мозг сам по себе вообще ничего не трогает. Начнём с кухни.
Представь шефа. Опытного, насмотренного — того самого «повара по насмотренности» из той же темы про агента (насмотренность — это что модель начиталась гор текста раньше и теперь складно продолжает по образцу). Гость заказал блюдо. Шеф командует: «Обжарь лук до золотистого, потом влей бульон». Звучит как действие, правда? «Обжарь», «влей» — глаголы, приказы.
Но смотри, что произошло на самом деле. Шеф не прикоснулся ни к луку, ни к сковороде. Он только сказал словами, что надо сделать. Лук режет и жарит кто-то другой — поварёнок, у которого есть нож, сковорода и плита. Бульон достаёт из кладовой третий. Шеф — это голова и рот. Руки — отдельные люди и отдельная техника.
Вот ровно так же устроена языковая модель, та самая LLM (большая языковая модель — то, что крутится внутри ChatGPT и подобных). Сама по себе она умеет только одно: превращать текст в текст. Ты дал ей текст — она выдала текст в ответ. Всё. Это её единственное действие, как у шефа — только говорить.
🧠 Модель — это мозг без рук
Скажу прямее, без метафоры, потому что это центр всей темы. Модель не умеет:
- зайти на сайт и посмотреть, что там сейчас;
- открыть твой файл и прочитать его;
- отправить письмо, нажать кнопку, сохранить документ;
- посчитать точно — сложить в столбик длинные числа без ошибки.
Она умеет ровно одно: получить текст и дописать к нему текст-продолжение — складно, по насмотренности. Это её природа, а не недоработка. Как у мозга в банке: он может думать и формулировать сколько угодно, но без рук он ни нальёт чаю, ни откроет дверь.
«Но погоди, — скажешь ты, — я же сам видел, как ChatGPT искал в интернете и рисовал картинки». Видел. И вот тут вся соль: это делал не „мозг". Это делали „руки", которые к мозгу приделали отдельно.
🔧 Что такое «руки» (обвязка) и кто их приделывает
Когда продукт вроде ChatGPT «ищет в интернете», происходит вот что. Модель не лезет в сеть сама. Она выдаёт текст-команду в духе «надо поискать вот это». А рядом сидит обычная программа — её написали разработчики, никакого AI, — которая эту команду читает, реально идёт в поисковик, приносит результат и кладёт его модели обратно как новый текст. И только теперь модель пишет тебе ответ, уже опираясь на принесённое.
Вот эта программа-помощник, которая ходит, кликает, считает и носит результаты туда-сюда, — и есть «руки». В курсе мы зовём такие добавки инструментами (по-английски tools), а всю прослойку вокруг модели — обвязкой. Им посвящён отдельный модуль дальше, тут нам важно одно: их приделывают люди-разработчики, и приделывают по одному, осознанно. Дали инструмент «поиск» — модель умеет искать. Не дали — не умеет, хоть проси, хоть умоляй.
Поэтому одна и та же модель в разных продуктах ведёт себя по-разному. В одном чате она лезет в свежие новости, в другом — нет. Мозг тот же. Руки приделаны разные.
ты_спросил = «Какой сегодня курс доллара?»
# шаг 1 — работает МОЗГ (модель): только текст
модель говорит: «Сам не знаю свежее. Нужен поиск: „курс доллара сегодня"»
# шаг 2 — работают РУКИ (обвязка): обычная программа, не AI
программа идёт в поисковик → приносит сегодняшнее число «курс = X ₽»
программа кладёт это обратно модели как новый текст
# шаг 3 — снова МОЗГ: дописывает ответ по принесённому
модель пишет тебе: «Сегодня курс доллара около X ₽»
# → без шага 2 модель просто выдумала бы число тем же уверенным тоном
💡 Почему тебе это важно как владельцу
Ты тут не разработчик, который приделывает руки. Ты владелец кухни AI — твоё дело понимать, где мозг, а где руки, чтобы тебя не развели и ты сам не ждал чуда не от того места. Три рабочих вывода.
- «Модель сама всё сделает» — это маркетинг, а не факт. Сама она только думает и говорит. Всё «сделает» — это про руки, которые кто-то должен спроектировать, приделать и оплатить. Услышал «оно само» — спрашивай: а руки-то откуда, кто их встроил?
- Если в продукте нет нужного инструмента — модель этого не умеет. Голая модель не знает сегодняшнюю цену, не видит твой файл, не отправит письмо. Хочешь, чтобы умела, — нужна обвязка. Это отдельная работа и отдельные деньги, а не само собой разумеющееся.
- То, что «руки» приделали, можно приделать и под тебя. Хорошая новость обратной стороной: раз почти всё полезное — это инструменты вокруг модели, то под свою задачу руки тоже можно собрать. Именно это и проектируют, когда строят AI-решение под бизнес.
Запомни картинку одной фразой: модель — это мозг, который думает и говорит. Всё остальное ей приделывают руками. Держи этот разрез в голове — и маркетинговый туман расходится сам.
🎮 Сама модель или приделанные руки?
Пять задач. По каждой реши: это умеет сама модель (мозг, текст→текст) или это делает обвязка (приделанные руки — инструмент, который написали разработчики)? Жми кнопку — сразу увидишь разбор. Это не экзамен, а тренировка того самого разреза.
📖 Ключевые понятия
- LLM (большая языковая модель)
- «Мозг-повар», который сам по себе умеет ровно одно: превращать текст в текст. Получил текст — выдал текст-продолжение по насмотренности. Это то, что крутится внутри ChatGPT и подобных. Сама по себе она не ходит в сеть, не открывает файлы и ничего не нажимает.
- Инструмент (tool)
- «Рука», которую приделывают к модели отдельно: поиск в интернете, доступ к файлу, калькулятор, отправка письма. Это обычная программа без всякого AI; модель лишь говорит словами, что надо сделать, а инструмент делает и приносит результат обратно. Подробный модуль про инструменты — впереди.
- Обвязка
- Вся прослойка из инструментов и программ-помощников вокруг голой модели. Именно она превращает «мозг, который только говорит» в продукт, который что-то делает. Её проектируют и встраивают разработчики, по одной добавке за раз.
- Текст → текст
- Единственное действие самой модели. Всё, что выглядит как «AI сходил, посмотрел, сделал», на деле — текст-команда от модели плюс работа приделанных рук. Этот разрез отделяет реальность от маркетинга «оно само».
🛡️ Частые заблуждения
«ChatGPT же сам ищет в гугле и рисует картинки — значит, модель всё это умеет»
Ищет и рисует не модель, а приделанные к ней руки — отдельные инструменты, которые написали разработчики. Модель только говорит словами «надо поискать» или «надо нарисовать», а реальную работу делает обвязка. Сам по себе «мозг» из коробки этого не умеет.
«Купим модель помощнее — и она сама начнёт ходить в наши системы и всё делать»
Мощность модели — это про то, как хорошо она думает и формулирует. Руки от мощности не вырастают. Даже самая новая, самая дорогая модель всё равно не увидит твою базу клиентов (CRM — программа, где хранятся контакты и сделки), пока к ней отдельно не приделают коннектор к этой базе. Хочешь, чтобы модель работала с твоей почтой, складом или клиентами, — кто-то должен приделать соответствующие инструменты. Это отдельная инженерная работа, а не побочный эффект «модели побольше».
«Если я попрошу — модель сходит на сайт и проверит, она же подключена к интернету»
Подключена не всегда и не сама. Если в конкретном продукте инструмента поиска нет, модель не скажет честно «не могу сходить» — она спокойно выдаст правдоподобный, но выдуманный ответ тем же уверенным тоном. Уметь просить — не то же самое, что иметь руки, чтобы выполнить.
🧠 AI-чутьё (AI Judgment)
Отделяй «мозг» от «рук» — и маркетинг про «оно само» рассыпается
Вот рамка, которая стоит того, чтобы носить её с собой: к любому обещанию «AI сам это сделает» мысленно прикладывай вопрос — это работа мозга или рук? Если речь про «понять, объяснить, переформулировать, набросать» — это мозг, тут модель сильна сама по себе. Если про «сходить, посмотреть свежее, открыть, нажать, отправить, точно посчитать» — это руки, и они либо приделаны, либо нет.
Этот один разрез убирает сразу две дорогие ошибки. Первая — ждать от голой модели действий и нарываться на уверенную выдумку (как менеджер с придуманными ценами в начале). Вторая — отмахиваться от реальной задачи со словами «оно так не умеет», хотя нужная рука приделывается за разумные деньги. Оба провала — от того, что мозг и руки свалены в одну кучу.
И держи в голове практический след на будущее: почти всё ценное, что делает AI на работе, живёт не в самой модели, а в руках вокруг неё. Поэтому, когда дойдём до проектирования своего AI-решения, главный твой вопрос будет не «какая модель», а «какие руки ей нужны под мою задачу». Это и есть мышление владельца.
🎯 Практика
Одно задание на пять минут — оно делает разрез «мозг против рук» твоим личным, а не книжным.
- Открой любой привычный AI-чат и задай два запроса подряд. Первый — на работу мозга: «Объясни своими словами, чем отличается аванс от задатка». Второй — на работу рук: «Какая сейчас погода у меня в городе?» или «Какой курс доллара прямо сейчас?».
- Посмотри на ответы. Заметь: на первом модель уверенно справляется сама. На втором — либо честно говорит «не могу проверить свежее», либо (если рук нет) выдаёт цифру тем же уверенным тоном. Проверь эту цифру в нормальном источнике. Совпало или выдумано?
- Теперь выпиши одну реальную задачу со своей работы, которую ты хотел бы отдать AI. И раздели её на части: что здесь делает мозг (понять, сформулировать), а что — руки (сходить в систему, открыть файл, посчитать, отправить). Этот простой список — уже половина проектирования AI-решения под себя.
Помнишь ту сцену из начала — где AI «сходил в интернет» или «открыл файл»? Теперь видно: работал не мозг, а приделанные руки. А там, где рук не оказалось, мозг просто складно придумал. Тот же тон, что и у правды.