Педагогика Bloom: Understand ⏱ 7 мин основы LLM

Почему LLM сам ничего не делает

🧊 Won't Have 💧 Could Have ☀️ Should Have 🔥 Must Have

🔥 Must Have

Разделить «мозг» и «руки» — фундамент всего Модуля 2 и темы инструментов. Пропустишь — будешь ждать от модели не того.

🤔 Зачем это читать

Менеджер по закупкам открывает ChatGPT и пишет: «Какая сейчас цена на нержавейку у нашего поставщика? Сравни с прошлым месяцем». Ответ приходит — складный, с цифрами, с процентом изменения. Он берёт эти цифры в служебную записку. А потом выясняется: модель ни на какой сайт не ходила, ни в какой прайс не заглядывала. Она просто придумала правдоподобные числа, потому что её об этом попросили. Записка ушла наверх с выдумкой.

Знакомо? Или другой вариант, ровно наоборот. На совещании предлагают: «Давайте подключим ChatGPT, чтобы он сам разбирал входящие письма и складывал вложения в нужные папки». Кто-то возражает: «Так он же не умеет лазить по почте». И спор повисает, потому что никто за столом не знает точно — умеет модель сама ходить в почту или нет. А ведь это вопрос на 4 000 000 ₽ бюджета.

Оба раза причина одна. Люди не отделяют то, что умеет сама модель, от того, что вокруг неё приделали разработчики. И поэтому либо ждут от голой модели того, чего она не может (и нарываются на выдумку), либо наоборот не верят, что что-то реально, хотя это решается одной добавкой. И то и другое — дорогие ошибки на ровном месте.

После этой темы ты будешь чётко различать: вот это делает сам «мозг», а вот это — «руки», которые ему приделали. Один этот разрез снимает половину маркетингового тумана про AI и кладёт фундамент под всё, что в курсе дальше — инструменты, агенты, память.

Задержись на 10 секунд. Вспомни последний раз, когда ты видел, как AI «сходил в интернет», «открыл файл» или «нарисовал картинку». Ты ведь думал, что это делает сама модель, да? Подержи эту сцену в голове — к концу страницы ты поймёшь, кто там на самом деле работал руками.

👨‍🍳 Сначала — одна сцена с кухни

В теме про устройство агента ты уже видел «мозг» и «руки» рядом — как две из частей агента. Теперь разберём вплотную, почему мозг сам по себе вообще ничего не трогает. Начнём с кухни.

Представь шефа. Опытного, насмотренного — того самого «повара по насмотренности» из той же темы про агента (насмотренность — это что модель начиталась гор текста раньше и теперь складно продолжает по образцу). Гость заказал блюдо. Шеф командует: «Обжарь лук до золотистого, потом влей бульон». Звучит как действие, правда? «Обжарь», «влей» — глаголы, приказы.

Но смотри, что произошло на самом деле. Шеф не прикоснулся ни к луку, ни к сковороде. Он только сказал словами, что надо сделать. Лук режет и жарит кто-то другой — поварёнок, у которого есть нож, сковорода и плита. Бульон достаёт из кладовой третий. Шеф — это голова и рот. Руки — отдельные люди и отдельная техника.

Вот ровно так же устроена языковая модель, та самая LLM (большая языковая модель — то, что крутится внутри ChatGPT и подобных). Сама по себе она умеет только одно: превращать текст в текст. Ты дал ей текст — она выдала текст в ответ. Всё. Это её единственное действие, как у шефа — только говорить.

🧠 Модель — это мозг без рук

Скажу прямее, без метафоры, потому что это центр всей темы. Модель не умеет:

зайти на сайт и посмотреть, что там сейчас;
открыть твой файл и прочитать его;
отправить письмо, нажать кнопку, сохранить документ;
посчитать точно — сложить в столбик длинные числа без ошибки.

Она умеет ровно одно: получить текст и дописать к нему текст-продолжение — складно, по насмотренности. Это её природа, а не недоработка. Как у мозга в банке: он может думать и формулировать сколько угодно, но без рук он ни нальёт чаю, ни откроет дверь.

«Но погоди, — скажешь ты, — я же сам видел, как ChatGPT искал в интернете и рисовал картинки». Видел. И вот тут вся соль: это делал не „мозг". Это делали „руки", которые к мозгу приделали отдельно.

Мозг и руки — это разные вещи

🧠

Мозг — это модель

Думает и говорит. Берёт текст — выдаёт текст. Больше сама по себе не умеет ничего.

🖐

Руки — это обвязка

Поиск в сети, доступ к файлу, калькулятор, отправка письма. Их приделывают разработчики отдельно.

То, что ты зовёшь «ChatGPT», — это мозг плюс руки в одной коробке. Кажется единым существом, а внутри — модель и приделанная к ней обвязка. Голая модель руками не машет.

🔧 Что такое «руки» (обвязка) и кто их приделывает

Когда продукт вроде ChatGPT «ищет в интернете», происходит вот что. Модель не лезет в сеть сама. Она выдаёт текст-команду в духе «надо поискать вот это». А рядом сидит обычная программа — её написали разработчики, никакого AI, — которая эту команду читает, реально идёт в поисковик, приносит результат и кладёт его модели обратно как новый текст. И только теперь модель пишет тебе ответ, уже опираясь на принесённое.

Вот эта программа-помощник, которая ходит, кликает, считает и носит результаты туда-сюда, — и есть «руки». В курсе мы зовём такие добавки инструментами (по-английски tools), а всю прослойку вокруг модели — обвязкой. Им посвящён отдельный модуль дальше, тут нам важно одно: их приделывают люди-разработчики, и приделывают по одному, осознанно. Дали инструмент «поиск» — модель умеет искать. Не дали — не умеет, хоть проси, хоть умоляй.

Поэтому одна и та же модель в разных продуктах ведёт себя по-разному. В одном чате она лезет в свежие новости, в другом — нет. Мозг тот же. Руки приделаны разные.

Псевдокод (на пальцах) · что на самом деле происходит при «поиске в интернете» # это НЕ настоящий код, а логика на человеческом языке
ты_спросил = «Какой сегодня курс доллара?»

# шаг 1 — работает МОЗГ (модель): только текст
модель говорит: «Сам не знаю свежее. Нужен поиск: „курс доллара сегодня"»

# шаг 2 — работают РУКИ (обвязка): обычная программа, не AI
программа идёт в поисковик → приносит сегодняшнее число «курс = X ₽»
программа кладёт это обратно модели как новый текст

# шаг 3 — снова МОЗГ: дописывает ответ по принесённому
модель пишет тебе: «Сегодня курс доллара около X ₽»
# → без шага 2 модель просто выдумала бы число тем же уверенным тоном

💡 Почему тебе это важно как владельцу

Ты тут не разработчик, который приделывает руки. Ты владелец кухни AI — твоё дело понимать, где мозг, а где руки, чтобы тебя не развели и ты сам не ждал чуда не от того места. Три рабочих вывода.

«Модель сама всё сделает» — это маркетинг, а не факт. Сама она только думает и говорит. Всё «сделает» — это про руки, которые кто-то должен спроектировать, приделать и оплатить. Услышал «оно само» — спрашивай: а руки-то откуда, кто их встроил?
Если в продукте нет нужного инструмента — модель этого не умеет. Голая модель не знает сегодняшнюю цену, не видит твой файл, не отправит письмо. Хочешь, чтобы умела, — нужна обвязка. Это отдельная работа и отдельные деньги, а не само собой разумеющееся.
То, что «руки» приделали, можно приделать и под тебя. Хорошая новость обратной стороной: раз почти всё полезное — это инструменты вокруг модели, то под свою задачу руки тоже можно собрать. Именно это и проектируют, когда строят AI-решение под бизнес.

Запомни картинку одной фразой: модель — это мозг, который думает и говорит. Всё остальное ей приделывают руками. Держи этот разрез в голове — и маркетинговый туман расходится сам.

🎮 Сама модель или приделанные руки?

Пять задач. По каждой реши: это умеет сама модель (мозг, текст→текст) или это делает обвязка (приделанные руки — инструмент, который написали разработчики)? Жми кнопку — сразу увидишь разбор. Это не экзамен, а тренировка того самого разреза.

📖 Ключевые понятия

LLM (большая языковая модель): «Мозг-повар», который сам по себе умеет ровно одно: превращать текст в текст. Получил текст — выдал текст-продолжение по насмотренности. Это то, что крутится внутри ChatGPT и подобных. Сама по себе она не ходит в сеть, не открывает файлы и ничего не нажимает.
Инструмент (tool): «Рука», которую приделывают к модели отдельно: поиск в интернете, доступ к файлу, калькулятор, отправка письма. Это обычная программа без всякого AI; модель лишь говорит словами, что надо сделать, а инструмент делает и приносит результат обратно. Подробный модуль про инструменты — впереди.
Обвязка: Вся прослойка из инструментов и программ-помощников вокруг голой модели. Именно она превращает «мозг, который только говорит» в продукт, который что-то делает. Её проектируют и встраивают разработчики, по одной добавке за раз.
Текст → текст: Единственное действие самой модели. Всё, что выглядит как «AI сходил, посмотрел, сделал», на деле — текст-команда от модели плюс работа приделанных рук. Этот разрез отделяет реальность от маркетинга «оно само».

🛡️ Частые заблуждения

«ChatGPT же сам ищет в гугле и рисует картинки — значит, модель всё это умеет»

Ищет и рисует не модель, а приделанные к ней руки — отдельные инструменты, которые написали разработчики. Модель только говорит словами «надо поискать» или «надо нарисовать», а реальную работу делает обвязка. Сам по себе «мозг» из коробки этого не умеет.

«Купим модель помощнее — и она сама начнёт ходить в наши системы и всё делать»

Мощность модели — это про то, как хорошо она думает и формулирует. Руки от мощности не вырастают. Даже самая новая, самая дорогая модель всё равно не увидит твою базу клиентов (CRM — программа, где хранятся контакты и сделки), пока к ней отдельно не приделают коннектор к этой базе. Хочешь, чтобы модель работала с твоей почтой, складом или клиентами, — кто-то должен приделать соответствующие инструменты. Это отдельная инженерная работа, а не побочный эффект «модели побольше».

«Если я попрошу — модель сходит на сайт и проверит, она же подключена к интернету»

Подключена не всегда и не сама. Если в конкретном продукте инструмента поиска нет, модель не скажет честно «не могу сходить» — она спокойно выдаст правдоподобный, но выдуманный ответ тем же уверенным тоном. Уметь просить — не то же самое, что иметь руки, чтобы выполнить.

🧠 AI-чутьё (AI Judgment)

Отделяй «мозг» от «рук» — и маркетинг про «оно само» рассыпается

Вот рамка, которая стоит того, чтобы носить её с собой: к любому обещанию «AI сам это сделает» мысленно прикладывай вопрос — это работа мозга или рук? Если речь про «понять, объяснить, переформулировать, набросать» — это мозг, тут модель сильна сама по себе. Если про «сходить, посмотреть свежее, открыть, нажать, отправить, точно посчитать» — это руки, и они либо приделаны, либо нет.

Этот один разрез убирает сразу две дорогие ошибки. Первая — ждать от голой модели действий и нарываться на уверенную выдумку (как менеджер с придуманными ценами в начале). Вторая — отмахиваться от реальной задачи со словами «оно так не умеет», хотя нужная рука приделывается за разумные деньги. Оба провала — от того, что мозг и руки свалены в одну кучу.

И держи в голове практический след на будущее: почти всё ценное, что делает AI на работе, живёт не в самой модели, а в руках вокруг неё. Поэтому, когда дойдём до проектирования своего AI-решения, главный твой вопрос будет не «какая модель», а «какие руки ей нужны под мою задачу». Это и есть мышление владельца.

🎯 Практика

Одно задание на пять минут — оно делает разрез «мозг против рук» твоим личным, а не книжным.

Открой любой привычный AI-чат и задай два запроса подряд. Первый — на работу мозга: «Объясни своими словами, чем отличается аванс от задатка». Второй — на работу рук: «Какая сейчас погода у меня в городе?» или «Какой курс доллара прямо сейчас?».
Посмотри на ответы. Заметь: на первом модель уверенно справляется сама. На втором — либо честно говорит «не могу проверить свежее», либо (если рук нет) выдаёт цифру тем же уверенным тоном. Проверь эту цифру в нормальном источнике. Совпало или выдумано?
Теперь выпиши одну реальную задачу со своей работы, которую ты хотел бы отдать AI. И раздели её на части: что здесь делает мозг (понять, сформулировать), а что — руки (сходить в систему, открыть файл, посчитать, отправить). Этот простой список — уже половина проектирования AI-решения под себя.

Помнишь ту сцену из начала — где AI «сходил в интернет» или «открыл файл»? Теперь видно: работал не мозг, а приделанные руки. А там, где рук не оказалось, мозг просто складно придумал. Тот же тон, что и у правды.

🔗 Что дальше

Следующая тема: 2.2 — Как агент «думает». Раз мозг сам по себе только говорит, посмотрим, как из этого «говорения» собирается рассуждение шаг за шагом — основа того, как агент решает, какую руку и когда позвать.

Связанные темы:

1.5 — Анатомия агента — общая картина, откуда эта тема растёт: где в устройстве агента сидит «мозг», а где «руки».
2.3 — Токены и контекстное окно — чем именно оперирует мозг, когда «читает» текст, и почему у его рабочего стола есть предел.

Дальше в курсе:

3.1 — Промпт: бланк заказа — раз модель работает только с текстом, ключевой навык владельца — точно сформулировать заказ этому мозгу.
4.1 — Инструменты агента — целый модуль про те самые «руки»: какие бывают, кто их приделывает и сколько это стоит.