|
Пару мыслей:
1. Нет больше таких понятий как «промпт инжиниринг», «контекст инжиниринг». Это все устарело, не успев появиться. Все лучшие промпт-техники уже по-умолчанию внедрены в SOTA модели. Единственное где такие техники могут пригодиться — это в локальных, маленьких моделях. Но это уже нишевое применение. Можно пробелы подтянуть по мере надобности
Учитывая также что instruction-following у передовых моделей на высоком уровне, то получается что весь промпт инжиниринг сейчас просто сводится к «минимизации двоякости». То есть, в промпте не должно быть чего-то, что может трактоваться по-разному. Например: «Сделай мне маркетинговый план». «Сделай» — это как? Презентацию сделать? .md файл? Непонятно. Значит надо указать output format. «Мне» — точно тебе? Или может попросить написать для 10-летнего ребенка, чтобы ИИ не закидывал умными терминами? «Маркетинговый» — СММ? Affiliate? Или что-то другое? «План» — что такое план по твоему? a), b), c)? Или буллеты? И т.д. Ну и ограничения можно добавить: не делай это или вот это. Грубо говоря, итерация каждого слова. Минимизация ambiguity. Вот и все.
Контекст инжиниринг — его тоже больше нет. Все с ним возились и делали вид что умные (я тоже делал вид). Сейчас с агентами, параллельными агентами, тасками от Клода — это все тупо не важно уже. -Да, но... -Нет. Не важно уже. Сейчас просто берется триллион скиллов (в том числе и самописных), нужные MCP-сервера. Контекст агентам сгружается. Готово. Ты молодец
Как оказалось, 200к контекста — это очень даже достаточно, если использовать агентов. Порог вхождения снизился уже до невозможности
2. Тотальное отупение населения. Катализатором, конечно, стала возможность моделей искать информацию в интернете и анализировать фото, которые загрузил пользователь. Все сводится к ChatGPT/Gemini у большинства. Просто скриншоты с ответами ИИ, «я спросил у ИИ», «так а что ты? спроси у ИИ просто» и т.д.
Просто безмежная и абсолютная вера в то что ИИ отвечает. Полное отсутствие критического мышления и безусловная вера любому ответу ИИ. На что это похоже? Правильно, на секту. ИИ — это харизматичный лидер секты. Он подстраивается под тебя полностью. Все знает, не сомневается. Харизматичен. Готов поддержать любой разговор. Что тут говорить если народ даже не знает что такое «контекст». Никакого желания даже минимально разобраться с инструментом.
Лично для себя я не представляю как люди могут каждый день общаться с ним и даже на секунду не задуматься «хм, а что это за штука вообще? Как она работает? Откуда она все знает?». Нет. Не нужно. Зачем? Проще просто верить что он все знает по какой-то причине да и все
3. Учитывая п.2 — по рыночным законам должны будут появляться сервисы/компании, где работают только люди. Знаешь, вот как есть плашки «Без ГМО», без консервантов и т.д. — вот так должны быть и сертификаты для компаний / сервисов: «Без ИИ». Про повальное использование ИИ в бизнес-контексте я уже вообще молчу. Когда с тобой даже не хотят общаться, а сразу суют бестолково настроенного Квена и ты не можешь пробиться через него к живому человеку. Да, я согласен что в B2C — это необходимость, потому что розничный покупатель, как правило, ничего не понимает. Но в B2B контексте использовать ИИ сразу с порога — это просто неуважение. А такая сертификация могла бы быть очень кстати. И абсолютно адекватным выглядит сценарий (к которому все и идет) когда в основе стоит человек с опытом. И его инструменты/работники — это просто набор агентов, скиллов и прочего. То есть, «инжиниринг» стоит в основе всего:
-Проще взять толкового software engineer, который работает один, но знает как работать с ИИ, агентами, имеет успешные кейсы. -Проще взять 1 юриста с опытом, но который в своем арсенале имеет опыт работы с ИИ и агентами. Инжиниринг/оркестрирование для юриста: 1. взять такой-то закон, найти вот это 2. взять вот это, сравнить с этим 3. посмотреть вот это, сопоставить с п.1 и т.д.
Подтвержденный track record в инжиниринге/оркестрировании + подтвержденный опыт работы с ИИ инструментами. Скажем, ладно, оркестрированием может и условный Опус заниматься. Но без человека не обойтись. Он в любом случае должен проверить план, подкорректировать и оценить результат.
А ситуация когда ты обращаешься к, не знаю, миграционному юристу, а он просто все твои вопросы пихает в ChatGPT — такого быть не может, конечно. И таких просто рынок вынесет вперед ногами, потому что это полное дно.
4. Учитывая недавние терзания между GUI/CLI и невозможность отбросить преимущества обоих — было решено подумать что с этим можно сделать. При всех недостатках GUI — он, собака, удобный. CLI — преимущества тоже понятны, но это если чисто под ИИ заворачивать что-то и писать под это скилл. А если нужно что-то посередине?
Оказалось что решение есть — TUI (Terminal / Text-based User Interface). И есть готовые библиотеки на Питоне. Он объединяет в себе все самое лучшее от GUI и CLI: какой-никакой графический формат и возможность остаться внутри терминала. Бонусом является то что не нужно создавать никакую графику, тестировать ее и прочее. То с чем возникает больше всего проблем. Кнопку нажал, кнопка не работает. Кнопку пофиксил, а не работает уже что-то другое.
Тут, по крайней мере, такая необходимость отпадает. ИИ, в том числе, гораздо легче фиксит нерабочие элементы интерфейса, потому что не нужно использовать никакие puppeteer, не нужен JS, CSS и прочее. Чисто текст. То что LLM и нужно. Поэтому, если кто-то тоже бодается с графическими интерфейсами — то можно посмотреть на TUI. Готовая библиотека, питон. Красота
5. Когда я давным давно впервые столкнулся с Питоном, то я был поражен: мне казалось что это фантастика. Мне казалось что я кодил чуть ли не на обычном английском. Настолько мне все показалось простым, удобным и максимально близким к обычному человеческому языку. И мне это понравилось
Сейчас абстракция устремилась еще дальше: Питон — это уже даже не прям высокий уровень. Высокий уровень — это мы сейчас просто в Клод/Кими/Квен/Кило код пишем на обычном английском. Или говорим в микрофон. По сути говоря, абстракция дошла до того что английский стал сам по себе языком программирования, еще более высокого уровня
Казалось бы: куда дальше? А нет, есть куда. Остался еще 1 уровень, как минимум. Вершина, пик асбтракции. Сейчас все равно надо по клавишам долбить пальцами, либо в микрофон говорить. А вершина — это чтобы мне было достаточно подумать о чем-то и все. И также тебе в мозг приходит уведомление от Клода. Ты подтверждаешь, тебе в мозг в глаза транслирует че получилось. Ну и потом рекламу транслируют тебе в глаза, как уже обсуждалось. Так и будут монетизироваться, гады. В прочем, уже обсуждалось
6. В продолжение п.5. Думаешь, это бред? Невозможно? А вот и нет. Уже проходили стадии отрицания: ИИ не может в кодинг, не может в изображения, видео. Ладно, тепреь может, но пока еще это выглядит смешно. Ладно, теперь уже выглядит нормально, но видно же что ИИ делал. И т.д.
Ментальная гимнастика невероятного уровня. Мне всегда вспоминается пример с Уиллом Смитом, жрущим спагетти. Как ни крути, но величайший milestone человечества, который человечество неправильно интерпретировало.
Когда это увидели — оно было поднято на смех. «Если это все что может ваш ИИ — то нам нечего бояться». А ведь нужно было смотреть под другим углом: сам факт того что компутер сгенерировал какое-то видео, на котором четко определялся человек, который похож на Уилла Смита и который ел нечто, похожее на спагетти — вот это важно. Сам факт того что можно было понять что там происходит. И в конечном итоге качество видео подтянулось, конечно же
Что имеем сейчас? Клод написал какой-никакой, но компилятор. В комментариях умники подняли на смех: ну разве это компилятор? Там то не работает, это. И вообще, там наполовину взяли уже готовое решение, написанное человеком.
Ничем не напоминает видео с Уиллом Смитом? Напоминает. Но мы теперь умные. И смотрим под другим углом: важно не качество компилятора. А факт того что ИИ автономно сделал нечто, похожее на компилятор, которое косо-криво, но работает. А качество компилятор подтянется, обязательно. Через 2 года Клод напишет компилятор в 1 промпт, я уверен. «Напиши С компилятор. Don't make mistakes:». И там просто его в луп посадят, как и сейчас.
Поэтому, качество — это не имеет значения. Нужно отслеживать milestones. Судить не внешний вид, а суть
|