Главная | Опросы | Регистрация |  | Поиск | Стата | 1.0Сайт
Радио Бингуру
🔊
Выбрать
Готово

Мысли об ИИ

Автор | Дата:   
Самый депрессивный топик на реддите это топик про карьеру в айти, там адище. Народ на полном серьезе бросает 20-летние айти карьеры и уходит в...



Будущее может быть дистопично, или воюй в 3 мировой или сиди на нищенском пособии, остальное заберет ии. Народ понимает что роботам (пока) стволы не выдадут, так что армия и полиция это верняк и они правы

И армия еще ладно (беспилотники и т.д.), а вот мочить десятки миллионов безработных понадобится армия внутренняя, поэтому самое время записываться в каратели, у них работа будет и будет охуенная (ну т.е. востребованная ггг)
Автор | Дата:   
1312 😎
Автор | Дата:   
Килокод мучает иишки и дает им код с багами чтоб их нашли https://blog.kilo.ai/p/review-testing

Опус развалил всех (но задорого), Грок удивительно выступил хорошо и дешево



Гемини? Адище, все просрал. Гемини низя делать коды ботов и вообще ничего, пусть рассказывает про диеты
Автор | Дата:   
ОпенАИ поделился статистикой — топовые разрабы на кодексе сжигают сто миллиардов (!!) токеов каждый месяц. 6 лет назад эта цифра была 100 тысяч (пффф, одна моя сессия работы, если не меньше)



Так что если у кого еще нет хотя бы миллиарда токенов в месяц..

Продолжаем работать  надувать ИИ пузырь, посоны 
Автор | Дата:   


Microsoft провёл ежегодную конфу для разработчиков Microsoft Build 2026. 

 Для тех, кто не смотрел. Я пока не умею в обзоры, анализ и выводы как Андрей и те кто по уши в теме, но немного напишу. В общем навалили всего и много. Рассказали о своих супер-пупер датацентрах. Анонсировали совместно с Nvidia новый компуктер Surface RTX Spark DevBox с 128 Гб оперативной памяти и заточкой под всяких там разрабочиков и желающих гонять более-менее соображающую локальную ллм. Центральная же тема повествования это построение экосистемы  где центральное место занимают агенты на любой вкус и цвет. А анонсов было действительно много. Тут и своё семейство MAI(если не лучше, так точно не хуже лидеров рынка), рождённое и воспитанное самостоятельно, без всяких там OpenAI. И своя облачная инфраструктура с базами данных (HorizonDB, Web IQ, Fabric IQ, Work IQ, научная Microsoft Discovery), маркетплейс с 11000+  моделей Foundry. И GitHub Copilot как отдельное приложение-агент, SDK Rayfin для подключения агентов к бизнес-системам, много Linux-утилит на Windows, нормальный терминал с AI, WSL-контейнеры с GPU. Подтянули к себе в систему OpenClaw. Ещё был отдельный блок про разного рода решения по безопасности, сотрудничествам и бла бла. Ну и конечно анонсировали Majorana 2, который тот  самый, квантовый, самый передовой. 

 В общем, можно выделить 2 часа и посмотреть, а можно  не смотреть и спросить у  оловянного, но это сухо и без лысого Наделлы)).





Шеф, плиз, перекинь в «Новости ИИ». Там наверное уместнее будет.
Автор | Дата:   
Sanych

О блин... Ссылку...

Ссылку скинь! Надо глянуть чё тама
Автор | Дата:   
glamuriss: Ссылку скинь! Надо глянуть чё тама
Оригинал


И там в канале остальное
Автор | Дата:   
glamuriss

Рано мне ещё ссылки кидать...не положено по статусу ...либо не научился. Штудирую сейчас правила пользования форумом, как типичный хомяк, после того как что-то не получилось или есть ощущение что делаю что-то не так.
Автор | Дата:   
ndr

не наказывай начальник, если туплю и где-то нарушаю. Исправлюсь
Автор | Дата:   
Все обсуждают последние дни только его — Жирного Котяру



Новая модель Мистраля породила массу слухов и конечно название стало мемегенератором

Ну и это очень мило все



Понятно что котомодель подорвала тви



Кому охота читать их научную работу (как они тренили кота) и поржать с мемов это тут https://x.com/AlexanderKnigge/status/2066528515311493292
Автор | Дата:   
Инференса не хватает мы тонем капитан везде дефицит иишки захлестывают нас. С интересом смотрю кто тащит на опене



Лидора сразу видно да? По скорости цене и качеству AkashML https://akashml.com/ дала всем просраться, Грег молодец

В тви ее щас любят и $AKT гонят к баксу, но он все еще дешевый как гомно особенно исторически...
Автор | Дата:   
Мне одному кажется что Opus стал тупее после того как вышла версия 4.8? Делать стал ошибки в каки-то совершенно базовых вещах или вообще отказывается следовать файлу с инструкциями, даже если его прям специально ему подсовывать. Складывается ощущение что ради достижения выдающихся результатов в кодинге, ему напрочь порезали все остальное до уровня sonnet 4.5. Я пока не дошел в обучалках до конкретной терминологии, поэтому описание «на кончиках пальцев», но все же. 

Пока это смахивает на живой пример закона Гудхартра, когда оптимизируют показатель, вместо цели. 

Если это действительно так, то предположу что связано это не в последнюю очередь и с дефицитом вычислительных мощностей, ибо зачем их тратить на то, что вроде как может (не может) и модель младшего разряда.
Автор | Дата:   
IGMike08

Ты можешь выбрать модель и 4.7 тоже доступен если надо. Мы это обсуждали ранее. Опус 4.8 это типа ебанутого академика, он плохо подходит для текущих задач, но он велик для архитектурных вещей



Стандартный мув это планировать систему академиком (т.е. 4.8), а работать должен раб типа соннета 4.6, хайку, гемини, геммы, гпт, дешевых китайцев и проч

У каждой модели есть своя специализация
Автор | Дата:   
ndr

Вот да, к этому эмпирически и прихожу, мне надо было видимо прочувствовать. Что «самый умный» не значит «самый оптимальный». Я и сейчас разграничиваю им задачи, но иногда думаешь такой: «ну не, это слишком сложно для Sonnet, надо взять САМОЕ лучшее», ну как с индикаторами когда-то, ей богу

А с академиком 100%, это видимо так. С какой стати седой дед бы копал траншеи лучше молодого Ваньки) 

Другое дело что надо для себя как-то вывести пределы компетенций каждого, чтобы и Ванька не сваял херни, и дед не работал лопатой
Автор | Дата:   
IGMike08

Тут еще сильно зависит как ты его используешь. Если переслопливать его через чат он быстро отупеет, если же грамотно юзать субагентов, скилы, хуки, шелл скрипты, пайплайны и прочее тогда он делает блестящую оркестровку — куда лучше чем 4.7 — и в итоге ты получаешь намного лучше результаты

Так что видимо 4.8 это типа тест насколько ты освоил иишку на сей момент
Автор | Дата:   
IGMike08: Мне одному кажется что Opus стал тупее после того как вышла версия 4.8?
Оригинал
По началу мне тоже казалось что-то не так, но пару идей реализовал с ним и привык к разговорам, максимум по контексту доходил до 600к+, обязательно после работы прошу написать его репорт объяснение и т.д, это аккуратно сохраняю к подходящему проекту, процесс создания бота так-то массивный поэтому, при первом открытии сразу даю путь на проект с которым работаем он чекает и мы  всегда легко продолжаем. Вообще упорядоченность( как в башке так и в файлах) как пол мне ооочень важна при работе с ИИ иначе можно пыхтеть пыхтеть, а получиться каша
Автор | Дата:   
Зато теперь знаю что если кажется что модель тупая, то дело вовсе не в модели
Автор | Дата:   
IGMike08: Зато теперь знаю что если кажется что модель тупая, то дело вовсе не в модели
Оригинал
Самый большой буст из всего дает короткий курс AI Fluency у тех же Антропиков. Нужно интернализировать знания, которые там дают: что главный параметр успеха — это твоя компетенция, составление плана делегирования с учетом ограничений и возможности моделей и т.д.

Иногда, после обсуждения видения конечной цели, оказывается, что для решения твоей задачи ИИ вообще даже не нужен
Автор | Дата:   
smellmybum

оказывается, что для решения твоей задачи ИИ вообще даже не нужен
Эт да, и порой даже вреден)
Автор | Дата: 10Только для участников с 10+ постами — войдите, чтобы продолжить   
Скрытый пост
Автор | Дата: Только для зарегистрированных — войдите, чтобы прочитать   
Скрытый пост
Автор | Дата:   
Как известно, GPT 5.6 забанен точно также как Опус 5 (который назвали Fable), тенденция понятна, никто рознице сверхмодели, представляющие угрозу нац. безопасности больше не даст, максимум — в кратно усеченном варианте

Кто с Fable успел поработать, вы ж там помните да, какой он был зацензуренный. И на вопрос «Hello» ставил бан кек, явно прошерстив локальную/облачную память, короче пидр надзиратель

Че делать

Glm 5.2 на который все дрочат и называют спасителем это дистилированный опус/фейбл. Как известно из отчета антропика, китайцы с 25 тысяч (!) фейковых акков сцедили его на миллионы промптов. Дистилляция это грубо говоря ты непрерывно спрашиваешь модель и сохраняешь ее ответы для настройки

Короче это дешевая копия опуса, с оригиналом она не сравнится, все это любой может попробовать и убедиться сам

Ситуация тогда хуевая ибо топовый опус уже никогда не дадут, обрезанный будет непригодный, китайцы будут... как китайцы, это просто смех что даже тут они делают не nike а noke тоже самое абсолютно

Выход реальный — научиться наконец-то использовать ии

Что такое опус, что там такого крутого — там просто под капотом он делает дохуя всего, незаметно для юзера. На простой запрос опус может запустить 100+ субагентов и команд и потом это кажется «магией»

Однако если научиться делать одну такую команду, вторую, один скилл, второй, очень узкоспециализированный, настолько атомарный чтобы сюка выполнял буквально одну задачу, даже иногда одну строку в пайтоне/расте, тогда МОЖНО сделать почти на любой модели результаты... даже лучше

Просто нужно а) научиться б) не пожалеть времени. Помогают в этом харнесы где хороша видна изнанка как pi.dev и производные от него, где каждую тулзу ты настраиваешь под себя

Перейдем к конкретным примерам

Когда в клоде спрашиваешь «найди мне в инете/погугли» он включает внутренний инструмент WebSearch описанный вот тут https://platform.claude.com/docs/en/agents-and-tools/tool-use/web-search-tool

Под капотом он там делает дохуя всего, сжирая токены, цензурируя и проч. Юзер этого не видит и принимает все за чистую монету, типа «клод поискаль» — хе, так как он ищет? Где? Каким образом? Никто этим вопросом не задается

«Хуево» отвечу я и потому что все это можно — нужно — делать самому. Понадобится api поисковой базы, я использую Brave API — https://brave.com/search/api/

Еще есть Kagi это очень хороший тоже поисковик уровня мяо https://kagi.com/api/docs/openapi и есть еще много других

На их основе делается 1) тулза 2) скилл

Далее при поиске чего угодно харнес (клод код гермес опенкод т.д.) будет юзать ТВОЙ поиск, через простой хук, а не внутренний зацензуренный хуй пойми как устроенный поиск клода

Далее ты делаешь эти тулзы под нужные задачи, например



— Brave Search идет как основной

— Brave Answer это их же (брейва) иишный посредник, т.е. он собрал линки с тулзы выше и выдал цимес, его тянет харнес

— twt это мой поисковик твиттера тут понятно

— WebSearch — встроенное гомно — остается только для базовых вопросов если ни один выше не подойдет (1 из 20, я его планирую отключить)

— Перплексити понятно для дип рисерча (пока свою такую не сделал), контекст7 все знают, его тоже нахуй и меняем его на gh search

Теперь, мы берем этот же брейв скилл и т.д. и даем его например... халявной Gemma 4 и знаете что получится? Я вам докладываю — она ищет ТОЧНО ТАКЖЕ КАК КЛОД КОТОРЫЙ ДОРОЖЕ В 50 РАЗ. Видите мне не жалко капслока

Это всего лишь одна тулза — WebSearch. Какие там есть еще, например — самые примитивные там



Аналогично Гемме и другим микромоделям можно дать баш, тулзы для чтения/записи операционной системы, функционал субагентов, их оркестровки и прочее

Поэтому мой тезис и я настаиваю — опус крут внутренней оркестровкой кучи тулзов, но это все можно переделать под себя так, чтобы потом использовать с любой моделью вообще. И в результате опус будет нужен все меньше... и меньше.. и меньше, пока не останется для спефицических задач, которые можно вызывать без паписки — по апи — затратив три цента

Это все конечно обсуждалось ранее, безумие огромной машины, которой забивают гвозди. Не нужна мощь клода чтобы гуглить, читать файлы в операционке, переводить, распознавать картинки и тысячи других маленьких задач, не-ну-жен оп-ус нах-уй

Но люди подсаживаются на волшебное окно которое делает все само, не понимают что под капотом и понимать не хотят. Потом у них волшебное окно отбирают, а они — кричунькают! 

Вместо того, чтобы сделать это окно самому и стать свободным — ведь настроенная экосистема тулзы/скиллы будет автоматом доступна ЛЮБОЙ модели мира. Ибо все это выполнено в стандарте https://agents.md/ который все модели мира договорились использовать основным jajajaja
Автор | Дата:   
Проиллюстрируем вышесказанное на простейшем примере

Слева дорогущий Опус 4.8, справа — дешманский, практически бесплатный qwen 3 32b с чутса, которому выдан brave search



Как видим ответ квена... даже лучше, потому что я у опуса не спрашивал «время по гринвичу, а потом аргентинское». Квен же объяснил про время восточное (о чем опус умолчал) и перешел к ответу

Вот сколько стоит опус



Вот сколько квен



ВОПРОС, ЗАЧЕМ для операций поиска использовать модель которая ДОРОЖЕ в 50 раз? 50 раз!

А теперь представьте что это сотни и сотни, тысячи и тысячи операций которые НАДО делать бесплатными моделями, а опусу оставлять лишь самые сложные задачи

Людям не хватает 200 долларов паписки, да, так вы башляйте больше кек. Отдайте антропику последние трусы, 2000, 20000 долларов, не останавливайтесь. Есть целые дашборды где люди хвастаются сколько денег они потеряли. Это же психбольница

Вместо того чтобы бесплатной модели дать маленький скриптик, еще скриптик, еще один, связать их в маленькую тулзу и вот ты тратишь в 50-100 раз меньше токенов, задача за задачей... можно даже все это делать бесплатной армией агентов, а опусу отдавать готовые результаты, чтобы он не ЖРАЛ свои драгоценные сюка токены

Разве происходящее не истерично, нет?  По моему да. Даже этот простейший пример в инторнетах вызывает шок ого так это не только клод/гпт/гемини может это пездец

Ну а это чисто поржать. Норм время и дату указал, да

Автор | Дата:   
ndr

На сегодняшний день я лично пришел к тому что в основном использую уже банально pi.dev + gemma 4 31b turbo копеечную, с нужными скиллами и тулзами. Гемма — идеальный трудяга и просто отличная модель

Абсолютно неудивительным образом рост собственной компетенции в вопросах и задачах которые нужно решить, снижает зависимость от топ-моделей

И, конечно, собственная компетенция с тобой остается. А иглу заберут хитрые Антропики
Автор | Дата:   
smellmybum: На сегодняшний день я лично пришел к тому что в основном использую уже банально pi.dev + gemma 4 31b turbo копеечную, с нужными скиллами и тулзами. Гемма — идеальный трудяга и просто отличная модель
Оригинал
Ты чисто для агентских задач или для кодинга тоже? Я не представляю как джемма или даже квен\глм для кодинга использовать, на страдания джеминая без слез невозможно смотреть 

smellmybum: И, конечно, собственная компетенция с тобой остается. А иглу заберут хитрые Антропики
Оригинал
Они уже  Клод все больше ахуевает в край потихоньку: 





Но тут на реддите ребята лайфак нашли, юзают pi.dev на кодекс подписке просто модель 5.4-мини юзают + дипсик для простых задач через opencode go

В целом за 20 + 10 баксов должно покрыть 90% нужд 
Автор | Дата:   
@Automador

Клод все больше ахуевает в край потихоньку:  




Кожаных наверное не любит...к своим вон, с респектом😄
Автор | Дата:   
Automador: Я не представляю как джемма или даже квен\глм для кодинга использовать, на страдания джеминая без слез невозможно смотреть
Оригинал
Gemma и Gemini два разных класса моделей насяльник, Gemmа намного лучче
хомяки 3 сегодня 20 постовпик 178
© 2026 Форум Бингуру. Уходи, тебя не звали
  ⇓     ⇑