Главная | Опросы | Регистрация |  | Поиск | Стата | 1.0 | Сайт
Радио Бингуру
🔊
Выбрать
Готово
Искуственный Интеллект BINGURU FORUM / Искуственный Интеллект /  
 

Новые модели ИИ

 
Автор | Дата:   
Сабж, обсуждаем новинки — новые модели искуственных этих ваших интеллектов

Автор | Дата:   
@Patt тебе понравится. Baichuan-M2 для медицины топчик


Автор | Дата:   
Я под медицину тут как-то упоминал HuatuoGPT. Мне нравится принцип по которому они модель тренили, хотя я бы чуть-чуть по-другому сделал, наверное

И что тоже очень ценно (@Patt 100% оценит тоже) — это вот этот датасет

Это взяли с тестов/экзаменов сложные вопросы из реального мира. А ответы — это проверенные медиками ответы. Т.е. ответ на вопрос — это истина. Проверенные, подтвержденные диагнозы для вот этих проблем.

По такому же принципу этот датасет можно точно также наполнять, особенно если у Patt (или у кого-то еще) есть доступ к чему-то похожему: база проблем и база проверенных ответов.

Huatuo — это просто Llama-instruct учили «думать» (chain-of-thought) прежде чем выдавать ответ. Соответственно, можно брать другую LLM (не обязательно лламу), файнтюнить вообще по-другому, например разцензуренными промптами и ответами ChatGPT (ибо это медицина и там может быть «кровь», «кишки», «анус» и прочее на что бедный зацензуренный ChatGPT может сказать «я не могу, это плохие слова. Давай попробуем еще раз»). Короче, суть в том что изворачиваться можно по полной, чего душа желает.

Чтоб я для медицинского gpt еще добавил, ну так, навскидку: для медицины важно не только правильность самого ответа, сколько также знание о том что 100% не подходит под проблему

Ну т.е., понятно что если у тебя проблема задана «чел сломал ногу», а твоя модель говорит «ну я точно могу сказать что это не рак крови» — толку мало. Скорее просто дополнительно делать датасет, куда впихивать проблемы и болезни, которые не подошли по таким-то таким-то причинам. Чтоб reasoning меньше галюцинаций ловил

Автор | Дата:   
Ух ты восторг! Да, на шаг ближе к хлопкоткачу. Ну и что! Очень круто все равно! Как раз добавлю в список инструментов, которые мне через неделю уже очень пригодятся. Не сказать, что лучше клода условного в 2-3 раза, но по своему большой восторг. Просто шайтан машине кидаешь херню сокращенную типо хм пук пук бомжара 50 лет ноги руки не двигаются мрт менингиома как резать как лечить. Эта тварь тебя облизывает с ног до головы. Очень классно предоставляет актуальную информацию, проводит диф диагноз, лечение согласно мировым стандартам назначает, а затем согласует с региональными лол че. Гораздо легче промптировать. Да вы знаете как я клода промптил? Там промпты были на страницу так я ему еще и примеры закидывал как надо. Эта сучка творит вообще грязь. 5 слов и она тебе все классификации(капец как важно это), четкие противопоказания, показания и это вообще с нулевыми вводными данным. о х у е т ь. Да, ее надо еще сильно адаптировать, пользовательский интерфейс под эти данные пилить, но что она выдает сама по себе в таком сыром виде поражает, конечно. Такую штуку хорошо бы всем участковым поставить на компы. Выявляемость бы заболеваний на ранних стадиях увеличилась в разы, да и вообще вот такую классную модельку к примеру запустить шуршать на больничный сервер, чтобы он предлагал дополнительную диагностику или еще что-то, вызывал клинфармаколога автоматически при странном лечении.Вердикт: всем врачам по планшету с Baichuan-M2!!! Ммм кайф...Какой потенциал...

P.S. На самом деле я никогда не был так рад тому, что у меня хир специальность. Смотришь на эту дуру и думаешь, а терапевты нахера вообще нужны? Я хоть резать могу, временное УТП. А тот же клод, не говоря уже про эту хрень, намного круче выпускника будет, которого посадили на участок работать. В любом случае прогресс огонь, будущее уже здесь!

Автор | Дата:   
Спасибо ребята, мне капец как стыдно, что не я эту тему создал. С весны тудушка висит еще. Поискать ии+медицина. Бингурычи сделали это за меня. Буду наверстывать сейчас. Спасибо еще раз за инфу и очередной пинок

Автор | Дата:   
Patt
Такими темпами вы с помощью этих иишек скоро из мертвых воскрешать начнете гыы

Зы: по поводу терапевтов, не давно знакомая к эндокринологу (к ним хер запишешься еще), в частный центр, за денежку не маленькую попала на прием. 5 минут та девушка доктор бумажки по заполняла и 20 минут гпт мучала, прямо при знакомой.. рука-лицо.. говорит может вам это назначить, но вы в положении наверное не стоит сейчас в интернете уточним у коллег типо и напихивает в gpt вводные знакомая говорит ну так я в принципе такой прием могла сама себе не выходя из дома провести)

Автор | Дата:   
Drhnhg
Классика. Палятся вообще, довольно сложно конкурировать когда есть карманный профессор. Он реально проводит охренительную диф.диагностику временами исходя из симптомов. Но надо помнить изначальную функцию врача, которая в обществе почему-то не распространена.
1. Врач это аналитик
2. Врач это тот кто принимает решения
3. Врач это тот кто несет ответственность
На трейдеров же никто не гонит, что они суперпродуктивно новости через аналитические дашборды получают, агенты смотрят графики. Трейдер это тот кто вовремя и правильно принимает решение. Главное в этом суть продуктивность и процент к капиталу. Ведь мы не считаем, что трейдер не трейдер, если ема 100 сам не высчитывает и график вручную не строит. Так и здесь. Какая разница как принимает решение врач. Главное чтобы оно было в тайминг и приносило результат. Но ничего, я думаю к этому к концу моей жизни придут

Автор | Дата:   
старая тема но в тему

Как тысячи игроков Eve Online помогают в расшифровке человеческого тела

Представляю вашему вниманию перевод статьи Мэта Камена (Matt Kamen) от 28 апреля 2016 года.
В статье рассказывается о том, какие возможности могут предоставить и предоставляют многопользовательские игры в решении важных проблем для всего человечества, связанных с необходимостью привлечения большого количества человеческих ресурсов.

https://habr.com/ru/articles/333528/

Автор | Дата:   
Где узнавать про новые модели, строго с первоисточника https://openrouter.ai/models?order=newest

Также — OpenRouter используется ведущими компаниями для анонимного тестирования будущих моделей. На момент теста они предоставляются бесплатно

Вот сейчас там висят



Cloaked — это оно. Это или новый Sonnet или следующий Gemini, судя по окну в 2 млн

Доступны на время теста полностью freeeeeee

Автор | Дата:   
ndr:
Где узнавать про новые модели
Оригинал
и здеся https://huggingface.co/

Автор | Дата:   
Топы рвет Grok Code Fast 1, обогнал клод в два раза


Автор | Дата:   
Вышли сразу 3 охуевшие модели



Новый Соннет и новый дипсик, но особую любовь отдадим GLM 4.6 — это прекрасная модель. Поюзать кто не хочет роутер можно на https://chat.z.ai/

Уровня почти Соннет, а стоит писичку. И дип рисерч есть и поиски и все такое

Автор | Дата:   
Скорость просто бешенная, только Grok F1 и Gemini освоил, буквально недавно казалось только-только CLI тулзы вышли и уже 2.0 версии выходят А GLM вообще паровозом всех сметает

Автор | Дата:   
Генератор миров от гугла Genie3
https://deepmind.google/discover/blog/genie-3-a-new-frontier-for-world-models/

Автор | Дата:   
Espada
Ебануться, мы точно в симуляции живём

Автор | Дата:   
Вышла новая Nano Banana Pro. Народ ее уже разорвал, она может все

Где мне она запомнилась — инфографика Вот такая красота делается одним простейшим промптом

Вау. А ведь когда-то дизайнер была такая профессия



Промт:

Create detailed colorful infographic explaining how the Bittensor works
Полноразмерка кому надо https://od.lk/f/NDRfNzQwNzExOThf

Она также подключена к поиску т.е. это не изображение из воздуха — Гемини найдет сначала инфу, а затем ее засунет в графику

Скоро трейдерские графики надо полагать будут тока так и делаться

Автор | Дата:   
ndr:
Скоро трейдерские графики надо полагать будут тока так и делаться
Оригинал
Нет, серьезно, потому что вот Tradingview это чего такое — это просто обычный джаваскрипт который по API непрерывно рисует данные

Но его возможности весьма ограничены, мы это видимо по графикам — они все одинаковые абсолютно

ИИ-шка используя те же данные может нарисовать графики в любой стилистике с актуальными данными и регенерировать их хоть раз в секунду для графиков секундных...

Скажем, если я хочу графики вот такие — я их получу



И такие



И даже вот такие мяяяя



ИИ-шки всегда будет мало. Все эти датацентры, о которых так переживают — 3 года форварда и они все будут перегружены

А дальше возможно я сделаю себе целый live-generated-channel где голая Алиса будет мне рассказывать про курс доллара

Ирония в том что это все уже доступно — вместе с Алисой. Просто это «сейчас» дорого. А завтра дорого не будет

Автор | Дата:   
Вышел Opus 4.5, он чудовищно хорош



Теперь до людей начинает доходить уровень их безработицы вскоре



Могу подтвердить, это нечто исключительное. Пришлось опять брать максимальную подписку. Спасибо, Антропик, что воруешь мои 200 баксов в месяц 

Но мы тебе все простим. С новым опусом можно сделать абсолютно что угодно, дизайн, сайт, проект, терминал, портал, мессенджер... охуителен

Причем бенчи этого не показывают. По SWE Bench Опус ну чуть лучше Гемини 3 Про — это не так, он лучше на два порядка



В сухом остатке, если убрать крики фанбоев — люди заблуждаются что «ии прогресс остановился», ничего нового уже не будет и бла бла

ИИ модели наращивают мощности по экспоненте — она неизменна. Время задуматься, чем ты будешь занят в 27м когда выйдет условный Опус 6, способный заменить весь интернет

Автор | Дата:   
ndr: люди заблуждаются что «ии прогресс остановился», ничего нового уже не будет и бла бла
Оригинал
да как так остановился, ии роботов на войну еще не отправляли... уверяю за кулисами полно необычного происходит

новый Опус дааа каеф, он если что в antigravity безлимитный, перед тем как 200 отдавать оно самое чтобы затестить

мне нрав что Deepseek продолжает делать прорывы в этой области, например, их недавняя новинка DeepSeek-OCR, там они представили революционный (возможно) подход к сжатию контекста, вот https://arxiv.org/abs/2510.18234 напочитать на досуге
После deep think это второе такое, но к чему нет внимания. Станет ли это прорывом — узнаем когда антропик снизят цену на макс, а то хочется погладить, а нет, кусается

Автор | Дата:   
Новый Kimi 2.5 пробовали https://www.kimi.com/en ? Вышел буквально на днях (26-го) о чём я узнал из отчёта у пети, который сказал что для кода прямо таки топовый + для фото, видео и всего остального. Немного покопавшись выяснил что его особенности это дешевизна (~10 раз) и поддержку до 100 агентов.
Вчера для тестов закинул ему файл с ссылками материалы по AI с запросом составить под меня порядок и план изучения, для пущего объёма включил deep research. Так он 3ч пыхтел
2ч походу лазил по сайтам и собирал инфу


Полчаса писал отчёт, а потом полчаса что то кодил и сделал страничку с визуальный отчётом

Вышло прикольно, правда по пути работы я выснил, что в режиме глубокого анализа не получается закидывать файлы.
По сегодняшней работе нравиться количество визуального сопровождения исследования

Интересно ваше мнение и опыт работы с данной моделькой 

Автор | Дата:   
Vorob
Кими традиционный лидер eq бенча т.е. это лучшая модель в мире по эмоциональному интеллекту, лучше гпт, клода, гемини, лучше всех. Но только в этом и конкретно модель Kimi K2 Instruct



Что такое эмоциональный интеллект можно у них почитать https://eqbench.com/

Вкратце это способность модели улавливать человеческие эмоции и адекватно на них реагировать. Вот лучше Кими это никто не делает. Код, графики, это на самом деле все умеют — это не модель делает, это тулзы. Все умеют вызывать пайтон чтобы строить графики, лазить по инету и т.д. Кодит Кими объективно плохо

А вот если тебе нужен например личный помощник или телеграм бот или «а поговорить» вот это Кими. То что она мочит на русском это нечто. Прекрасная модель строго для вот такого эмоционального применения

Искуственный Интеллект BINGURU FORUM / Искуственный Интеллект /
 Новые модели ИИ

Ваш ответ Нажмите эту иконку для возврата на цитируемое сообщение

 

  ?
Только зарегистрированные пользователи могут отправлять сообщения. Авторизуйтесь для отправки сообщений, или зарегистрируйтесь сейчас.

 

Майоры: У терминала - 11
Трейдят - 2 [ Mixail, OrthoMaster ]
В окопе: 137 []
У терминала - 133 / Трейдят - 4
© 2026 Binguru Forum Engine. All rights reserved.
 


  ⇑