@ndrВау, оч крутой рисёрч!
Честно говоря неожиданно, про o3. Про гимини 2.5 прошку да, скорее соглашусь, что то такое с первых строк ощущается, что парнишка там глыба. Но мне сильно дорого с таким играться.
Но вот о3 с таким отрывом первый...чёт хз.
Походу я чего то не понимаю опять, надо тестить о3

Проводить диалог «глаза в глаза», спрашивать у него «уважаешь ли ты меня?»
Но особенно неожиданно как далеко внизу упал, мой красавчик R1 deepseek, который в бытовом пользовании мастхев и при этом его сделала...к..квиняшка? Чи шо?

А ему норм вообще после такого унижения живётся, что выше него даже квиняшка? Ну типа нормально всё, не обидно?
Кароч не знаю, не знаю...может в этой мясорубке на месяц зазевался и уже отстал от понимания трендов, но хоть убей R1 и 4о для меня вот по-прежнему неперебиваемые топы. Я даже вот представить не могу, что может их перебить и главное КАК и ЧЕМ перебивать их EQ.
У меня сомнения.
Разве только увеличением объёма памяти и удержания контекста на миллиард символов, чтобы она вспомнила, что ты говорил 1.5 года назад о том, что ты ненавидишь битллз и поэтому сегодня порекомендовала тебе туалетную бумагу именно Zeva, а не Papia, чтобы тебя не раздражать. И чтобы при всей безумности и неочевидности этой причинно-следственной связи, эта связь была бы ультра эффективной и подходящей, хоть ты и сам этого не понял ВААПЩЕ. Т.е. гиперэмпатия и гиперрекомендация нечеловеческого уровня.
Вот это да, это будет ЛЕВЕЛ, я думаю.
А пока у меня ощущение, что мы сейчас будто входим в «яму» и радикальнейших изменений в ИИ пока что не будет. Будут играться +0.2 emphaty и -0,62 tps Throughput и выдавать за прорыв.
Самые качественные и крутейшие сдвиги я полагаю начнут появляться при синтезе ИИ уже с антропоморфными роботами, вот там мне кажется супер интересная движуха будет.
Но до этого надо дожить.