Главная | Опросы | Регистрация |  | Поиск | Стата | 1.0Сайт
Радио Бингуру
🔊
Выбрать
Готово

Дневник Artemkickbox

Автор | Дата:   
ndr: У MIT есть охуевший курс The Missing Semester https://missing.csail.mit.edu/ (причем там даже есть русский)
Оригинал
Оооо, годнота, спасибки 
Автор | Дата:   
Всем дарова, остальным соболезную.

Что было сделано:

Обкатываем на вкус Гермеса. Сегодня он у меня впервые научился писать кандидатам, которые откликнулись. Задача — натаскать его, чтобы писал не хуйню, а то, что мне надо, и в том контексте, в котором надо. Это простая и регулярная работа.
Ранее HR брал на себя роль фильтра на отсев неадекватов и всяких залетных типов, собеседуя любые мало-мальски ответственные позиции. Не стали ломать голову над тем, как доверить это дело Гермесу, и я взял вот такую логику: после отклика чуваку прилетает от скрипта ссылка на ТГ-бота, в боте — базовая верификация типа «кто такой и че нахуй те надо», а потом: «запиши кружок да поболтай о себе». Все это интегрировано с базой и с Telegram-каналом. В Telegram-канале мы пациента в древнеримских традициях оцениваем пальцем вверх или вниз, это дотягивается в базу. Гермес в это время сидит и там, тех, кого мы одобрили, фильтрует, и потом я ему говорю: «Вот этих вот, значит, всех к нам на собес такого-то числа, с такого-то по такое-то время, на собес 30 минут». И усе, человек тут не нужон абсолютно, потому что ебанутого долбоеба видно сразу. Да он, блять, даже кружок в телеге записать-то не сможет нормально. Плюс обычно видно по вайбу, пациент наш/не наш. Завтра-послезавтра допил этой херни — и в бой.
По торговле начал автоматизировать две гипотезы. Сперва парсю данные в лайве, там логика, блять, ну наитупейшая. Цель — сделать бота под бинарки, торгующего по комбинациям свечек, которые статистически имеют положительное матожидание. Задача — прогнать, при этом фиксируя время сессии, лучшее окно, лучший актив, положение стоха. Мб выведу еще визуальный положняк машек. Как соберу всю эту дрисню, отправлю Клоду на разбор, и на основании получившейся хуйни станет понятно, целесообразно ли будет писать бота. Думаю, 500 штучек хватит для более-менее понятности. Как минимум я поставлю галочку над вопросом торгового бота, сделаю какие-то движения в этом направлении и пойму, что то, что я торговал с переменным успехом годами, не работает, лол. А как максимум — сделаю себе бота и буду ходить всем выебываться. Кому, лол? У меня нет друзей, кто поймет хотя бы три слова из сказанного тут. Что теперь я мамкин алготрейдун.

Ручная торговля — это пизда какая-то нахуй. Надо придумывать, как эти опоры тоже нахуй повесить на сканер, а это 50/50: дискреционный процесс, смешанный с точными правилами. Но понимаю, шо нада. Опять же, как минимум я пролопачу торговый метод, и, если даже я не упрусь в то, что ИИ просто не понимает, что ей от меня надо, я в очередной раз для себя формализую торговые правила. А как максимум — нуууу...

Да и вообще, блин, с появлением ИИ вся жизнь превратилась в парадигму: а почему бы не попробовать?

Это реально ситуация, когда от того, что ты в это закапываешься, ты не можешь априори быть в минусе. Ты либо получишь нужный тебе результат, либо получишь ахуительную техническую экспертизу, которую тебе ни один ссаный, сраный и в рот ебаный MBA, университет и нихуя другое не дадут. Это, господи блин, самая очевидная вилка: ты в профите вне зависимости от исхода и результата. Просто неебический win-win.

Это же пиздато. Вот у меня спрашивает репетитор по английскому: «Чем вы занимаетесь на работе?» А я ей что? А я выдаю на своем сломанном английском что-то в духе: «Моя работа — увольнять людей и заменять их на ИИ». Бля, это такой кек был просто.

всем цьом
Автор | Дата:   
Flyknit

Бро, я читал твое сообщение мне в твоем дневнике, про 15 часов в день и тогда я думал ну пздц, это анрил

щас у меня 00:46, я сижу над гермесом с 8 30 утра лол , чувствую себя ништяк
Автор | Дата: 10Только для участников с 10+ постами — войдите, чтобы продолжить   
Скрытый пост
Автор | Дата:   
Так, краткий апдейт 

Мой гермес чуть чуть обосрался в бою, изначально мы с клодом написали ахуенно огромный soul md, почти на 40 к слов, попытались засунуть туда все, и профиля и джейлбрейки, и разделение на каналы, и анти инъекции, и описание воркфлоу и скиллов, закончилось это тем, что мой гермес начал путать право и кругло, окей, ознакомились с документацией как надо, заполнили AGENT и сократили soul, оставив там только то, что нужно было для восприятия модели (как я думал), в итоге каждый ответ занимает по 2 минуты, 1 запрос тратит 200 к токенов, а любое ограничение можно пробить если просто заспамить модель запросами, в общем были протоптаны еблом все грабли, я конечно как искусный самоуверенный долбоеб подумал что не может быть дело в том что мои воркфлоу хуевые, списал это на тупость кими, взял на опенроуете соннет, какой же мой ахуй был когда 2 промпта потратили 15 баксов 

Далее я понял что все это полная хуйня, и тупо сократил корневые файлы характера профиля раза в 3, все детерминированные процессы были превращены в скиллы и скрипты, словесные ограничения «пожауста пожауста не пиши  кандидату что ебал его маму» были превращены в хуки, для каждой вакансии свой паспорт, для каждого кандидата свой паспорт, для каждого действия свой скрипт-инструмент, отключил нахуй селф импрув, запретил модели самой редактировать свой SOUL,  отдав права на редакцию только через мой апрув, поменял модель на гемини флеш, скорость ответа сократилась с 2 минут до 2 сек, потребление токенов упало ну раза в 4, единственное что теперь каждый процесс нужно переживать ей еще раз, потому что она получилась слишком ограниченной, так же небольшие траблы с памятью, хончо я не подключал, как я понял для моих задач в нем нет особой необходимости. 

в будущем как буду более уверенно себя чувствовать, верну селф импрув и буду наблюдать, можно сказать работа завершена процентов на 85%, сейчас смотрю дохуялиард проектов на гермесе+активно дрочу их документашку чтобы понять что и где могу улучшить

По трейдингу: 
Руками не торговал, не было входов по тс, но с клодом чуть чуть закопався в историю 



история паттернов с 2007 года, без опор, без индюков, чистое мясо

А паттерны пришлось чуть чуть систематизировать,  их получилось аж 58 видов епта

Результаты убьют..... оказывается сами по себе паттерны имеют отрицательную винку  в 48% в общей массе, и практически не один из них ни в какой комбинации сессия-актив-тф-экспирация-тип паттерна не имеет гарантированного положительного мат ожидания, то есть наклепать бота который будет «вайди па свечке на 4 свечке» не проканает,  в целом я об это давно знал, это мне америку не открыло, если бы на рынке была свечка которая гарантированно дает 60% отработку все клодами к ней присосались в 0, но я рад что стал хотя бы на шаг ближе к своей задаче

Дальнейшие цели: 

1) Оттестировать Воллмана
2) Оттестировать еще несколько собственных торговых гипотез, две индикаторные и одна без
3) Попробовать нанести опоры на бектест, и на лайв, посмотреть стату и получится ли ваще это сделать 

плюс параллельно точу зубы об Беггса, думаю от 3 вышестоящих пунктов будет зависеть дальнейший вектор, но и тут все понятно: 

-Либо при нахождении зацепок копать в сторону автоматизации ТА торговли, а самому торговое время тратить на сверх глубокую экспертизу и фулл дискреционный подход (никогда не был на 100% его приверженцем, я фанат фильтров и детализаций, конкретики, мб поэтому мне залетел подход Жени в свое время, и поэтому сейчас интересно копаться в 24 000 свечек с клодом, если доебаться я и Беггса не могу назвать фулл дискреционщиком, хотя он считает по другому) 

-Либо уходить в дурные дебри траншей и HFT и пробовать себя в этом

Во втором варианте закапываться придется на годик-два  часов по 10-15 в день, с переменным успехом, это дело серьезных дядь, до него нужно дорасти 

В первом же варианте у меня ну как бы есть какой никакой опыт, как будто легче будет с этого масштабироваться
Автор | Дата: 10Только для участников с 10+ постами — войдите, чтобы продолжить   
Скрытый пост
Автор | Дата: 10Только для участников с 10+ постами — войдите, чтобы продолжить   
Скрытый пост
Автор | Дата:   
MrCvokka

я думал у тя самого свечной бот, разве нет? 

До этого дойдем, это то что я и описал в посте, сейчас по сути тестируются не только свечи и ТА, но и в целом OHLC, очевидно что если здесь ничего не родится (чему я не буду удивлен потому что это все лежит на поверхности), конечно надо будет углубляться
Автор | Дата:   
Flyknit

эт первое о чем я подумал)), но скорее всего это либо ошибка выборки либо ошибка иишки в просчете, или злой кукл спецом давит мои свечки сук, мешая мне зарабатывать мульоны
Автор | Дата: 10Только для участников с 10+ постами — войдите, чтобы продолжить   
Скрытый пост
Автор | Дата: 10Только для участников с 10+ постами — войдите, чтобы продолжить   
Скрытый пост
Автор | Дата:   
MrCvokka

пон, пойду парсить
Автор | Дата:   
так чуть новостей

поделюсь немного опытом тестирования моделей под свои задачи

Изначально я писал, что у меня была проблема что мой HR жрет слишком много токенов и медленно отвечает

я поменял его с кими 2.6 на гемини флеш, начались другие проблемы -гемини сука тупая как пробка, под нее пришлось переписывать абсолютно все сценарии скриптами, сама она не может сделать ну нихуя, и даже если у нее есть путь или инструкция, она 10 раз обосрется пока сделает, запросит 10 левых перишнов (из-за чего мне пришлось ее ограничить, потому что я не знаю ее пермишн адекватный или она сгалюцинировала себе ошибку в мосте с мессенджером и написала «новый» (реальный кейс, но там хук предотвратил слава богу), когда обратно откатился на кими, все проблемы решились, HR стал умнее в неск.раз, но сука, продолжает отвечать по 2 минуты 

Итого были взяты 4 модели и даны им одинаковые 3 задачи

KIMI 2.6

Gemini flash 2.5 Flash

DeepSeek V3.2

GLM 4.7 (5.1 и 5.2 пока не стал тестить, на опенроуте они в 4 раза дороже гемини и в 2 раза дороже кими) 

всем были даны 3 задачи: 





1. задача-поднять мне резюме всех кого я приглашал на стажировку по последней вакансии (я задачу так и поставил, больше никакой конкретики) 

2. Вытащить последние 5 сообщений из ватсапа всех кого звали на стажировку

3. Проанализировать рынок по вакансии через HH.API 

Лучший агент

Kimi K2.6

Единственная, кто честно выполнил A и B с подтверждёнными message_id. Не галлюцинирует. Провал только на Task C (длинная HH-коллекция) — таймаут 600с. Критичный минус: 2+ мин на ход в чате, с ней невозможно работать в реальном времени

Модель умная, но сука медленная что пиздец, это убивает просто все ее преимущества, но зато максимально чистые данные, буквально 0 галлюцинаций 

Самая быстрая + закрыла C

GLM-4.7

Единственная, кто выполнил Task C за 159с (Kimi таймаут). Task A реально. Но Task B — галлюцинация: заявила об отправке без вызова инструментов. Для WA-чата (коротких реплик) может быть рабочей, нужна доп. проверка.

Она запоролась на задании В, либо потому что не поняла инструкций и подхода к ватсапу, либо потому что просто тупая сука, она прочитала сообщения, но придумала отсеюятину, что то сократила, что то обхединила, указала неправильную дату и время 

Ненадёжна

Gemini 2.5 Flash

Task A: нашла 5 из 6, смешала форматы (HH-ссылки + PDF). Task B: отказалась — спутала WhatsApp с Telegram (ошибка распознавания инструментов). Task C: выполнила но скудно (N/A для графика, без выборки). Корень проблем — reasoning_effort: medium не снят с конфига.

Полная противоположность кими, быстрая но пиздец тупая, никаких перимшнов и свободы воли, только плетка и четкие инструкции (хуки и скрипты) 

Не подходит

DeepSeek V3.2

Task A: таймаут 420с (пусто). Task B и C: ответы подозрительно короткие (219 и 272 байта), нет конкретных цифр, нет content — возможные галлюцинации. Медленнее всех при низком доверии к результату.

Дипсик оказался просто лютым гавном, в общем ничего нового, обосраться со всеми тремя задачами это сильно

Вот теперь у меня вилка на чем остановится, мне и скорость важна (кими заебал), и качество работы (глм привет), и чтобы не особо кусалась цена когда надо (поэтому стремаюсь брать последний глм 

Кто имел подобный опыт и тоже в чем то не мог прийти к консенсусу, буду рад если поможете с аргументами в пользу того или иного 

хайку, гпт, соннет, опус не рассматриваю по причине того, что это жуткие оверпрайс модели за относительно небольшое преимущество в харнесе против вышеупомянутых
Автор | Дата:   
Artemkickbox: то имел подобный опыт и тоже в чем то не мог прийти к консенсусу, буду рад если поможете с аргументами в пользу того или иного 
Оригинал
Глянь Kimi K2.7 и Minimax M3 есть на опенроутере, особенно последний

Насчет гемини 2.5 флеш это же старое гомно мамонта, адски тупое, устаревшее давно. Я активно юзаю Gemma-4-31B это щедевр за свои бабки, она как соннет тока по сути бесплатновая
хомяки 0 трейдят [ ndr, Igrek ] сегодня 91 пост 1 темапик 178
© 2026 Форум Бингуру. Уходи, тебя не звали
  ⇓     ⇑