ndr: Единственная трейдерская модель созданная трейдерами это дипсик, однако он усталь
ОригиналУсталь — это мягко сказано )
Дела у него сейчас очень херовы...
Видел инфо от (предположительно) знающих людей в теме, что
N Wire — известный китайский журналист в сфере технологий ИИ. Ссылаясь на MKT News, сообщает, что Alibaba, Bybedance и Tencent открыли массовые закупки чипов Huawei в расчете на то, что DeepSeek устранит проблемы их нестабильности и модель DeepSeek V4 будет работать стабильно.
Интересно, что это событие произошло после «эпик фейла» при запуске DeepSeek V4 в веб-приложении, из-за чего сервис не работал более 7 часов.
Судя по новости, китайские компании располагают инсайдом о том, что это была не фатальная проблема, а «детские болезни», и DeepSeek V4 всё же заработает на платформах Huawei.
Если китайские компании прорвутся со своими GPU, рынок ИИ изменится. Сейчас у них есть недогруженные ЦОД во Внутренней Монголии с господдержкой на базе Huawei. Если удастся полностью ввести их в эксплуатацию, китайцы начнут быстро заполнять рынок инференса через облако и подавят конкурентов ценами, не снижая при этом скорость.
Если дипсик все таки оживет и поправится, я уверен он даст еще прикурить.
Как дал прикурить, своим GRPO, когда все кто в теме просто охуели...Еще и опенсорс, еще и всем рассказали открыто как это работает и как делается...За это им респект
Напомню что эта штука дала возможность как минимум в два раза дешевле трейнить большие языковые модели и быстрее (это я конечно утрирую с цифрами, но это лишь образ, не точность, для понимания)
GRPO (Group Relative Policy Optimization) по сравнению с PPO (Proximal Policy Optimization) может сократить расходы на вычислительные ресурсы и память в среднем на 40–50%. В отдельных случаях, например, при крупномасштабном обучении, эта экономия может быть еще более значительной.
Это ML, я что знаю про ML
Маркос Лопес де Прадо, очень рекомендую.
Это квант с кучей открытых лекций, книг итд.
И именно МЛ в трейдинге (это сильно отличается от моделей которые применяются в других бизнесах, поэтому тут точечно прям)
Может многое быть нихуя не понятным, но блин...во времена ИИ можно расщепить каждое слово )
Именно от него я узнал о таких подходах в препроцессинге данных и таргета (и не только) как:
Мета-лейблинг (Meta-Labeling)Тут смысл такой, что первая модель дает вероятность отработки сигнала (понятие сигнал очень важно, это может быть очень разностороняя хуйня, а не только точка входа).
Вторая модель как следующий слой говорит ок или лох (войти или нет) и если войти то каким обьемом учитывая вероятности и уверенности первого слоя модели.
Это позволяет брать все сигналы прошедшие через первый слой, без снижения recall (полноты и охвата, чувствительности, это одна из метрик «качества» проверки моделей, их много разных), но решения принимаются дальше — на не четкий сигнал безусловно никаких котлет/вторая модель скажет — хуй
Метод трёх барьеров (Triple Barrier Method)Здесь казалось бы все просто, но бляяя... Такая простая и логичная вещь, но каггл воены не догадались )
Пример — сигнал (скажем не знаю — пинбор, просто для понимания) — таргет в данных помечается с учетом тейк профита, стоп лосса и важное — времени, окна времени...
То есть отработает ли пинбор сходя до тейка или стоп лосса скажем за 4 часа.
В принципе двойно барьер я и без лопеза допедрил делать правильно, но вот третий компонент дает улучшение в целом для профита итд.
Фракционно дифференцированные признаки (Fractionally Differentiated Features)Совершенно охуевшая тема, в которой я только начал разбиратся...
При подготовки данных входящих для моделей, любая гпт будем вам говорить о логарифмических доходностях, что это мол тру фича и модель найдет закономерности относительно сигнала и предикта таргета...НО
Стандартные методы (например, взятие логарифмической доходности) делают ряд стационарным, но уничтожают долгосрочную память, которая может быть ценной для предсказаний. Лопес де Прадо предложил метод фракционного дифференцирования (FracDiff), который находит баланс, делая ряд стационарным (удобным для ML-моделей), но при этом сохраняя его память и предсказательную силу
Очень очень важная херня, особенно при обучении темпоральных моделей на окнах (ЛСТМ, темпоральный транс).
Поэтому любого оловянному братану стоит это учесть, чтобы он вам не начала рассказывать про лог доходности в фичах — это норм, но этого недостаточно для предсказательной силы.
Информационно-управляемые бары (Information-Driven Bars)Еще одна охуевшая тема, это про наши любимые OHLC тики итд.
Как надо подать данные, в каком виде — чтобы модель отсеяла куча мусора и распознала с чем коррелирует сигнал относительно таргета — задача со зведочкой.
О чем кстати ты часто тоже писал, что нужно смотреть на цену под разными угламии искать другие методы итд итп, ибо очевидное не работает.
ВОТ это фундамент прям. Здесь мы не раскладываем временной ряд (его тоже можно, но база будет в виде)
Метод 1: Базовые бары (Standard Bars)
Это переходной этап от времени к информации. Они основаны на активности, но не на её содержании:
[list]
Тик-бары: Фиксируются после заданного числа транзакций (например, каждые 2000 сделок). Убирают зависимость от времени, но игнорируют размер сделки.
Объемные бары: Фиксируются после того, как накопленный объем торгов достигнет заданного порога. Учитывают размер сделок, что дает более стабильные выборки.
Долларовые бары: Фиксируются по достижении заданного торгового оборота в долларах (объем * цена). Это лучший из стандартных баров, так как он автоматически адаптируется к цене актива и учитывает инфляцию/сплиты[/list]
Что то намекает нам про рендж бары итд.
Здесь важно правильные пороги и цифры подобрать при фиксации, понятное дело что для каждого рынка они свои.
Но это не сложно по сути взять например обьем, какойто интервал и разложить ящик с усами и посмотрет ьквантили, дцели и прочую херню — там уже в зависимости от цели порешать
Метод 2: Информационно-управляемые бары (Information-Driven Bars)
Это уже настоящая инновация. Идея в том, чтобы дискретизировать рынок не по объему, а по дисбалансу, который указывает на приход новой информации.
Лопес де Прадо выделяет два основных типа.
1. Imbalance Bars (Бары на основе дисбаланса)
Их ключевая логика — агрессивные покупки (аптики) и продажи (даунтики) кодируются знаками (+1/-1).
Затем строится их накопленная сумма. Новый бар формируется, когда эта сумма превысит математическое ожидание дисбаланса для данного актива.
Это сигнализирует о том, что на рынок пришли информированные трейдеры
В зависимости от того, что мы считаем «событием», Imbalance Bars делятся на три подвида:
[list]
Tick Imbalance Bars (TIB): Самый простой вид. Использует только направление каждой сделки (аптик/дауник) без учета объема. Каждая сделка имеет вес 1 или -1.
Volume Imbalance Bars (VIB): Более совершенный вид. Направление сделки умножается на её объем (т.е. большой агрессивный ордер оказывает большее влияние).
Dollar Imbalance Bars (DIB): Аналогичен VIB, но вместо объема сделки используется её стоимость в долларах[/list]
2. Run Bars (Бары на основе серий)
В то время как дисбаланс смотрит на разницу между покупками и продажами, Run Bars анализируют последовательность (серию) однонаправленных сделок. Длинная серия аптиков (например, подряд 100 сделок) — это сильный сигнал. Идея в том, чтобы создать новый бар, как только накопится серия, длина которой статистически значима и не может быть случайной.
Run Bars тоже бывают трех видов: Tick, Volume и Dollar.
___
Кстати сам Маркоз в своих открытых лекциях говорит что предикт куда пойдет цена это самое скучное и неинтересное для него)
И развивает больше такие темы как
HRP (Hierarchical Risk Parity) — это про управления рисками и портфелями. Также критикует классическую оптимизацию Марковица (мол она по пизде идет итд итп).
Поиск микро-альфа (Microscopic Alpha) — тут я думаю все понятно нам всем ). Скачиваем все микротики мира всего и ковыряемся в данных. Кластеризуем МЛ ом итд итп
Кausal Factor Investing (Причинный факторный анализ) — тут я думаю тоже все понятно, нам нужна не просто кореляция признаков в стат данных, а гораздо более глубокое понимание причин.