FlyknitЯ не спец в ИИ, сам только недавно начал изучать. Но хочу выразить следующую мысль:
Важно не забывать про дизайн моделей. Грубо говоря, задача всех этих chatgpt, клодов, дипсиков и т.д. — предсказывать следующего слово на основе предыдущего, что и создает возможность чатиться с ними. Логика и анализ — это тоже результат дизайна модели: модель натренировали на большом объеме данных и научили ее отлично составлять предложения. Болтать, короче
Но дизайн моделей не предусматривает правильность ответов. Это важно, потому что из-за такого дизайна ИИ и галлюцинирует, по сути. Ибо не было надзирателя с кнутом, чтобы тот хлыстал оловяного за неправильные ответы. Его хлыстали за другое.
Соотвественно, ИИ абсолютно спокойно мог бы ответить «учитывая твою головную боль — я считаю что тебе нужно биться головой об стену». И с точки зрения дизайна модели это будет абсолютно правильный ответ как и «советую пойти к врачу». Понятно что первый ответ маловероятен (ибо тренировочные данные тоже влияют на ответ, alignment, guardrails и т.д.), но никогда не равен нулю. И оба предложения звучат довольно грамотными. Но вот только твой жизненный опыт и знания позволяют тебе понять что ИИ написал бред, ровно как клинически больной человек. Ведь он тоже может тебе говорить что сегодня он летал на луну, встречался с президентом и т.д. И не исключено что будет адекватен, грамотен и приятен в общении.
Но когда вот эта грань между сумасшедшим ответом и грамотным ответом становится настолько маленькой — то тут уже нужна бОльшая квалификация чтобы отличить одно от другого.
Так вот. Сама возможность получения ответа — это круто. Но нужен fine-tuning. Как раз таки такой, в котором будет supervised learning: надзритель с кнутом и пряником. HuatuoGPT, например, интересно подошли к
решению вопроса (текст несложный, довольно легко читается. Кроме формул, конечно). Ибо постановка диагноза медицинского — это именно chain-of-thought
Так вот. Получаем на выходе модель, которая имеет больше шансов поставить верный диагноз за счет supervised learning + chain of thought. Но тоже. Тот же huatuo dataset очень маленький. И должна быть специлизация, желательно.
А назначение лечения — это уже должна быть другая модель. С тем же supervised learning обучением/тюнингом. В общем, диагноз и лечение — это обязательно должны быть 2 разные модели. Ибо разные датасеты будут и дизайны