Проверили руками старые болезни reasoning, почти всё вылечилось

отметили
29
человек
Автор статьи на Хабре рассказывает о практическом опыте внедрения «режима рассуждения» (reasoning) в нейросеть, которая размечает звонки отдела продаж. До этого момента команда опасалась двух известных проблем таких моделей: склонности к излишним размышлениям (overthinking) и подверженности подсказкам из промпта.Для теста использовалась задача, требующая понимания контекста и намерений клиента — определение «следующего шага с учётом возражений». В отличие от простых полей вроде суммы сделки, эта задача сложнее и больше подходит для оценки качества рассуждений модели.Проверка проводилась на модели 2026 года, и результаты оказались неожиданными: проблемы, которые считались «врождёнными» болезнями reasoning, практически исчезли. Модель перестала уходить в бесконечные рассуждения и не следовала слепо инструкциям, если они противоречили фактам.Автор отмечает, что все старые страхи оказались напрасными — на практике «режим рассуждения» отработал чисто и эффективно. В итоге команда приняла решение включить эту опцию для сложных полей в продакшене.
Добавил Uberalles Uberalles 22 Июня
Комментарии участников:
Ни одного комментария пока не добавлено


Войдите или станьте участником, чтобы комментировать