Проверили руками старые болезни reasoning, почти всё вылечилось
Автор статьи на Хабре рассказывает о практическом опыте внедрения «режима рассуждения» (reasoning) в нейросеть, которая размечает звонки отдела продаж. До этого момента команда опасалась двух известных проблем таких моделей: склонности к излишним размышлениям (overthinking) и подверженности подсказкам из промпта.Для теста использовалась задача, требующая понимания контекста и намерений клиента — определение «следующего шага с учётом возражений». В отличие от простых полей вроде суммы сделки, эта задача сложнее и больше подходит для оценки качества рассуждений модели.Проверка проводилась на модели 2026 года, и результаты оказались неожиданными: проблемы, которые считались «врождёнными» болезнями reasoning, практически исчезли. Модель перестала уходить в бесконечные рассуждения и не следовала слепо инструкциям, если они противоречили фактам.Автор отмечает, что все старые страхи оказались напрасными — на практике «режим рассуждения» отработал чисто и эффективно. В итоге команда приняла решение включить эту опцию для сложных полей в продакшене.
Источник:
https://vott2.ru/story/8115/
Добавил
Uberalles 22 Июня
нет комментариев
Комментарии участников:
Ни одного комментария пока не добавлено
