[Перевод] ИИ в ловушке: что произойдет, когда в интернете не останется текстов, написанных людьми?

отметили
75
человек
в архиве
Главная проблема, описанная в статье, заключается в том, что генеративный искусственный интеллект сам уничтожает свою основу — тексты, написанные людьми. Чем больше контента создают нейросети, тем меньше в интернете остаётся оригинальных человеческих материалов, на которых эти нейросети обучаются. Это приводит к так называемой «ловушке ИИ», когда модели начинают учиться на собственном же выходе, что ведёт к деградации их качества.Процесс изменения экономики данных идёт по двум направлениям. Первое — это загрязнение обучающих выборок синтетическим контентом, который выдаётся нейросетями и затем снова попадает в интернет. Второе — это растущая нехватка свежих и уникальных текстов, написанных людьми, которые служат эталоном для обучения. В результате модели начинают воспроизводить собственные ошибки и шаблоны, что снижает их разнообразие и точность.Авторы отмечают, что эта проблема усугубляется стремительным ростом популярности ИИ-инструментов. Платформы вроде ChatGPT и Midjourney ежедневно генерируют миллионы изображений и текстов, которые затем публикуются в сети. Таким образом, интернет постепенно превращается в замкнутый цикл, где машины пишут для машин, а человеческий вклад становится всё менее заметным.Предыстория вопроса связана с тем, что раньше качество ИИ напрямую зависело от объёма и чистоты данных. Сейчас же, когда синтетические данные становятся доминирующими, разработчики сталкиваются с необходимостью фильтровать обучающие наборы.
Добавил Freemen Freemen 27 Апреля
Комментарии участников:
aprioric
+45
aprioric, 27 Апреля , url

что произойдет

Может тогда начнут писать правильно: «что произойдёт»? )))



Войдите или станьте участником, чтобы комментировать