DeepSeek и Пекинский университет создадут самосовершенствующиеся ИИ-модели

Новый метод улучшит работу ИИ с меньшими затратами ресурсовКитайский стартап DeepSeek и Пекинский университет Цинхуа объявили о совместной разработке более эффективных моделей искусственного интеллекта (BB). Их цель — уменьшить затраты на обучение ИИ-моделей, делая их более быстрыми и экономичными.

© Solen Feyissa

Исследования в этом направлении описаны в недавно опубликованной статье, в которой ученые предлагают новый способ обучения с подкреплением. Эта методика позволяет ИИ лучше учитывать предпочтения человека, награждая модели за более точные и понятные ответы. Обучение с подкреплением уже доказало свою эффективность в узких областях, однако применение этих техник для более широких задач всегда было проблемой. DeepSeek предлагает решение с использованием технологии, которую она называет «самокритическим настройком принципов».

Этот подход продемонстрировал лучшие результаты по сравнению с существующими методами и моделями, требуя меньших вычислительных ресурсов. Новые модели, получившие название DeepSeek-GRM (Generalist Reward Modeling), будут выпущены с открытым исходным кодом, что откроет доступ для других разработчиков ИИ.

Источник

Like this post? Please share to your friends:
Arcads
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: