Статья о DeepSeek-R1 была опубликована на обложке журнала Nature, а основатель и генеральный директор DeepSeek Лян Вэньфэн выступил в качестве соавтора. Исследовательская группа экспериментально продемонстрировала, что возможности рассуждения больших языковых моделей могут быть улучшены с помощью чистого обучения с подкреплением, что снижает нагрузку на человеческий фактор и превосходит модели, обученные традиционными методами в таких задачах, как математика и программирование. DeepSeek-R1 имеет 91,1 тыс. звезд на GitHub и получил положительные отзывы от разработчиков по всему миру. Доцент Университета Карнеги-Меллона и другие прокомментировали его эволюцию от мощного, но непрозрачного инструмента поиска решений до системы, способной вести диалог, подобный человеческому. В редакционной статье Nature он был назван первым основным LLM, опубликованным после рецензирования, что является долгожданным шагом к прозрачности. Рецензирование помогает прояснить принципы работы LLM, оценить их эффективность и повысить безопасность моделей.
Все комментарии