Cointime

Download App
iOS & Android

Alibaba запускает новую модель вывода, которая содержит всего 1/21 параметров, сопоставимых с DeepSeek R1

Команда Alibaba Qwen официально опубликовала свои последние результаты исследований — большую языковую модель QwQ-32B. Имея всего лишь около 1/21 параметров DeepSeek-R1, QwQ-32B достигла скачка производительности посредством обучения с подкреплением.

Комментарий

Все комментарии

Рекомендуем к прочтению