Сегодня мы одновременно выпускаем две официальные версии наших моделей: DeepSeek-V3.2 и DeepSeek-V3.2-Speciale. DeepSeek-V3.2 — наша первая модель, интегрирующая мышление в использование инструментов, поддерживающая как мысленный, так и немысленный режимы вызова инструментов. Мы предлагаем метод синтеза данных для обучения больших агентов, конструируя большое количество задач обучения с подкреплением, которые можно решить «сложно, но легко проверить» (более 1800 сред, более 85 000 сложных инструкций), что значительно повышает обобщающую способность модели. (DeepSeek)
Все комментарии