DeepSeek открывает сегодня Неделю открытого исходного кода первой базой открытого исходного кода — Flash MLA, эффективным ядром декодирования MLA, оптимизированным для графических процессоров Hopper, разработанным специально для обработки последовательностей переменной длины. Сообщается, что Flash MLA был вдохновлен проектами FlashAttention 2&3 и Cutlass.
Все комментарии