Grass, Ontocord и LAION, известные организации в области искусственного интеллекта, объявили о совместном выпуске набора данных VALID (Video-Audio Large Interleaved Dataset). Набор данных создан на базе Grass Video Warehouse и содержит 30 миллионов аудиоклипов, чередующихся с изображениями и текстом, что делает его первым в отрасли набором видео-аудио данных с чередованием. Выпуск VALID обеспечит поддержку новых данных для обучения мультимодальных моделей ИИ.
Все комментарии