Cointime

Download App
iOS & Android

Сотрудники OpenAI публично обвинили xAI в предоставлении вводящих в заблуждение результатов тестов для своей последней модели искусственного интеллекта Grok3

Недавно сотрудник OpenAI публично обвинил компанию Илона Маска xAI в публикации вводящих в заблуждение результатов тестов для ее последней модели искусственного интеллекта Grok3. В ответ соучредитель xAI Игорь Бабушкин заявил, что компания не сделала ничего противозаконного. Диаграмма xAI показывает, что две версии Grok3 — Grok3 Reasoning Beta и Grok3 mini Reasoning — превзошли самую мощную на данный момент доступную модель OpenAI, o3-mini-high, на AIME 2025. Однако сотрудники OpenAI поспешили указать на платформе X, что диаграмма xAI не включает оценку AIME 2025 для o3-mini-high при «cons@64». Бабушкин утверждал на Platform X, что OpenAI уже публиковала подобные вводящие в заблуждение графики тестов в прошлом. Хотя эти графики используются для сравнения производительности собственных моделей.

Комментарий

Все комментарии

Рекомендуем к прочтению