Сотрудники OpenAI публично обвинили xAI в предоставлении вводящих в заблуждение результатов тестов для своей последней модели искусственного интеллекта Grok3

Недавно сотрудник OpenAI публично обвинил компанию Илона Маска xAI в публикации вводящих в заблуждение результатов тестов для ее последней модели искусственного интеллекта Grok3. В ответ соучредитель xAI Игорь Бабушкин заявил, что компания не сделала ничего противозаконного. Диаграмма xAI показывает, что две версии Grok3 — Grok3 Reasoning Beta и Grok3 mini Reasoning — превзошли самую мощную на данный момент доступную модель OpenAI, o3-mini-high, на AIME 2025. Однако сотрудники OpenAI поспешили указать на платформе X, что диаграмма xAI не включает оценку AIME 2025 для o3-mini-high при «cons@64». Бабушкин утверждал на Platform X, что OpenAI уже публиковала подобные вводящие в заблуждение графики тестов в прошлом. Хотя эти графики используются для сравнения производительности собственных моделей.

Недавно просмотренные

Популярные валюты

ежедневные тенденции

Надо читать каждый день

Добро пожаловать

Зарегистрировать аккаунт

Войдите, используя email

Зарегистрируйтесь с помощью email

Проверь свои входящие

Сотрудники OpenAI публично обвинили xAI в предоставлении вводящих в заблуждение результатов тестов для своей последней модели искусственного интеллекта Grok3

Все комментарии

Рекомендуем к прочтению

На этой неделе чистый приток средств в американские спотовые биткоин-ETF составил 1,4166 миллиарда долларов.

Цена на серебро на спотовом рынке упала ниже 88 долларов за унцию, снизившись на 4,72% за день.

Стратегическое партнерство Cointime с Feixiaohao Hainan Summit позволит совместно разработать глобальную дорожную карту для сообщества Web3, чтобы "стремительно двигаться к Nasdaq".

Десять главных прогнозов Delphi Digital на 2026 год

X убивает "мастурбацию ртом", кто рыдает, а кто молча пользуется ситуацией?

Вчера в американский спотовый биткоин-ETF поступило 104,08 миллиона долларов США в виде чистого притока средств.

Вчера в американский спотовый Ethereum ETF поступило 164,32 миллиона долларов США в виде чистого притока средств.

Компания Nexer Dex выпустила бета-версию своего сервиса спотовой торговли, демонстрационная версия которого станет доступна 18 января.

Самый ранний срок давности для ретроактивного налогообложения доходов, полученных за рубежом, — 2017 год.

Надо читать каждый день

Проверка фактов: Сколько денег на самом деле потерял Чикагский университет, торгуя криптовалютой?

Поскольку эффект от сокращения финансирования вдвое ослабевает, возглавляют ли институции новый цикл развития биткоина?

Solidify Chain: Безопасный путь от стимулирования инфляции к обеспечению денежного потока

Solidify Chain: Безопасный путь от стимулирования инфляции к обеспечению денежного потока

Кризис идентичности и парадокс управления биткоином

Битва за уголовные обвинения: спор Пауэлла и Трампа о процентных ставках

делиться