Golden Finance сообщает, что OpenAI и Anthropic недавно провели взаимную оценку моделей, чтобы выявить проблемы, которые могли быть пропущены в ходе их собственного тестирования. В среду в своих блогах компании сообщили, что этим летом провели тестирование безопасности общедоступных моделей ИИ друг друга, проверяя их на наличие галлюцинаций и так называемых «несоответствий», когда модели работают не так, как задумывали разработчики. Эти оценки были проведены до того, как OpenAI выпустила GPT-5, а Anthropic, основанная бывшими сотрудниками OpenAI, выпустила Opus 4.1 в начале августа.
Все комментарии