OpenAI и Anthropic проверили безопасность ИИ-систем друг друга
2025-08-28 20:17:03
OpenAI и Anthropic решили совместно оценить безопасность своих открытых моделей искусственного интеллекта и поделились результатами тестов. Anthropic проверила модели OpenAI на склонность к «угождению» пользователю, выдаче опасных советов, самосохранению и поддержке человеческого неправильного использования. OpenAI, в свою очередь, тестировала модели Anthropic на способность следовать инструкциям, избегать «обхода ограничений», выдавать неточные ответы и строить сложные схемы.
Подробнее https://www.ferra.ru/news/apps/openai-i-anthropic-pro...