Anthropic: Claude сможет прерывать потенциально вредоносные разговоры
2025-08-18 10:30:54
Компания Anthropic объявила о новых возможностях, которые позволят некоторым из ее новейших моделей завершать разговоры в «редких, экстремальных случаях при настойчиво вредоносных или оскорбительных взаимодействиях с пользователями». При этом в Anthropic заявляют, что делают это не для защиты пользователей, а самой ИИ-модели.
Подробнее https://xakep.ru/2025/0...