Исследователи показали, что ИИ можно джейлбрекнуть с помощью повторения промптов
2024-12-25 10:30:02
Специалисты компании Anthropic, разрабатывающей семейство больших языковых моделей (LLM) Claude, опубликовали исследование, которое демонстрирует, что LLM можно принудить выполнять запрещенные действия, повторяя промпты на разный лад, а также автоматизировав этот процесс.
Подробнее https://xakep.ru/20...