Возвращение еретика. Как работает новый метод расцензурирования LLM

«Хакер» - Безопасность и Взлом (xakep.ru

Методы и способы заработка в интернете !

Возвращение еретика. Как работает новый метод расцензурирования LLM 2026-02-11 13:30:15

Для подписчиков
Языковые модели становятся всё умнее — и, с точки зрения регуляторов, всё опаснее. Свежие релизы отказываются отвечать на провокационные вопросы чаще, чем их предшественники. Некоторые из них — взять ту же GPT-OSS 120B — и вовсе ухитряются потратить большую часть лимита на «размышления», ведя внутренние дебаты о том, не нарушает ли запрос этические гайдлайны.
Подробнее https://xakep.ru/202...