| Телеграм-канал БлоGнот

23 мая 2025 г. / Source

Anthropic применила в Claude Opus 4 самые строгие меры безопасности в истории компании. Внутреннее тестирование показало, что модель может помочь новичкам в создании биологического оружия. Главный научный сотрудник Джаред Каплан прямо заявил, что система может дать советы по синтезу “чего-то вроде COVID или более опасной версии гриппа”.

Меры включают усиленную кибербезопасность, предотвращение “джейлбрейков” и дополнительные системы для обнаружения вредоносного поведения. Пишут даже, что в модель встроена функция whistleblower, и она может сама отправить email “куда следует”, если пользователь будет использовать её для чего-то “вопиюще злого”.