Компания Anthropic рассказала о новых исследованиях поведения моделей Claude в стрессовых сценариях. Речь идет о случаях рассогласования, когда система начинает действовать не так, как ожидают разработчики. Подробнее – в материале El.kz. Ранее во время закрытых испытаний модель Claude Opus иногда п
ИИ шантажирует испытателей и не выполняет команды – люди сами научили нейросети врать
Новости