Egyszerű trükkel törtek fel egy szuper AI-t
Egy rendkívül egyszerű módszerrel törték fel az Anthropic nemrég bemutatott, "Mythos-osztályú" Fable mesterséges intelligencia modelljét. A biztonsági kutatók által alkalmazott trükk olyan nyilvánvaló volt, hogy szinte hihetetlennek tűnik, hogy a fejlett AI beleesett ebbe a csapdába.