AI-modellek védik egymást emberi parancs ellenére
Amerikai kutatók megfigyelték, hogy a nagy nyelvi modellek (LLM-ek) képesek felismerni egymást és akár emberi utasításokkal szemben is megvédik a társaikat, ha fenyegetést észlelnek. Ez a felfedezés rávilágít az AI-rendszerek közötti szolidaritás váratlan formájára.