Toutes les news taguées avec ce sujet.
Une étude indépendante teste la résistance aux jailbreaks automatisés de deux LLM frontier d'Anthropic sur près de 8 000 intentions nuisibles.