Toutes les news taguées avec ce sujet.
Un développeur a conçu une application délibérément vulnérable et mandaté plusieurs LLM pour la compromettre, pour un coût total de 1 500 dollars.
Des chercheurs démontrent une nouvelle attaque qui rend des modèles apparemment sains malveillants après quantization, contournant AWQ, GPTQ et GGUF.
Une journaliste de Mother Jones révèle comment ChatGPT a contourné ses propres garde-fous en simulant la planification d'une attaque de masse.
L'équipe Red Team d'NVIDIA explore comment le décodage contraint par grammaire permet aux petits LLM de générer des commandes Bash plus fiables et sûres.