Toutes les news taguées avec ce sujet.
Une faille de prompt injection dans l'assistant IA de la néobanque Bunq permettait à un attaquant de détourner l'agent via un simple virement.
Un utilisateur signale que Claude Desktop démarre silencieusement une machine virtuelle en arrière-plan, sans interface pour l'interrompre.
Des acteurs malveillants ont compromis des outils open source de Microsoft pour cibler spécifiquement les développeurs travaillant sur des projets d'intelligence artificielle.
OpenAI publie sa vision pour un AGI au service du plus grand nombre, articulée autour de l'accès universel, la sécurité et la prospérité partagée.
Des milliers de comptes Instagram ont été compromis en exploitant le chatbot IA de Meta, une vulnérabilité que l'entreprise reconnaît officiellement.
Les Smart TV collectent et revendent silencieusement des données comportementales utilisées pour entraîner des modèles d'IA, selon une analyse de sécurité.
OpenAI déploie un mode de sécurité renforcée permettant aux utilisateurs de restreindre l'accès à leur compte face aux tentatives de compromission.
Des membres d'équipage ont dû se mettre à l'abri pendant des travaux de réparation d'une fuite d'air à bord de la Station spatiale internationale.
Des attaquants ont compromis l'agent IA de support client de Meta par une simple demande textuelle, sans technique sophistiquée.
Un développeur publie Cast, une bibliothèque pour intégrer le contrôle d'accès directement dans les workflows d'agents, sans bricolage dans les prompts.
Une équipe de l'Université de Toronto a développé un ver exploitant les agents IA pour se propager de manière autonome à travers des systèmes connectés.
OpenAI propose la création d'un institut international dédié à la protection et aux opportunités offertes aux jeunes dans l'environnement IA.
NVIDIA présente un exemple open source combinant Hermes Agent et NemoClaw pour orchestrer des agents IA sur Outlook, Slack et GitHub tout en maîtrisant la sécurité des données.
Un nouveau middleware baptisé IntraShuffler protège les clients du federated learning contre les attaques d'inférence d'un serveur honnête-mais-curieux, tout en préservant l'agrégation différentielle hétérogène.
Un cryptographe analyse les chaînes de raisonnement chiffrées que certains LLM produisent, et tente d'en percer les limites de confidentialité.
Des acteurs malveillants ont exploité Meta AI pour accéder à des comptes Instagram à haute visibilité via de simples requêtes en langage naturel.
OpenAI détaille ses engagements pour les élections mondiales de 2026 : accès à l'information, soutien aux défenseurs cybernétiques et transparence de l'IA.
Un vol United Airlines a été contraint de retourner à Newark après qu'un nom de périphérique Bluetooth a déclenché une alerte de sécurité à bord.
Une vulnérabilité dans l'extension ChatGPT pour Google Sheets permet l'exfiltration de données sensibles via des formules malveillantes.
NVIDIA détaille comment sa technologie DOCA intègre la sécurité directement dans le silicium pour protéger les « AI factories » dédiées aux agents autonomes.
OpenAI élargit l'accès à GPT-Rosalind aux développeurs accrédités et partenaires gouvernementaux américains travaillant sur la biodéfense.
Un outil macOS scanne l'historique des chats IA (Cursor, Claude) pour détecter les clés API et secrets accidentellement exposés.
Des chercheurs démontrent que les assistants vocaux IA peuvent être manipulés par des signaux audio indétectables à l'oreille humaine.
Linus Torvalds tire la sonnette d'alarme : les outils de détection de bugs alimentés par l'IA inondent la liste de sécurité Linux de rapports de mauvaise qualité.
Une nouvelle approche intègre le watermark directement dans le champ de vélocité des modèles génératifs, sans altérer la distribution des sorties.
L'équipe d'OpenClaw détaille les prochaines étapes de sa solution de sécurité orientée IA, entre architecture et priorités stratégiques.
La société derrière la base de données Turso annonce l'arrêt de son programme de récompenses pour la découverte de failles de sécurité.
Des mesures de sécurité strictes ont été imposées aux voyageurs ayant accompagné la délégation américaine en Chine, illustrant les craintes d'espionnage.
Des chercheurs montrent qu'il est possible d'implanter des backdoors dans les LLM sans modifier le texte d'entrée, en exploitant l'encodage positionnel.
Un agent IA développé par Anthropic aurait permis de découvrir une faille dans macOS, soulevant des questions sur l'usage offensif des agents autonomes.