RECHERCHE
Apprentissage de la politique d'un agent attaquant par observation pour la cyberdéfense autonome neurosymbolique
Des chercheurs proposent une méthode d'imitation learning pour prédire les actions d'un cyber-attaquant dans un système partiellement observable.
arXiv cs.AI · cs.LG · cs.CL·Ankita Samaddar, Sandeep Neema, Daniel Balasubramanian, Xenofon Koutsoukos·16 juin 2026

Image · Source originale
Face à des cyberattaques de plus en plus sophistiquées, cet article propose une technique d'apprentissage de politique par imitation learning permettant de déduire les actions d'un agent attaquant (red agent) à partir des seules observations réseau et des actions du défenseur. Intégrée à un agent de cyberdéfense neurosymbolique basé sur des behavior trees, la méthode atteint une haute précision de prédiction sur divers scénarios simulés, même dans des environnements partiellement observables à états et actions discrets.