RECHERCHE

Apprentissage de la politique d'un agent attaquant par observation pour la cyberdéfense autonome neurosymbolique

Des chercheurs proposent une méthode d'imitation learning pour prédire les actions d'un cyber-attaquant dans un système partiellement observable.

arXiv cs.AI · cs.LG · cs.CL·Ankita Samaddar, Sandeep Neema, Daniel Balasubramanian, Xenofon Koutsoukos·16 juin 2026

Image · Source originale

Face à des cyberattaques de plus en plus sophistiquées, cet article propose une technique d'apprentissage de politique par imitation learning permettant de déduire les actions d'un agent attaquant (red agent) à partir des seules observations réseau et des actions du défenseur. Intégrée à un agent de cyberdéfense neurosymbolique basé sur des behavior trees, la méthode atteint une haute précision de prédiction sur divers scénarios simulés, même dans des environnements partiellement observables à états et actions discrets.

Chaleur 7

Pertinence 55

Nouveauté 65

OUVRIR LA SOURCE ↗

#reinforcement-learning #cybersécurité #imitation-learning #neurosymbolique #agents-autonomes