RECHERCHE
Détection d'anomalies structurelles dans les statistiques régionales européennes par machine learning non supervisé
Un framework combinant cinq méthodes d'anomaly detection identifie les régions NUTS2 dont les profils socio-économiques divergent du schéma européen.
arXiv cs.AI · cs.LG · cs.CL·Bogdan Oancea·4 mai 2026

Image · Source originale
Ce papier propose un cadre de machine learning non supervisé pour détecter des profils régionaux structurellement atypiques à partir des données Eurostat 2022. Cinq méthodes sont comparées (z-scores, distance de Mahalanobis, Isolation Forest, Local Outlier Factor, One-Class SVM) sur quatre indicateurs : PIB par habitant, chômage, niveau d'éducation tertiaire et densité de population. Une région est classée anomalie si au moins trois méthodes la signalent. Les résultats mettent en évidence à la fois des métropoles très développées (Bruxelles, Vienne, Berlin) et des régions défavorisées (Hongrie du Nord, Estrémadure, Slovaquie).