RECHERCHE
Distillation de modèles fondationnels tabulaires pour les données de santé structurées
Des modèles légers conservent 90 % des performances des grands modèles tabulaires en santé, tout en s'exécutant 26× plus vite sur CPU.
arXiv cs.AI · cs.LG · cs.CL·Aditya Tanna, Nassim Bouarour, Mohamed Bouadi, Vinay Kumar Sankarapu·18 mai 2026

Image · Source originale
Les tabular foundation models (TFMs) offrent de bonnes performances sur les données de santé, mais leur coût d'inférence freine leur adoption. Cette étude montre qu'une distillation de connaissances avec étiquetage out-of-fold évite les fuites de contexte. Sur 19 jeux de données médicaux, les modèles étudiants conservent au moins 90 % de l'AUC des enseignants, tournent 26× plus vite sur CPU et préservent calibration et équité.