RECHERCHE
Représentations de modèles pré-entraînés comme signaux d'acquisition pour l'apprentissage actif des MLIPs
Des noyaux dérivés d'un MLIP pré-entraîné permettent de réduire de 38 % les données nécessaires à l'entraînement de potentiels interatomiques réactifs.
arXiv cs.AI · cs.LG · cs.CL·Eszter Varga-Umbrich, Shikha Surana, Paul Duckworth, Jules Tilly·5 mai 2026

Image · Source originale
Des chercheurs proposent d'utiliser l'espace latent d'un modèle MLIP pré-entraîné (MACE) pour guider l'apprentissage actif, sans recourir à des ensembles comités, à des têtes d'incertitude bayésienne ou à du fine-tuning auxiliaire. Deux signaux d'acquisition sont introduits : un noyau tangent neuronal (NTK) à largeur finie et un noyau d'activation basé sur les features latentes. Sur des benchmarks de chimie réactive, ces approches surpassent les baselines classiques et réduisent en moyenne de 38 % les données requises pour atteindre les cibles d'erreur énergétique.