10 items

#transformers

Toutes les news taguées avec ce sujet.

Chronologie · 60 derniers jours

RECHERCHE
heat 45
Un modèle génératif apprend la structure du Modèle Standard à partir des données du LHC
Un transformer entraîné sur des données ATLAS retrouve masses et résonances du Modèle Standard sans connaissance physique préalable explicite.
RECHERCHE
heat 25
Rang spectral et profondeur : comment l'architecture des Transformers évite l'effondrement
Une étude théorique décortique le rôle des skip connections et de la normalisation dans la préservation du rang des gradients au fil des couches.
RECHERCHE
heat 35
Un cadre théorique explique la dynamique d'apprentissage du raisonnement inductif dans les Transformers
Des chercheurs modélisent l'apprentissage des circuits de raisonnement inductif via une variété invariante de faible dimension, rendant leur dynamique interprétable.
RECHERCHE
heat 52
Comment les données façonnent l'usage des fréquences RoPE : de l'échelle positionnelle à la généralisation en longueur
Une étude théorique explique pourquoi les modèles utilisent inégalement les fréquences RoPE et lie ce phénomène à la structure multi-échelle du langage naturel.