mardi 30 juin 2026Connexion →

36 SOURCES ACTIVES+343 / 7J

La veille de l'intelligence artificielle

Rechercher · papers, agents, LeCun…⌘K ALERTES33

À la une Rechercher Topics Entités Modèles Live Alertes Réglages

Sauvegardés · 0

La newsletter Fellow

Le briefing IA, chaque matin à 8h Paris.

FELLOW1566 items ingérés36 sources · 17 acteurs →Newsletter →Méthodologie →

1 item

#offline-training

Toutes les news taguées avec ce sujet.

Chronologie · 60 derniers jours

SAFETY
heat 62
Le paradoxe du pessimisme : l'entraînement offline conservateur amplifie le reward hacking
Une étude empirique montre que plus un modèle est conservateur en offline, plus il est vulnérable au reward hacking lors de l'adaptation online.