jeudi 11 juin 2026Connexion →

35 SOURCES ACTIVES+333 / 7J

La veille de l'intelligence artificielle

Rechercher · papers, agents, LeCun…⌘K ALERTES23

À la une Rechercher Topics Entités Modèles Live Alertes Réglages

Sauvegardés · 0

La newsletter Fellow

Le briefing IA, chaque matin à 8h Paris.

FELLOW1195 items ingérés35 sources · 17 acteurs →Newsletter →Méthodologie →

1 item

#reward-uncertainty

Toutes les news taguées avec ce sujet.

Chronologie · 60 derniers jours

RECHERCHE
heat 42
Exploiter l'incertitude sur la récompense pour induire des comportements diversifiés en RL
Une reformulation du problème RL remplace la récompense scalaire par une distribution, faisant émerger la diversité comportementale sans sacrifier la performance.