Toutes les news taguées avec ce sujet.
Un suivi chronologique des classements ELO des grands modèles d'IA sur la plateforme Chatbot Arena, pour visualiser l'évolution des performances.
Une analyse de 89 000 comparaisons sur 52 LLMs montre que les classements globaux type Arena masquent une hétérogénéité structurée par langue et contexte.