Toutes les news taguées avec ce sujet.
Une étude questionne la fiabilité et la valeur réelle des benchmarks utilisés pour évaluer les modèles d'IA.