Toutes les news taguées avec ce sujet.
Des employés d'Amazon auraient manipulé un leaderboard interne évaluant les performances IA, forçant la direction à clore le dispositif.
IBM Research et Hugging Face lancent un leaderboard dédié aux agents IA en open source, pour évaluer leurs capacités réelles en conditions réalistes.