Toutes les news taguées avec ce sujet.
Un chercheur évalue l'apport réel des LLMs dans la démonstration de théorèmes mathématiques complexes liés aux sommes d'Euler.
Une analyse critique soutient que le rythme des avancées en IA s'essouffle, remettant en question le narratif dominant de progrès exponentiel.
Une approche qui reformule chaque cellule en fait atomique structuré pour améliorer le question-answering sur tableaux complexes.
Relégué en troisième position dans la course aux modèles fondamentaux, Google tente un retour en grâce lors de son I/O annuel, notamment sur le terrain du coding.
Les compétitions de cybersécurité type Capture The Flag seraient désormais compromise par les LLM capables de résoudre automatiquement les challenges.
Poolside décortique les pratiques de « benchmark hacking » et met en lumière comment les métriques d'évaluation des LLM sont détournées.