Toutes les news taguées avec ce sujet.
FASE remplace les vérifications coûteuses par LLM dans la quantification d'incertitude du code, avec +25 % de corrélation et seulement 0,3 % du coût de calcul.
Une étude révèle que les LRMs peinent à aligner leur confiance interne et leur expression linguistique, malgré des chaînes de raisonnement étendues.
Des chercheurs identifient un défaut structurel dans l'apprentissage de systèmes dynamiques chaotiques et proposent KAFFEE, un cadre basé sur le filtre de Kalman étendu.
Des modèles identiques entraînés sur des tirages différents peuvent diverger sur 22 % des prédictions individuelles, même à précision globale équivalente.
CMR-EXTR convertit des comptes rendus d'IRM cardiaque en données structurées avec un score de confiance par champ, atteignant 99,65 % de précision.
Un framework de conformal prediction intégrant la topologie des graphes dans le processus de localisation, pour une meilleure quantification de l'incertitude dans les GNN.
Une généralisation des prédicteurs Venn-Abers à la régression non bornée, combinant prédiction conforme et garanties de validité probabiliste.
Une simple métrique d'entropie sur le premier token généré rivalise avec les méthodes de self-consistency multiple, à une fraction du coût computationnel.