RECHERCHE
AxDafny : génération de code vérifiée par agents en Dafny
Un framework agentique guidé par un vérificateur formel atteint 92,7 % de succès sur DafnyBench, surpassant les meilleures approches connues.
arXiv cs.AI · cs.LG · cs.CL·Benjamin Breen, Austin Letson, Borja Requena Pozo, Leopoldo Sarra·30 juin 2026

Image · Source originale
AxDafny est un framework de réparation itérative guidé par vérificateur formel pour la génération de code Dafny : il produit à la fois le code exécutable et les artefacts de preuve (invariants, assertions, arguments de terminaison). Les auteurs introduisent également LCB-Pro-Dafny, un benchmark de 250 problèmes de compétition traduits en Dafny avec spécifications formelles. Sur DafnyBench, AxDafny atteint 92,7 % de vérification réussie, soit +6,5 points sur le meilleur résultat antérieur.