RECHERCHE · Hugging Face
ScarfBench : un benchmark pour évaluer les agents IA dans la migration de frameworks Java d'entreprise
IBM Research publie ScarfBench, un benchmark dédié à l'évaluation des agents IA sur des tâches réelles de migration de frameworks Java en contexte enterprise.
Hugging Face Blog·30 juin 2026

Image · Source originale
IBM Research introduit ScarfBench, un benchmark conçu pour mesurer les capacités des agents IA à effectuer des migrations de frameworks Java d'entreprise. Il couvre des scénarios concrets impliquant des bases de code complexes et des transitions entre frameworks. L'initiative vise à standardiser l'évaluation des outils d'automatisation du code dans des contextes industriels exigeants.