RECHERCHE
SHERLOC : localisation diagnostique structurée pour les agents de réparation de code
Un framework sans fine-tuning qui améliore la localisation des bugs dans les dépôts de code et booste les agents de réparation de +5,95 pp sur SWE-Bench.
arXiv cs.AI · cs.LG · cs.CL·Hovhannes Tamoyan, Sean Narenthiran, Erik Arakelyan, Mira Mezini·23 juin 2026

Image · Source originale
SHERLOC est un framework sans entraînement qui couple un LLM de raisonnement avec des outils de dépôt compacts pour localiser les failles dans le code avant réparation. Il atteint 84,33 % d'accuracy@1 sur SWE-Bench Lite et 81,27 % de recall@1 sur SWE-Bench Verified, en rivalisent avec des méthodes multi-agents à ~30B paramètres. Injecter ses diagnostics dans des agents de réparation améliore le taux de résolution de +5,95 pp tout en réduisant les tokens de localisation de 36,7 % et les tokens totaux de 23,1 %.