RECHERCHE
BAMI : atténuation des biais dans le GUI grounding sans entraînement
Une méthode d'inférence sans fine-tuning qui réduit les biais de précision et d'ambiguïté dans la localisation d'éléments d'interface pour agents GUI.
arXiv cs.AI · cs.LG · cs.CL·Borui Zhang, Bo Zhang, Bo Wang, Wenzhao Zheng·7 mai 2026

Image · Source originale
BAMI (Bias-Aware Manipulation Inference) propose une approche sans entraînement pour améliorer le GUI grounding, capacité clé des agents d'interface. Via la méthode d'attribution MPD, les auteurs identifient deux sources d'erreurs principales : la haute résolution des images et la complexité des éléments d'interface. La méthode combine un focus coarse-to-fine et une sélection de candidats, portant le modèle TianXi-Action-7B de 51,9 % à 57,8 % sur le benchmark ScreenSpot-Pro.