RECHERCHE
DIRECT : quand et où allouer le compute de test-time dans les planificateurs embarqués
Un framework de routage multimodal pour optimiser l'allocation du compute à l'inférence dans les agents robotiques, sans sacrifier les performances.
arXiv cs.AI · cs.LG · cs.CL·Jadelynn Dao, Milan Ganai, Yasmina Abukhadra, Ajay Sridhar·10 juin 2026

Image · Source originale
DIRECT est un framework de routage qui exploite le contexte visuel et textuel de la scène pour décider dynamiquement combien de compute allouer à chaque requête dans les agents incarnés pilotés par VLM. Les expériences sur VLABench, RoboMME et un bras Franka physique montrent que le scaling naïf du test-time compute génère des gains inégaux. DIRECT atteint des performances équivalentes ou supérieures à des modèles plus puissants avec jusqu'à 65 % de latence en moins.