RECHERCHE
EEVEE : apprentissage de prompts à l'inférence pour agents LLM multi-datasets
Un framework de test-time prompt learning capable de gérer des flux hétérogènes multi-datasets, avec des gains allant jusqu'à +48 % sur les benchmarks.
arXiv cs.AI · cs.LG · cs.CL·Weixian Xu, Shilong Liu, Mengdi Wang·9 juin 2026

Image · Source originale
EEVEE est le premier framework de test-time prompt learning multi-datasets pour agents LLM, conçu pour des flux de tâches réels et hétérogènes. Un routeur partitionne les entrées en clusters de tâches et leur assigne des configurations de prompts adaptées, optimisées via une stratégie de co-évolution router-prompt. Le système améliore les scores multi-benchmarks de 10,38 points sur Qwen3-4B-Instruct et 24,32 sur DeepSeek-V3.2, surpassant les méthodes SOTA GEPA et ACE de jusqu'à 48,2 %.