RECHERCHE
TFlow : les agents LLM se coordonnent via des perturbations de poids plutôt que du texte
Un framework de communication entre agents LLM qui remplace les messages textuels par des perturbations LoRA transitoires, réduisant les tokens traités de 83 %.
arXiv cs.AI · cs.LG · cs.CL·Wenrui Bao, Huan Wang, Jian Wang, Zhangyang Wang·13 mai 2026

Image · Source originale
TFlow (Thought Flow) propose une nouvelle interface de communication entre agents LLM : au lieu d'échanger des messages textuels, les agents expéditeurs compilent leurs états cachés en perturbations LoRA de bas rang appliquées temporairement aux poids du modèle récepteur. Cette approche permet une adaptation au niveau de l'instance sans modifier durablement le modèle ni alourdir le contexte. Sur cinq benchmarks avec trois agents Qwen3-4B, TFlow réduit les tokens traités jusqu'à 83,27 % et le temps d'inférence jusqu'à 4,6×, tout en gagnant jusqu'à 8,5 points de précision par rapport à un récepteur seul.