RECHERCHE
QPP peut-il sélectionner la meilleure reformulation de requête pour les pipelines RAG ?
Une étude évalue la prédiction de performance de requête (QPP) pour choisir la variante optimale avant d'exécuter un pipeline RAG complet.
arXiv cs.AI · cs.LG · cs.CL·Negar Arabzadeh, Andrew Drozdov, Michael Bendersky, Matei Zaharia·24 avril 2026

Image · Source originale
Les LLM génèrent facilement plusieurs reformulations d'une même requête, mais exécuter le pipeline RAG pour chacune est coûteux. Cette recherche explore le QPP pour sélectionner la meilleure variante en amont. Les expériences sur TREC-RAG révèlent un écart systématique entre les métriques de retrieval (nDCG) et la qualité des réponses générées. Les prédicteurs pré-retrieval légers égalent souvent les méthodes post-retrieval plus lourdes.