RECHERCHE
EVENT5Ws : un large dataset open-domain pour l'extraction d'événements
Des chercheurs publient EVENT5Ws, un dataset annoté manuellement pour l'extraction d'événements en open-domain, avec benchmark de LLMs état de l'art.
arXiv cs.AI · cs.LG · cs.CL·Praval Sharma, Ashok Samal, Leen-Kiat Soh, Deepti Joshi·23 avril 2026

EVENT5Ws est un dataset open-domain de grande taille, annoté manuellement et validé statistiquement, conçu pour l'extraction d'événements à partir de documents textuels. Il répond aux limites des corpus existants, souvent restreints à des domaines fermés ou dépourvus de vérification manuelle à grande échelle. Les auteurs évaluent des LLMs pré-entraînés sur ce benchmark et montrent que les modèles entraînés sur EVENT5Ws généralisent à des contextes géographiques variés.