RECHERCHE
V4FinBench : un benchmark de prédiction de faillite sur plus d'un million d'observations
Un nouveau benchmark financier à grande échelle compare LLMs, modèles tabulaires et méthodes classiques sur la prédiction de faillite d'entreprises.
arXiv cs.AI · cs.LG · cs.CL·Marcin Kostrzewa, Sebastian Tomczak, Roman Furman, Anna Poberezhna·11 mai 2026

Image · Source originale
V4FinBench introduit un jeu de données de plus d'un million d'observations d'entreprises issues du groupe de Visegrád (2006-2021), avec 131 variables et six horizons de prédiction. Le benchmark évalue TabPFN fine-tuné, Llama-3-8B via QLoRA et des baselines de gradient boosting dans un contexte de fort déséquilibre de classes. TabPFN avec fine-tuning orienté déséquilibre égale ou dépasse le gradient boosting sur les horizons longs, tandis que Llama-3-8B reste en retrait sur ROC-AUC à tous les horizons.