RECHERCHE
Pipeline open-source en deux étapes pour la classification fine de véhicules par Vision Transformers
Un système combinant RT-DETR et ViT-Base/16 classe automatiquement les véhicules en six catégories pour évaluer les risques de blessure des cyclistes.
arXiv cs.AI · cs.LG · cs.CL·Gandhimathi Padmanaban, Fred Feng·3 juin 2026

Image · Source originale
Des chercheurs présentent un pipeline open-source en deux étapes combinant un détecteur RT-DETR et un Vision Transformer fine-tuné (ViT-Base/16) pour classer les véhicules en six types (voiture, SUV, pick-up, monospace, grand van, camion). Évalué sur 3 805 événements de dépassement filmés à Ann Arbor, le système atteint 0,94 de précision en distribution et 0,89 hors distribution. Un mécanisme d'abstention basé sur la confiance limite les erreurs silencieuses.