RECHERCHE
Au-delà du matching 2D : un framework unifié pour la géolocalisation cross-view d'objets
Un nouveau dataset de 220 000 paires sol-satellite et drone-satellite, couplé à un framework single-stage intégrant contraintes 3D et géométrie caméra.
arXiv cs.AI · cs.LG · cs.CL·Liyao Wang, Ruipu Wu, Haojun Xu, Lei Shi·29 juin 2026

Image · Source originale
Les chercheurs introduisent un dataset haute-fidélité de 220 000 paires d'images (sol/drone vers satellite) avec prompts multimodaux et poses caméra. Leur framework GAGeo, fondé sur le modèle 3D π³, prédit en un seul passage boîtes englobantes, masques de segmentation et poses caméra. Une perte contrastive utilisant la vue satellite comme ancre universelle permet la géolocalisation sol-vers-drone en zero-shot, sans données triplet d'entraînement.