RECHERCHE
Semantic Browsing : diversité contrôlée pour la génération d'images
Une méthode pour explorer des galeries d'images générées selon des axes de variation sémantiques structurés, pilotés par un workflow agentique.
arXiv cs.AI · cs.LG · cs.CL·Sara Dorfman, Maya Vishnevsky, Omer Dahary, Or Patashnik·22 juin 2026

Image · Source originale
Les modèles text-to-image actuels peinent à produire de vraie diversité : les sorties convergent vers une interprétation visuelle unique. Les chercheurs proposent le « Semantic Browsing », une approche qui induit la diversité au niveau textuel plutôt que dans la diffusion stochastique. Un VLM opère via un workflow agentique pour générer des axes de variation interprétables, permettant à l'utilisateur de naviguer dans un espace de design structuré et cohérent avec le prompt initial.