Toutes les news taguées avec ce sujet.
Un outil open-source propose de migrer vers un nouveau modèle d'embeddings sans réindexer toute la base vectorielle.
EmbedFilter exploite la matrice de dé-embedding des LLM pour supprimer l'influence des tokens fréquents et améliorer les représentations sémantiques zero-shot.
Un développeur explore concrètement les embeddings visuels, leurs usages et leurs limites dans des projets réels.
Kapa.ai détaille sa pipeline d'indexation d'images pour les systèmes RAG : une approche technique pour enrichir la recherche documentaire au-delà du texte.
IBM lance une nouvelle version de ses modèles d'embeddings multilingues sous licence Apache 2.0, affichant les meilleures performances retrieval sous 100M de paramètres.
Des chercheurs d'IBM proposent d'affiner les requêtes d'embedding à l'inférence via un LLM, avec des gains allant jusqu'à +25% sur des tâches zero-shot.
Une nouvelle méthode basée sur la réflexion de Householder réduit les faux positifs de 32,5 % lors de la comparaison de la polysémie contextuelle de deux mots.
Un développeur montre qu'un auto-encodeur à base de polynômes dépasse l'analyse en composantes principales pour compresser les embeddings de transformeurs.