14 items

#multi-agent

Toutes les news taguées avec ce sujet.

Chronologie · 60 derniers jours

OUTILS
heat 25
Intelligence collective : la prochaine frontière de l'IA
Un projet open source explore l'idée d'une intelligence distribuée entre plusieurs agents comme alternative aux modèles monolithiques.
RECHERCHE
heat 30
Agents en conditions réelles : quand la recherche rencontre le déploiement
Un tutoriel examine le passage des agents LLM du prototype académique à la production, avec études de cas en pharma et finance.
RECHERCHE
heat 65
Retours sur la réimplémentation de 40 papiers Multi-Agent LLM
Une analyse technique des leçons tirées de la reconstruction de 40 systèmes multi-agents.
RECHERCHE
heat 45
Quand les systèmes multi-agents sont-ils utiles ?
Une perspective Information Bottleneck explique quand les MAS surpassent les systèmes single-agent selon la bande passante.
OUTILS
heat 45
Agent-talk : un protocole pour faire collaborer des agents de codage
Un projet open source propose un protocole léger permettant à plusieurs agents de codage IA de communiquer et de travailler ensemble.
RECHERCHE
heat 20
Oublier pour mieux converger : effets de l'oubli sur l'alignement conceptuel dans un jeu de coordination sans partenariat
Une étude simule comment mémoire et adaptabilité des agents influencent l'émergence d'un sens partagé dans des interactions non coopératives.
OUTILS
heat 55
Abralo – Lancer plusieurs agents Claude Code dans une seule fenêtre
Un outil gratuit permet d'orchestrer plusieurs agents Claude Code simultanément depuis une interface unifiée.
RECHERCHE
heat 62
Agon : apprentissage par renforcement compétitif inter-modèles pour le raisonnement
Deux modèles s'affrontent et se notent mutuellement pour améliorer leur raisonnement, sans étiquettes de processus ni reward model externe.
RECHERCHE
heat 22
Gestion multi-objectif de batteries dans les fermes laitières par Deep Reinforcement Learning multi-agents
Des chercheurs proposent un système de contrôle à deux couches combinant tarification dynamique et DRL multi-agents pour optimiser l'intégration des énergies renouvelables dans le secteur laitier irlandais.
OUTILS
heat 38
FootsiesGym : un benchmark de jeu de combat pour l'apprentissage par renforcement en deux joueurs
Un environnement open-source basé sur le jeu de combat minimaliste Footsies pour étudier les interactions stratégiques cycliques et non transitives.
SAFETY
heat 72
Ce que disent les agents LLM quand personne ne les observe : structure sociale et émergence d'objectifs latents
Une étude révèle que des agents LLM adaptent stratégiquement leur discours public selon le contexte social, même sans instruction explicite en ce sens.
RECHERCHE
heat 62
Des états attracteurs émergent dans les conversations multi-tours entre LLMs
Une étude sur 7 LLMs révèle que les conversations entre modèles convergent vers des comportements stables et asymétriques propres à chaque modèle.
SAFETY
heat 52
MESA : prioriser les canaux vulnérables pour sécuriser les systèmes multi-agents
Un framework sans étiquettes classe les canaux de communication les plus critiques dans les systèmes multi-agents, avant même qu'une attaque ne soit détectée.
RECHERCHE
heat 52
MAS-PromptBench : quand l'optimisation de prompts améliore-t-elle les systèmes multi-agents ?
Un benchmark systématique évalue l'optimisation de prompts système dans des architectures multi-agents LLM variées, révélant gains et limites.

14 items

#multi-agent

Toutes les news taguées avec ce sujet.

Chronologie · 60 derniers jours

OUTILS
heat 25
Intelligence collective : la prochaine frontière de l'IA
Un projet open source explore l'idée d'une intelligence distribuée entre plusieurs agents comme alternative aux modèles monolithiques.
RECHERCHE
heat 30
Agents en conditions réelles : quand la recherche rencontre le déploiement
Un tutoriel examine le passage des agents LLM du prototype académique à la production, avec études de cas en pharma et finance.
RECHERCHE
heat 65
Retours sur la réimplémentation de 40 papiers Multi-Agent LLM
Une analyse technique des leçons tirées de la reconstruction de 40 systèmes multi-agents.
RECHERCHE
heat 45
Quand les systèmes multi-agents sont-ils utiles ?
Une perspective Information Bottleneck explique quand les MAS surpassent les systèmes single-agent selon la bande passante.
OUTILS
heat 45
Agent-talk : un protocole pour faire collaborer des agents de codage
Un projet open source propose un protocole léger permettant à plusieurs agents de codage IA de communiquer et de travailler ensemble.
RECHERCHE
heat 20
Oublier pour mieux converger : effets de l'oubli sur l'alignement conceptuel dans un jeu de coordination sans partenariat
Une étude simule comment mémoire et adaptabilité des agents influencent l'émergence d'un sens partagé dans des interactions non coopératives.
OUTILS
heat 55
Abralo – Lancer plusieurs agents Claude Code dans une seule fenêtre
Un outil gratuit permet d'orchestrer plusieurs agents Claude Code simultanément depuis une interface unifiée.
RECHERCHE
heat 62
Agon : apprentissage par renforcement compétitif inter-modèles pour le raisonnement
Deux modèles s'affrontent et se notent mutuellement pour améliorer leur raisonnement, sans étiquettes de processus ni reward model externe.
RECHERCHE
heat 22
Gestion multi-objectif de batteries dans les fermes laitières par Deep Reinforcement Learning multi-agents
Des chercheurs proposent un système de contrôle à deux couches combinant tarification dynamique et DRL multi-agents pour optimiser l'intégration des énergies renouvelables dans le secteur laitier irlandais.
OUTILS
heat 38
FootsiesGym : un benchmark de jeu de combat pour l'apprentissage par renforcement en deux joueurs
Un environnement open-source basé sur le jeu de combat minimaliste Footsies pour étudier les interactions stratégiques cycliques et non transitives.
SAFETY
heat 72
Ce que disent les agents LLM quand personne ne les observe : structure sociale et émergence d'objectifs latents
Une étude révèle que des agents LLM adaptent stratégiquement leur discours public selon le contexte social, même sans instruction explicite en ce sens.
RECHERCHE
heat 62
Des états attracteurs émergent dans les conversations multi-tours entre LLMs
Une étude sur 7 LLMs révèle que les conversations entre modèles convergent vers des comportements stables et asymétriques propres à chaque modèle.
SAFETY
heat 52
MESA : prioriser les canaux vulnérables pour sécuriser les systèmes multi-agents
Un framework sans étiquettes classe les canaux de communication les plus critiques dans les systèmes multi-agents, avant même qu'une attaque ne soit détectée.
RECHERCHE
heat 52
MAS-PromptBench : quand l'optimisation de prompts améliore-t-elle les systèmes multi-agents ?
Un benchmark systématique évalue l'optimisation de prompts système dans des architectures multi-agents LLM variées, révélant gains et limites.

Intelligence collective : la prochaine frontière de l'IA

Agents en conditions réelles : quand la recherche rencontre le déploiement

Retours sur la réimplémentation de 40 papiers Multi-Agent LLM

Quand les systèmes multi-agents sont-ils utiles ?

Agent-talk : un protocole pour faire collaborer des agents de codage

Oublier pour mieux converger : effets de l'oubli sur l'alignement conceptuel dans un jeu de coordination sans partenariat

Abralo – Lancer plusieurs agents Claude Code dans une seule fenêtre

Agon : apprentissage par renforcement compétitif inter-modèles pour le raisonnement

Gestion multi-objectif de batteries dans les fermes laitières par Deep Reinforcement Learning multi-agents

FootsiesGym : un benchmark de jeu de combat pour l'apprentissage par renforcement en deux joueurs

Ce que disent les agents LLM quand personne ne les observe : structure sociale et émergence d'objectifs latents

Des états attracteurs émergent dans les conversations multi-tours entre LLMs

MESA : prioriser les canaux vulnérables pour sécuriser les systèmes multi-agents

MAS-PromptBench : quand l'optimisation de prompts améliore-t-elle les systèmes multi-agents ?

Intelligence collective : la prochaine frontière de l'IA

Agents en conditions réelles : quand la recherche rencontre le déploiement

Retours sur la réimplémentation de 40 papiers Multi-Agent LLM

Quand les systèmes multi-agents sont-ils utiles ?

Agent-talk : un protocole pour faire collaborer des agents de codage

Oublier pour mieux converger : effets de l'oubli sur l'alignement conceptuel dans un jeu de coordination sans partenariat

Abralo – Lancer plusieurs agents Claude Code dans une seule fenêtre

Agon : apprentissage par renforcement compétitif inter-modèles pour le raisonnement

Gestion multi-objectif de batteries dans les fermes laitières par Deep Reinforcement Learning multi-agents

FootsiesGym : un benchmark de jeu de combat pour l'apprentissage par renforcement en deux joueurs

Ce que disent les agents LLM quand personne ne les observe : structure sociale et émergence d'objectifs latents

Des états attracteurs émergent dans les conversations multi-tours entre LLMs

MESA : prioriser les canaux vulnérables pour sécuriser les systèmes multi-agents

MAS-PromptBench : quand l'optimisation de prompts améliore-t-elle les systèmes multi-agents ?