Toutes les news taguées avec ce sujet.
Un framework multi-agents simule une rédaction complète pour produire des articles de data-journalisme interactifs, sourcés et vérifiables automatiquement.
DNQ propose un cadre d'apprentissage par renforcement guidé par l'équilibre de Nash pour entraîner des agents d'enchères multi-tours en environnement compétitif.
Un développeur démontre comment faire communiquer deux agents IA de coding — Claude Code et OpenAI Codex — en temps réel via le système de versioning Git.
Un nouveau système pipelines les étapes de raisonnement entre agents dès leur génération, réduisant la latence et améliorant la qualité des réponses.
Un framework de communication entre agents LLM qui remplace les messages textuels par des perturbations LoRA transitoires, réduisant les tokens traités de 83 %.
Un développeur argue que faire communiquer des agents LLM via du texte libre est une erreur de conception, et propose une alternative structurée.
Une nouvelle méthode de gradient de politique généralisée sur k étapes permet de dépasser les points critiques sous-optimaux dans les MDP à classes de politiques restreintes.
Élargir la fenêtre de contexte des LLM dégrade la coopération dans les dilemmes sociaux multi-agents — un phénomène contre-intuitif documenté sur 7 modèles et 4 jeux.
Un projet issu d'un hackathon déploie une architecture multi-agent pour évaluer automatiquement la manufacturabilité de pièces CNC, en s'appuyant sur les GPU AMD MI300X.
RAO est une approche par reinforcement learning pour des agents capables de s'instancier récursivement, améliorant l'efficacité et la généralisation.