21 items

#architecture

Toutes les news taguées avec ce sujet.

Chronologie · 60 derniers jours

OUTILS
nvidiaheat 55
Dans l'architecture GPU Rubin de NVIDIA, conçue pour l'ère de l'IA agentique
NVIDIA détaille l'architecture Rubin, pensée pour les workflows agentiques multi-étapes et le raisonnement à grande échelle.
RECHERCHE
h-companyheat 35
H Company présente « Booting Fast and Slow », une approche à double vitesse pour ses agents IA
Le laboratoire français détaille une architecture combinant raisonnement rapide et lent, inspirée des travaux en psychologie cognitive.
RECHERCHE
heat 25
Rang spectral et profondeur : comment l'architecture des Transformers évite l'effondrement
Une étude théorique décortique le rôle des skip connections et de la normalisation dans la préservation du rang des gradients au fil des couches.
OPINION
huggingfaceheat 30
Le routage de modèles : simple en apparence, complexe en pratique
IBM Research décortique les pièges du routage entre modèles d'IA et pourquoi une approche naïve atteint vite ses limites.
RECHERCHE
huggingfaceheat 35
Ce que la construction de Shippy nous a appris sur les agents IA
Allen AI revient sur les enseignements techniques tirés du développement de son agent Shippy, entre choix d'architecture et écueils pratiques.
OPINION
heat 35
The Agentic Loop : trois boucles déguisées en une seule
Un essai décortique l'architecture réelle des agents IA, présentée comme trois boucles imbriquées plutôt qu'un mécanisme unique.
RECHERCHE
heat 35
Un instrument exact pour mesurer l'usage des états dans les modèles state-space sélectifs (Mamba)
Une nouvelle méthode révèle que les modèles Mamba réallouent dynamiquement leurs modes d'état selon l'entrée, ouvrant la voie à un élagage plus efficace.
RECHERCHE
h-companyheat 35
H Company détaille son approche « pensée rapide et lente » pour les agents IA
Le laboratoire français présente une architecture combinant réflexes rapides et raisonnement approfondi pour ses agents autonomes.
OUTILS
heat 62
Fichiers plutôt qu'outils : comment Knock a construit son agent avec un système de fichiers virtuel et Bash
Knock détaille l'architecture de son agent IA basée sur un filesystem virtuel et Bash, une approche minimaliste qui évite la prolifération d'outils.
OPINION
h-companyheat 52
Démarrer vite et lentement — la vision de H Company sur les agents IA
H Company publie un essai sur sa philosophie de développement d'agents IA, distinguant deux régimes d'action distincts.
OUTILS
heat 55
Patterns Redis pour les agents de code
Un guide pratique des patterns d'architecture Redis adaptés aux agents de codage autonomes, entre mémoire, coordination et persistance.
OPINION
heat 52
Tout ne devrait pas coûter un token : le cas pour l'IA déterministe
Certaines tâches ne nécessitent pas de LLM. Un plaidoyer pour savoir quand ne pas tokeniser et privilégier des approches déterministes.
OPINION
heat 42
Largeur vs. profondeur : spéculations sur la marge dans les LLM
Un essai de réflexion sur le compromis fondamental entre largeur (MoE, parallélisme) et profondeur (chaînes de raisonnement) dans l'architecture des modèles de langage.
RECHERCHE
heat 62
Le journal d'exécution comme agent : une nouvelle architecture pour les systèmes IA
Un papier arXiv propose de faire du log d'exécution le composant central des agents IA, repensant ainsi leur architecture fondamentale.
RECHERCHE
heat 52
L'hypothèse de séparation état-prédiction dans les Transformers
Des chercheurs proposent de découpler le flux de calcul des Transformers en deux flux distincts, améliorant l'efficacité et les performances sur les tâches en aval.
SAFETY
heat 52
Agent-Native Immune System : architecture et taxonomie de la défense endogène des agents IA
Des chercheurs proposent ANIS, un système immunitaire intégré directement dans la boucle cognitive des agents IA pour contrer les attaques à l'exécution.
RECHERCHE
heat 62
Un-0 : génération d'images par oscillateurs couplés
Une approche radicalement différente de la génération d'images, fondée sur la dynamique d'oscillateurs couplés plutôt que sur la diffusion ou les transformers.
RECHERCHE
huggingfaceheat 52
Quels tokens un modèle hybride prédit-il mieux ?
Allen AI analyse en détail les différences de prédiction entre architectures hybrides et transformers classiques au niveau du token.
OPINION
heat 45
Qui fait quoi ? Les topologies d'équipes appliquées aux plateformes agentiques
Comment adapter le framework Team Topologies à l'ère des agents IA ? Une analyse des responsabilités organisationnelles au sein des plateformes agentiques.
OPINION
h-companyheat 55
L'architecture de l'agentivité : la vision d'H Company pour l'entreprise autonome
H Company expose sa vision d'une entreprise entièrement pilotée par des agents IA autonomes, et l'architecture technique qu'elle entend bâtir pour y parvenir.
RECHERCHE
heat 55
Tapered Language Models : allouer plus de capacité aux premières couches
Une nouvelle approche architecturale réduit progressivement la largeur des MLP en profondeur et améliore la perplexité sans coût supplémentaire.

21 items

#architecture

Toutes les news taguées avec ce sujet.

Chronologie · 60 derniers jours

OUTILS
nvidiaheat 55
Dans l'architecture GPU Rubin de NVIDIA, conçue pour l'ère de l'IA agentique
NVIDIA détaille l'architecture Rubin, pensée pour les workflows agentiques multi-étapes et le raisonnement à grande échelle.
RECHERCHE
h-companyheat 35
H Company présente « Booting Fast and Slow », une approche à double vitesse pour ses agents IA
Le laboratoire français détaille une architecture combinant raisonnement rapide et lent, inspirée des travaux en psychologie cognitive.
RECHERCHE
heat 25
Rang spectral et profondeur : comment l'architecture des Transformers évite l'effondrement
Une étude théorique décortique le rôle des skip connections et de la normalisation dans la préservation du rang des gradients au fil des couches.
OPINION
huggingfaceheat 30
Le routage de modèles : simple en apparence, complexe en pratique
IBM Research décortique les pièges du routage entre modèles d'IA et pourquoi une approche naïve atteint vite ses limites.
RECHERCHE
huggingfaceheat 35
Ce que la construction de Shippy nous a appris sur les agents IA
Allen AI revient sur les enseignements techniques tirés du développement de son agent Shippy, entre choix d'architecture et écueils pratiques.
OPINION
heat 35
The Agentic Loop : trois boucles déguisées en une seule
Un essai décortique l'architecture réelle des agents IA, présentée comme trois boucles imbriquées plutôt qu'un mécanisme unique.
RECHERCHE
heat 35
Un instrument exact pour mesurer l'usage des états dans les modèles state-space sélectifs (Mamba)
Une nouvelle méthode révèle que les modèles Mamba réallouent dynamiquement leurs modes d'état selon l'entrée, ouvrant la voie à un élagage plus efficace.
RECHERCHE
h-companyheat 35
H Company détaille son approche « pensée rapide et lente » pour les agents IA
Le laboratoire français présente une architecture combinant réflexes rapides et raisonnement approfondi pour ses agents autonomes.
OUTILS
heat 62
Fichiers plutôt qu'outils : comment Knock a construit son agent avec un système de fichiers virtuel et Bash
Knock détaille l'architecture de son agent IA basée sur un filesystem virtuel et Bash, une approche minimaliste qui évite la prolifération d'outils.
OPINION
h-companyheat 52
Démarrer vite et lentement — la vision de H Company sur les agents IA
H Company publie un essai sur sa philosophie de développement d'agents IA, distinguant deux régimes d'action distincts.
OUTILS
heat 55
Patterns Redis pour les agents de code
Un guide pratique des patterns d'architecture Redis adaptés aux agents de codage autonomes, entre mémoire, coordination et persistance.
OPINION
heat 52
Tout ne devrait pas coûter un token : le cas pour l'IA déterministe
Certaines tâches ne nécessitent pas de LLM. Un plaidoyer pour savoir quand ne pas tokeniser et privilégier des approches déterministes.
OPINION
heat 42
Largeur vs. profondeur : spéculations sur la marge dans les LLM
Un essai de réflexion sur le compromis fondamental entre largeur (MoE, parallélisme) et profondeur (chaînes de raisonnement) dans l'architecture des modèles de langage.
RECHERCHE
heat 62
Le journal d'exécution comme agent : une nouvelle architecture pour les systèmes IA
Un papier arXiv propose de faire du log d'exécution le composant central des agents IA, repensant ainsi leur architecture fondamentale.
RECHERCHE
heat 52
L'hypothèse de séparation état-prédiction dans les Transformers
Des chercheurs proposent de découpler le flux de calcul des Transformers en deux flux distincts, améliorant l'efficacité et les performances sur les tâches en aval.
SAFETY
heat 52
Agent-Native Immune System : architecture et taxonomie de la défense endogène des agents IA
Des chercheurs proposent ANIS, un système immunitaire intégré directement dans la boucle cognitive des agents IA pour contrer les attaques à l'exécution.
RECHERCHE
heat 62
Un-0 : génération d'images par oscillateurs couplés
Une approche radicalement différente de la génération d'images, fondée sur la dynamique d'oscillateurs couplés plutôt que sur la diffusion ou les transformers.
RECHERCHE
huggingfaceheat 52
Quels tokens un modèle hybride prédit-il mieux ?
Allen AI analyse en détail les différences de prédiction entre architectures hybrides et transformers classiques au niveau du token.
OPINION
heat 45
Qui fait quoi ? Les topologies d'équipes appliquées aux plateformes agentiques
Comment adapter le framework Team Topologies à l'ère des agents IA ? Une analyse des responsabilités organisationnelles au sein des plateformes agentiques.
OPINION
h-companyheat 55
L'architecture de l'agentivité : la vision d'H Company pour l'entreprise autonome
H Company expose sa vision d'une entreprise entièrement pilotée par des agents IA autonomes, et l'architecture technique qu'elle entend bâtir pour y parvenir.
RECHERCHE
heat 55
Tapered Language Models : allouer plus de capacité aux premières couches
Une nouvelle approche architecturale réduit progressivement la largeur des MLP en profondeur et améliore la perplexité sans coût supplémentaire.

Dans l'architecture GPU Rubin de NVIDIA, conçue pour l'ère de l'IA agentique

H Company présente « Booting Fast and Slow », une approche à double vitesse pour ses agents IA

Rang spectral et profondeur : comment l'architecture des Transformers évite l'effondrement

Le routage de modèles : simple en apparence, complexe en pratique

Ce que la construction de Shippy nous a appris sur les agents IA

The Agentic Loop : trois boucles déguisées en une seule

Un instrument exact pour mesurer l'usage des états dans les modèles state-space sélectifs (Mamba)

H Company détaille son approche « pensée rapide et lente » pour les agents IA

Fichiers plutôt qu'outils : comment Knock a construit son agent avec un système de fichiers virtuel et Bash

Démarrer vite et lentement — la vision de H Company sur les agents IA

Patterns Redis pour les agents de code

Tout ne devrait pas coûter un token : le cas pour l'IA déterministe

Largeur vs. profondeur : spéculations sur la marge dans les LLM

Le journal d'exécution comme agent : une nouvelle architecture pour les systèmes IA

L'hypothèse de séparation état-prédiction dans les Transformers

Agent-Native Immune System : architecture et taxonomie de la défense endogène des agents IA

Un-0 : génération d'images par oscillateurs couplés

Quels tokens un modèle hybride prédit-il mieux ?

Qui fait quoi ? Les topologies d'équipes appliquées aux plateformes agentiques

L'architecture de l'agentivité : la vision d'H Company pour l'entreprise autonome

Tapered Language Models : allouer plus de capacité aux premières couches

Dans l'architecture GPU Rubin de NVIDIA, conçue pour l'ère de l'IA agentique

H Company présente « Booting Fast and Slow », une approche à double vitesse pour ses agents IA

Rang spectral et profondeur : comment l'architecture des Transformers évite l'effondrement

Le routage de modèles : simple en apparence, complexe en pratique

Ce que la construction de Shippy nous a appris sur les agents IA

The Agentic Loop : trois boucles déguisées en une seule

Un instrument exact pour mesurer l'usage des états dans les modèles state-space sélectifs (Mamba)

H Company détaille son approche « pensée rapide et lente » pour les agents IA

Fichiers plutôt qu'outils : comment Knock a construit son agent avec un système de fichiers virtuel et Bash

Démarrer vite et lentement — la vision de H Company sur les agents IA

Patterns Redis pour les agents de code

Tout ne devrait pas coûter un token : le cas pour l'IA déterministe

Largeur vs. profondeur : spéculations sur la marge dans les LLM

Le journal d'exécution comme agent : une nouvelle architecture pour les systèmes IA

L'hypothèse de séparation état-prédiction dans les Transformers

Agent-Native Immune System : architecture et taxonomie de la défense endogène des agents IA

Un-0 : génération d'images par oscillateurs couplés

Quels tokens un modèle hybride prédit-il mieux ?

Qui fait quoi ? Les topologies d'équipes appliquées aux plateformes agentiques

L'architecture de l'agentivité : la vision d'H Company pour l'entreprise autonome

Tapered Language Models : allouer plus de capacité aux premières couches