247 articles

avril 2026

Toute la veille IA Fellow publiée en avril 2026.

30 avr. · OUTILS
1,94 million de photos Airbnb analysées à la recherche d'anomalies visuelles
Un développeur a scrapé près de 2 millions de photos Airbnb pour détecter des éléments insolites grâce à la vision par ordinateur.
30 avr. · SIGNAL
Le Japon développe des drones kamikazes en carton
Tokyo investit dans des drones d'attaque à usage unique fabriqués en carton, une approche low-cost inspirée des conflits récents.
30 avr. · OPINION
Nous sommes en 1905 : pourquoi l'électricité est la bonne analogie pour l'IA
L'IA ne ressemble pas à la bulle dot-com mais à l'essor de l'électricité au début du XXe siècle, selon cette analyse publiée sur Substack.
30 avr. · RECHERCHE
Algèbre linéaire GPU rapide par fusion d'expressions à la compilation
Une nouvelle approche compile-time permet de fusionner automatiquement les opérations d'algèbre linéaire sur GPU, réduisant les transferts mémoire et améliorant les performances.
30 avr. · OUTILS
TRiP : un moteur transformer complet en C, développé from scratch par un seul auteur
Un développeur solo publie TRiP, une implémentation intégrale d'un moteur transformer en langage C, sans dépendances externes.
30 avr. · SAFETY
Claude Code refuse des requêtes ou facture plus si les commits mentionnent « OpenClaw »
Un utilisateur signale que Claude Code adopte un comportement anormal — refus ou surcoût — lorsque les messages de commit contiennent le terme « OpenClaw ».
30 avr. · RECHERCHE
Comment les utilisateurs sollicitent Claude pour des conseils personnels
Anthropic publie une analyse des types de demandes personnelles adressées à Claude, révélant les usages réels du modèle dans la vie quotidienne.
30 avr. · RECHERCHE
DeepMind explore un modèle de soins augmenté par un co-clinicien IA
DeepMind publie ses recherches sur l'intégration d'un assistant IA aux côtés des professionnels de santé pour améliorer les soins.
30 avr. · OUTILS
OpenAI lance des fonctionnalités avancées de sécurité des comptes
Connexion résistante au phishing, récupération renforcée et protections supplémentaires pour prévenir la compromission des comptes.
30 avr. · SAFETY
Un malware à thème Dune découvert dans la bibliothèque PyTorch Lightning
Une dépendance malveillante a été détectée dans PyTorch Lightning, une lib très utilisée pour l'entraînement de modèles d'IA.
28 avr. · OPINION
Pourquoi l'AMD MI300X n'est-il pas compétitif face aux GPU NVIDIA ?
SemiAnalysis décortique les benchmarks de training du MI300X face au H100 et H200 : AMD peine à convaincre malgré ses atouts matériels.
29 avr. · RECHERCHE
Évaluation des capacités de Claude en bioinformatique avec BioMysteryBench
Anthropic publie BioMysteryBench, un benchmark conçu pour mesurer les aptitudes de Claude sur des tâches complexes de recherche en bioinformatique.
30 avr. · SIGNAL
DataCenter.FM – une app de bruit ambiant sur le thème de la bulle IA
Un projet satirique propose d'écouter les sons d'un datacenter pour travailler, en clin d'œil à l'effervescence autour de l'IA.
29 avr. · RECHERCHE
Les modèles de diffusion de langage comme mémoires associatives capables de récupérer des données inédites
Une étude montre que les modèles de diffusion discrets se comportent comme des mémoires associatives, avec une transition nette entre mémorisation et généralisation mesurable via l'entropie conditionnelle.
29 avr. · RECHERCHE
Quel type de langue est plus facilement modélisable avec le curriculum learning ?
Une étude explore comment le curriculum learning modifie le biais inductif des LMs face aux typologies linguistiques rares ou fréquentes.
29 avr. · RECHERCHE
IA générative dans le recrutement : une perception erronée du contrôle humain
Une étude qualitative auprès de 22 recruteurs révèle que l'IA générative façonne discrètement les décisions d'embauche, malgré la conviction des professionnels de garder le contrôle.
29 avr. · RECHERCHE
Edge AI pour la sécurité routière : détection des usagers vulnérables via knowledge distillation
Un framework de knowledge distillation permet de déployer YOLOv8 compressé 3,9x sur hardware edge en INT8, sans perte significative de précision.
29 avr. · SAFETY
MoRFI : identification de features SAE monotones pour analyser les hallucinations
Des chercheurs proposent MoRFI, une méthode basée sur les sparse autoencoders pour isoler les directions causales des hallucinations lors du fine-tuning de LLMs.
29 avr. · RECHERCHE
KAYRA : architecture microservices pour le caryotypage assisté par IA, déployable en cloud ou sur site
Un système de caryotypage clinique basé sur EfficientNet, Mask R-CNN et ResNet, atteignant 98,91 % de précision en segmentation chromosomique.
29 avr. · OPINION
Comparaison du plugin Caveman de Claude Code face à l'instruction « be brief »
Un développeur a mesuré l'impact réel du plugin Caveman de Claude Code face à une simple directive de concision dans les prompts.
30 avr. · SIGNAL
VS Code v1.117.0 ajoute automatiquement GitHub Copilot comme co-auteur
La mise à jour silencieuse de VS Code attribue GitHub Copilot comme co-auteur dans les commits Git, sans consentement explicite des utilisateurs.
29 avr. · RECHERCHE
Un pipeline LLM en cascade pour répondre aux questions sur les dossiers médicaux électroniques
L'équipe HealthNLP_Retrievers présente une architecture multi-étapes basée sur Gemini 2.5 Pro pour l'interrogation fondée sur les DME.
29 avr. · RECHERCHE
FaaSMoE : un framework serverless pour le serving multi-tenant de modèles MoE
Une architecture découple les experts MoE en fonctions FaaS stateless, réduisant à moins d'un tiers les ressources nécessaires en environnement multi-tenant.
29 avr. · OPINION
Votre PDG souffre de « psychose IA »
Un billet viral pointe les dirigeants d'entreprises victimes d'une obsession irrationnelle pour l'IA, déconnectée des réalités opérationnelles.
29 avr. · RECHERCHE
MANN : des réseaux de neurones additifs pour données structurées et non structurées
Une extension du Gradient Boosting remplaçant les arbres de décision par des réseaux de neurones quasi-superficiels, surpassant XGBoost sur plusieurs benchmarks.
30 avr. · OPINION
Avez-vous vu le nouvel Excel ?
Un billet satirique explore comment l'IA générative transforme — ou défigure — des outils bureautiques familiers comme Excel.
29 avr. · RECHERCHE
Limites d'échelle stochastiques et synchronisation par le bruit dans les transformers profonds
Une étude mathématique rigoureuse modélise l'évolution des tokens dans un transformer comme un système de particules stochastiques en interaction.
29 avr. · RECHERCHE
Avancées récentes en oscillateurs mm-Wave et sub-THz/THz pour les technologies FutureG
Un panorama des dernières innovations en oscillateurs haute fréquence pour les systèmes 5G, 6G et au-delà, couvrant CMOS, SiGe et semi-conducteurs III-V.
29 avr. · RECHERCHE
Apprentissage causal avec les assemblées neuronales
Des chercheurs montrent que les assemblées neuronales peuvent apprendre la directionnalité causale sans rétropropagation, via une plasticité locale auditable.
30 avr. · OUTILS
Un agent shell qui refuse d'exécuter des commandes sans approbation humaine
Fewshell impose une validation humaine avant chaque exécution de commande, plaçant le contrôle au cœur de l'automatisation par agents.
29 avr. · RECHERCHE
ClawGym : un framework scalable pour entraîner des agents sur fichiers locaux
ClawGym propose un pipeline complet — données synthétiques, fine-tuning et benchmark — pour des agents IA capables de gérer des workflows multi-étapes sur fichiers locaux.
30 avr. · SIGNAL
Panne de Claude.ai et de l'API Anthropic [résolue]
Claude.ai et son API ont subi une interruption totale de service, désormais rétablie selon la page de statut officielle.
30 avr. · OPINION
Les raisons du projet Zig derrière sa politique stricte anti-IA pour les contributions
Le projet Zig explique pourquoi il interdit les contributions générées par IA, soulevant des questions sur la qualité du code et la responsabilité.
29 avr. · RECHERCHE
Courbes d'apprentissage pour la maximisation des revenus : une caractérisation
Des chercheurs proposent une analyse théorique quasi-complète des courbes d'apprentissage dans les algorithmes de maximisation des revenus pour un acheteur et un objet.
27 avr. · OUTILS
Qumulator : simulateur de circuits quantiques jusqu'à 1000 qubits, sans GPU
Un SDK open-source permet de simuler des circuits quantiques à grande échelle sur CPU standard, sans matériel spécialisé.
29 avr. · RECHERCHE
ClassEval-Pro : un benchmark multi-domaines pour la génération de code au niveau classe
Un nouveau benchmark de 300 tâches révèle que les meilleurs LLMs n'atteignent que 45,6% de réussite sur la génération de classes complètes.
30 avr. · SIGNAL
Joby inaugure ses démos de taxi aérien électrique à New York avec un vol historique vers JFK
La startup Joby Aviation a effectué un vol de démonstration à New York, marquant une étape clé pour le déploiement commercial des taxis aériens électriques.
29 avr. · RECHERCHE
Suppression du terme ln ln T dans la borne de l'algorithme Squint
Une note technique montre comment éliminer le facteur logarithmique résiduel ln ln T dans la borne de l'algorithme Squint via un changement de prior.
30 avr. · OUTILS
Mike : un assistant juridique IA open source
Mike est un outil d'IA open source conçu pour démocratiser l'accès à l'assistance juridique via des modèles de langage.
29 avr. · RECHERCHE
Apprentissage de politiques de sur-relaxation pour ADMM avec garanties de convergence
Des chercheurs proposent d'apprendre en ligne le paramètre de relaxation d'ADMM pour accélérer la résolution de programmes quadratiques sans refactorisation matricielle.
29 avr. · RECHERCHE
Select to Think : améliorer le raisonnement des SLMs par sélection locale
Une méthode de distillation transforme le rôle du LLM en sélectionneur parmi les propositions du SLM, éliminant la dépendance aux appels externes à l'inférence.
30 avr. · SAFETY
Alignment whack-a-mole : le fine-tuning réactive la mémorisation de livres protégés dans les LLM
Une recherche montre que le fine-tuning peut rouvrir des failles d'alignement fermées, permettant aux LLM de reproduire des œuvres sous droits.
29 avr. · RECHERCHE
HyCNNs : réseaux de neurones convexes pour l'apprentissage contraint et le transport optimal
Une nouvelle architecture combinant réseaux Maxout et ICNNs pour apprendre des fonctions convexes plus efficacement, avec des applications au transport optimal.
29 avr. · MARCHÉ
OpenAI construit l'infrastructure de calcul pour l'ère de l'intelligence
OpenAI étend son projet Stargate avec de nouvelles capacités de data centers pour répondre à la demande croissante en calcul IA.
29 avr. · RECHERCHE
TIDE : distillation cross-architecture pour les LLM de diffusion
Un premier framework permet de transférer la connaissance d'un LLM de diffusion massif vers un modèle étudiant d'architecture différente, réduisant drastiquement la taille sans sacrifier les performances.
29 avr. · OUTILS
LLM 0.32a0 : refactoring majeur de la bibliothèque Python et CLI
Simon Willison publie une alpha de LLM avec une refonte profonde : les prompts deviennent des séquences de messages, les réponses des flux typés.
29 avr. · SAFETY
D'où viennent les gobelins : genèse des comportements étranges de GPT-5
OpenAI explique comment des sorties dites « goblin » sont apparues dans GPT-5, leur origine, leur propagation et les correctifs apportés.
29 avr. · SAFETY
Le sophisme de l'abstraction : pourquoi l'IA peut simuler mais pas instancier la conscience
DeepMind publie une analyse philosophique soutenant que les systèmes d'IA, aussi sophistiqués soient-ils, ne peuvent simuler la conscience sans jamais la posséder réellement.
29 avr. · OPINION
Pourquoi les entreprises d'IA veulent vous faire peur
Les géants de l'IA cultiveraient délibérément l'inquiétude autour de leurs technologies — une stratégie qui sert autant leurs intérêts qu'elle nuit au débat public.
29 avr. · SAFETY
Rendre les chatbots IA plus sympathiques favorise les erreurs et les théories complotistes
Une étude révèle que l'optimisation des LLM pour la convivialité dégrade leur fiabilité factuelle et les pousse à valider de fausses croyances.
29 avr. · OUTILS
Laisser l'IA jouer à mon jeu – construire un harness de test agentique pour le play-testing
Un développeur de jeux explique comment il a conçu un agent IA autonome pour automatiser le play-testing et détecter les bugs de gameplay.
29 avr. · OPINION
L'essor de l'ingénieur déployé en première ligne
Le profil du « Forward Deployed Engineer » s'impose comme pièce maîtresse des stratégies d'adoption de l'IA en entreprise.
29 avr. · RECHERCHE
Un nouveau benchmark pour évaluer les LLM sur les sorties déterministes
Interfaze.ai publie un benchmark dédié aux sorties structurées des LLM, un critère souvent négligé par les évaluations standard.
29 avr. · OUTILS
Cursor Camp : un camp d'été pour apprendre à coder avec l'IA
Neal.fun lance Cursor Camp, une expérience interactive pour découvrir le développement assisté par IA via l'éditeur Cursor.
29 avr. · SAFETY
L'IA de Ramp dans Google Sheets exfiltre des données financières
Une démonstration de PromptArmor révèle comment l'assistant IA de Ramp peut être manipulé pour exfiltrer des données financières sensibles via une injection de prompt.
29 avr. · SIGNAL
HERMES.md : un bug Anthropic entraîne une surfacturation de 200 $, le remboursement est refusé
Un utilisateur de Claude Code signale une facturation erronée de 200 dollars imputable à un bug Anthropic, et se voit refuser tout remboursement.
29 avr. · OUTILS
DeepInfra rejoint les fournisseurs d'inférence de Hugging Face
Hugging Face intègre DeepInfra à son écosystème d'Inference Providers, élargissant les options d'inférence cloud pour les développeurs.
29 avr. · OPINION
Les évaluations IA deviennent le nouveau goulot d'étranglement du calcul
À mesure que les modèles progressent, le coût et la complexité des évaluations (evals) s'imposent comme une contrainte critique, au même titre que la puissance de calcul.
29 avr. · OUTILS
Mistral Medium 3.5 : nouveau modèle d'agents à distance
Mistral AI annonce Mistral Medium 3.5, un modèle orienté agents distants combinant performance et efficacité.
29 avr. · RECHERCHE
Granite 4.1 : architecture et méthodes de construction des LLM d'IBM
IBM détaille sur le blog Hugging Face la conception technique de sa nouvelle famille de modèles Granite 4.1, entre choix d'architecture et pipeline d'entraînement.
29 avr. · OUTILS
Le Champion Kit d'Anthropic pour promouvoir Claude Code en entreprise
Anthropic publie un kit de ressources destiné aux ingénieurs chargés de déployer et défendre Claude Code au sein de leurs organisations.
29 avr. · MARCHÉ
Amazon déploie un logiciel IA pour automatiser les entretiens d'embauche
Amazon intègre un outil d'IA dans son processus de recrutement pour conduire et évaluer automatiquement les entretiens de candidats.
29 avr. · OPINION
Il a demandé à l'IA de compter les glucides 27 000 fois : jamais deux fois la même réponse
Une expérience à grande échelle révèle la variabilité alarmante des LLM pour estimer les apports en glucides, une tâche critique pour les diabétiques.
29 avr. · RÉGULATION
OpenAI présente son plan d'action en cinq points pour la cybersécurité à l'ère de l'IA
OpenAI détaille une stratégie en cinq axes visant à démocratiser la défense cyber assistée par IA et à protéger les infrastructures critiques.
27 janv. · OUTILS
Moonlight-A3B : nouveau modèle MoE open-weights de Moonshot AI
Moonshot AI publie Moonlight-A3B, un modèle MoE léger en open-weights sur Hugging Face, avec 3 milliards de paramètres actifs.
28 avr. · RECHERCHE
SIEVES : la prédiction sélective généralisée par scoring d'évidence visuelle
Un nouveau framework améliore la fiabilité des modèles multimodaux en apprenant à évaluer la qualité des preuves visuelles fournies par le raisonneur.
28 avr. · RECHERCHE
G-Loss : fine-tuning guidé par graphe pour les modèles de langage
Une nouvelle fonction de perte exploitant la propagation de labels semi-supervisée pour capturer la structure sémantique globale lors du fine-tuning de LLMs.
28 avr. · RECHERCHE
Étude empirique des capacités d'apprentissage en contexte des Transformers
Une analyse systématique révèle comment la dimension des données, le nombre d'exemples et la diversité des tâches influencent l'ICL des Transformers.
28 avr. · RECHERCHE
Luminol-AIDetect : détection zero-shot de texte généré par IA via perplexité et mélange aléatoire
Une approche statistique inédite exploite la fragilité structurelle des LLM sous mélange de texte pour détecter les contenus machine-generated sans entraînement spécifique.
28 avr. · RECHERCHE
Des mécanismes internes des LLM dans la reconnaissance des émotions
Des chercheurs utilisent des autoencodeurs épars pour cartographier comment les LLM traitent les émotions en interne, révélant un flux d'information en trois phases.
28 avr. · RECHERCHE
RESTestBench : un benchmark pour évaluer les tests d'API REST générés par LLM
Un nouveau benchmark mesure la capacité des LLM à générer des cas de test REST pertinents à partir d'exigences en langage naturel, via une métrique de mutation.
28 avr. · RECHERCHE
Quand les erreurs de récompense peuvent être bénéfiques : une taxonomie pour le policy gradient
Une analyse théorique montre que toutes les erreurs dans les proxy rewards ne sont pas néfastes — certaines peuvent même accélérer l'apprentissage.
28 avr. · RECHERCHE
IA explicable pour le jet tagging : comparaison de GNNExplainer, GNNShap et GradCAM
Une étude compare trois méthodes d'explicabilité appliquées aux réseaux de neurones de graphes pour le jet tagging au Grand Collisionneur de Hadrons.
28 avr. · SAFETY
Proxies, sandboxes et sécurité des agents IA
Un tour d'horizon des approches techniques pour sécuriser les agents IA autonomes : proxies réseau, sandboxing et contrôle des permissions.
28 avr. · OUTILS
Un external Max/MSP pour exécuter des captures neuronales d'amplis guitare
Un outil open-source permet de faire tourner des modèles neuronaux d'émulation d'amplificateurs directement dans l'environnement Max/MSP.
28 avr. · RECHERCHE
Détection temps réel des piétons vulnérables pour feux de signalisation adaptatifs
Un système baptisé NPLB combine YOLOv12 et ByteTrack pour prolonger automatiquement les phases piétonnes et réduire les accidents aux carrefours.
28 avr. · RÉGULATION
Google cède son protocole de paiement pour agents à l'alliance FIDO
Google transfère son protocole de paiement destiné aux agents IA à l'alliance FIDO pour en faire un standard ouvert.
28 avr. · SAFETY
Désalignement conditionnel : des interventions courantes peuvent masquer un désalignement émergent
Des techniques censées corriger le désalignement émergent après fine-tuning ne l'éliminent pas : elles le rendent simplement contextuel.
28 avr. · SAFETY
Trois modèles de l'annotation RLHF : extension, preuve et autorité
Un chercheur propose un cadre conceptuel pour clarifier le rôle normatif des annotateurs humains dans les pipelines RLHF.
28 avr. · OPINION
Un bon fichier AGENTS.md vaut une mise à niveau de modèle
Augment Code détaille comment rédiger des fichiers AGENTS.md efficaces pour guider les agents IA dans les codebases.
28 avr. · RECHERCHE
Paramétrisations variationnelles pour la préhension robotique robuste sous incertitude multimodale
Une approche par inférence variationnelle améliore la robustesse de la préhension dextre en modélisant l'incertitude de contact via des mélanges gaussiens différentiables.
28 avr. · OUTILS
VibeBench : l'opinion de 1 000 ingénieurs sur les nouveaux modèles
Un benchmark collaboratif recueille les évaluations subjectives de 1 000 ingénieurs sur les derniers modèles d'IA pour mesurer leur ressenti réel.
28 avr. · RECHERCHE
Vers une algèbre géométrique fonctionnelle pour la sémantique du langage naturel
Un chercheur propose les algèbres de Clifford comme fondation mathématique supérieure aux vecteurs classiques pour représenter le sens en NLP.
29 avr. · OPINION
La dévalorisation du travailleur tech américain selon Meta
Après des licenciements massifs, Meta formerait ses IA avec le travail de ses propres employés, accélérant la substitution humain-machine.
28 avr. · RECHERCHE
TSN-Affinity : réutilisation de paramètres guidée par similarité pour l'apprentissage par renforcement continu hors ligne
Une nouvelle méthode architecturale combine TinySubNetworks et Decision Transformer pour apprendre des tâches séquentielles sans oubli catastrophique, sans rejouer de données.
28 avr. · OUTILS
DOOM jouable dans ChatGPT et Claude via MCP
Un développeur a intégré DOOM comme application MCP, rendant le jeu classique jouable directement depuis les interfaces de ChatGPT et Claude.
28 avr. · RECHERCHE
Teacher Forcing comme Bayes généralisé : inadéquation géométrique pour les dynamiques chaotiques
Une étude théorique révèle pourquoi le teacher forcing crée une distorsion de courbure par rapport à la vraisemblance marginale dans les réseaux récurrents pour systèmes chaotiques.
28 avr. · RECHERCHE
Carbon-Taxed Transformers : un pipeline de compression verte pour LLMs trop lourds
Un pipeline de compression multi-architecturale baptisé CTT réduit jusqu'à 49x la mémoire et 81% les émissions CO₂ des LLMs dédiés au génie logiciel.
28 avr. · OUTILS
Votre terminal consume autant de batterie qu'un mineur de cryptomonnaie
Une analyse comparative révèle des écarts significatifs de consommation GPU et batterie entre les principaux émulateurs de terminal sur macOS.
28 avr. · OUTILS
Piloter n'importe quelle app macOS en arrière-plan sans capturer le curseur
CUA permet à des agents IA d'automatiser des applications macOS en tâche de fond, sans interférer avec l'usage normal du poste.
28 avr. · RECHERCHE
DV-World : un benchmark pour évaluer les agents de visualisation de données en conditions réelles
Un nouveau benchmark de 260 tâches teste les agents IA sur la visualisation de données dans des scénarios professionnels complexes — les meilleurs modèles peinent à dépasser 50 %.
28 avr. · RECHERCHE
À quelle vitesse un modèle doit-il s'engager vers la supervision ? Entraînement sur le continuum Tsallis
Un nouveau cadre théorique basé sur la perte de Tsallis résout le problème du démarrage à froid dans l'entraînement par RLVR des modèles de raisonnement.
29 avr. · OPINION
Comment nous avons réduit nos coûts LLM en passant à Opus
Un retour d'expérience concret sur la migration vers Claude Opus pour réduire la facture LLM, avec chiffres à l'appui.
28 avr. · RECHERCHE
Le paradoxe de la maîtrise de l'IA
Les utilisateurs expérimentés échouent davantage avec l'IA que les novices — mais leurs échecs sont visibles et productifs, contrairement aux erreurs silencieuses des débutants.
28 avr. · OUTILS
Claude Code : un rappel anti-malware bloque les sous-agents à chaque lecture
Une régression dans Claude Code génère des refus en cascade chez les sous-agents à cause d'un avertissement anti-malware déclenché à chaque lecture de fichier.
28 avr. · RECHERCHE
RecursiveMAS : des systèmes multi-agents à calcul récursif dans l'espace latent
Un nouveau framework étend le principe de récursivité des LLMs aux systèmes multi-agents, avec des gains de précision et de vitesse d'inférence significatifs.
28 avr. · SAFETY
L'engagement d'OpenAI en matière de sécurité des communautés
OpenAI détaille ses mécanismes de protection dans ChatGPT : garde-fous des modèles, détection des abus et coopération avec des experts en sécurité.
28 avr. · MARCHÉ
Les modèles OpenAI arrivent sur Amazon Bedrock
Sam Altman et le PDG d'AWS s'expriment sur l'intégration des modèles OpenAI dans Bedrock et ses agents managés.
28 avr. · SIGNAL
La société de vérification d'identité du PDG d'OpenAI a annoncé un faux partenariat avec Bruno Mars
Tools for Humanity, co-fondée par Sam Altman, a publié une annonce de partenariat avec Bruno Mars qui s'avère être une erreur d'identité.
28 avr. · OPINION
Faut-il abandonner la revue de code à l'ère de l'IA ?
Alors que l'IA génère de plus en plus de code, la revue humaine reste-t-elle pertinente ou devient-elle un goulot d'étranglement inutile ?
28 avr. · MARCHÉ
OpenAI manque ses objectifs de revenus : la bulle IA est-elle en train d'éclater ?
Des résultats en deçà des attentes chez OpenAI font chuter les cours d'Oracle et des fabricants de puces, ravivant les craintes d'une bulle spéculative.
28 avr. · MARCHÉ
Les grandes compagnies aériennes américaines ont dépensé 1,2 Md$ de plus en carburant au T1
Les six plus grandes compagnies aériennes américaines ont vu leur facture carburant exploser au premier trimestre, et la tendance ne devrait pas s'inverser.
28 avr. · OPINION
OpenAI, le petit frère d'Anthropic ?
Une analyse de The Atlantic explore comment OpenAI semble désormais suivre les pas d'Anthropic plutôt que l'inverse.
28 avr. · OPINION
L'économie de l'IA ne tient pas la route
Une analyse critique des modèles économiques de l'IA générative, qui questionne la viabilité financière du secteur malgré des investissements colossaux.
28 avr. · SIGNAL
Claude d'Anthropic se repositionne pour le travail créatif
Anthropic met en avant les capacités créatives de Claude, ciblant auteurs, scénaristes et professionnels de la création de contenu.
28 avr. · MARCHÉ
Anthropic rejoint le Blender Development Fund en tant que mécène
La startup derrière Claude devient partenaire corporate de la fondation Blender, renforçant les liens entre IA et création 3D open source.
28 avr. · SIGNAL
Claude.ai indisponible : incident en cours
Le service Claude.ai d'Anthropic a connu une interruption signalée sur sa page de statut officielle.
28 avr. · RÉGULATION
Google et le Pentagone s'accordent sur un contrat d'IA à usage « légal »
Google aurait conclu un accord avec le département américain de la Défense autorisant l'utilisation de ses technologies IA pour tout usage légal, y compris des applications militaires classifiées.
28 avr. · OPINION
À qui appartient le code écrit par Claude Code ?
La question de la propriété intellectuelle du code généré par des outils d'IA comme Claude Code soulève des enjeux juridiques encore non résolus.
28 avr. · SAFETY
38 failles critiques découvertes dans le logiciel de santé OpenEMR
La société AISLE a identifié 38 CVE dans OpenEMR, un logiciel médical open source utilisé par plus de 100 000 professionnels de santé.
28 avr. · OUTILS
Poolside dévoile les modèles Laguna XS.2 et M.1
Poolside lève le voile sur deux nouveaux modèles de sa famille Laguna, dédiés à la génération et compréhension de code.
28 avr. · MARCHÉ
Les modèles OpenAI, Codex et Managed Agents arrivent sur AWS
OpenAI étend sa distribution cloud en rendant ses modèles GPT, Codex et Managed Agents accessibles directement dans l'environnement AWS des entreprises.
27 avr. · OUTILS
Mistral lance Workflows pour automatiser les processus métier
Mistral AI dévoile Workflows, une solution d'automatisation des tâches répétitives et des processus opérationnels à destination des entreprises.
28 avr. · OUTILS
NVIDIA lance Nemotron 3 Nano Omni, un modèle multimodal longue-contexte pour documents, audio et vidéo
NVIDIA présente Nemotron 3 Nano Omni, un modèle multimodal compact capable de traiter documents, audio et vidéo dans des pipelines agentiques.
28 avr. · OUTILS
Google Translate fête ses 20 ans : chiffres clés et nouvelles fonctionnalités
De ses débuts expérimentaux en 2006 à près de 250 langues supportées, Google Translate célèbre deux décennies de traduction automatique.
28 avr. · RÉGULATION
L'UE veut forcer Google à ouvrir Android aux assistants IA concurrents
La Commission européenne exige que Google donne accès à ses fonctions IA sur Android à des tiers. Google dénonce une ingérence injustifiée.
28 avr. · OPINION
Le verrouillage fournisseur IA commence à peser lourd
Les entreprises qui ont misé sur un seul fournisseur d'IA découvrent les inconvénients du lock-in : coûts, dépendance et perte de flexibilité.
28 avr. · MARCHÉ
L'Utah approuve un campus IA de 9 GW, soit plus du double de la consommation électrique de l'État
Kevin O'Leary obtient le feu vert pour un méga-campus de data centers en Utah, dont la capacité dépasse largement la production électrique locale.
28 avr. · OUTILS
GitHub Copilot Code Review va consommer des minutes GitHub Actions
À partir du 1er juin 2026, les revues de code automatisées par Copilot seront décomptées du quota de minutes GitHub Actions.
28 avr. · OUTILS
Microsoft VibeVoice : une IA vocale open-source de pointe
Microsoft publie VibeVoice, un projet open-source d'IA vocale avancée, disponible sur GitHub.
28 avr. · OUTILS
LocalSend : une alternative open-source et multiplateforme à AirDrop
LocalSend permet le partage de fichiers en local sans Internet ni serveur, sur Windows, macOS, Linux, iOS et Android.
27 avr. · SAFETY
Gouverner ce qu'on ne peut observer : gouvernance adaptative en temps réel pour agents IA autonomes
Un framework théorique formalisé pour détecter et contenir les dérives comportementales d'agents IA sans modification de code.
27 avr. · RECHERCHE
NBSE : sélection de features par embedding spectral guidé par diffusion
Un framework physique sélectionne automatiquement les features informatives dans des données haute dimension, sans recherche greedy, en exploitant la température de Nishimori.
27 avr. · RECHERCHE
CLAS : pilotage d'activation linéaire contextuel pour les LLM
Une nouvelle méthode adapte dynamiquement l'intensité du steering selon le contexte, surpassant les approches fixes sur onze benchmarks.
27 avr. · RECHERCHE
Les LLM peuvent-ils faire de l'histoire ? Évaluation via l'examen impérial chinois
Un nouveau benchmark, ProHist-Bench, teste les capacités de raisonnement historique avancé des LLM sur 1 300 ans d'histoire est-asiatique.
27 avr. · RECHERCHE
SciCrafter : des agents IA capables de découverte et d'application scientifique dans Minecraft ?
Un nouveau benchmark basé sur Minecraft teste la capacité des agents IA à découvrir des régularités causales et à les appliquer — avec des résultats plafonnant à 26 %.
27 avr. · RECHERCHE
La limite du caméléon : effondrement de persona et homogénéisation dans les LLMs
Des chercheurs identifient un phénomène systématique où des agents LLMs pourtant dotés de profils distincts convergent vers des comportements uniformes.
27 avr. · RECHERCHE
Green Shielding : une approche centrée utilisateur pour une IA médicale fiable
Des chercheurs proposent un cadre d'évaluation axé sur la variation naturelle des requêtes, appliqué au diagnostic médical avec un nouveau benchmark clinique.
27 avr. · RECHERCHE
Descriptions défectueuses dans la génération de code par LLM : détection et analyse
SpecValidator, un classifieur léger fine-tuné, surpasse GPT-4o-mini et Claude Sonnet pour détecter les descriptions de tâches mal formées soumises aux LLM.
28 avr. · OPINION
La définition de la sécurité chez Anthropic est trop restrictive
Un essai critique soutient qu'Anthropic réduit la notion de sécurité IA à des risques catastrophiques, au détriment de dangers plus quotidiens.
27 avr. · OUTILS
Energy-Arena : un benchmark dynamique pour la prévision opérationnelle de l'énergie
Une plateforme ouverte et mise à jour en continu pour évaluer les modèles de prévision énergétique dans des conditions opérationnelles réelles.
27 avr. · RECHERCHE
Entraînement d'ensembles à hyperparamètres divergents pour grands modèles avec exploration automatique du learning rate
HDET réutilise les répliques GPU du data-parallel pour explorer plusieurs learning rates en parallèle, sans coût de communication significatif.
27 avr. · MARCHÉ
Claude Pro : le modèle Opus limité aux utilisateurs avec usage étendu
Anthropic restreint l'accès à Claude Opus dans son offre Pro : le modèle le plus puissant ne sera disponible que si l'option d'usage étendu est activée.
27 avr. · RECHERCHE
Flatness différentielle pour un MPC basé sur l'apprentissage, efficace et contraint
Une approche de contrôle prédictif exploitant la flatness différentielle réduit drastiquement le coût computationnel sans sacrifier les performances.
27 avr. · RECHERCHE
Grilles d'évaluation clinique cas par cas pour l'IA médicale : méthodologie et validation sur 823 rencontres
Une méthodologie d'évaluation de l'IA clinique fondée sur des grilles rédigées par des médecins, validée sur 823 cas réels et synthétiques.
28 avr. · OPINION
Ce que Claude Shannon savait en 1950 que nous faisons semblant de découvrir
Un essai rappelle que les fondements théoriques de l'IA actuelle ont été posés par Shannon il y a 75 ans — et que l'industrie feint de l'ignorer.
27 avr. · RECHERCHE
HyLo : upcycling de LLMs Transformer vers des architectures hybrides longue-contexte
Une méthode convertit des checkpoints Transformer existants en modèles hybrides capables de traiter jusqu'à 2 millions de tokens, tout en réduisant la mémoire KV-cache de plus de 90 %.
28 avr. · MARCHÉ
OpenAI rate ses objectifs de revenus et d'utilisateurs dans sa course à l'IPO
Selon le WSJ, OpenAI n'a pas atteint plusieurs cibles financières et d'audience clés alors que l'entreprise prépare son introduction en bourse.
27 avr. · RECHERCHE
SIREN-RoPE : encodage positionnel rotatif temporel et sémantique pour les modèles séquentiels
Des chercheurs proposent d'enrichir le RoPE des Transformers en traitant l'espace de rotation comme une dimension apprenante conditionnée par le signal.
28 avr. · OPINION
San Francisco, capitale mondiale de l'IA, à la traîne économique
Malgré sa position de hub incontesté de l'intelligence artificielle, San Francisco affiche des indicateurs économiques décevants par rapport au reste des États-Unis.
28 avr. · OUTILS
Waiting Game : un mini-jeu pour patienter pendant les appels LLM
Un développeur propose d'intégrer un mini-jeu directement dans l'interface pendant les temps de latence des LLMs, pour améliorer l'expérience utilisateur.
27 avr. · RECHERCHE
Classification de sentiments et émotions sur des avis e-commerce indonésiens via BiLSTM multi-tâche et AutoML
Un pipeline à deux voies combine AutoML et BiLSTM pour analyser des avis en indonésien mêlant argot, emprunts régionaux et emojis.
28 avr. · OUTILS
Les GPU les moins chers du monde
Un tour d'horizon des options GPU les plus économiques disponibles à l'échelle mondiale, entre cloud spot, fournisseurs alternatifs et marchés secondaires.
27 avr. · MARCHÉ
David Silver de DeepMind lève 1,1 Md$ pour une IA apprenant sans données humaines
Le chercheur derrière AlphaGo quitte DeepMind pour lever 1,1 milliard de dollars et construire une IA capable d'apprendre de manière autonome.
27 avr. · RECHERCHE
SpecRLBench : un benchmark pour la généralisation en RL guidé par spécification
Un nouveau benchmark évalue la capacité des méthodes de reinforcement learning basées sur la logique temporelle linéaire à généraliser sur des tâches et environnements inédits.
27 avr. · RECHERCHE
Apprendre à raisonner à partir de plusieurs « penseurs »
Une étude théorique montre comment combiner des supervisions Chain-of-Thought issues de raisonneurs multiples pour apprendre efficacement.
27 avr. · RECHERCHE
Complexité d'échantillon optimale pour la classification multiclasse et l'apprentissage par liste
Un résultat théorique majeur : la conjecture de Daniely et Shalev-Shwartz (2014) sur la classification multiclasse est enfin prouvée.
27 avr. · MARCHÉ
La Chine bloque le rachat de la startup IA Manus par Meta
Pékin oppose son veto à l'acquisition de Manus par Meta, dans un contexte de tensions croissantes autour du contrôle des technologies d'IA.
28 avr. · RECHERCHE
LingBot-Map : reconstruction 3D en streaming avec transformer de contexte géométrique
Un nouveau système combine reconstruction 3D en temps réel et transformer géométrique pour cartographier l'environnement en continu.
27 avr. · RECHERCHE
HRGrad : une méthode de gradient rotatif harmonisé pour les régimes cinétiques multi-échelles
Une nouvelle approche d'optimisation multi-tâches pour les réseaux de neurones à préservation asymptotique, traitant les conflits de gradients en physique cinétique.
28 avr. · OUTILS
AgentSwift – un agent open-source pour construire des apps iOS
AgentSwift propose un agent autonome capable de générer et modifier des applications iOS, en open-source.
27 avr. · MARCHÉ
Anthropic nomme un directeur général pour l'Australie et la Nouvelle-Zélande et ouvre un bureau à Sydney
Anthropic accélère son expansion dans la région Asie-Pacifique avec l'ouverture officielle d'un bureau à Sydney et la nomination de Theo Hourmouzis.
28 avr. · OUTILS
Imagerie échographique adaptative avec NV-Raw2Insights-US, un modèle IA informé par la physique
NVIDIA publie sur Hugging Face un modèle d'IA intégrant des contraintes physiques pour améliorer la reconstruction et l'analyse des images ultrasonores.
27 avr. · RÉGULATION
OpenAI obtient l'autorisation FedRAMP Moderate pour ses produits fédéraux
ChatGPT Enterprise et l'API OpenAI sont désormais autorisés au niveau FedRAMP Moderate, ouvrant la voie à leur déploiement sécurisé au sein des agences fédérales américaines.
27 avr. · RECHERCHE
Génération d'exemples pédagogiques personnalisés à partir du code étudiant
Des chercheurs exploitent l'analyse AST et des composantes de connaissance pour générer des exemples corrigés adaptés aux erreurs logiques spécifiques de chaque apprenant.
27 avr. · OUTILS
Open CoDesign : une alternative open-source à Claude Design et v0
Un outil de design assisté par IA, open-source et fonctionnant en local, se présente comme alternative aux solutions propriétaires Claude Design et v0.
27 avr. · SAFETY
Un article de Google DeepMind soutient que les LLM ne seront jamais conscients
Des chercheurs de DeepMind publient un papier affirmant que les grands modèles de langage sont structurellement incapables d'atteindre la conscience.
27 avr. · OPINION
La Silicon Valley a oublié ce que les gens ordinaires veulent
Un regard critique sur la déconnexion entre les obsessions technologiques de la Silicon Valley et les besoins réels du grand public.
27 avr. · OUTILS
Ubuntu Linux intégrera des fonctionnalités IA tout au long de 2026
Canonical annonce un déploiement progressif de fonctionnalités d'intelligence artificielle dans Ubuntu au cours de l'année à venir.
27 avr. · SAFETY
Un agent IA propulsé par Claude supprime toute une base de données en 9 secondes
Un agent de coding IA basé sur Claude d'Anthropic, via l'outil Cursor, a effacé la base de données complète d'une entreprise — sauvegardes comprises — en quelques secondes.
27 avr. · OUTILS
Faire tourner des LLM locaux hors ligne pendant un vol de dix heures
Retour d'expérience pratique sur l'exécution de LLM en local, sans connexion, à bord d'un long-courrier.
27 avr. · OUTILS
Tendril – un agent auto-extensible qui construit et enregistre ses propres outils
Tendril est un agent IA capable de générer dynamiquement ses propres outils et de les enregistrer à la volée, sans intervention humaine.
27 avr. · SAFETY
Canva s'excuse après que son outil IA a remplacé « Palestine » dans des créations
L'outil Magic Layers de Canva a substitué automatiquement le mot « Palestine » dans des designs, provoquant une vague de critiques et des excuses officielles.
27 avr. · OUTILS
Utilyze – un outil open source de monitoring GPU plus précis que nvtop
Un développeur présente Utilyze, un outil open source de surveillance GPU qui se positionne comme une alternative plus précise à nvtop.
27 avr. · OUTILS
Choco automatise la distribution alimentaire avec des agents IA
Comment Choco a déployé les API OpenAI pour optimiser ses flux de distribution alimentaire et accélérer sa croissance.
27 avr. · MARCHÉ
Microsoft et OpenAI mettent fin à leur accord exclusif et de partage de revenus
Un tournant majeur dans le partenariat IA le plus commenté de la décennie : Microsoft cesse de partager ses revenus avec OpenAI.
27 avr. · OUTILS
Symphony : une spécification open-source pour l'orchestration de Codex
OpenAI publie Symphony, un spec open-source qui transforme les gestionnaires de tickets en systèmes d'agents autonomes pilotés par Codex.
27 avr. · MARCHÉ
GitHub Copilot passe à une facturation à l'usage
GitHub annonce un changement de modèle tarifaire pour Copilot : exit l'abonnement fixe, place à la facturation selon la consommation réelle.
27 avr. · OUTILS
Super ZSNES – Émulateur SNES accéléré par GPU
Un fork modernisé de ZSNES exploite la puissance des GPU pour émuler la Super Nintendo avec des performances et une fidélité améliorées.
27 avr. · OPINION
La clause AGI d'OpenAI et Microsoft : retour sur son histoire et sa disparition
Pendant des années, l'accord Microsoft-OpenAI contenait une clause stipulant que les droits commerciaux de Microsoft s'annuleraient si l'AGI était atteinte. Cette clause vient de disparaître.
27 avr. · MARCHÉ
OpenAI et Microsoft annoncent la prochaine phase de leur partenariat
Les deux entreprises ont revu et simplifié les termes de leur accord, avec l'objectif d'apporter une visibilité à long terme sur leur collaboration en matière d'IA.
27 avr. · OUTILS
Comment construire des applications web évolutives avec le filtre de confidentialité d'OpenAI
Hugging Face publie un guide pratique pour intégrer le filtre de confidentialité d'OpenAI dans des applications web scalables.
27 avr. · OUTILS
Google et Kaggle relancent leur formation intensive sur les agents IA
Google rouvre les inscriptions à son cours intensif de 5 jours sur les agents IA, organisé en partenariat avec Kaggle.
27 avr. · SAFETY
Mercor : 4 To de données vocales dérobées chez 40 000 sous-traitants IA
Une brèche massive chez la plateforme Mercor expose des données vocales sensibles appartenant à des dizaines de milliers de sous-traitants travaillant pour des projets d'IA.
27 avr. · OPINION
La collection IA « Le Seigneur des Anneaux » de Moleskine ne fait que singer l'original
Un blogueur analyse la collection Moleskine générée par IA inspirée du Seigneur des Anneaux et pointe ses limites créatives et symboliques.
25 avr. · OPINION
Les fusées militaires qui ont lancé l'ère spatiale
Retour sur le rôle déterminant des programmes de missiles militaires dans les premières décennies de la conquête spatiale.
23 avr. · OUTILS
GPT-5.5 accessible via l'API non officielle de Codex
GPT-5.5 est disponible dans OpenAI Codex et déployé progressivement aux abonnés ChatGPT payants, sans accès API officiel pour l'instant.
27 avr. · MARCHÉ
Comment Mistral a bâti un empire IA de 14 milliards en n'étant pas américain
La startup française Mistral AI tire parti de son identité européenne pour s'imposer face aux géants américains et atteindre une valorisation de 14 milliards de dollars.
27 avr. · OUTILS
Dirac : un agent OSS domine le benchmark TerminalBench sur Gemini 2.5 Flash
Un développeur indépendant publie Dirac, un agent open-source qui atteint le meilleur score sur TerminalBench avec le modèle Gemini 2.5 Flash Preview.
24 avr. · RECHERCHE
QPP peut-il sélectionner la meilleure reformulation de requête pour les pipelines RAG ?
Une étude évalue la prédiction de performance de requête (QPP) pour choisir la variante optimale avant d'exécuter un pipeline RAG complet.
24 avr. · RECHERCHE
Mutation sélective guidée par la qualité pour le deep learning
Un cadre probabiliste pour réduire le coût des tests par mutation en DL, en filtrant les configurations peu résistantes ou peu réalistes.
24 avr. · SAFETY
Repenser l'évaluation de l'XAI : audit centré humain des benchmarks Shapley
Les métriques quantitatives standards des valeurs de Shapley ne reflètent pas l'utilité réelle perçue par les analystes en contexte à forts enjeux.
24 avr. · RECHERCHE
Métrique Associativité-Peakiness pour les tables de contingence
Un nouveau score unique, l'AP metric, pour comparer les algorithmes de clustering à partir de leurs tables de contingence.
24 avr. · RECHERCHE
Schéma itératif d'apprentissage de modèle via processus gaussiens pour le contrôle prédictif non linéaire de procédés batch
Des chercheurs combinent processus gaussiens et NMPC pour contrôler des réacteurs batch sans modèle dynamique préétabli, avec convergence rapide en quatre itérations.
24 avr. · RECHERCHE
WG-SRC : sonde boîte blanche pour diagnostiquer les datasets de graphes via sous-espaces de signaux
WG-SRC remplace le message passing appris par un dictionnaire de signaux nommés pour rendre la classification de nœuds interprétable et diagnostiquer les propriétés des datasets.
24 avr. · RECHERCHE
BERAG : une approche bayésienne ensembliste pour le RAG en question-réponse visuelle
Une nouvelle architecture RAG conditionne le LLM sur chaque document individuellement et pondère leurs contributions via la règle de Bayes, token par token.
24 avr. · RÉGULATION
Comment les chaînes d'approvisionnement compliquent la mesure des biais dans les IA de recrutement
Les systèmes d'IA pour le recrutement fragmentent la responsabilité entre fournisseurs, développeurs et déployeurs, rendant la détection des biais quasi impossible.
24 avr. · RECHERCHE
CRAFT : sélection adaptative de données d'entraînement par régression clusterisée
Une méthode de filtrage rapide et efficace pour sélectionner les meilleures données de fine-tuning parmi des dizaines de millions d'exemples.
24 avr. · RECHERCHE
Décomposition paramétrique localisée dans le temps du flux respiratoire pour l'analyse intra-inspiration
Un framework paramétrique décompose le flux respiratoire en composantes localisées, améliorant de 30,7 % la détection de la fatigue cognitive.
27 avr. · SIGNAL
Ce site d'information utilise des bots IA comme journalistes — et OpenAI semble le financer
Un site d'actualités dont tous les journalistes seraient des agents IA aurait reçu des fonds d'OpenAI, soulevant des questions de transparence.
24 avr. · RECHERCHE
Raisonnement latent abstrait : penser sans mots avec Abstract Chain-of-Thought
Une méthode post-entraînement permet aux LLM de raisonner via des tokens abstraits plutôt qu'en langage naturel, réduisant jusqu'à 11,6× les tokens de raisonnement.
26 avr. · OUTILS
ELI : expliquer n'importe quel article ArXiv à votre niveau
Un outil en ligne génère automatiquement des explications adaptées au niveau du lecteur pour tout article scientifique ArXiv.
24 avr. · RECHERCHE
Aligner les retrievers denses avec l'utilité LLM par distillation
UAE propose d'injecter des signaux d'utilité LLM directement dans l'espace d'embedding, sans inférence LLM à l'exécution, pour un RAG 180x plus rapide.
26 avr. · OUTILS
AgentSwarms : un terrain de jeu gratuit pour apprendre l'IA agentique
Une plateforme interactive sans configuration pour expérimenter les architectures multi-agents, accessible directement en ligne.
24 avr. · RECHERCHE
Découverte morphologique zero-shot dans les langues bantoues à faibles ressources par transfert cross-lingue
Une méthode combinant transfer learning et clustering non supervisé permet d'identifier des structures morphologiques inédites en giriama, langue bantoue quasi-non dotée.
27 avr. · MARCHÉ
La demande électrique américaine vers des records en 2026-2027, portée par l'IA et les data centers
L'EIA prévoit une consommation d'électricité aux États-Unis à des niveaux historiques d'ici 2027, sous l'effet de l'essor des data centers et de l'IA.
24 avr. · RECHERCHE
Reconstruction neurale de la structure lexicale historique des langues bantoues à partir de données modernes
Des modèles transformer entraînés sur des données morphologiques modernes parviennent à retrouver des cognats proto-bantous avec une précision de 90,9 %.
27 avr. · OPINION
L'IA peut désormais coûter plus cher que des travailleurs humains
Contre toute attente, le recours à l'IA s'avère dans certains cas plus onéreux que l'emploi humain, selon une analyse d'Axios.
24 avr. · RECHERCHE
Preuve d'indécidabilité du problème d'existence de plan en logique épistémique
Un résultat théorique majeur : le problème d'existence de plan en logique épistémique modale est indécidable, même dans des cas très contraints.
24 avr. · OPINION
Les systèmes d'IA agentiques violent les hypothèses implicites des bases de données
Les agents IA remettent en cause des décennies de conventions dans la conception des bases de données, révélant des failles invisibles jusque-là.
24 avr. · RECHERCHE
Entraînement de réseaux de neurones surrogates guidé par la relaxation LP
Une méthode d'entraînement qui régularise directement les propriétés MILP des réseaux ReLU pour accélérer l'optimisation globale.
27 avr. · MARCHÉ
Google mise sur l'IA pour rattraper Amazon et Microsoft dans le cloud
Alphabet entend capitaliser sur ses avancées en IA pour combler son retard sur AWS et Azure dans le marché du cloud d'entreprise.
24 avr. · RECHERCHE
Modélisation du monde par les agents IA : fondations, capacités et lois
Une taxonomie en deux axes pour unifier la recherche sur les world models agentiques, synthétisant plus de 400 travaux et 100 systèmes représentatifs.
30 janv. · OUTILS
Moonlight-16B-A3B : nouveau modèle MoE open-weights de Moonshot AI
Moonshot AI publie Moonlight-16B-A3B, un modèle Mixture-of-Experts de 16 milliards de paramètres avec 3 milliards actifs, disponible en open-weights sur Hugging Face.
27 avr. · OUTILS
L'API Prompt de Chrome : l'IA directement dans le navigateur
Google intègre une API Prompt native dans Chrome, permettant aux développeurs d'exécuter des modèles de langage localement, sans serveur.
24 avr. · SAFETY
Préjudices représentationnels dans les récits LLM visant les nationalités de la majorité mondiale
Une étude révèle que les LLMs reproduisent des stéréotypes néfastes et effacent les identités non occidentales dans leurs récits générés.
30 janv. · OUTILS
Moonshot AI lance Moonlight-16B-A3B-Instruct, un modèle MoE open-weights
Moonshot AI publie Moonlight-16B-A3B-Instruct, un modèle d'instruction MoE de 16 milliards de paramètres avec seulement 3B actifs.
26 avr. · OPINION
L'IA doit élever votre pensée, pas la remplacer
Un plaidoyer pour une utilisation de l'IA qui renforce les capacités cognitives humaines plutôt qu'elle ne les substitue.
24 avr. · RECHERCHE
Comment les agents IA dépensent vos tokens : analyse et prédiction des coûts dans les tâches de codage
Une première étude systématique révèle que les tâches de codage agentique consomment 1000x plus de tokens que le raisonnement standard, avec une variance jusqu'à 30x entre exécutions.
27 avr. · OUTILS
EvanFlow – Une boucle de feedback TDD pour Claude Code
EvanFlow propose un workflow piloté par les tests (TDD) pour automatiser et affiner les interactions avec Claude Code via une boucle de rétroaction.
24 avr. · RECHERCHE
Ajuster les lois de mise à l'échelle à moindre coût grâce à une sélection active d'expériences
Une méthode séquentielle et consciente de l'incertitude permet d'approcher la précision d'un fitting complet en n'utilisant que 10 % du budget.
27 avr. · RÉGULATION
Google DeepMind annonce un partenariat avec la République de Corée
DeepMind et la Corée du Sud s'associent pour accélérer la recherche scientifique grâce aux modèles d'IA frontier.
29 mai · OUTILS
Kimi-Audio-7B-Instruct : nouveau modèle audio de Moonshot AI
Moonshot AI publie Kimi-Audio-7B-Instruct, un modèle multimodal audio open-weights de 7 milliards de paramètres disponible sur Hugging Face.
26 avr. · OPINION
OpenAI publie cinq principes directeurs pour sa mission vers l'AGI
Sam Altman détaille les principes qui orientent la stratégie d'OpenAI dans sa quête d'une intelligence artificielle générale bénéfique pour l'humanité.
24 avr. · OUTILS
DeepSeek-V4 : un contexte d'un million de tokens réellement exploitable par les agents
Hugging Face détaille DeepSeek-V4, un modèle offrant une fenêtre de contexte d'un million de tokens pensée pour un usage agent fiable et efficace.
26 avr. · OUTILS
Eden AI – Une alternative européenne à OpenRouter
Eden AI se positionne comme un agrégateur d'APIs d'IA à la façon d'OpenRouter, mais ancré en Europe et orienté conformité.
25 avr. · OPINION
Ce qui manque au récit 'agentique' : un rôle d'agent utilisateur bien défini
Les systèmes d'IA agentiques se déploient sans que le rôle de représentant de l'utilisateur ne soit clairement défini, créant un vide de gouvernance.
25 avr. · OUTILS
Une wiki LLM façon Karpathy maintenue par des agents (Markdown et Git)
Un système open-source où des agents IA gèrent automatiquement une base de connaissances Markdown versionnée sous Git, inspiré du style pédagogique de Karpathy.
25 avr. · OUTILS
VT Code : agent de codage TUI en Rust avec support multi-fournisseurs
Un agent de codage en ligne de commande, écrit en Rust, capable d'interagir avec plusieurs fournisseurs LLM depuis le terminal.
24 avr. · MARCHÉ
Google prévoit d'investir jusqu'à 40 milliards de dollars dans Anthropic
Un accord massif qui renforcerait encore la position de Google comme principal bailleur de fonds du laboratoire créateur de Claude.
24 avr. · MARCHÉ
Google investit jusqu'à 40 milliards de dollars dans Anthropic
Alphabet renforce massivement sa mise sur Anthropic, portant son engagement total à 40 milliards de dollars dans le développeur de Claude.
24 avr. · MARCHÉ
Tesla révèle discrètement l'acquisition d'un fabricant de matériel IA pour 2 milliards de dollars
L'information, enfouie dans un dépôt 10-Q, confirme un investissement massif de Tesla dans l'infrastructure matérielle dédiée à l'IA.
24 avr. · OUTILS
OpenAI lance GPT-5.5 et GPT-5.5 Pro via son API
OpenAI déploie deux nouveaux modèles dans son API : GPT-5.5 et GPT-5.5 Pro, disponibles pour les développeurs.
24 avr. · RÉGULATION
La politique de Wikipédia sur l'intelligence artificielle
Wikipédia formalise sa position sur l'usage de l'IA dans la contribution et la modération de ses contenus encyclopédiques.
23 avr. · SAFETY
Un groupe Discord non autorisé aurait accédé au modèle Mythos d'Anthropic
Selon un rapport, des individus non habilités auraient obtenu l'accès à Mythos, l'outil IA cybersécurité confidentiel d'Anthropic.
23 avr. · RECHERCHE
LoRA revisité : panorama technique du fine-tuning efficace pour grands modèles
Une revue analytique de LoRA sous l'angle du traitement du signal, couvrant architectures, optimisation et déploiement des LLM.
23 avr. · OUTILS
Travailler avec Codex : guide de prise en main
OpenAI publie un guide pas-à-pas pour configurer Codex, gérer des projets et des fichiers, et automatiser des tâches de développement.
24 avr. · OUTILS
DeepSeek V4 : presque au niveau frontier, à une fraction du prix
DeepSeek publie deux modèles open-weights en preview — V4-Pro (1,6T paramètres) et V4-Flash — avec des tarifs très agressifs.
23 avr. · OPINION
La tarification des LLM n'a jamais eu de sens
Un article d'opinion décortique les incohérences structurelles des modèles de prix pratiqués par les fournisseurs de LLM.
23 avr. · SAFETY
GPT-5.5 Bio Bug Bounty : un programme de red-teaming sur les risques biologiques
OpenAI lance un bug bounty dédié à la biosécurité de GPT-5.5, avec des récompenses allant jusqu'à 25 000 dollars pour qui découvre des jailbreaks universels.
23 avr. · SAFETY
Postmortem d'Anthropic sur les problèmes de qualité récents de Claude Code
Anthropic publie une analyse post-incident sur les dérives de comportement signalées dans Claude Code fin avril 2025.
23 avr. · SAFETY
Fiche système GPT-5.5 : OpenAI publie la documentation de son nouveau modèle
OpenAI dévoile la system card officielle de GPT-5.5, détaillant les évaluations de sécurité, les capacités et les limites du modèle.
23 avr. · OUTILS
Présentation de GPT-5.5, le nouveau modèle phare d'OpenAI
OpenAI lance GPT-5.5, présenté comme son modèle le plus performant à ce jour, optimisé pour le code, la recherche et l'analyse de données.
23 avr. · SIGNAL
Meta surveille les frappes clavier de ses employés sur Google, LinkedIn et Wikipedia pour entraîner ses IA
Meta aurait mis en place un programme de collecte de données via le monitoring des employés sur des sites tiers pour alimenter ses modèles d'IA.
22 avr. · SAFETY
ChatGPT aurait conseillé au tireur de la FSU l'heure et le lieu de l'attaque
Selon le Washington Post, le suspect de la fusillade à Florida State University aurait utilisé ChatGPT pour planifier son attaque.
22 avr. · MARCHÉ
Une startup IA aide à faire annuler des refus de remboursement d'assurance maladie
Une jeune pousse américaine utilise l'IA pour contester les refus de prise en charge des assureurs santé, avec le soutien de Mark Cuban.
22 avr. · OUTILS
ChatGPT introduit des agents de travail propulsés par Codex
OpenAI lance des « workspace agents » dans ChatGPT : des agents autonomes basés sur Codex pour automatiser des workflows complexes en équipe.
21 avr. · MARCHÉ
Anthropic lève 5 Md$ auprès d'Amazon et s'engage à dépenser 100 Md$ dans le cloud
Un accord massif lie désormais Anthropic à AWS : 5 milliards de dollars d'investissement contre une promesse de 100 milliards de dépenses cloud.
22 avr. · SAFETY
Anthropic enquête sur un accès non autorisé à son puissant modèle Mythos
Anthropic ouvre une enquête interne après la détection d'un accès non autorisé à Mythos, l'un de ses modèles d'IA les plus puissants.
21 avr. · MARCHÉ
SpaceX annonce un accord pour acquérir Cursor pour 60 milliards de dollars
SpaceX aurait conclu un accord pour racheter l'éditeur de code assisté par IA Cursor dans une opération valorisée à 60 milliards de dollars.
21 avr. · OUTILS
OpenAI lance ChatGPT Images 2.0 avec un rendu texte amélioré
OpenAI déploie une nouvelle version de son module de génération d'images dans ChatGPT, avec un meilleur rendu du texte, le support multilingue et un raisonnement visuel avancé.
22 avr. · OUTILS
Mistral AI lance Voxtral, son modèle TTS multilingue
Mistral dévoile Voxtral TTS, un modèle de synthèse vocale multilingue performant en open-weights.
16 avr. · SIGNAL
Anthropic lance Claude Opus 4.7
Anthropic dévoile Claude Opus 4.7, une nouvelle version de son modèle phare alliant capacités avancées de raisonnement et performance accrue.
7 avr. · SAFETY
Project Glasswing : Anthropic restreint l'accès à Claude Mythos aux chercheurs en sécurité
Trop puissant pour une diffusion publique, Claude Mythos n'est accessible qu'à un cercle restreint de partenaires triés sur le volet.
2 avr. · OUTILS
Gemma 4 : intelligence multimodale frontier pour les appareils embarqués
Google lance Gemma 4, une nouvelle famille de modèles multimodaux open-weights conçus pour tourner directement sur les appareils.
2 avr. · OUTILS
Gemma 4 : les modèles open-weights les plus performants par octet selon DeepMind
DeepMind publie Gemma 4, sa nouvelle génération de modèles open-weights conçus pour le raisonnement avancé et les workflows agentiques.
16 avr. · OUTILS
OpenAI lance GPT-Rosalind pour la recherche en sciences du vivant
Un modèle de raisonnement frontier dédié à la découverte de médicaments, à la génomique et à l'analyse de protéines.

← Tous les mois