Toutes les news taguées avec ce sujet.
OpenAI détaille ses recommandations pour structurer des évaluations indépendantes des capacités et garde-fous des systèmes IA frontier.
Une étude audite le pluralisme éthique des grands modèles de langage appliqués à la médecine clinique, révélant des biais systématiques dans leurs décisions.
Un paper de position soutient que les méthodes d'assurance comportementale sont structurellement inadaptées aux exigences de vérification imposées par les cadres réglementaires actuels.
Des auditeurs de l'Ontario révèlent que les outils IA de transcription utilisés par les médecins produisent régulièrement des erreurs sur des faits élémentaires.
Des chercheurs formalisent une méthode d'audit de sûreté des LLM applicable quand aucun benchmark labellisé n'existe encore pour un contexte donné.