SAFETY · Pleias
Toxic Commons : un dataset de contenus toxiques en open-weights par PleIAs
PleIAs publie une collection de données toxiques en accès libre pour la recherche en sécurité et l'alignement des modèles de langage.
Pleias (Hugging Face)·31 octobre 2024

Image · Source originale
Le lab PleIAs met à disposition sur Hugging Face la collection « Toxic Commons », un ensemble de datasets regroupant des contenus toxiques destinés à la recherche en safety et au fine-tuning de modèles. Cette initiative open-data vise à fournir aux chercheurs des ressources standardisées pour mieux détecter, filtrer et contrer les sorties nuisibles des LLM.