SAFETY · Pleias

Toxic Commons : un dataset de contenus toxiques en open-weights par PleIAs

PleIAs publie une collection de données toxiques en accès libre pour la recherche en sécurité et l'alignement des modèles de langage.

Pleias (Hugging Face)·31 octobre 2024

Image · Source originale

Le lab PleIAs met à disposition sur Hugging Face la collection « Toxic Commons », un ensemble de datasets regroupant des contenus toxiques destinés à la recherche en safety et au fine-tuning de modèles. Cette initiative open-data vise à fournir aux chercheurs des ressources standardisées pour mieux détecter, filtrer et contrer les sorties nuisibles des LLM.

Chaleur 0

Pertinence 72

Nouveauté 58

OUVRIR LA SOURCE ↗

#dataset #safety #toxicité #open-data #alignment