RECHERCHE

Apprendre aux LLMs la correspondance de chaînes et le backtracking pour résoudre des puzzles de manipulation de bits

Une équipe propose une approche sans arithmétique pour entraîner les LLMs à déduire des tables de vérité dans des espaces combinatoires explosifs.

arXiv cs.AI · cs.LG · cs.CL·Prateek Agnihotri, Sanchit Jain, Prabhat Agnihotri, Aditya Prasad·22 juin 2026

Image · Source originale

Des chercheurs présentent une méthode pour le NVIDIA Nemotron Model Reasoning Challenge sur les puzzles de manipulation de bits. Plutôt que de simuler une logique booléenne arithmétique — source d'hallucinations — ils reformulent la déduction de portes logiques en tâche de similarité de chaînes, avec un DFS à backtracking et une récupération autonome d'erreurs. La tokenisation bit-à-bit et un fine-tuning supervisé interactif complètent l'approche.

Chaleur 10

Pertinence 62

Nouveauté 72

OUVRIR LA SOURCE ↗

#LLM #raisonnement #bit-manipulation #backtracking #fine-tuning