RECHERCHE
Apprendre aux LLMs la correspondance de chaînes et le backtracking pour résoudre des puzzles de manipulation de bits
Une équipe propose une approche sans arithmétique pour entraîner les LLMs à déduire des tables de vérité dans des espaces combinatoires explosifs.
arXiv cs.AI · cs.LG · cs.CL·Prateek Agnihotri, Sanchit Jain, Prabhat Agnihotri, Aditya Prasad·22 juin 2026

Image · Source originale
Des chercheurs présentent une méthode pour le NVIDIA Nemotron Model Reasoning Challenge sur les puzzles de manipulation de bits. Plutôt que de simuler une logique booléenne arithmétique — source d'hallucinations — ils reformulent la déduction de portes logiques en tâche de similarité de chaînes, avec un DFS à backtracking et une récupération autonome d'erreurs. La tokenisation bit-à-bit et un fine-tuning supervisé interactif complètent l'approche.