Toutes les news taguées avec ce sujet.
Un nouveau framework réduit de 47 % les tokens consommés par le voting pondéré en filtrant les traces de raisonnement sémantiquement redondantes.
Une simple métrique d'entropie sur le premier token généré rivalise avec les méthodes de self-consistency multiple, à une fraction du coût computationnel.