Toutes les news taguées avec ce sujet.
Une méthode de compression de contexte conversationnel qui maintient une mémoire révisable par fil de discussion, stabilisant latence et perplexité sur des centaines de tours.