GradMem: Writing Context into LLM Memory via Test-Time Gradient Descent

March 30, 2026Posted by Federico Ulfo

GradMem: Writing Context into LLM Memory via Test-Time Gradient Descent, GradMem introduces writing context into memory using test-time gradient descent rather than forward-pass encoding. By optimizing memory tokens with a reconstruction loss, a frozen model can compress long contexts into small memory without the lossy limitations of existing approaches.