π Decay: curva de esquecimento
Decay e compressao programada. Memoria nova: detalhe completo. Memoria velha: one-liner. Memoria muito velha: arquivada.
π Curva aplicada
Dia 1: 'Debugamos webhook timeout no endpoint /charge.
Root cause: Lambda payload limit de 6MB.
Fix: chunking em 4MB segments. Deployed staging.'
(80 palavras)
Dia 7: 'Webhook timeout fixado por chunking sob limite Lambda.'
(9 palavras)
Dia 30: 'Webhook chunking fix (Lambda).'
(5 palavras)
Dia 90: [arquivado em archive/2026-Q1/]π Economia acumulada
- Sem decay: 1000 entries Γ 100 palavras = 100k palavras
- Com decay: ~20% detalhado, 40% medio, 40% one-liner β 25k palavras
- Reducao: 75% em storage e tokens de busca
β Salience: frequencia resiste
Salience e o contra-peso do decay. Memoria acessada frequentemente resiste ao envelhecimento.
π Formula simples
Decay com salience:
- β’
age_effective = age_days / salience_factor - β’
salience = 1 + (access_count Γ 0.2) - β’Exemplo: memoria de 30 dias, acessada 5 vezes
- β’β salience = 2.0 β idade efetiva = 15 dias
- β’β ainda no estagio 'summary', nao vira one-liner
π‘ Tracking simples
Cada busca em knowledge/ incrementa access_count no frontmatter. 3 linhas em Python.
β¬οΈ Promotion: 3-strikes β regra
Quando um mesmo padrao aparece 3+ vezes, vira regra prescritiva em CLAUDE.md. A memoria se graduou.
Observacao 1
'Usei idempotency key no webhook da Stripe.' β knowledge/patterns/
Observacao 2
'Idempotency key no webhook de retry.' β knowledge/patterns/
Observacao 3
'Idempotency key no webhook de refund.' β script detecta cluster.
PROMOVIDA
Regra em CLAUDE.md: 'Sempre usar idempotency key em payment webhook.' Observacoes originais arquivadas.
π‘ Sempre com aprovacao
Script cria promotions/pending.md. Voce revisa e aprova. CLAUDE.md ruim e pior que ausente.
ποΈ Progressive disclosure
Principio arquitetural: carrega o minimo essencial sempre, busca o resto por demanda. 10x economia de tokens.
π Backpack vs library card
BACKPACK (carrega tudo sempre): Session start: 25k tokens de memoria Custo por sessao: alto, mesmo sem precisar LIBRARY CARD (carrega indice, busca on-demand): Session start: identidade + contexto = 500 tokens Por pergunta: busca top 3 = 1500 tokens Total medio: 2k tokens Custo: 10x menor, mesma utilidade.
π OrΓ§amento de camadas
- Sempre-ativo: identidade (200) + contexto (400) = 600 tokens
- Pesquisado: long-term top 3 por turno = 1500 tokens
- Working: variavel, 1-2k no meio de sessao
- Episodica: 0 por default, so quando voce pede
π OrΓ§amento de tokens por camada
Cap rigido evita inflacao. Quando estoura, voce REFATORA a camada. Disciplina e parte do design.
β Respeitar os caps
- βIdentidade: β€200 tokens
- βContexto critico: β€400 tokens
- βWorking por sessao: β€2k tokens
- βLong-term injetado por turno: β€1.5k tokens
β Sinais de inflacao
- βIdentidade com 'projeto atual' (vai em contexto)
- βContexto com historico (vai em long-term)
- βWorking sem lifecycle (entope)
- βLong-term carregado em bloco (vira backpack)
π Sintese: a pilha completa
Os 7 niveis resumidos. Voce ja tem o modelo mental que vai usar pelo resto do curso.
π A pilha inteira
ββ ALWAYS ON (cheap, tiny) βββββββββββββββββ β IDENTIDADE ~200 tokens persistente β β CTX CRITICO ~400 tokens sobrevive β β compact β ββ ON DEMAND βββββββββββββββββββββββββββββββ€ β WORKING MEM ~1-2k sessao β ββ SEARCHED ββββββββββββββββββββββββββββββββ€ β LONG-TERM ilimitado nunca bulk β β EPISODICA arquivo raramente β ββ BACKGROUND ββββββββββββββββββββββββββββββ€ β DECAY comprime automaticamente β β PROMOTION padroes viram regras β β PROGRESSIVE min sempre, max on-demand β ββββββββββββββββββββββββββββββββββββββββββββ
π Resumo do Modulo
Proximo:
Trilha 3 β Anatomia dos 18 hooks