Modulo 2.4: Conhecimento de Longo Prazo

📚 4 tipos: fato, decisao, padrao, preferencia

Long-term nao e uma gaveta so. Quatro tipos de entrada tem caracteristicas diferentes e devem ser buscados de forma diferente.

🗂️ Os 4 tipos

Cada um tem formato e busca proprios:

•FATO: como algo e. 'Usamos Postgres 15 com pgvector.'
•DECISAO: escolha feita. 'Escolhemos FastAPI sobre Flask em Jan/26.'
•PADRAO: regra recorrente. 'Sempre usar idempotency key em webhook.'
•PREFERENCIA: gosto pessoal. 'Prefiro PRs pequenos com commits focados.'

📊 Impacto em recall

Flat: 61% recall medio
Taxonomia 4 tipos: 82% recall (+34%)
Hierarquia espacial: 95% no nivel mais profundo

🔎 Pesquisado, nunca carregado em bloco

O principio progressive disclosure: 10.000 entradas no disco, 3-5 entram no prompt. 10x economia de tokens.

📐 Bulk-load vs progressive

BULK-LOAD (errado):
  Session start ─▶ carrega 10k memorias ─▶ 25k tokens
  Custo: alto, constante, quase sempre inutil.

PROGRESSIVE (certo):
  Session start ─▶ carrega identidade + contexto (~500 tokens)
  Usuario pergunta ─▶ busca top 3 relevantes (~1.5k tokens)
  Total medio: 2k tokens
  Custo: baixo, variavel com uso real.

💡 Quando carregar tudo

Quase nunca. A unica excecao razoavel: projeto novo com long-term pequeno (<50 entradas). Nesse caso, bulk-load e honesto.

📁 Flat vs taxonomia vs grafo

Tres estruturas, tres momentos de vida do sistema. A boa noticia: voce migra quando precisa, nao precisa escolher certo no dia 1.

Flat (0-100 entradas)

Um arquivo knowledge.md append-only. Busca por grep. Zero esforço, recall 61%.

Taxonomia 4-tipos (100-500)

Pastas por tipo (facts/, decisions/, patterns/, preferences/). Recall 82%.

Grafo com links (500+)

Notas linkam uma para outra. Busca caminha no grafo. Complexidade maior, recall ~95%.

🔤 Keyword vs semantica

Keyword (grep) acha termos exatos. Semantica acha conceito. Hibrido e a resposta em quase todo caso real.

✓ Keyword basta

✓Seu dominio tem termos tecnicos unicos (pgvector, FastAPI)
✓Voce se lembra de frases exatas
✓Conhecimento < 200 entradas
✓Nao quer manter embeddings

✗ Precisa semantica

✗Voce pensa por conceito ('a decisao sobre pagamentos')
✗Vocabulario varia entre escritores (time grande)
✗Conhecimento > 500 entradas
✗Dominio conceitual (produto, estrategia)

➕ Como adicionar entradas

A qualidade do input define a qualidade do output. Tres estrategias, diferentes nivelas de automacao.

📝 Estrategias de captura

Do mais manual ao mais automatico:

•Manual: voce escreve o arquivo. Zero ruido, alta fricção.
•Hibrido: Claude sugere no fim da sessao, voce aprova. Melhor ratio.
•Auto: hook captura tudo. Baixa fricção, alto ruido — precisa decay forte.

💡 Meu voto

Hibrido. Hook gera proposta de entry ao SessionEnd, voce aprova em 5 segundos. Sinal alto, esforço baixo.

🗄️ Analogia: arquivo fisico

Voce nao carrega o arquivo fisico do escritorio. Quando precisa de documento, levanta e vai buscar na gaveta certa. Long-term funciona igual.

⚠️ Armadilha comum

Inflar CLAUDE.md com conhecimento que deveria estar em long-term. Sintoma: CLAUDE.md > 500 linhas. Solucao: mover 80% para knowledge/ pesquisavel.

📝 Resumo do Modulo

✓

4 tipos de entrada — fato, decisao, padrao, preferencia — +34% recall vs flat.

✓

Progressive disclosure — busca 3-5 relevantes, nunca carrega tudo.

✓

Flat vira taxonomia — migre quando o recall grep cai abaixo de 70%.

✓

Hibrido semantica + keyword — 70% menos tokens com mesma qualidade.

Proximo:

2.5 — Memoria Episodica (o porque)

← Modulo anterior Proximo Modulo →