π 4 tipos: fato, decisao, padrao, preferencia
Long-term nao e uma gaveta so. Quatro tipos de entrada tem caracteristicas diferentes e devem ser buscados de forma diferente.
ποΈ Os 4 tipos
Cada um tem formato e busca proprios:
- β’FATO: como algo e. 'Usamos Postgres 15 com pgvector.'
- β’DECISAO: escolha feita. 'Escolhemos FastAPI sobre Flask em Jan/26.'
- β’PADRAO: regra recorrente. 'Sempre usar idempotency key em webhook.'
- β’PREFERENCIA: gosto pessoal. 'Prefiro PRs pequenos com commits focados.'
π Impacto em recall
- Flat: 61% recall medio
- Taxonomia 4 tipos: 82% recall (+34%)
- Hierarquia espacial: 95% no nivel mais profundo
π Pesquisado, nunca carregado em bloco
O principio progressive disclosure: 10.000 entradas no disco, 3-5 entram no prompt. 10x economia de tokens.
π Bulk-load vs progressive
BULK-LOAD (errado): Session start ββΆ carrega 10k memorias ββΆ 25k tokens Custo: alto, constante, quase sempre inutil. PROGRESSIVE (certo): Session start ββΆ carrega identidade + contexto (~500 tokens) Usuario pergunta ββΆ busca top 3 relevantes (~1.5k tokens) Total medio: 2k tokens Custo: baixo, variavel com uso real.
π‘ Quando carregar tudo
Quase nunca. A unica excecao razoavel: projeto novo com long-term pequeno (<50 entradas). Nesse caso, bulk-load e honesto.
π Flat vs taxonomia vs grafo
Tres estruturas, tres momentos de vida do sistema. A boa noticia: voce migra quando precisa, nao precisa escolher certo no dia 1.
Flat (0-100 entradas)
Um arquivo knowledge.md append-only. Busca por grep. Zero esforΓ§o, recall 61%.
Taxonomia 4-tipos (100-500)
Pastas por tipo (facts/, decisions/, patterns/, preferences/). Recall 82%.
Grafo com links (500+)
Notas linkam uma para outra. Busca caminha no grafo. Complexidade maior, recall ~95%.
π€ Keyword vs semantica
Keyword (grep) acha termos exatos. Semantica acha conceito. Hibrido e a resposta em quase todo caso real.
β Keyword basta
- βSeu dominio tem termos tecnicos unicos (pgvector, FastAPI)
- βVoce se lembra de frases exatas
- βConhecimento < 200 entradas
- βNao quer manter embeddings
β Precisa semantica
- βVoce pensa por conceito ('a decisao sobre pagamentos')
- βVocabulario varia entre escritores (time grande)
- βConhecimento > 500 entradas
- βDominio conceitual (produto, estrategia)
β Como adicionar entradas
A qualidade do input define a qualidade do output. Tres estrategias, diferentes nivelas de automacao.
π Estrategias de captura
Do mais manual ao mais automatico:
- β’Manual: voce escreve o arquivo. Zero ruido, alta fricΓ§Γ£o.
- β’Hibrido: Claude sugere no fim da sessao, voce aprova. Melhor ratio.
- β’Auto: hook captura tudo. Baixa fricΓ§Γ£o, alto ruido β precisa decay forte.
π‘ Meu voto
Hibrido. Hook gera proposta de entry ao SessionEnd, voce aprova em 5 segundos. Sinal alto, esforΓ§o baixo.
ποΈ Analogia: arquivo fisico
Voce nao carrega o arquivo fisico do escritorio. Quando precisa de documento, levanta e vai buscar na gaveta certa. Long-term funciona igual.
β οΈ Armadilha comum
Inflar CLAUDE.md com conhecimento que deveria estar em long-term. Sintoma: CLAUDE.md > 500 linhas. Solucao: mover 80% para knowledge/ pesquisavel.
π Resumo do Modulo
Proximo:
2.5 β Memoria Episodica (o porque)