MODULO 2.4

πŸ—„οΈ Conhecimento de Longo Prazo

Arquivo fisico da memoria. Ilimitado em tamanho, mas nunca carregado em bloco. Busca por demanda.

6
Topicos
35
Minutos
Medio
Nivel
Camada
Tipo
1

πŸ“š 4 tipos: fato, decisao, padrao, preferencia

Long-term nao e uma gaveta so. Quatro tipos de entrada tem caracteristicas diferentes e devem ser buscados de forma diferente.

πŸ—‚οΈ Os 4 tipos

Cada um tem formato e busca proprios:

  • β€’FATO: como algo e. 'Usamos Postgres 15 com pgvector.'
  • β€’DECISAO: escolha feita. 'Escolhemos FastAPI sobre Flask em Jan/26.'
  • β€’PADRAO: regra recorrente. 'Sempre usar idempotency key em webhook.'
  • β€’PREFERENCIA: gosto pessoal. 'Prefiro PRs pequenos com commits focados.'

πŸ“Š Impacto em recall

  • Flat: 61% recall medio
  • Taxonomia 4 tipos: 82% recall (+34%)
  • Hierarquia espacial: 95% no nivel mais profundo
2

πŸ”Ž Pesquisado, nunca carregado em bloco

O principio progressive disclosure: 10.000 entradas no disco, 3-5 entram no prompt. 10x economia de tokens.

πŸ“ Bulk-load vs progressive

BULK-LOAD (errado):
  Session start ─▢ carrega 10k memorias ─▢ 25k tokens
  Custo: alto, constante, quase sempre inutil.

PROGRESSIVE (certo):
  Session start ─▢ carrega identidade + contexto (~500 tokens)
  Usuario pergunta ─▢ busca top 3 relevantes (~1.5k tokens)
  Total medio: 2k tokens
  Custo: baixo, variavel com uso real.

πŸ’‘ Quando carregar tudo

Quase nunca. A unica excecao razoavel: projeto novo com long-term pequeno (<50 entradas). Nesse caso, bulk-load e honesto.

3

πŸ“ Flat vs taxonomia vs grafo

Tres estruturas, tres momentos de vida do sistema. A boa noticia: voce migra quando precisa, nao precisa escolher certo no dia 1.

1

Flat (0-100 entradas)

Um arquivo knowledge.md append-only. Busca por grep. Zero esforΓ§o, recall 61%.

2

Taxonomia 4-tipos (100-500)

Pastas por tipo (facts/, decisions/, patterns/, preferences/). Recall 82%.

3

Grafo com links (500+)

Notas linkam uma para outra. Busca caminha no grafo. Complexidade maior, recall ~95%.

4

πŸ”€ Keyword vs semantica

Keyword (grep) acha termos exatos. Semantica acha conceito. Hibrido e a resposta em quase todo caso real.

βœ“ Keyword basta

  • βœ“Seu dominio tem termos tecnicos unicos (pgvector, FastAPI)
  • βœ“Voce se lembra de frases exatas
  • βœ“Conhecimento < 200 entradas
  • βœ“Nao quer manter embeddings

βœ— Precisa semantica

  • βœ—Voce pensa por conceito ('a decisao sobre pagamentos')
  • βœ—Vocabulario varia entre escritores (time grande)
  • βœ—Conhecimento > 500 entradas
  • βœ—Dominio conceitual (produto, estrategia)
5

βž• Como adicionar entradas

A qualidade do input define a qualidade do output. Tres estrategias, diferentes nivelas de automacao.

πŸ“ Estrategias de captura

Do mais manual ao mais automatico:

  • β€’Manual: voce escreve o arquivo. Zero ruido, alta fricΓ§Γ£o.
  • β€’Hibrido: Claude sugere no fim da sessao, voce aprova. Melhor ratio.
  • β€’Auto: hook captura tudo. Baixa fricΓ§Γ£o, alto ruido β€” precisa decay forte.

πŸ’‘ Meu voto

Hibrido. Hook gera proposta de entry ao SessionEnd, voce aprova em 5 segundos. Sinal alto, esforΓ§o baixo.

6

πŸ—„οΈ Analogia: arquivo fisico

Voce nao carrega o arquivo fisico do escritorio. Quando precisa de documento, levanta e vai buscar na gaveta certa. Long-term funciona igual.

⚠️ Armadilha comum

Inflar CLAUDE.md com conhecimento que deveria estar em long-term. Sintoma: CLAUDE.md > 500 linhas. Solucao: mover 80% para knowledge/ pesquisavel.

πŸ“ Resumo do Modulo

βœ“
4 tipos de entrada β€” fato, decisao, padrao, preferencia β€” +34% recall vs flat.
βœ“
Progressive disclosure β€” busca 3-5 relevantes, nunca carrega tudo.
βœ“
Flat vira taxonomia β€” migre quando o recall grep cai abaixo de 70%.
βœ“
Hibrido semantica + keyword β€” 70% menos tokens com mesma qualidade.

Proximo:

2.5 β€” Memoria Episodica (o porque)