MODULO 5.1

🎯 As 6 decisoes de design

Capture, Format, Structure, Retrieval, Injection, Lifecycle. Seis eixos independentes que definem QUALQUER sistema de memoria.

6
Topicos
35
Minutos
Design
Nivel
Fundamentos
Tipo
1

πŸ“₯ Capture: como memorias entram

Primeira decisao: quem decide o que vira memoria?

πŸŽ™οΈ Tres filosofias

Em ordem de automacao:

  • β€’Manual (journal): voce escreve cada entry. Zero ruido, alta fricΓ§Γ£o.
  • β€’Auto (security camera): hook grava tudo. Baixa fricΓ§Γ£o, alto ruido.
  • β€’Hibrido (spam filter): Claude sugere, voce aprova. Ratio otimo.

πŸ’‘ Recomendacao

ComeΓ§ar hibrido. SessionEnd propoe 3-5 entries, voce aprova em 30 segundos. Depois de 2 semanas, voce sabe se quer mais ou menos automacao.

2

πŸ’Ύ Format: onde as memorias vivem

Segunda decisao: storage. Cada opcao tem trade-offs claros.

πŸ“¦ 5 opcoes praticas

Do mais simples ao mais robusto:

  • β€’Markdown puro: arquivos .md em pasta. Zero dependencia.
  • β€’Obsidian: markdown + UI + mobile. Humano-primeiro.
  • β€’SQLite: busca FTS5 rapida, local, zero infra.
  • β€’sqlite-vec: mesmo SQLite + semantica local.
  • β€’Cloud (Supabase/Pinecone): multi-device, multi-user.

πŸ’‘ Escolha pela fase

0-100 memorias: markdown. 100-500: markdown ou SQLite. 500+: SQLite com vec. 1000+: avaliar cloud. Detalhes no modulo 5.3.

3

🧱 Structure: flat, taxonomia, grafo

Terceira decisao: topologia. Numeros duros de recall.

πŸ“Š Recall medido por estrutura

  • Flat (um arquivo): 61% recall medio
  • Taxonomia 4-tipos: 82% recall (+34%)
  • Hierarquia espacial: 95% recall
  • Grafo com backlinks: ~95% com inferencias
  • Fonte: testes comparativos em datasets de 500+ entries

πŸ’‘ Progressao natural

Comece flat. Migre quando recall cair. Nao super-engenheirar estrutura antes de ter conteudo.

4

πŸ” Retrieval: keyword, semantica, hibrido

Quarta decisao: como buscar. Economia dramatica de tokens.

πŸ“Š Comparativo de retrieval

  • Bulk-load (tudo sempre): 25k tokens/sessao
  • Keyword (grep): 8k tokens, 70% recall
  • Semantica (embeddings): 8k tokens, 85% recall
  • Hibrido (multi-sinal): 7k tokens, 92% recall

πŸ’‘ Multi-sinal ganha

Keyword + semantica + entidade combinadas. Modulo 5.4 detalha implementacao.

5

πŸ’‰ Injection: como o prompt recebe

Quinta decisao: quando e quanto injetar.

πŸ“ Duas estrategias

Oposicao classica:

  • β€’Backpack: carrega tudo em toda sessao. Simples, caro, previsivel.
  • β€’Library card: carrega indice minimo, busca por demanda. Complexo, barato, adaptativo.
  • β€’Vencedor quase sempre: library card. Economia de 10x em tokens.

πŸ’‘ Progressive disclosure

Principio: sempre-ativo minimo (identidade + contexto), resto busca on-demand. Padrao em qualquer sistema escalavel.

6

♻️ Lifecycle: decay + promotion

Sexta decisao: como envelhecer.

βœ“ Com lifecycle

  • βœ“Memorias velhas compressam automaticamente
  • βœ“Padroes repetidos viram regras permanentes
  • βœ“Storage cresce controlado
  • βœ“Sistema se auto-cuida

βœ— Sem lifecycle

  • βœ—Memoria cresce sem limite
  • βœ—Busca fica lenta com volume
  • βœ—Padroes relevantes se perdem em ruido
  • βœ—Sistema vira lixao

πŸ“ Resumo do Modulo

βœ“
6 eixos independentes β€” voce escolhe em cada um.
βœ“
Combinacoes geram arquiteturas β€” milhares de sistemas possiveis.
βœ“
Comecar simples, evoluir β€” YAGNI aplicado a memoria.
βœ“
Cada escolha custa β€” complexidade vs benefit mensurado.

Proximo:

5.2 β€” Estrutura: flat vs taxonomia vs grafo