π₯ Capture: como memorias entram
Primeira decisao: quem decide o que vira memoria?
ποΈ Tres filosofias
Em ordem de automacao:
- β’Manual (journal): voce escreve cada entry. Zero ruido, alta fricΓ§Γ£o.
- β’Auto (security camera): hook grava tudo. Baixa fricΓ§Γ£o, alto ruido.
- β’Hibrido (spam filter): Claude sugere, voce aprova. Ratio otimo.
π‘ Recomendacao
ComeΓ§ar hibrido. SessionEnd propoe 3-5 entries, voce aprova em 30 segundos. Depois de 2 semanas, voce sabe se quer mais ou menos automacao.
πΎ Format: onde as memorias vivem
Segunda decisao: storage. Cada opcao tem trade-offs claros.
π¦ 5 opcoes praticas
Do mais simples ao mais robusto:
- β’Markdown puro: arquivos .md em pasta. Zero dependencia.
- β’Obsidian: markdown + UI + mobile. Humano-primeiro.
- β’SQLite: busca FTS5 rapida, local, zero infra.
- β’sqlite-vec: mesmo SQLite + semantica local.
- β’Cloud (Supabase/Pinecone): multi-device, multi-user.
π‘ Escolha pela fase
0-100 memorias: markdown. 100-500: markdown ou SQLite. 500+: SQLite com vec. 1000+: avaliar cloud. Detalhes no modulo 5.3.
π§± Structure: flat, taxonomia, grafo
Terceira decisao: topologia. Numeros duros de recall.
π Recall medido por estrutura
- Flat (um arquivo): 61% recall medio
- Taxonomia 4-tipos: 82% recall (+34%)
- Hierarquia espacial: 95% recall
- Grafo com backlinks: ~95% com inferencias
- Fonte: testes comparativos em datasets de 500+ entries
π‘ Progressao natural
Comece flat. Migre quando recall cair. Nao super-engenheirar estrutura antes de ter conteudo.
π Retrieval: keyword, semantica, hibrido
Quarta decisao: como buscar. Economia dramatica de tokens.
π Comparativo de retrieval
- Bulk-load (tudo sempre): 25k tokens/sessao
- Keyword (grep): 8k tokens, 70% recall
- Semantica (embeddings): 8k tokens, 85% recall
- Hibrido (multi-sinal): 7k tokens, 92% recall
π‘ Multi-sinal ganha
Keyword + semantica + entidade combinadas. Modulo 5.4 detalha implementacao.
π Injection: como o prompt recebe
Quinta decisao: quando e quanto injetar.
π Duas estrategias
Oposicao classica:
- β’Backpack: carrega tudo em toda sessao. Simples, caro, previsivel.
- β’Library card: carrega indice minimo, busca por demanda. Complexo, barato, adaptativo.
- β’Vencedor quase sempre: library card. Economia de 10x em tokens.
π‘ Progressive disclosure
Principio: sempre-ativo minimo (identidade + contexto), resto busca on-demand. Padrao em qualquer sistema escalavel.
β»οΈ Lifecycle: decay + promotion
Sexta decisao: como envelhecer.
β Com lifecycle
- βMemorias velhas compressam automaticamente
- βPadroes repetidos viram regras permanentes
- βStorage cresce controlado
- βSistema se auto-cuida
β Sem lifecycle
- βMemoria cresce sem limite
- βBusca fica lenta com volume
- βPadroes relevantes se perdem em ruido
- βSistema vira lixao
π Resumo do Modulo
Proximo:
5.2 β Estrutura: flat vs taxonomia vs grafo