π― As 6 decisoes de design
Capture, Format, Structure, Retrieval, Injection, Lifecycle. Seis eixos definem todo sistema de memoria.
Auto: hook captura sempre. Manual: voce decide. Hibrido: Claude sugere, voce aprova.
Hibrido tem melhor sinal/ruido para maioria dos casos.
Capture strategy.
Markdown: humano-primeiro. SQLite: busca estruturada. Vetor: semantica. Cloud: multi-device.
Escolha errada custa retrabalho futuro.
Storage choice.
Flat: simples. Taxonomia 5 tipos: +34% recall. Grafo: +58% em decisoes complexas.
Escolha estrutural sem pensar e a maior fonte de retrabalho.
Topology.
Multi-sinal (keyword + semantico + entidade) reduz 70% em tokens mantendo recall.
Economia linear ao longo de milhares de sessoes.
Hybrid search.
Bulk (tudo sempre): simples, caro. Progressive (identidade sempre, resto busca): 10x economia.
Progressive e o padrao arquitetural definidor de sistemas escalaveis.
Progressive disclosure.
Keep all: cresce sem limite. Decay: velhas somem. Promote best + decay rest: balanΓ§o otimo.
Sem lifecycle, sistema entope e para.
Lifecycle policy.
ποΈ Estrutura: flat, taxonomia, grafo
Como organizar os arquivos. Trade-off: simplicidade vs recall.
memories.md. Toda memoria nova e um paragrafo com data. Busca por grep. 61% recall em testes.
Abandonar flat cedo demais e erro. Comece simples.
Minimum viable memory.
Cinco pastas, uma por tipo. Recall sobe para ~82%.
Melhor retorno por esforΓ§o. Taxonomia fixa vs custo de implementacao zero.
5-type taxonomy.
Pastas aninhadas por projeto -> area -> tema. Recall 95% no nivel mais profundo.
Funciona especialmente bem quando voce tem vaults Obsidian.
Spatial hierarchy.
Notas linkam uma para outra. Busca pode caminhar no grafo. Mais poder, mais complexidade.
Ideal para conhecimento densamente conectado.
Graph memory.
Script de migracao: le memories.md, usa LLM para classificar cada paragrafo em um dos 5 tipos, distribui.
Migrar depois e possivel. Comeca simples, cresce quando precisar.
Migration path.
<100 memorias: flat. 100-500: taxonomia. 500+: hierarquia. Conhecimento denso: grafo.
Regra simples evita debate infinito.
Rule of thumb.
πΎ Backends: do markdown ao Pinecone
Markdown, Obsidian, SQLite, sqlite-vec, ChromaDB, Supabase, Pinecone. Quando vale cada um.
Arquivos .md em pasta. Busca com grep. Backup com git. Humano legivel.
Comece aqui. 80% dos usuarios nao precisam de mais.
Plain markdown.
Mesmos arquivos markdown, mas Obsidian app te da UI, backlinks, grafo, mobile. Claude le via CLI.
Voce ja tem vault pessoal? Reuse. Sinergia enorme.
Two doors pattern.
DB embedded, full-text search otimo. Milhares de memorias com busca <50ms.
Passo natural quando grep fica lento.
FTS5.
Extensao SQLite para vetores + modelo de embedding local. Zero API externa.
Privacidade + offline + gratis. Tripla vitoria.
Local semantic search.
Supabase: Postgres + vetor + auth. Turso: SQLite distribuido. Pinecone: vetor gerenciado.
Util em time ou multi-device. Caro se voce e solo.
Cloud backends.
Tabela com: backend, setup time, privacidade, multi-device, custo, semantica. Voce escolhe linha.
Evita "paralisia por analise" na decisao de infra.
Decision matrix.
βοΈ Multi-sinal: o painel de juizes
Combinacao de keyword, semantica e entidade. Mesma qualidade, 70% menos tokens.
Keyword pega termos exatos. Semantica pega conceito. Entidade pega proper nouns. Juntos cobrem quase tudo.
Bruteforce de 25k tokens vs multi-sinal de 7k. Mesma qualidade.
Signal fusion.
Query -> [keyword, vetor, entidade] -> uniao -> rank por score combinado -> top 3.
Pipeline padrao. Adapta para qualquer backend.
Parallel search, re-rank.
Dominio tecnico com siglas: keyword pesa mais. Dominio conceitual: semantica pesa mais.
Ajuste fino vira o "ultimo 10%" de ganho.
Signal weighting.
Extraia proper nouns de cada memoria (regex simples funciona). Indexe. Boost quando a query menciona.
Entidades sao o sinal mais preciso disponivel.
NER, entity boost.
Bruteforce (tudo no prompt): 25k. Multi-sinal (top 3): 7k. Delta: 18k tokens por sessao.
Soma de 10 sessoes por dia x 200 dias = 36M tokens economizados.
Cost analysis.
Script compact com sqlite-vec + FTS5 + regex entidades. Abre, recebe query, retorna top 3.
Ponto de partida para adaptar.
Reference implementation.
π Decay com salience scoring
Como implementar a curva de Ebbinghaus para sua memoria. Comprime velho, preserva frequente.
Dia 1: detalhe. Dia 7: resumo 50%. Dia 30: one-liner. Dia 90: arquivado. Calibre para seu ritmo.
Compressao sistematica preserva o que importa com menos tokens.
Forgetting curve.
Cada vez que voce busca e clica na memoria, access_count sobe. Decay real = base / access_count.
Memoria valiosa nao some por ser antiga.
Salience formula.
Python que itera memorias, aplica formula, comprime ou arquiva. Cron semanal ou SessionEnd mensal.
Sem execucao regular, decay so vive no papel.
Scheduled compression.
Conservador: 2 semanas. Moderado: 1 semana. Agressivo: 3 dias. Escolha pelo ritmo de trabalho.
Tune pelo seu fingerprint, nao pelo padrao.
Decay speed.
Memoria decaida vai para archive/, nao e apagada. git + archive = seguro.
Ninguem se arrepende de arquivar. Todos se arrependem de deletar.
Soft delete.
Script que imprime: quantas memorias hoje, quantas comprimidas esta semana, quantas arquivadas.
Sem metrica, voce nao sabe se calibrou bem.
Observability.
β¬οΈ Promotion: 3-strikes β CLAUDE.md
A memoria que prova valor vira regra permanente. Padrao vira lei.
Observacao aparece 3x no working/long-term -> script extrai regra -> anexa ao CLAUDE.md -> deleta originais.
Memoria vira sabedoria. Cada regra promovida e um erro nao repetido.
Pattern to rule.
Script roda LLM pequeno (Gemini Flash) para agrupar memorias similares. Cluster com >=3 = candidato.
LLM detecta padroes que regex nao detecta.
LLM clustering.
"Sempre X quando Y" > "Observamos que X". Regra prescritiva e mais acionavel.
Formato afeta se Claude aplica ou ignora.
Rule style.
Script gera PROPOSTA em promotions/pending.md. Voce revisa e aprova com um comando.
CLAUDE.md ruim e pior que CLAUDE.md ausente.
Human-in-the-loop.
Memorias que geraram a regra vao para archive, referenciando a regra. Rastreio preservado.
Se a regra precisar ser revisitada, voce tem as evidencias originais.
Provenance.
3 observacoes sobre usar idempotency key em webhooks -> regra "Sempre usar idempotency key em payment webhook".
Ver o ciclo inteiro concretiza o conceito.
Worked example.