Horus · Documentação interna

Context Layer: o cérebro jurídico que abastece nossas IAs

Como funciona, por dentro — explicado para qualquer pessoa do time, mesmo sem saber nada de tecnologia.

Atualizado em 23/06/2026 · 8.148 trechos de lei · 7 áreas do Direito · qualidade de busca ~98%

1O que é, em uma frase

O Context Layer é uma biblioteca jurídica viva e organizada que entrega à inteligência artificial o trecho exato da lei certo para cada pergunta — sempre atualizado e com a fonte citada.

Analogia: pense num estagiário paralegal extremamente caprichoso que mantém toda a legislação recortada artigo por artigo, etiquetada e sempre em dia. Quando alguém faz uma pergunta jurídica, ele corre até a estante, pega a página certa e entrega na mão da IA — que então responde com base na lei, e não no "achismo".

Tese por trás disso: hoje o modelo de IA é commodity (qualquer um tem acesso). O que diferencia a Horus é o contexto — a inteligência de dados jurídicos bem curada. É esse o nosso ativo.

2O problema que ele resolve

Uma IA sozinha, sem fonte, tende a inventar (o termo técnico é "alucinar"): cita um artigo que não existe, inventa número de processo, mistura leis. Para um produto jurídico, isso é inaceitável.

O Context Layer elimina isso com uma regra de ouro: a IA só pode responder com base nos trechos reais que a biblioteca entregou, e cada afirmação precisa apontar o artigo de onde saiu. Se a base não sustenta a resposta, a IA é obrigada a dizer isso — em vez de chutar.

Em uma linha: sem Context Layer, a IA é um estagiário confiante e desinformado. Com ele, é um estagiário que sempre cita a fonte.

3As 3 camadas (a biblioteca por dentro)

Por baixo, o Context Layer tem três partes que trabalham juntas:

① Ingestão Porta de entrada. Busca as leis oficiais (Planalto) e evita refazer o que já está na base. ② Conhecimento A estante (o "corpus"). 8.148 trechos de lei, 1 por artigo, prontos p/ busca por significado. ③ Contexto A memória/inteligência. Glossário, histórico de uso e "sinais" de qualidade e mudança.
📥
Camada 1 · Ingestão

De onde vêm as leis

Um robô busca o texto integral e oficial da legislação no site do Planalto. Ele só processa o que mudou (se a lei não mudou, não refaz o trabalho — economiza tempo e custo). Hoje cobre 7 áreas: Trabalhista, Cível, Penal, Consumidor/Bancário, Tributário e Previdenciário.

📚
Camada 2 · Conhecimento

Como a lei fica organizada para a IA

Cada lei é recortada artigo por artigo (ex.: "CLT, Art. 3º"). De cada trecho criamos uma "impressão digital matemática" (o embedding) — uma tradução do significado do texto em números. É isso que permite buscar por sentido, não só por palavra: perguntar "quem é empregador?" encontra o artigo certo mesmo sem usar a palavra exata.

🧠
Camada 3 · Contexto

A inteligência que aprende com o uso

Aqui ficam o glossário de termos jurídicos, o histórico de cada decisão tomada com a IA (quando alguém aceita, edita ou rejeita uma resposta, isso vira aprendizado) e os "sinais" — avisos automáticos quando algo precisa de atenção (uma lei mudou, falta cobertura num assunto, a qualidade caiu).

4Como ele responde a uma pergunta

Quando o Estagiário (ou outro produto) recebe uma dúvida jurídica, acontece isto nos bastidores, em segundos:

  1. Busca dupla na estanteProcuramos os trechos relevantes de dois jeitos ao mesmo tempo: por significado (a impressão digital matemática) e por palavra exata (número do artigo, termo técnico). Os dois resultados são combinados.
  2. Um "juiz" reordena os melhoresUma segunda IA leve (o reranking) lê os ~20 melhores candidatos e os coloca em ordem de relevância para aquela pergunta. É como um revisor que separa "o que realmente responde" do "que só parece".
  3. Resposta aterrada e com fonteA IA escreve a resposta usando apenas esses trechos, citando o artigo e copiando o texto literal. Proibido inventar. Se os trechos não bastam, ela avisa.
  4. O uso vira memóriaA pergunta e a resposta são registradas. Se depois um advogado aceita ou corrige aquela resposta, esse retorno melhora a base — o sistema fica mais inteligente com o tempo.
Por que importa: esse caminho (chamado RAG) é o que garante respostas confiáveis e auditáveis. Toda afirmação pode ser conferida no artigo citado.

5O loop diário que mantém tudo vivo

Todo dia, automaticamente (às 9h), o sistema roda um ciclo de 6 passos. É o que torna a base viva em vez de uma biblioteca empoeirada:

PASSO 1

📥 Atualizar

Re-confere as leis oficiais e absorve o que mudou.

PASSO 2

🔎 Detectar impacto

Se um entendimento foi superado, marca e avisa quem dependia dele.

PASSO 3

📊 Cobertura

Vê onde falta material ou onde a confiança está baixa.

PASSO 4

✨ Enriquecer

Sugere termos de glossário e "certifica" os trechos mais confiáveis.

PASSO 5

🎯 Aprender

Roda uma prova de qualidade e mede o acerto da busca por área.

PASSO 6

📣 Ativar

Resume o dia e empurra os avisos para onde o time trabalha.

Esse desenho segue o "método Atlan": o dado não fica parado esperando ser consultado — ele vai atrás do time quando há algo importante.

6Como ele avisa o time (e os agentes)

No fim do dia, o sistema gera um resumo de inteligência e o entrega nos canais onde as pessoas e as IAs já trabalham:

📊 Painel (Dashboard)Visão de tudo: o que mudou, lacunas, confiança e a tendência de qualidade por área.
💬 WhatsApp / SlackResumo diário direto na conversa (opt-in: só liga se o time quiser).
🔌 Servidor MCPUma "tomada" padrão para qualquer agente de IA puxar contexto certificado na hora. Ver como conectar ↓
🔔 Sinais de alertaSe a qualidade cai ou uma fonte fica desatualizada, dispara aviso automático — ninguém precisa ficar olhando.

7Como provamos que funciona

Não confiamos no "achismo": medimos. Todo dia rodamos uma prova com perguntas de gabarito (sabemos a resposta certa) e checamos se a busca encontra o artigo correto. A métrica principal é o recall — a % de vezes em que o artigo certo aparece entre os melhores resultados.

~98%
acerto médio da busca
7
áreas do Direito
8.148
trechos de lei na base
diário
prova + alerta automático

Acerto da busca, por área (medição real)

ÁreaAcerto (recall)
Cível100%
Consumidor / Bancário100%
Penal100%
Previdenciário100%
Trabalhista96%
Tributário95%

A meta interna era ~80%. Chegamos perto de 100% depois de descobrir e corrigir um problema de organização dos trechos — algo que só apareceu porque medimos. Sem a prova diária, o erro ficaria invisível.

8Quem usa o quê (mapa de conexões)

O Context Layer é uma base compartilhada no centro. À esquerda, quem pergunta (puxa contexto). À direita, quem recebe avisos (o sistema empurra). Cada seta mostra como a conexão é feita.

QUEM PERGUNTA (puxa) QUEM RECEBE (push) Context Layer biblioteca jurídica 8.148 trechos · 7 áreas 🧠 viva · auditável ⭐ O Estagiário Chat jurídico aterrado em lei via Edge Function (HTTP) ⚖️ JurisLab Gestão de escritórios via Edge Function (HTTP) 🤖 Claude / Cursor / agentes Qualquer assistente de IA via MCP (a "tomada" universal) 📊 Dashboard / Painel Tendência e sinais por área 💬 WhatsApp / Slack Resumo diário (opt-in) 📧 E-mail / outros Alertas de mudança/regressão puxa contexto (pergunta → resposta com fonte) recebe avisos (o sistema empurra a inteligência) 🔄 o loop diário alimenta o centro automaticamente

Resumindo: produtos da Horus (Estagiário, JurisLab) puxam contexto por uma porta HTTP interna; qualquer agente de IA de fora pluga pela tomada universal MCP; e os canais (painel, WhatsApp, Slack, e-mail) recebem os resumos e alertas que o sistema empurra todo dia.

9Como conectar a biblioteca em qualquer ferramenta (via MCP)

O MCP (Model Context Protocol) é um padrão universal — pense numa tomada/USB para inteligência artificial. Qualquer ferramenta compatível (Claude Desktop, Claude Code, Cursor, e outras) pode "plugar" no Context Layer e, na hora, ganhar a capacidade de consultar a base jurídica. Não precisa reprogramar nada: é só apontar a ferramenta para o nosso servidor MCP.

O que você ganha ao conectar

Depois de plugado, o agente passa a ter 3 ferramentas novas que ele usa sozinho quando precisa de Direito:

🔍 search_legal_contextFaz uma pergunta jurídica e recebe os trechos de lei mais relevantes, com a citação do artigo + sinais de confiança e de "frescor" (se a norma ainda está vigente).
📋 get_document_statusConfere se uma fonte ainda vale: vigência, se foi revogada/superada, área e nível de certificação. Útil antes de citar.
📖 glossary_lookupConsulta o glossário jurídico (definição, sinônimos, área) para desambiguar um termo.

Como conectar — passo a passo

1

Abra a configuração de MCP da sua ferramenta

No Claude Desktop/Code, Cursor etc., existe um arquivo de configuração de "MCP servers". É onde você lista as tomadas disponíveis.

2

Cole o bloco do servidor "horus-context"

É o trecho abaixo. Ele diz à ferramenta como iniciar o servidor e quais credenciais usar.

3

Preencha as 3 credenciais (secrets)

Endereço da base + a chave de serviço do banco + a chave da OpenAI (usada para a busca por significado). Peça ao time técnico — elas ficam no cofre de segredos, não no documento.

4

Reinicie a ferramenta

Ao reabrir, as 3 ferramentas jurídicas aparecem disponíveis. Pronto: o agente já consulta a base.

configuração do MCP — bloco "horus-context"
{
  "mcpServers": {
    "horus-context": {
      "command": "pnpm",
      "args": ["--filter", "@horus/context-mcp", "start"],
      "env": {
        "SUPABASE_URL": "https://awayzohsotdxleimgnef.supabase.co",
        "SUPABASE_SERVICE_ROLE_KEY": "<pedir ao time — fica no cofre>",
        "OPENAI_API_KEY": "<pedir ao time — fica no cofre>"
      }
    }
  }
}

// Em produtos próprios (web/app), em vez do MCP usa-se a porta HTTP interna (a Edge Function legal-rag-query), que já entrega a resposta pronta e aterrada. O MCP é o caminho para agentes e ferramentas de terceiros.

⚠️ Segurança e LGPD: a chave de serviço dá acesso amplo ao banco — por isso o servidor MCP só deve rodar em ambiente confiável (a máquina de quem opera). Para uso externo ou multiusuário, ele é colocado atrás de uma camada de autenticação. E, por desenho, o MCP só serve o corpus público (legislação) — nunca dados de cliente.

Em uma frase

Conectar = colar um bloco de configuração + 3 chaves → e qualquer agente de IA passa a "saber Direito" puxando da nossa biblioteca, com fonte citada.

10Glossário rápido (sem medo dos termos)

Corpus
O acervo de textos de lei organizado para a IA usar. Nossa "estante".
Chunk (trecho)
Um pedaço da lei — no nosso caso, geralmente um artigo inteiro.
Embedding (impressão digital)
A tradução do significado de um texto em números, para o computador buscar por sentido e não só por palavra.
RAG (busca + resposta aterrada)
O método de primeiro buscar os trechos reais e só então responder com base neles. É o que evita a IA inventar.
Reranking (o juiz)
Uma segunda passada que reordena os melhores trechos por relevância à pergunta, melhorando a precisão.
Recall (acerto)
A medida de qualidade: com que frequência o artigo certo aparece entre os melhores resultados.
Alucinação
Quando a IA inventa uma informação que parece verdadeira mas não é. O Context Layer existe para impedir isso.
MCP
Um "padrão de tomada" universal para conectar agentes de IA a fontes de dados — como uma USB para inteligência artificial.
Edge Function
Uma pequena porta de programa na nuvem que os produtos próprios chamam para obter a resposta jurídica pronta.
Sinal
Um aviso automático gerado pela base quando há algo a fazer (lei mudou, falta cobertura, qualidade caiu).