Letra da Lei
Voltar ao blog

IA + Direito

Por que o ChatGPT erra no direito brasileiro

Modelos de fronteira produzem texto que parece jurídico — mas alucinam números de artigo, datas de vigência e súmulas inteiras. O problema não está no modelo. Está no contexto.

·3 min de leitura·Equipe Letra da Lei

Pergunte ao ChatGPT qual é o prazo de prescrição para vícios ocultos no Código de Defesa do Consumidor. A resposta vem rápida, em prosa segura, com referência a um número de artigo que não existe — ou que existe, mas trata de outra matéria.

Não é um caso isolado. Em testes que rodamos com Claude, GPT-4 e Gemini, modelos de fronteira inventam citações jurídicas brasileiras em uma fração alarmante das perguntas. O problema não é a inteligência do modelo. É o grounding.

O que é grounding, e por que falta no direito brasileiro

Modelos generativos são treinados em corpora gigantescos da internet aberta. Para o direito americano — com bases públicas como Westlaw, Cornell LII, Justia — há sinal de sobra. Para o direito brasileiro, o sinal é escasso, fragmentado em PDFs do Diário Oficial, atrás de paywalls de plataformas comerciais ou diluído em comentários de blog jurídico.

Três sintomas que todo advogado já viu

  1. Números de artigo invertidos. O modelo cita "Art. 47 do CDC" quando queria dizer "Art. 27". A semântica do texto está próxima — o número, não.
  2. Súmulas inventadas. Súmula 312 do STJ vira citação confiante. Confere com a base oficial: não existe.
  3. Dispositivos revogados tratados como vigentes. O modelo não sabe que aquele artigo foi alterado pela Lei 14.181/2021. Continua respondendo com a redação antiga.

Por que apenas adicionar PDFs não resolve

A primeira reação técnica é: "tudo bem, jogue a CF/88 num RAG e pronto". Não é tão simples.

O direito brasileiro tem estrutura nativa. Caput, parágrafos, incisos, alíneas. Vigência por dispositivo, não por documento inteiro. Citações cruzadas entre leis. Empilhar um PDF num vector store ignora isso e produz chunks que cortam um inciso ao meio.

Cada artigo é a menor unidade citável do direito brasileiro. A IA precisa receber a lei na forma que o advogado lê — não num PDF picado.

Letra da Lei, manifesto interno

O que a Letra da Lei vai fazer diferente

A abordagem que estamos construindo: em vez de empilhar arquivos, vamos indexar artigo por artigo. Cada chunk carrega seus metadados de origem:

{
  "lei": "Lei 8.078/90 (CDC)",
  "artigo": "27",
  "vigencia": "1990-09-12",
  "caput": "...",
  "paragrafos": ["§ 1º — ...", "§ 2º — ..."]
}

Exposto via MCP (Model Context Protocol), o padrão da Anthropic adotado pela indústria. A ideia: quando você perguntar para o Claude sobre prescrição no CDC, ele vai decidir consultar a Letra da Lei automaticamente, receber os artigos relevantes com vigência atualizada, e responder com a citação real.

O recado para o advogado

Você não precisa esperar a próxima geração de modelo. O Claude já é capaz — falta a lei do lado dele. É isso que estamos construindo: você mantém o seu modelo, a gente entrega a letra da lei.

A lista de espera está aberta. Quem entrar agora terá acesso antecipado quando lançarmos.