RAG com citação de página e linha

Curadoria documental verificável, sem alucinação.

O VeriCura extrai, valida e vetoriza processos, certidões e balanços pela posição exata na página — não por adivinhação estatística. Cada resposta da IA aponta o pixel de origem; cada decisão carrega quem a tomou.

100% offlinena Local Edition — sigilo por design
H > IA > Thumano sempre vence a máquina
Até o pixelproveniência de toda informação
Balanço patrimonial · exercício 2023fls. 142
ContaDébitoCrédito
Caixa geral165,00
Receita de serviços9.480,00
Total geral136.058,59136.058,59
região · título · y:0.118
tabela · débito = crédito ✓
assinatura · revisão humana
“Qual o total geral do exercício de 2023?”
R$ 136.058,59, conforme balanço patrimonial validado.
▣ fls. 142 · região tabela · linha 4
PROJETADO PARA AUDITORIA INQUESTIONÁVEL
Tribunais de ContasSecretarias de FazendaConselhos profissionais Escritórios jurídicosAuditorias independentes
O problema do mercado // x:0 y:1

Soluções genéricas repassam custo e inventam dados.

Plataformas convencionais terceirizam tudo para APIs caras de visão computacional e tropeçam em PDFs mal formatados — gerando respostas que parecem certas, mas não são. Em peça jurídica ou contábil, isso é fatal.

Abordagem convencional

Caixa-preta cara

  • Custo de API de visão repassado a cada página processada.
  • Alucinação ao interpretar documentos mal estruturados.
  • Dados sensíveis trafegando pela internet, fora do seu controle.
  • Nenhuma prova de onde, na página, a informação foi extraída.
  • CPFs e dados pessoais expostos à IA e aos índices de busca.
A abordagem VeriCura

O dado perfeito — e comprovável

  • Coordenadas lógicas: cada campo extraído pela posição na página.
  • Human-in-the-Loop: o curador valida antes do registro definitivo — e a decisão humana sempre prevalece sobre a da IA.
  • Processamento local opcional: o documento não sai do seu ambiente.
  • Resposta com citação: página, região e linha de origem, sempre.
  • LGPD por construção: dado pessoal vira token reversível só por papel autorizado.
Como funciona // fluxo de trabalho

De PDF bruto a conhecimento consultável — com o humano só no resíduo.

O determinístico faz o grosso, barato e auditável. A IA julga, ordena e classifica — nunca inventa valor. O curador confere apenas o que os portões de qualidade marcaram como pendente.

Fluxo de trabalho VeriCura PDF original passa por triagem, extração por coordenadas e portões de qualidade; a IA julga, o humano valida só o resíduo, e o resultado vira base vetorial com citação. PDF original imutável · sha-256 Triagem inteligente classifica página a página digital · scan · híbrido Extração por coordenada o motor certo p/ cada trecho texto · OCR · tabelas bbox + confiança + origem Portões de qualidade fidelidade do que importa números · débito = crédito fraco? re-roteia ↺ Base vetorial + RAG resposta sempre com citação página · região · linha IA local: o juiz ordena e classifica — nunca inventa Curador humano confere apenas o resíduo FLUXO VERICURA — DETERMINÍSTICO NO GROSSO · IA NO JULGAMENTO · HUMANO NO RESÍDUO
Lê-se: a máquina decide o método certo página a página, valida com critérios objetivos e devolve para outro motor quando o resultado é fraco. O humano entra apenas onde a confiança não fecha — e a decisão dele prevalece.
ETAPA 01

Ingestão

Cada documento é registrado por impressão digital criptográfica (SHA-256) e o original fica imutável — a fonte de fé de todo o processo.

ETAPA 02

Coordenadas lógicas

Cada campo é localizado pela geometria na página: título, tabela, assinatura, carimbo — tudo com posição, origem e confiança.

ETAPA 03

Validação humana

O curador confirma ou corrige na tela de comparação, lado a lado com o original. Toda ação fica registrada: quem, quando e por quê.

ETAPA 04

Vetorização & RAG

Só o dado validado vira vetor semântico. A IA corporativa responde citando página, região e linha — e você confere em um clique.

Arquitetura // um núcleo, qualquer infraestrutura

O mesmo motor do notebook offline à nuvem Oracle dedicada.

O coração do VeriCura — extração, modelo documental, curadoria e entregáveis — é idêntico em qualquer edição. O que troca é a borda: motores de OCR, banco e armazenamento se conectam por adapters. Híbrido é uma decisão sua, não uma limitação do software.

Arquitetura VeriCura Núcleo único com pipeline, modelo documental e entregáveis; adapters conectam motores locais ou em nuvem; as três edições compartilham a mesma plataforma. Seus PDFs originais imutáveis NÚCLEO VERICURA — IDÊNTICO NAS TRÊS EDIÇÕES Pipeline triagem · extração montagem · validação página a página Modelo documental físico (posição) + lógico (sentido) ligados por proveniência curadoria: H > IA > T trilha de auditoria completa Entregáveis árvore do acervo base RAG com citação PDF remontado legível + versão tarjada (LGPD) Sua IA responde citando ADAPTERS — A BORDA QUE TROCA OCR local (NPU/GPU) OCR em nuvem (OCI) Banco + vetor 26ai Disco ou Object Storage Local Edition 100% offline · custo zero de API Cloud Standard OCI · GPU elástica · pay-as-you-go Enterprise tenancy dedicada · governança extrema MISTURE LIVREMENTE: PROCESSE LOCAL E ARQUIVE NA NUVEM · OU O CONTRÁRIO — A ESCOLHA É DO CLIENTE
Trocar de edição não muda o motor — muda só a borda. Por isso a avaliação que você faz hoje no seu ambiente vale, intacta, quando crescer para a nuvem.
Proveniência até o pixel Da página física à resposta da IA, cada elo aponta o anterior: página, região com coordenadas, trecho vetorizado e resposta com citação verificável. PROVENIÊNCIA ATÉ O PIXEL — O ELO QUE NENHUMA CAIXA-PRETA OFERECE página fls. 142 Região extraída x:0.18 y:0.46 w:0.64 h:0.12 origem: camada de texto · conf. 0,98 coordenada lógica Trecho vetorizado só conteúdo validado e elegível citação embutida no índice base de conhecimento Resposta da IA “R$ 136.058,59 — confira aqui:” ▣ fls. 142 · região tabela · linha 4 um clique abre o original
A seta de volta é o produto: qualquer afirmação da IA se confere no documento original em um clique. Sem rastro, não entra na base.
O produto // a mesa do curador

Original e extração, lado a lado. Clique de um lado, acende do outro.

A tela de curadoria mostra o PDF original com as regiões detectadas e, ao lado, o conteúdo extraído. A seleção é sincronizada nos dois sentidos — inclusive em dois monitores. Dados pessoais aparecem mascarados quando a política LGPD está ativa.

Fila do resíduo

O curador não folheia o acervo: a tela abre direto no que a máquina marcou como pendente — e em mais nada.

Tudo vira trilha

Aprovar, corrigir, tarjar, abrir diligência: cada ação registra autor, horário e motivo. A decisão humana prevalece sobre a da IA.

Painel do acervo

Gestores acompanham em tempo real: documentos por etapa, resíduo humano, diligências abertas e qualidade por origem.

LGPD por construção // dado pessoal vira token

A IA consulta o acervo sem nunca ver um CPF.

O VeriCura detecta dados pessoais (CPF, RG, nomes, contatos) e os substitui por um token criptográfico nas superfícies que você escolher — telas, base de busca ou tudo. O valor real fica em cofre cifrado, reversível apenas por papel autorizado, com cada acesso auditado.

CPF 123.456.789-09
detectado no documento, com posição exata na página
[lgpd:cpf:9f3a1c0d77ab]
token determinístico: o mesmo CPF gera o mesmo token — buscas e cruzamentos continuam possíveis, sem expor o dado
🔒 cofre cifrado
reversão somente por papel autorizado · cada consulta gera registro de auditoria · eliminação definitiva sob demanda

Você escolhe o tratamento

Apenas inventariar, mascarar nas telas, mascarar para a IA, ou mascarar tudo — política por acervo, alinhada ao seu encarregado de dados.

O original não muda

O PDF de origem permanece intacto e lacrado. Versões tarjadas para compartilhamento são derivados gerados sob demanda.

Direito de eliminação

Atendimento ao titular com destruição criptográfica da chave e ata do ato — sem quebrar a integridade do restante do acervo.

Três esteiras de evolução // comece local, cresça soberano

Do appliance local à fortaleza institucional.

Valor imediato com custo zero de infraestrutura no seu ambiente, e transição fluida para a nuvem quando a escala pedir. E como tudo é conectado por adapters, misturar é permitido: processe local e arquive na nuvem, ou use OCR em nuvem num documento específico — a decisão é sempre sua.

EDIÇÃO 01

Local Edition

Edge · privacidade absoluta

Transforma seu equipamento em um appliance de IA 100% offline. Ideal para escritórios jurídicos, auditorias isoladas e acervos sob sigilo.

  • Documentos sensíveis nunca saem do host — sigilo por design.
  • OCR e IA locais (NPU/GPU do equipamento): sem um centavo em APIs pagas.
  • Oracle Database 26ai Free embarcado, sem DBA dedicado.
isolamento físico · armazenamento local
EDIÇÃO 02

Cloud Standard

SaaS na OCI · economia elástica

Para quando o volume cresce e a curadoria precisa de acesso distribuído e colaborativo, sobre a infraestrutura da Oracle Cloud.

  • GPUs sob demanda: ligam na ingestão, desligam ao terminar.
  • Acervo físico no OCI Object Storage; o banco vira puro motor de busca.
  • Oracle Autonomous Database: tuning, patches e backups geridos pela nuvem.
autonomous · WAF · IAM · buckets
EDIÇÃO 03 · FORTALEZA

Enterprise

OCI dedicada · governança extrema

Implantado na tenancy privada do cliente, com soberania total. A esteira para grandes corporações e órgãos de controle.

  • Auditoria em tabelas imutáveis: nem o DBA altera um registro validado.
  • LGPD estrita: criptografia TDE, mascaramento dinâmico e Database Vault.
  • Retenção secular no Archive: 11 noves de durabilidade por 20+ anos.
exadata · data vault · immutable tables
Matriz de implantação // a mesma plataforma, três níveis de maturidade
Dimensão técnicaLocal EditionCloud StandardEnterprise
Motor relacional e vetorialOracle 26ai Free (host local)OCI Autonomous DatabaseAutonomous / Exadata Cloud
Infraestrutura de OCR / IANPU / GPU do equipamentoOCI Compute GPU (elástica)Cluster GPU dedicado (alta disponibilidade)
Repositório físico (PDF/JSON)Disco local, endereçado por hashOCI Object Storage (Standard)Object Storage Archive (20+ anos)
Governança de dadosIsolamento físico (offline)WAF, IAM, backups automáticosImmutable Tables, Data Vault, mascaramento LGPD
Governança & compliance // prova auditável

Rastreabilidade legal inquestionável.

Recursos nativos do Oracle 26ai e da OCI que transformam o acervo documental em prova auditável — e o VeriCura em parte da sua cadeia de custódia.

Tabelas imutáveis

Uma vez validado, o registro do processo não pode ser alterado nem forjado — nem por um administrador com privilégios máximos.

LGPD por design

Tokenização de dados pessoais, criptografia ponta a ponta (TDE), mascaramento dinâmico nas telas e trilhas unificadas de auditoria.

Soberania de dados

Implantação no seu ambiente ou na sua tenancy privada, com controle total e operação 24/7.

Retenção secular

Acervo preservado com 99,999999999% de durabilidade e proteção contra desastres por 20 anos ou mais.

RAG sem alucinação

A IA responde sobre milhares de processos sempre citando página, região e linha — e a citação abre o original.

Custo controlado

Ingestão de custo zero no Edge e GPUs elásticas que ligam só durante o processamento — sem servidor ocioso.

Próximo passo

Comece local. Cresça soberano.

Avalie o VeriCura no seu próprio ambiente, com seus documentos reais, e desenhe a rota de evolução até a nuvem corporativa Oracle no seu ritmo.

Fale conosco // resposta em 1 dia útil

Vamos curar o seu acervo.

Conte sobre o seu cenário de documentos e retornaremos com a edição mais adequada e os próximos passos de uma prova de conceito.

EndereçoAv. Paulista, 1636 — sl. 1105/3205
01310-200 · São Paulo · SP
Resposta em até 1 dia útil · Seus dados não são compartilhados.