Scanner de PII Grátis

Scanner de Privacidade — Encontre e Tarje PII em Qualquer Texto

Cole qualquer texto, clique em Escanear e cada nome, e-mail, telefone, endereço e número de conta é destacado na hora. Copie a versão tarjada — perfeito pra limpar um prompt antes de colar no ChatGPT, Claude ou Gemini. Roda 100% no seu navegador.

Seu texto0 / 50.000
Dados pessoais detectados

Clique em Escanear para destacar cada dado pessoal do seu texto. A IA roda no seu dispositivo.

Sobre Scanner de Privacidade — Encontre e Tarje PII em Qualquer Texto

Se você já se pegou prestes a colar um e-mail de cliente, um rascunho de contrato ou um export do Slack no ChatGPT e parou pra pensar «espera aí, isso pode sair do meu notebook?» — esta ferramenta foi feita exatamente pra esse momento. O Scanner de Privacidade lê qualquer bloco de texto, destaca cada dado pessoal que encontra (nomes, e-mails, telefones, endereços, datas, números de conta, IDs, URLs, organizações e padrões tipo segredo) e te dá, em um clique, uma versão limpa pra colar no LLM que você quiser. O modelo de detecção e o seu texto ficam no seu dispositivo — sem upload, sem cadastro e sem registro do que você escaneou.

Por baixo do capô, o scanner roda o modelo aberto privacy-filter da OpenAI — um fine-tune multilíngue de XLM-RoBERTa treinado especificamente pra reconhecer dados pessoais — através do transformers.js, com aceleração via WebGPU quando disponível e fallback em WebAssembly nos demais casos. O primeiro escaneamento baixa o modelo quantizado em q4 do CDN da Hugging Face (uma vez, fica em cache), e os escaneamentos seguintes começam na hora. Como o modelo é multilíngue, funciona em português, espanhol, alemão, francês, japonês e muitas outras línguas — não só em inglês.

Três modos de tarjamento cobrem os usos mais comuns. «Mascarar» substitui cada entidade por [REDACTED] — o padrão mais seguro quando um humano vai revisar o resultado. «Rotular» substitui pelo tipo da entidade — [PERSON], [EMAIL], [PHONE] — útil quando o LLM precisa entender a estrutura do prompt. «Remover» tira a entidade por completo, ideal para trechos curtos onde você quer o resultado mais enxuto. Escolha o modo que combina com o seu fluxo e copie ou baixe um .txt do texto limpo.

O Scanner de Privacidade é a resposta gratuita pra «vou colar no ChatGPT mesmo». Não substitui uma revisão manual cuidadosa em conteúdo sensível — nenhum modelo de PII é perfeito, e casos limítrofes (nomes só com iniciais, endereços parciais, formatos de ID incomuns) podem escapar. Use como uma primeira camada que pega o óbvio em segundos e leia uma vez antes de enviar. Para PDFs com dados sensíveis, nossa ferramenta Tarjar PDF usa o mesmo motor mas aplica as detecções como retângulos pretos e rasteriza as páginas afetadas no salvamento, então o texto original é destruído — não é só um filtro visual.

Scanner de Privacidade — Encontre e Tarje PII em Qualquer Texto — Perguntas Frequentes

Qual é a diferença entre isto e colar o texto no ChatGPT?

Quando você cola texto sensível no ChatGPT, Claude, Gemini ou qualquer outro LLM em nuvem, esse texto sai do seu dispositivo e vai parar num servidor de terceiro — e dependendo do plano e da configuração, pode ser retido para treinamento. O Scanner de Privacidade roda o modelo de detecção totalmente no seu navegador. O texto não sai do seu dispositivo, não tem cadastro nem conta, e nenhum servidor tem registro do que você escaneou. O propósito da ferramenta é justamente limpar o prompt antes que ele saia daqui.

Que tipos de dados pessoais ele detecta?

Nomes de pessoas (PERSON), endereços de e-mail (EMAIL), telefones (PHONE), endereços (ADDRESS), datas (DATE), números de conta tipo IBAN ou cartão (ACCOUNT), documentos como CPF/passaporte (ID), URLs, nomes de organizações (ORG) e padrões tipo segredo como senhas e chaves de API (SECRET). O modelo subjacente é o privacy-filter da OpenAI, treinado especificamente pra essa tarefa — ele privilegia a detecção, então revise os destaques e copie a versão limpa que melhor servir ao seu uso.

Funciona em outras línguas além do inglês?

Sim. O modelo privacy-filter é multilíngue (baseado no XLM-RoBERTa) e identifica dados pessoais em várias línguas. A qualidade é melhor em línguas com alfabeto latino — português, espanhol, alemão, francês, italiano, holandês — e mais fraca em línguas muito flexivas ou com alfabetos não latinos. Japonês, chinês e árabe funcionam, mas com menos cobertura. Se escanear um documento que não esteja em inglês e perceber que o modelo deixou algo passar, use os modos de tarjamento (Rotular é o mais seguro) e revise manualmente.

O escaneamento é realmente privado?

Sim. O modelo é baixado uma vez do CDN público da Hugging Face e fica em cache no seu navegador. A partir daí, cada escaneamento roda totalmente no seu dispositivo — nenhum texto ou resultado é enviado pra FormatFuse, OpenAI, Google ou qualquer outro servidor. Pode conferir abrindo a aba Network do seu navegador enquanto escaneia: depois do download inicial do modelo, zero requisições saindo. Não temos servidor que pudesse registrar o seu texto, mesmo se quiséssemos.

O que faço com o texto tarjado?

Escolha o modo que combina com o uso. «Mascarar» substitui cada entidade por [REDACTED] — o mais seguro quando um humano vai revisar. «Rotular» troca pelo tipo ([PERSON], [EMAIL] etc.), o melhor quando o LLM ainda precisa entender a estrutura do prompt. «Remover» tira a entidade por completo. Faça sempre uma última leitura antes de enviar — nenhum modelo é perfeito, e às vezes o contexto («o cliente do chamado [REDACTED]») vaza informação indiretamente.

Por que o primeiro escaneamento demora?

No primeiro uso a ferramenta baixa o modelo privacy-filter — cerca de 290 MB com quantização q4, servido pelo CDN da Hugging Face. O navegador deixa em cache, então cada escaneamento seguinte começa na hora (normalmente menos de um segundo pra alguns milhares de caracteres). Se a sua conexão estiver lenta, a barra do botão Escanear mostra a porcentagem. O download é direto entre você e o CDN da Hugging Face — a FormatFuse nunca vê a requisição.

Há limite no que posso escanear?

Há um limite de 50.000 caracteres por escaneamento, principalmente pra entradas muito longas não travarem o navegador. Pra maioria dos usos — e-mails, chamados de suporte, cláusulas de contrato, exports de chat, comentários de código, linhas de CSV — sobra espaço. Pra documentos mais longos, divida em partes e escaneie aos poucos. Não tem cota diária, não tem cadastro e não tem teto de uso — a ferramenta roda no seu dispositivo, então não temos custo pra repassar.

E pra PDFs e outros documentos?

Pra PDFs, use nossa ferramenta Tarjar PDF — usa o mesmo motor privacy-filter no seu dispositivo, mas aplica as detecções como retângulos pretos e rasteriza as páginas afetadas no salvamento, então o texto original é destruído (não é só um filtro visual). Pra imagens com texto, use a ferramenta Imagem para Texto (OCR) pra extrair o texto e cole aqui. Pra documentos do Word e .txt, copie o conteúdo na caixa acima.