Question 1

Qual é a diferença entre isto e colar o texto no ChatGPT?

Accepted Answer

Quando você cola texto sensível no ChatGPT, Claude, Gemini ou qualquer outro LLM em nuvem, esse texto sai do seu dispositivo e vai parar num servidor de terceiro — e dependendo do plano e da configuração, pode ser retido para treinamento. O Scanner de Privacidade roda o modelo de detecção totalmente no seu navegador. O texto não sai do seu dispositivo, não tem cadastro nem conta, e nenhum servidor tem registro do que você escaneou. O propósito da ferramenta é justamente limpar o prompt antes que ele saia daqui.

Question 2

Que tipos de dados pessoais ele detecta?

Accepted Answer

Nomes de pessoas (PERSON), endereços de e-mail (EMAIL), telefones (PHONE), endereços (ADDRESS), datas (DATE), números de conta tipo IBAN ou cartão (ACCOUNT), documentos como CPF/passaporte (ID), URLs, nomes de organizações (ORG) e padrões tipo segredo como senhas e chaves de API (SECRET). O modelo subjacente é o privacy-filter da OpenAI, treinado especificamente pra essa tarefa — ele privilegia a detecção, então revise os destaques e copie a versão limpa que melhor servir ao seu uso.

Question 3

Funciona em outras línguas além do inglês?

Accepted Answer

Sim. O modelo privacy-filter é multilíngue (baseado no XLM-RoBERTa) e identifica dados pessoais em várias línguas. A qualidade é melhor em línguas com alfabeto latino — português, espanhol, alemão, francês, italiano, holandês — e mais fraca em línguas muito flexivas ou com alfabetos não latinos. Japonês, chinês e árabe funcionam, mas com menos cobertura. Se escanear um documento que não esteja em inglês e perceber que o modelo deixou algo passar, use os modos de tarjamento (Rotular é o mais seguro) e revise manualmente.

Question 4

O escaneamento é realmente privado?

Accepted Answer

Sim. O modelo é baixado uma vez do CDN público da Hugging Face e fica em cache no seu navegador. A partir daí, cada escaneamento roda totalmente no seu dispositivo — nenhum texto ou resultado é enviado pra FormatFuse, OpenAI, Google ou qualquer outro servidor. Pode conferir abrindo a aba Network do seu navegador enquanto escaneia: depois do download inicial do modelo, zero requisições saindo. Não temos servidor que pudesse registrar o seu texto, mesmo se quiséssemos.

Question 5

O que faço com o texto tarjado?

Accepted Answer

Escolha o modo que combina com o uso. «Mascarar» substitui cada entidade por [REDACTED] — o mais seguro quando um humano vai revisar. «Rotular» troca pelo tipo ([PERSON], [EMAIL] etc.), o melhor quando o LLM ainda precisa entender a estrutura do prompt. «Remover» tira a entidade por completo. Faça sempre uma última leitura antes de enviar — nenhum modelo é perfeito, e às vezes o contexto («o cliente do chamado [REDACTED]») vaza informação indiretamente.

Question 6

Por que o primeiro escaneamento demora?

Accepted Answer

No primeiro uso a ferramenta baixa o modelo privacy-filter — cerca de 290 MB com quantização q4, servido pelo CDN da Hugging Face. O navegador deixa em cache, então cada escaneamento seguinte começa na hora (normalmente menos de um segundo pra alguns milhares de caracteres). Se a sua conexão estiver lenta, a barra do botão Escanear mostra a porcentagem. O download é direto entre você e o CDN da Hugging Face — a FormatFuse nunca vê a requisição.

Question 7

Há limite no que posso escanear?

Accepted Answer

Há um limite de 50.000 caracteres por escaneamento, principalmente pra entradas muito longas não travarem o navegador. Pra maioria dos usos — e-mails, chamados de suporte, cláusulas de contrato, exports de chat, comentários de código, linhas de CSV — sobra espaço. Pra documentos mais longos, divida em partes e escaneie aos poucos. Não tem cota diária, não tem cadastro e não tem teto de uso — a ferramenta roda no seu dispositivo, então não temos custo pra repassar.

Question 8

E pra PDFs e outros documentos?

Accepted Answer

Pra PDFs, use nossa ferramenta Tarjar PDF — usa o mesmo motor privacy-filter no seu dispositivo, mas aplica as detecções como retângulos pretos e rasteriza as páginas afetadas no salvamento, então o texto original é destruído (não é só um filtro visual). Pra imagens com texto, use a ferramenta Imagem para Texto (OCR) pra extrair o texto e cole aqui. Pra documentos do Word e .txt, copie o conteúdo na caixa acima.

Scanner de Privacidade — Encontre e Tarje PII em Qualquer Texto

Sobre Scanner de Privacidade — Encontre e Tarje PII em Qualquer Texto

Ferramentas Relacionadas

Experimente outros apps da RayLabs

Tire uma foto. Tenha um evento na agenda.