Escáner de Privacidad — Detecta y Redacta PII en Cualquier Texto
Pega cualquier texto, pulsa Escanear y verás cada nombre, correo, teléfono, dirección y número de cuenta resaltado al instante. Copia la versión redactada — perfecto para limpiar un prompt antes de pegarlo en ChatGPT, Claude o Gemini. Funciona 100% en tu navegador.
IA en tu dispositivo
Ni el modelo ni el texto salen de tu navegador
10 categorías de PII
Nombres, correos, teléfonos, direcciones, IDs y más
Privacidad ante todo
Sin registro, sin subidas, sin tracking del contenido
Pulsa Escanear para resaltar cada dato personal de tu texto. La IA se ejecuta en tu dispositivo.
Sobre Escáner de Privacidad — Detecta y Redacta PII en Cualquier Texto
Si alguna vez has estado a punto de pegar un correo de cliente, un borrador de contrato o un export de Slack en ChatGPT y te has frenado pensando «un momento, ¿esto debería salir de mi portátil?» — esta herramienta existe exactamente para ese momento. El Escáner de Privacidad recorre cualquier bloque de texto, resalta cada dato personal que encuentra (nombres, correos, teléfonos, direcciones postales, fechas, números de cuenta, identificaciones, URL, organizaciones y patrones tipo secreto) y te da, en un clic, una versión limpia que puedes pegar en el LLM que prefieras. El modelo de detección y tu texto se quedan en tu dispositivo — no hay subida, no hay registro, y no hay log de lo que escaneaste.
Por debajo, el escáner ejecuta el modelo abierto privacy-filter de OpenAI — un fine-tune multilingüe de XLM-RoBERTa entrenado específicamente para reconocer datos personales — a través de transformers.js, con aceleración por WebGPU cuando está disponible y respaldo en WebAssembly en caso contrario. El primer escaneo descarga el modelo cuantizado a q4 desde la CDN de Hugging Face (una sola vez, queda en caché), y los siguientes escaneos arrancan al instante. Como el modelo es multilingüe, funciona en español, portugués, alemán, francés, japonés y muchos otros idiomas — no solo en inglés.
Tres modos de redacción cubren los usos más comunes. «Enmascarar» reemplaza cada entidad por [REDACTED] — la opción más segura cuando quieres que un revisor humano vea que algo se quitó pero no qué era. «Etiquetar» reemplaza el valor por su categoría — [PERSON], [EMAIL], [PHONE] — útil cuando el LLM al que enviarás el texto necesita entender la estructura del prompt. «Eliminar» quita la entidad por completo, ideal para fragmentos cortos donde quieres el resultado más limpio. Elige el que encaje con tu flujo y copia o descarga un .txt del texto limpio.
El Escáner de Privacidad es la respuesta gratuita a «mejor lo pego en ChatGPT y ya». No sustituye a una revisión manual cuidadosa para contenido especialmente sensible — ningún modelo de PII es perfecto, y los casos límite (nombres con iniciales, direcciones parciales, formatos de ID raros) pueden colarse. Úsalo como una primera capa que detecta lo evidente en un segundo y luego revisa una vez antes de enviar. Para PDFs con datos sensibles, nuestra herramienta Redactar PDF usa el mismo motor pero aplica los hallazgos como rectángulos negros y rasteriza las páginas afectadas al guardar, así que el texto subyacente desaparece — no es solo un parche visual.
Herramientas Relacionadas
Escáner de Privacidad — Detecta y Redacta PII en Cualquier Texto — Preguntas Frecuentes
¿En qué se diferencia esto de pegar el texto en ChatGPT?
Cuando pegas texto sensible en ChatGPT, Claude, Gemini o cualquier otro LLM en la nube, ese texto sale de tu dispositivo y acaba en un servidor de un tercero — y dependiendo de tu plan y configuración, puede quedarse para entrenamiento. El Escáner de Privacidad ejecuta el modelo de detección íntegramente en tu navegador. El texto nunca sale de tu dispositivo, no hay registro ni cuenta, y ningún servidor tiene constancia de lo que escaneaste. El sentido de la herramienta es justo ese: limpiar el prompt antes de enviarlo.
¿Qué tipos de datos personales detecta?
Nombres de personas (PERSON), direcciones de correo (EMAIL), teléfonos (PHONE), direcciones postales (ADDRESS), fechas (DATE), números de cuenta tipo IBAN o tarjeta (ACCOUNT), identificaciones tipo pasaporte o DNI (ID), URL, nombres de organizaciones (ORG) y patrones tipo secreto como contraseñas o claves de API (SECRET). El modelo de fondo es privacy-filter de OpenAI, entrenado específicamente para esta tarea — prioriza la detección, así que revisa los resaltados y copia la versión limpia que mejor encaje con tu uso final.
¿Funciona en otros idiomas además del inglés?
Sí. El modelo privacy-filter es multilingüe (basado en XLM-RoBERTa) e identifica datos personales en muchos idiomas. La calidad es mejor en lenguas con alfabeto latino — español, portugués, alemán, francés, italiano, neerlandés — y algo más débil en lenguas muy flexivas o con alfabetos no latinos. Japonés, chino y árabe funcionan, pero con menos cobertura. Si escaneas un documento no inglés y notas que el modelo se dejó algo, recurre a los modos de redacción (Etiquetar es el más seguro) y revisa a mano.
¿El escaneo es realmente privado?
Sí. El modelo se descarga una vez desde la CDN pública de Hugging Face y se queda en caché en tu navegador. A partir de ahí, cada escaneo se ejecuta íntegramente en tu dispositivo — ni el texto ni los resultados se envían a FormatFuse, OpenAI, Google ni a ningún otro servidor. Puedes comprobarlo abriendo la pestaña Red de tu navegador mientras escaneas: tras la descarga inicial del modelo no hay ninguna petición saliente. No tenemos servidor que pudiera registrar tu texto aunque quisiéramos.
¿Qué hago con el texto redactado?
Elige el modo de redacción que mejor encaje con tu uso final. «Enmascarar» reemplaza cada entidad por [REDACTED], la opción más segura cuando un humano va a revisar el resultado. «Etiquetar» pone [PERSON], [EMAIL], etc., lo más útil cuando un LLM aún necesita entender la estructura del prompt. «Eliminar» quita la entidad por completo. Haz siempre una última lectura antes de enviar — ningún modelo es perfecto, y a veces el contexto («el cliente del ticket [REDACTED]») filtra información de forma indirecta.
¿Por qué el primer escaneo es lento?
En el primer uso la herramienta descarga el modelo privacy-filter — unos 290 MB a cuantización q4, servidos desde la CDN de Hugging Face. Tu navegador lo cachea después, así que cada escaneo siguiente arranca al instante (normalmente menos de un segundo para unos miles de caracteres). Si tu red es lenta, la barra de progreso del botón Escanear muestra el porcentaje. La descarga es directa entre tú y la CDN de Hugging Face — FormatFuse nunca ve la petición.
¿Hay límite a lo que puedo escanear?
Hay un límite de 50.000 caracteres por escaneo, sobre todo para que entradas muy largas no bloqueen el navegador. Para la mayoría de casos — correos, tickets de soporte, cláusulas de contratos, exports de chat, comentarios de código, filas de CSV — es de sobra. Para documentos más largos, divídelos y escanea por partes. No hay cuota diaria, no hay registro, y no hay tope de uso — la herramienta corre en tu dispositivo, así que no tenemos costes que repercutirte.
¿Y para PDFs y otros documentos?
Para PDFs, usa nuestra herramienta Redactar PDF — utiliza el mismo motor privacy-filter en tu dispositivo, pero aplica los hallazgos como rectángulos negros y rasteriza las páginas afectadas al guardar, así que el texto subyacente se destruye (no es solo un parche visual). Para imágenes con texto, usa Imagen a Texto (OCR) para extraer el texto y pégalo aquí. Para documentos de Word y .txt, copia el contenido al área de texto de arriba.
¿En qué se diferencia esto de pegar el texto en ChatGPT?
Cuando pegas texto sensible en ChatGPT, Claude, Gemini o cualquier otro LLM en la nube, ese texto sale de tu dispositivo y acaba en un servidor de un tercero — y dependiendo de tu plan y configuración, puede quedarse para entrenamiento. El Escáner de Privacidad ejecuta el modelo de detección íntegramente en tu navegador. El texto nunca sale de tu dispositivo, no hay registro ni cuenta, y ningún servidor tiene constancia de lo que escaneaste. El sentido de la herramienta es justo ese: limpiar el prompt antes de enviarlo.
¿Qué tipos de datos personales detecta?
Nombres de personas (PERSON), direcciones de correo (EMAIL), teléfonos (PHONE), direcciones postales (ADDRESS), fechas (DATE), números de cuenta tipo IBAN o tarjeta (ACCOUNT), identificaciones tipo pasaporte o DNI (ID), URL, nombres de organizaciones (ORG) y patrones tipo secreto como contraseñas o claves de API (SECRET). El modelo de fondo es privacy-filter de OpenAI, entrenado específicamente para esta tarea — prioriza la detección, así que revisa los resaltados y copia la versión limpia que mejor encaje con tu uso final.
¿Funciona en otros idiomas además del inglés?
Sí. El modelo privacy-filter es multilingüe (basado en XLM-RoBERTa) e identifica datos personales en muchos idiomas. La calidad es mejor en lenguas con alfabeto latino — español, portugués, alemán, francés, italiano, neerlandés — y algo más débil en lenguas muy flexivas o con alfabetos no latinos. Japonés, chino y árabe funcionan, pero con menos cobertura. Si escaneas un documento no inglés y notas que el modelo se dejó algo, recurre a los modos de redacción (Etiquetar es el más seguro) y revisa a mano.
¿El escaneo es realmente privado?
Sí. El modelo se descarga una vez desde la CDN pública de Hugging Face y se queda en caché en tu navegador. A partir de ahí, cada escaneo se ejecuta íntegramente en tu dispositivo — ni el texto ni los resultados se envían a FormatFuse, OpenAI, Google ni a ningún otro servidor. Puedes comprobarlo abriendo la pestaña Red de tu navegador mientras escaneas: tras la descarga inicial del modelo no hay ninguna petición saliente. No tenemos servidor que pudiera registrar tu texto aunque quisiéramos.
¿Qué hago con el texto redactado?
Elige el modo de redacción que mejor encaje con tu uso final. «Enmascarar» reemplaza cada entidad por [REDACTED], la opción más segura cuando un humano va a revisar el resultado. «Etiquetar» pone [PERSON], [EMAIL], etc., lo más útil cuando un LLM aún necesita entender la estructura del prompt. «Eliminar» quita la entidad por completo. Haz siempre una última lectura antes de enviar — ningún modelo es perfecto, y a veces el contexto («el cliente del ticket [REDACTED]») filtra información de forma indirecta.
¿Por qué el primer escaneo es lento?
En el primer uso la herramienta descarga el modelo privacy-filter — unos 290 MB a cuantización q4, servidos desde la CDN de Hugging Face. Tu navegador lo cachea después, así que cada escaneo siguiente arranca al instante (normalmente menos de un segundo para unos miles de caracteres). Si tu red es lenta, la barra de progreso del botón Escanear muestra el porcentaje. La descarga es directa entre tú y la CDN de Hugging Face — FormatFuse nunca ve la petición.
¿Hay límite a lo que puedo escanear?
Hay un límite de 50.000 caracteres por escaneo, sobre todo para que entradas muy largas no bloqueen el navegador. Para la mayoría de casos — correos, tickets de soporte, cláusulas de contratos, exports de chat, comentarios de código, filas de CSV — es de sobra. Para documentos más largos, divídelos y escanea por partes. No hay cuota diaria, no hay registro, y no hay tope de uso — la herramienta corre en tu dispositivo, así que no tenemos costes que repercutirte.
¿Y para PDFs y otros documentos?
Para PDFs, usa nuestra herramienta Redactar PDF — utiliza el mismo motor privacy-filter en tu dispositivo, pero aplica los hallazgos como rectángulos negros y rasteriza las páginas afectadas al guardar, así que el texto subyacente se destruye (no es solo un parche visual). Para imágenes con texto, usa Imagen a Texto (OCR) para extraer el texto y pégalo aquí. Para documentos de Word y .txt, copia el contenido al área de texto de arriba.

