Arrastra tus imágenes aquí

JPG, PNG, WebP, BMP, HEIC hasta 100 MB cada una

Tus imágenes se procesan localmente y nunca salen de este navegador.

Añade una o más imágenes arriba para empezar. Elige primero el idioma para obtener resultados más precisos.

Imagen a Texto OCR

Extrae texto de fotos, capturas y documentos escaneados dentro de tu navegador. Gratis, ilimitado y completamente privado — tus imágenes nunca salen de tu dispositivo.

La conversión de imagen a texto — también conocida como reconocimiento óptico de caracteres, u OCR — convierte los píxeles de un texto impreso en caracteres seleccionables y copiables. Es la forma más rápida de pasar los importes de un recibo en papel a una hoja de gastos, digitalizar los datos de contacto de una pila de tarjetas, sacar citas de la foto de un libro de texto para tus apuntes, transcribir la captura de una pizarra después de una reunión o recuperar el texto de un PDF escaneado que no tiene capa de texto. FormatFuse ejecuta toda la cadena en tu dispositivo, así que incluso los recibos con direcciones personales, las notas médicas o los contratos confidenciales se mantienen privados.

La mayoría de las herramientas de OCR gratuitas suben tus imágenes a un servidor, las procesan en la nube y te devuelven el texto extraído. Ese modelo es cómodo, pero significa que cada foto que pasas por la herramienta — incluido cualquier contenido personal o sensible — queda en infraestructura ajena. FormatFuse está construido sobre tesseract.js, un port a WebAssembly del motor de OCR Tesseract, que se ejecuta íntegramente dentro de la pestaña de tu navegador. La única actividad de red es una descarga única del motor de OCR y el modelo de idioma que elijas; a partir de ahí, el reconocimiento ocurre offline y nada sale de tu dispositivo.

FormatFuse soporta ocho idiomas de uso amplio de fábrica — inglés, español, francés, alemán, chino simplificado, japonés, hindi y árabe — y puedes cambiar de idioma en un desplegable antes de ejecutar el OCR. La precisión es máxima con texto impreso claro y de alto contraste a 300 ppp o más: páginas de libros, documentos mecanografiados, recibos, cartas y capturas de pantalla. Los resultados con escritura a mano, fotos borrosas, poca luz, superficies curvas y tipografías estilizadas serán irregulares — Tesseract es un motor genérico para texto impreso, no un modelo de escritura manual. Para mejores resultados, recorta a la zona del texto, mantén la cámara cuadrada respecto a la página y haz la foto con luz uniforme.

Imagen a Texto OCR — Preguntas Frecuentes

¿Se suben mis imágenes a un servidor?

No. Todo el procesamiento de OCR ocurre dentro de tu navegador con WebAssembly. La única petición de red es una descarga única del motor de OCR y del modelo de idioma que elijas — ambos se sirven desde FormatFuse y tu navegador los guarda en caché después. Puedes comprobarlo en la pestaña Red de tu navegador: tras la primera carga, ejecutar OCR sobre una imagen nueva no produce tráfico saliente.

¿Puede leer escritura a mano?

No de forma fiable. Tesseract está entrenado con texto impreso, así que las mayúsculas separadas y bien formadas a veces funcionan, pero la cursiva, las notas hechas con prisa o la escritura estilizada darán resultados pobres. Para contenido manuscrito, los modelos especializados rinden mucho mejor que el OCR genérico. Trata cualquier salida manuscrita como un borrador que necesita corrección manual.

¿Qué calidad de imagen necesito para buenos resultados?

Apunta a 300 ppp o más, con enfoque nítido, luz uniforme y buen contraste entre el texto y el fondo. Evita ángulos torcidos, sombras, reflejos y compresión JPG agresiva. Si el texto ocupa poco en el encuadre, recorta a la zona del texto antes de cargar. Las capturas y los documentos escaneados suelen funcionar mejor que las fotos del móvil de un documento.

¿Qué idiomas funcionan mejor?

El inglés da los resultados más consistentes porque tiene el corpus de entrenamiento más grande. Otros idiomas con escritura latina (español, francés, alemán) también son sólidos. El chino, el japonés, el hindi y el árabe funcionan bien con texto impreso claro pero son más sensibles a la resolución y al ruido. Si tu documento mezcla idiomas, elige el que aparezca con más frecuencia — el OCR multilingüe en una sola pasada no está soportado en esta herramienta.

¿Por qué la primera ejecución es lenta?

La primera vez que ejecutas OCR en un idioma concreto, tu navegador descarga el motor Tesseract (unos 3 MB) y los datos de entrenamiento específicos del idioma (de 2 a 15 MB según el idioma). Esa descarga ocurre una vez por idioma, tu navegador la guarda en caché y permite que cada ejecución posterior arranque al instante. Cambiar a un idioma nuevo dispara una descarga más para los datos de ese idioma, y luego ese también queda cacheado.

¿Qué formatos de imagen puedo usar?

JPG, PNG, WebP, BMP y HEIC están soportados. Los archivos HEIC del iPhone se decodifican en el navegador antes de ejecutar el OCR. Para PDFs escaneados, convierte primero las páginas a imágenes con nuestras herramientas PDF a JPG o PDF a PNG y luego ejecuta el OCR sobre las imágenes.