Arraste suas imagens aqui

JPG, PNG, WebP, BMP, HEIC até 100 MB cada

Suas imagens são processadas localmente e nunca saem deste navegador.

Adicione uma ou mais imagens acima para começar. Escolha primeiro o idioma para obter resultados mais precisos.

Imagem para Texto OCR

Extraia texto de fotos, capturas e documentos digitalizados dentro do seu navegador. Grátis, ilimitado e totalmente privado — suas imagens nunca saem do seu dispositivo.

A conversão de imagem para texto — também conhecida como reconhecimento óptico de caracteres, ou OCR — transforma os pixels de um texto impresso em caracteres selecionáveis e copiáveis. É a forma mais rápida de passar os valores de uma nota fiscal em papel para uma planilha de despesas, digitalizar os contatos de uma pilha de cartões de visita, tirar citações da foto de um livro didático para os seus resumos, transcrever a foto de um quadro depois de uma reunião ou recuperar o texto de um PDF digitalizado que não tem camada de texto. O FormatFuse executa todo o processo no seu dispositivo, então até notas fiscais com endereços pessoais, anotações médicas ou contratos confidenciais ficam privados.

A maioria das ferramentas de OCR grátis envia suas imagens para um servidor, processa na nuvem e devolve o texto extraído. Esse modelo é prático, mas significa que cada foto que você passa pela ferramenta — incluindo qualquer conteúdo pessoal ou sensível — fica em infraestrutura de terceiros. O FormatFuse é construído sobre o tesseract.js, uma porta para WebAssembly do motor de OCR Tesseract, que roda inteiramente dentro da aba do seu navegador. A única atividade de rede é um download único do motor de OCR e do modelo de idioma que você escolher; depois disso, o reconhecimento acontece offline e nada sai do seu dispositivo.

O FormatFuse suporta oito idiomas de uso amplo de fábrica — inglês, espanhol, francês, alemão, chinês simplificado, japonês, hindi e árabe — e você pode trocar de idioma em um menu antes de rodar o OCR. A precisão é máxima com texto impresso claro e de alto contraste a 300 dpi ou mais: páginas de livro, documentos datilografados, notas fiscais, cartas e capturas de tela. Os resultados com letra cursiva, fotos tremidas, pouca luz, superfícies curvas e fontes estilizadas vão ser irregulares — o Tesseract é um motor genérico para texto impresso, não um modelo de escrita à mão. Para os melhores resultados, corte na área do texto, mantenha a câmera reta em relação à página e tire a foto com luz uniforme.

Imagem para Texto OCR — Perguntas Frequentes

Minhas imagens são enviadas para um servidor?

Não. Todo o processamento de OCR acontece dentro do seu navegador via WebAssembly. A única requisição de rede é um download único do motor de OCR e do modelo de idioma que você escolher — ambos são servidos pelo FormatFuse e seu navegador guarda em cache depois. Você pode conferir na aba Rede do navegador: depois do primeiro carregamento, rodar OCR em uma imagem nova não gera tráfego de saída.

Ele consegue ler letra cursiva?

Não de forma confiável. O Tesseract é treinado com texto impresso, então maiúsculas separadas e bem-formadas às vezes funcionam, mas cursiva, anotações feitas com pressa ou letra estilizada vão dar resultados ruins. Para conteúdo manuscrito, modelos especializados se saem muito melhor que o OCR genérico. Trate qualquer saída de letra cursiva como um rascunho que precisa de revisão manual.

Que qualidade de imagem eu preciso para bons resultados?

Mire em 300 dpi ou mais, com foco nítido, luz uniforme e bom contraste entre o texto e o fundo. Evite ângulos tortos, sombras, reflexos e compressão JPG agressiva. Se o texto ocupa pouco no enquadramento, corte na área do texto antes de carregar. Capturas de tela e documentos digitalizados costumam funcionar melhor que fotos de celular de um documento.

Quais idiomas funcionam melhor?

O inglês entrega os resultados mais consistentes porque tem o maior corpus de treinamento. Outros idiomas com escrita latina (espanhol, francês, alemão) também são sólidos. Chinês, japonês, hindi e árabe funcionam bem com texto impresso claro mas são mais sensíveis a resolução e ruído. Se o seu documento mistura idiomas, escolha o que aparece com mais frequência — OCR multilíngue em uma única passada não é suportado nesta ferramenta.

Por que a primeira execução é lenta?

Na primeira vez que você roda OCR em um idioma específico, o seu navegador baixa o motor Tesseract (cerca de 3 MB) e os dados de treinamento daquele idioma (de 2 a 15 MB, dependendo do idioma). Esse download acontece uma vez por idioma, seu navegador guarda em cache e cada execução depois começa na hora. Trocar para um idioma novo dispara mais um download dos dados desse idioma, que também fica cacheado depois.

Quais formatos de imagem posso usar?

JPG, PNG, WebP, BMP e HEIC são suportados. Os arquivos HEIC do iPhone são decodificados no navegador antes do OCR rodar. Para PDFs digitalizados, converta as páginas em imagens primeiro com nossas ferramentas de PDF para JPG ou PDF para PNG e depois rode o OCR nas imagens.