Déposez vos images ici

JPG, PNG, WebP, BMP, HEIC jusqu'à 100 Mo chacune

Vos images sont traitées localement et ne quittent jamais ce navigateur.

Ajoutez une ou plusieurs images ci-dessus pour démarrer. Choisissez d'abord la langue pour les résultats les plus précis.

OCR Image en Texte

Extrayez du texte de photos, captures d'écran et documents numérisés directement dans votre navigateur. Gratuit, illimité et entièrement privé — vos images ne quittent jamais votre appareil.

La conversion d'image en texte — également appelée reconnaissance optique de caractères, ou OCR — transforme les pixels d'un texte imprimé en caractères sélectionnables et copiables. C'est le moyen le plus rapide de transférer les montants d'un reçu papier dans une feuille de notes de frais, de numériser les coordonnées d'une pile de cartes de visite, d'extraire des citations d'une photo de manuel pour vos notes, de transcrire la photo d'un tableau blanc après une réunion ou de récupérer le texte d'un PDF numérisé sans couche de texte. FormatFuse exécute toute la chaîne sur votre appareil, donc même les reçus contenant des adresses personnelles, les notes médicales ou les contrats confidentiels restent privés.

La plupart des outils d'OCR gratuits téléversent vos images sur un serveur, les traitent dans le cloud et vous renvoient le texte extrait. Ce modèle est pratique, mais cela signifie que chaque photo passée par l'outil — y compris tout contenu personnel ou sensible — atterrit sur une infrastructure tierce. FormatFuse est construit sur tesseract.js, un portage WebAssembly du moteur d'OCR Tesseract, qui s'exécute entièrement dans votre onglet de navigateur. La seule activité réseau est un téléchargement unique du moteur d'OCR et du modèle de langue que vous choisissez ; à partir de là, la reconnaissance se fait hors ligne et rien ne quitte votre appareil.

FormatFuse prend en charge huit langues très répandues d'origine — anglais, espagnol, français, allemand, chinois simplifié, japonais, hindi et arabe — et vous pouvez changer de langue dans une liste déroulante avant de lancer l'OCR. La précision est maximale avec un texte imprimé clair et fortement contrasté à 300 ppp ou plus : pages de livres, documents tapés, reçus, lettres et captures d'écran. Les résultats sur de l'écriture manuscrite, des photos floues, une faible luminosité, des surfaces courbes et des typographies stylisées seront irréguliers — Tesseract est un moteur générique pour le texte imprimé, pas un modèle d'écriture manuscrite. Pour de meilleurs résultats, recadrez sur la zone de texte, gardez l'appareil photo perpendiculaire à la page et photographiez sous un éclairage uniforme.

OCR Image en Texte — Questions Fréquentes

Mes images sont-elles téléversées sur un serveur ?

Non. Tout le traitement OCR se déroule dans votre navigateur grâce à WebAssembly. La seule requête réseau est un téléchargement unique du moteur d'OCR et du modèle de langue que vous choisissez — tous deux servis depuis FormatFuse et mis en cache par votre navigateur ensuite. Vous pouvez le vérifier dans l'onglet Réseau de votre navigateur : après le premier chargement, lancer l'OCR sur une nouvelle image ne produit aucun trafic sortant.

Peut-il lire l'écriture manuscrite ?

Pas de manière fiable. Tesseract est entraîné sur du texte imprimé, donc des majuscules d'imprimerie séparées et bien formées fonctionnent parfois, mais l'écriture cursive, les notes prises à la hâte ou l'écriture stylisée donneront de mauvais résultats. Pour le contenu manuscrit, des modèles spécialisés sont nettement plus performants que l'OCR générique. Considérez toute sortie manuscrite comme un brouillon nécessitant une correction manuelle.

Quelle qualité d'image faut-il pour de bons résultats ?

Visez 300 ppp ou plus, avec une mise au point nette, un éclairage uniforme et un bon contraste entre le texte et le fond. Évitez les angles inclinés, les ombres, les reflets et la compression JPG agressive. Si le texte occupe peu d'espace dans le cadre, recadrez sur la zone de texte avant le chargement. Les captures d'écran et les documents numérisés fonctionnent généralement mieux que les photos prises au smartphone d'un document.

Quelles langues fonctionnent le mieux ?

L'anglais donne les résultats les plus constants car il dispose du plus grand corpus d'entraînement. Les autres langues à écriture latine (français, espagnol, allemand) sont également solides. Le chinois, le japonais, l'hindi et l'arabe fonctionnent bien sur du texte imprimé clair mais sont plus sensibles à la résolution et au bruit. Si votre document mélange plusieurs langues, choisissez celle qui apparaît le plus fréquemment — l'OCR multilingue en une seule passe n'est pas pris en charge dans cet outil.

Pourquoi la première exécution est-elle lente ?

La première fois que vous lancez l'OCR dans une langue donnée, votre navigateur télécharge le moteur Tesseract (environ 3 Mo) et les données d'entraînement spécifiques à la langue (de 2 à 15 Mo selon la langue). Ce téléchargement a lieu une fois par langue, votre navigateur le met en cache et chaque exécution suivante démarre instantanément. Passer à une nouvelle langue déclenche un téléchargement supplémentaire pour les données de cette langue, qui est ensuite également mise en cache.

Quels formats d'image puis-je utiliser ?

JPG, PNG, WebP, BMP et HEIC sont pris en charge. Les fichiers HEIC d'iPhone sont décodés dans le navigateur avant l'exécution de l'OCR. Pour les PDF numérisés, convertissez d'abord les pages en images avec nos outils PDF en JPG ou PDF en PNG, puis lancez l'OCR sur les images.