Scanner PII Gratuit

Scanner de Confidentialité — Détecter et Caviarder les PII dans n'importe quel Texte

Collez n'importe quel texte, cliquez sur Analyser, et chaque nom, e-mail, numéro de téléphone, adresse et numéro de compte est mis en évidence à l'instant. Copiez la version caviardée — parfait pour nettoyer un prompt avant de le coller dans ChatGPT, Claude ou Gemini. Fonctionne 100 % dans votre navigateur.

Votre texte0 / 50 000
Données personnelles détectées

Cliquez sur Analyser pour mettre en évidence chaque donnée personnelle de votre texte. L'IA s'exécute sur votre appareil.

À propos de Scanner de Confidentialité — Détecter et Caviarder les PII dans n'importe quel Texte

Si vous vous êtes déjà retenu(e) au moment de coller un e-mail client, un brouillon de contrat ou un export Slack dans ChatGPT en vous demandant « attendez, est-ce que ça doit vraiment quitter mon poste ? » — cet outil est fait pour ce moment précis. Le Scanner de Confidentialité parcourt n'importe quel bloc de texte, met en évidence chaque donnée personnelle qu'il trouve (noms, e-mails, numéros de téléphone, adresses postales, dates, numéros de compte, identifiants, URL, organisations et chaînes de type secret) et vous fournit, en un clic, une version nettoyée à coller dans le LLM de votre choix. Le modèle de détection et votre texte restent sur votre appareil — aucun envoi, aucune inscription, aucun journal de ce que vous avez analysé.

Sous le capot, le scanner exécute le modèle ouvert privacy-filter d'OpenAI — un fine-tune multilingue de XLM-RoBERTa entraîné spécifiquement pour reconnaître les données personnelles — via transformers.js, accéléré par WebGPU lorsque c'est possible et en repli sur WebAssembly sinon. La première analyse télécharge le modèle quantifié en q4 depuis le CDN de Hugging Face (une seule fois, mis en cache ensuite), et chaque analyse suivante démarre instantanément. Comme le modèle est multilingue, il fonctionne sur le français, l'espagnol, le portugais, l'allemand, le japonais et bien d'autres langues — pas seulement l'anglais.

Trois modes de caviardage couvrent les usages les plus courants. « Masquer » remplace chaque entité par [REDACTED] — le réglage le plus prudent quand un humain doit relire le texte. « Étiqueter » remplace la valeur par sa catégorie — [PERSON], [EMAIL], [PHONE] — utile lorsque le LLM destinataire a besoin de comprendre la structure du prompt. « Supprimer » retire l'entité entièrement, idéal pour les passages courts où vous voulez le résultat le plus net possible. Choisissez le mode adapté à votre flux et copiez ou téléchargez un .txt du texte nettoyé.

Le Scanner de Confidentialité est la réponse gratuite au réflexe « je vais juste le coller dans ChatGPT ». Il ne remplace pas une relecture manuelle attentive sur du contenu très sensible — aucun modèle de PII n'est parfait, et les cas limites (initiales seules, adresses partielles, formats d'identifiants inhabituels) peuvent passer entre les mailles. Utilisez-le comme un premier filtre qui détecte l'évident en une seconde, puis relisez avant d'envoyer. Pour les PDF contenant des données sensibles, notre outil Caviarder PDF s'appuie sur le même moteur mais applique les détections sous forme de rectangles noirs et rasterise les pages concernées au moment de l'enregistrement, de sorte que le texte sous-jacent est réellement détruit — pas seulement masqué visuellement.

Scanner de Confidentialité — Détecter et Caviarder les PII dans n'importe quel Texte — Questions Fréquentes

Quelle est la différence avec le simple fait de coller dans ChatGPT ?

Lorsque vous collez un texte sensible dans ChatGPT, Claude, Gemini ou tout autre LLM en cloud, ce texte quitte votre appareil et atterrit sur un serveur tiers — et selon votre formule et vos réglages, il peut être conservé pour l'entraînement. Le Scanner de Confidentialité exécute le modèle de détection entièrement dans votre navigateur. Le texte ne quitte pas votre appareil, il n'y a ni inscription ni compte, et aucun serveur ne dispose d'une trace de ce que vous avez scanné. L'objectif même de l'outil est de nettoyer le prompt avant qu'il ne quitte votre poste.

Quels types de données personnelles sont détectés ?

Noms de personnes (PERSON), adresses e-mail (EMAIL), numéros de téléphone (PHONE), adresses postales (ADDRESS), dates (DATE), numéros de compte type IBAN ou carte bancaire (ACCOUNT), identifiants type passeport ou CNI (ID), URL, noms d'organisations (ORG) et motifs de type secret comme mots de passe ou clés d'API (SECRET). Le modèle utilisé est privacy-filter d'OpenAI, entraîné spécifiquement pour cette tâche — il favorise le rappel, donc relisez les surlignages et copiez la version nettoyée qui correspond à votre usage.

Cela fonctionne-t-il dans d'autres langues que l'anglais ?

Oui. Le modèle privacy-filter est multilingue (basé sur XLM-RoBERTa) et identifie les données personnelles dans de nombreuses langues. La qualité est meilleure pour les langues à alphabet latin — français, espagnol, portugais, allemand, italien, néerlandais — et plus faible pour les langues très flexionnelles ou aux écritures non latines. Le japonais, le chinois et l'arabe fonctionnent, mais avec un rappel plus faible. Si vous analysez un document non anglophone et que le modèle laisse passer un élément, repliez-vous sur les modes de caviardage (Étiqueter est le plus sûr) et relisez à la main.

L'analyse est-elle réellement privée ?

Oui. Le modèle est téléchargé une fois depuis le CDN public de Hugging Face et mis en cache par votre navigateur. À partir de là, chaque analyse s'exécute entièrement sur votre appareil — aucun texte ni résultat n'est envoyé à FormatFuse, OpenAI, Google ou un autre serveur. Vous pouvez le vérifier dans l'onglet Réseau de votre navigateur pendant que vous analysez : après le téléchargement initial du modèle, aucune requête sortante n'est émise. Nous n'avons pas de serveur qui pourrait journaliser votre texte, même si nous le voulions.

Que faire de la sortie caviardée ?

Choisissez le mode qui correspond à votre flux. « Masquer » remplace chaque entité par [REDACTED] — le plus prudent quand un humain relit le résultat. « Étiqueter » insère [PERSON], [EMAIL], etc., utile lorsqu'un LLM doit comprendre la structure du prompt. « Supprimer » retire entièrement l'entité. Faites toujours une dernière relecture avant d'envoyer — aucun modèle n'est parfait, et le contexte (« le client du ticket [REDACTED] ») peut parfois trahir indirectement de l'information.

Pourquoi la première analyse est-elle lente ?

À la première utilisation, l'outil télécharge le modèle privacy-filter — environ 290 Mo en quantification q4, servis par le CDN de Hugging Face. Votre navigateur le met ensuite en cache, donc chaque analyse suivante démarre instantanément (typiquement bien moins d'une seconde pour quelques milliers de caractères). Si votre connexion est lente, la barre du bouton Analyser affiche le pourcentage. Le téléchargement passe directement entre vous et le CDN de Hugging Face — FormatFuse ne voit pas la requête.

Y a-t-il une limite à ce que je peux analyser ?

Une limite de 50 000 caractères par analyse, principalement pour éviter qu'une saisie très longue ne fige le navigateur. Pour la plupart des usages — e-mails, tickets de support, clauses de contrat, exports de chat, commentaires de code, lignes de CSV — c'est largement suffisant. Pour des documents plus longs, découpez-les et analysez par parties. Pas de quota journalier, pas d'inscription et pas de plafond d'usage — l'outil tourne sur votre appareil, donc nous n'avons aucun coût à vous répercuter.

Qu'en est-il des PDF et autres documents ?

Pour les PDF, utilisez notre outil Caviarder PDF — il s'appuie sur le même moteur privacy-filter sur votre appareil, mais applique les détections sous forme de rectangles noirs et rasterise les pages concernées à l'enregistrement, de sorte que le texte sous-jacent est réellement détruit (et non simplement masqué visuellement). Pour les images contenant du texte, utilisez notre outil Image en Texte (OCR) pour extraire le texte, puis collez-le ici. Pour les documents Word et fichiers .txt, copiez le contenu dans la zone de texte ci-dessus.