Question 1

Quelle est la différence avec le simple fait de coller dans ChatGPT ?

Accepted Answer

Lorsque vous collez un texte sensible dans ChatGPT, Claude, Gemini ou tout autre LLM en cloud, ce texte quitte votre appareil et atterrit sur un serveur tiers — et selon votre formule et vos réglages, il peut être conservé pour l'entraînement. Le Scanner de Confidentialité exécute le modèle de détection entièrement dans votre navigateur. Le texte ne quitte pas votre appareil, il n'y a ni inscription ni compte, et aucun serveur ne dispose d'une trace de ce que vous avez scanné. L'objectif même de l'outil est de nettoyer le prompt avant qu'il ne quitte votre poste.

Question 2

Quels types de données personnelles sont détectés ?

Accepted Answer

Noms de personnes (PERSON), adresses e-mail (EMAIL), numéros de téléphone (PHONE), adresses postales (ADDRESS), dates (DATE), numéros de compte type IBAN ou carte bancaire (ACCOUNT), identifiants type passeport ou CNI (ID), URL, noms d'organisations (ORG) et motifs de type secret comme mots de passe ou clés d'API (SECRET). Le modèle utilisé est privacy-filter d'OpenAI, entraîné spécifiquement pour cette tâche — il favorise le rappel, donc relisez les surlignages et copiez la version nettoyée qui correspond à votre usage.

Question 3

Cela fonctionne-t-il dans d'autres langues que l'anglais ?

Accepted Answer

Oui. Le modèle privacy-filter est multilingue (basé sur XLM-RoBERTa) et identifie les données personnelles dans de nombreuses langues. La qualité est meilleure pour les langues à alphabet latin — français, espagnol, portugais, allemand, italien, néerlandais — et plus faible pour les langues très flexionnelles ou aux écritures non latines. Le japonais, le chinois et l'arabe fonctionnent, mais avec un rappel plus faible. Si vous analysez un document non anglophone et que le modèle laisse passer un élément, repliez-vous sur les modes de caviardage (Étiqueter est le plus sûr) et relisez à la main.

Question 4

L'analyse est-elle réellement privée ?

Accepted Answer

Oui. Le modèle est téléchargé une fois depuis le CDN public de Hugging Face et mis en cache par votre navigateur. À partir de là, chaque analyse s'exécute entièrement sur votre appareil — aucun texte ni résultat n'est envoyé à FormatFuse, OpenAI, Google ou un autre serveur. Vous pouvez le vérifier dans l'onglet Réseau de votre navigateur pendant que vous analysez : après le téléchargement initial du modèle, aucune requête sortante n'est émise. Nous n'avons pas de serveur qui pourrait journaliser votre texte, même si nous le voulions.

Question 5

Que faire de la sortie caviardée ?

Accepted Answer

Choisissez le mode qui correspond à votre flux. « Masquer » remplace chaque entité par [REDACTED] — le plus prudent quand un humain relit le résultat. « Étiqueter » insère [PERSON], [EMAIL], etc., utile lorsqu'un LLM doit comprendre la structure du prompt. « Supprimer » retire entièrement l'entité. Faites toujours une dernière relecture avant d'envoyer — aucun modèle n'est parfait, et le contexte (« le client du ticket [REDACTED] ») peut parfois trahir indirectement de l'information.

Question 6

Pourquoi la première analyse est-elle lente ?

Accepted Answer

À la première utilisation, l'outil télécharge le modèle privacy-filter — environ 290 Mo en quantification q4, servis par le CDN de Hugging Face. Votre navigateur le met ensuite en cache, donc chaque analyse suivante démarre instantanément (typiquement bien moins d'une seconde pour quelques milliers de caractères). Si votre connexion est lente, la barre du bouton Analyser affiche le pourcentage. Le téléchargement passe directement entre vous et le CDN de Hugging Face — FormatFuse ne voit pas la requête.

Question 7

Y a-t-il une limite à ce que je peux analyser ?

Accepted Answer

Une limite de 50 000 caractères par analyse, principalement pour éviter qu'une saisie très longue ne fige le navigateur. Pour la plupart des usages — e-mails, tickets de support, clauses de contrat, exports de chat, commentaires de code, lignes de CSV — c'est largement suffisant. Pour des documents plus longs, découpez-les et analysez par parties. Pas de quota journalier, pas d'inscription et pas de plafond d'usage — l'outil tourne sur votre appareil, donc nous n'avons aucun coût à vous répercuter.

Question 8

Qu'en est-il des PDF et autres documents ?

Accepted Answer

Pour les PDF, utilisez notre outil Caviarder PDF — il s'appuie sur le même moteur privacy-filter sur votre appareil, mais applique les détections sous forme de rectangles noirs et rasterise les pages concernées à l'enregistrement, de sorte que le texte sous-jacent est réellement détruit (et non simplement masqué visuellement). Pour les images contenant du texte, utilisez notre outil Image en Texte (OCR) pour extraire le texte, puis collez-le ici. Pour les documents Word et fichiers .txt, copiez le contenu dans la zone de texte ci-dessus.

Scanner de Confidentialité — Détecter et Caviarder les PII dans n'importe quel Texte

À propos de Scanner de Confidentialité — Détecter et Caviarder les PII dans n'importe quel Texte

Outils Associés

Essayez d'autres apps de RayLabs

Prends une photo. Obtiens un événement.