Question 1

Wie unterscheidet sich das vom Einfügen in ChatGPT?

Accepted Answer

Wenn Sie sensiblen Text in ChatGPT, Claude, Gemini oder ein anderes Cloud-LLM einfügen, verlässt dieser Text Ihr Gerät und landet auf einem fremden Server — je nach Tarif und Einstellungen ggf. sogar zum Training. Der Datenschutz-Scanner führt das Erkennungsmodell vollständig in Ihrem Browser aus. Der Text verlässt Ihr Gerät nicht, es gibt keine Anmeldung und keinen Account, und kein Server hat eine Aufzeichnung dessen, was Sie gescannt haben. Der Sinn des Werkzeugs besteht genau darin, den Prompt vor dem Absenden zu bereinigen.

Question 2

Welche Arten von personenbezogenen Daten werden erkannt?

Accepted Answer

Personennamen (PERSON), E-Mail-Adressen (EMAIL), Telefonnummern (PHONE), Postanschriften (ADDRESS), Datumsangaben (DATE), Kontonummern wie IBAN oder Kreditkartennummern (ACCOUNT), Ausweisnummern wie Personalausweis oder Reisepass (ID), URLs, Organisationsnamen (ORG) sowie geheimnisartige Muster wie Passwörter oder API-Schlüssel (SECRET). Das zugrunde liegende Modell ist OpenAIs privacy-filter, eigens für diese Aufgabe trainiert — es ist auf Recall optimiert, prüfen Sie also die Markierungen und übernehmen Sie die Variante, die zu Ihrem Folgeschritt passt.

Question 3

Funktioniert es auch in anderen Sprachen als Englisch?

Accepted Answer

Ja. Das privacy-filter-Modell ist mehrsprachig (auf Basis von XLM-RoBERTa) und erkennt PII in vielen Sprachen. Die Qualität ist bei lateinschriftlichen Sprachen am besten — Deutsch, Englisch, Spanisch, Portugiesisch, Französisch, Italienisch, Niederländisch — und schwächer bei stark flektierenden oder nicht-lateinischen Schriften. Japanisch, Chinesisch und Arabisch funktionieren, aber mit geringerer Trefferquote. Wenn das Modell in einem nicht-englischen Dokument etwas übersieht, greifen Sie auf den Modus „Beschriften“ zurück und prüfen Sie manuell.

Question 4

Ist der Scan wirklich privat?

Accepted Answer

Ja. Das Modell wird einmalig vom öffentlichen Hugging-Face-CDN heruntergeladen und in Ihrem Browser zwischengespeichert. Ab diesem Punkt läuft jeder Scan vollständig auf Ihrem Gerät — kein Text und kein Ergebnis werden an FormatFuse, OpenAI, Google oder einen anderen Server gesendet. Sie können das in der Netzwerk-Registerkarte Ihres Browsers überprüfen: Nach dem ersten Modell-Download gibt es keine ausgehenden Anfragen mehr. Wir betreiben keinen Server, der Ihren Text protokollieren könnte.

Question 5

Was mache ich mit dem geschwärzten Text?

Accepted Answer

Wählen Sie den Modus, der zum Folgeschritt passt. „Maskieren“ ersetzt jeden Treffer durch [REDACTED] — die sicherste Standardeinstellung, wenn eine Person das Ergebnis prüft. „Beschriften“ setzt [PERSON], [EMAIL] usw. ein, ideal wenn ein LLM die Struktur des Prompts weiter verstehen soll. „Entfernen“ löscht den Wert komplett. Lesen Sie vor dem Absenden noch einmal aufmerksam — kein Modell ist perfekt, und manchmal verraten Kontextangaben („der Kunde aus Ticket [REDACTED]“) indirekt zu viel.

Question 6

Warum ist der erste Scan langsam?

Accepted Answer

Beim ersten Aufruf lädt das Werkzeug das privacy-filter-Modell — etwa 290 MB bei q4-Quantisierung, ausgeliefert vom Hugging-Face-CDN. Ihr Browser legt es danach in den Cache, sodass jeder weitere Scan praktisch sofort startet (in der Regel deutlich unter einer Sekunde für einige tausend Zeichen). Bei langsamem Netz zeigt der Scan-Button den Download-Fortschritt in Prozent. Der Download läuft direkt zwischen Ihnen und dem Hugging-Face-CDN — FormatFuse sieht die Anfrage nicht.

Question 7

Gibt es ein Limit, wie viel ich scannen kann?

Accepted Answer

Pro Scan gilt ein Limit von 50.000 Zeichen — vor allem, damit sehr lange Eingaben den Browser nicht blockieren. Für die meisten Anwendungsfälle — E-Mails, Support-Tickets, Vertragsklauseln, Chat-Exporte, Code-Kommentare, CSV-Zeilen — reicht das mehr als aus. Längere Dokumente teilen Sie auf und scannen sie schrittweise. Es gibt kein Tageslimit, keine Anmeldung und keine Nutzungsobergrenze — das Werkzeug läuft auf Ihrem Gerät, also haben wir keine Kosten, die wir weitergeben müssten.

Question 8

Was ist mit PDFs und anderen Dokumenten?

Accepted Answer

Für PDFs nutzen Sie unser Werkzeug PDF schwärzen — es verwendet denselben privacy-filter-Motor auf Ihrem Gerät, wendet die Treffer aber als schwarze Schwärzungs-Rechtecke an und rasterisiert die betroffenen Seiten beim Speichern, sodass der zugrunde liegende Text tatsächlich gelöscht wird (nicht nur visuell überdeckt). Für Bilder mit Text nutzen Sie unser Bild-zu-Text (OCR) Tool, um den Text zu extrahieren, und fügen ihn hier ein. Word-Dokumente und .txt-Dateien kopieren Sie einfach in das Textfeld oben.

Datenschutz-Scanner — Personenbezogene Daten in beliebigem Text finden & schwärzen

Über Datenschutz-Scanner — Personenbezogene Daten in beliebigem Text finden & schwärzen

Ähnliche Tools

Weitere Apps von RayLabs ausprobieren

Ein Foto. Ein Kalendereintrag.