Unicode-Normalisierung erklärt: NFC, NFD, NFKC, NFKD
4 Min. Lesezeit
Derselbe Text kann mehrere Unicode-Darstellungen haben. Normalisierung konvertiert Text in eine Standardform für zuverlässigen Vergleich.
Die vier Formen
| Form | Name | Anwendungsfall |
|---|---|---|
| NFC | Composed | Am häufigsten — empfohlen für Web und Speicherung |
| NFD | Decomposed | Vom macOS-Dateisystem verwendet |
| NFKC | Compatibility Composed | Suche und Matching |
| NFKD | Compatibility Decomposed | Akzente entfernen |
Warum es wichtig ist
„café" kann als 4 Zeichen (NFC: é als einzelner Codepunkt) oder 5 Zeichen (NFD: e + kombinierender Akzent) kodiert werden. Ohne Normalisierung schlägt der String-Vergleich fehl.
Akzente entfernen
Verwenden Sie unseren Plain-Text-Konverter mit „Akzente/Diakritika entfernen", um Text zu normalisieren.