Unicode-Normalisierung erklärt: NFC, NFD, NFKC, NFKD

4 Min. Lesezeit

Derselbe Text kann mehrere Unicode-Darstellungen haben. Normalisierung konvertiert Text in eine Standardform für zuverlässigen Vergleich.

Die vier Formen

FormNameAnwendungsfall
NFCComposedAm häufigsten — empfohlen für Web und Speicherung
NFDDecomposedVom macOS-Dateisystem verwendet
NFKCCompatibility ComposedSuche und Matching
NFKDCompatibility DecomposedAkzente entfernen

Warum es wichtig ist

„café" kann als 4 Zeichen (NFC: é als einzelner Codepunkt) oder 5 Zeichen (NFD: e + kombinierender Akzent) kodiert werden. Ohne Normalisierung schlägt der String-Vergleich fehl.

Akzente entfernen

Verwenden Sie unseren Plain-Text-Konverter mit „Akzente/Diakritika entfernen", um Text zu normalisieren.