Normalisation Unicode expliquée : NFC, NFD, NFKC, NFKD

4 min de lecture

Le même texte peut avoir plusieurs représentations Unicode. La normalisation convertit le texte en une forme standard pour une comparaison fiable.

Les quatre formes

FormeNomCas d'usage
NFCComposéeLa plus courante — recommandée pour le web et le stockage
NFDDécomposéeUtilisée par le système de fichiers macOS
NFKCCompatibilité ComposéeRecherche et correspondance
NFKDCompatibilité DécomposéeSuppression des accents

Pourquoi c'est important

« café » peut être encodé en 4 caractères (NFC : é comme un seul point de code) ou 5 caractères (NFD : e + accent combinant). Sans normalisation, la comparaison de chaînes échoue.

Supprimez les accents

Utilisez notre convertisseur en texte brut avec « Supprimer les accents/diacritiques » pour normaliser le texte.