Normalisation Unicode expliquée : NFC, NFD, NFKC, NFKD
4 min de lecture
Le même texte peut avoir plusieurs représentations Unicode. La normalisation convertit le texte en une forme standard pour une comparaison fiable.
Les quatre formes
| Forme | Nom | Cas d'usage |
|---|---|---|
| NFC | Composée | La plus courante — recommandée pour le web et le stockage |
| NFD | Décomposée | Utilisée par le système de fichiers macOS |
| NFKC | Compatibilité Composée | Recherche et correspondance |
| NFKD | Compatibilité Décomposée | Suppression des accents |
Pourquoi c'est important
« café » peut être encodé en 4 caractères (NFC : é comme un seul point de code) ou 5 caractères (NFD : e + accent combinant). Sans normalisation, la comparaison de chaînes échoue.
Supprimez les accents
Utilisez notre convertisseur en texte brut avec « Supprimer les accents/diacritiques » pour normaliser le texte.