Normalización Unicode explicada: NFC, NFD, NFKC, NFKD
4 min de lectura
El mismo texto puede tener múltiples representaciones Unicode. La normalización convierte el texto a una forma estándar para una comparación confiable.
Las cuatro formas
| Forma | Nombre | Caso de uso |
|---|---|---|
| NFC | Compuesta | La más común — recomendada para web y almacenamiento |
| NFD | Descompuesta | Usada por el sistema de archivos de macOS |
| NFKC | Compatibilidad Compuesta | Búsqueda y matching |
| NFKD | Compatibilidad Descompuesta | Eliminar acentos |
Por qué importa
"café" puede codificarse como 4 caracteres (NFC: é como un solo punto de código) o 5 caracteres (NFD: e + acento combinante). Sin normalización, la comparación de strings falla.
Elimina acentos
Usa nuestro conversor a texto plano con "Eliminar acentos/diacríticos" para normalizar texto.