Normalización Unicode explicada: NFC, NFD, NFKC, NFKD

4 min de lectura

El mismo texto puede tener múltiples representaciones Unicode. La normalización convierte el texto a una forma estándar para una comparación confiable.

Las cuatro formas

FormaNombreCaso de uso
NFCCompuestaLa más común — recomendada para web y almacenamiento
NFDDescompuestaUsada por el sistema de archivos de macOS
NFKCCompatibilidad CompuestaBúsqueda y matching
NFKDCompatibilidad DescompuestaEliminar acentos

Por qué importa

"café" puede codificarse como 4 caracteres (NFC: é como un solo punto de código) o 5 caracteres (NFD: e + acento combinante). Sin normalización, la comparación de strings falla.

Elimina acentos

Usa nuestro conversor a texto plano con "Eliminar acentos/diacríticos" para normalizar texto.