Normalização Unicode explicada: NFC, NFD, NFKC, NFKD

4 min de leitura

O mesmo texto pode ter múltiplas representações Unicode. A normalização converte o texto para uma forma padrão para comparação confiável.

As quatro formas

FormaNomeCaso de uso
NFCCompostaMais comum — recomendada para web e armazenamento
NFDDecompostaUsada pelo sistema de arquivos do macOS
NFKCCompatibilidade CompostaBusca e matching
NFKDCompatibilidade DecompostaRemoção de acentos

Por que importa

"café" pode ser codificado como 4 caracteres (NFC: é como um único code point) ou 5 caracteres (NFD: e + acento combinante). Sem normalização, a comparação de strings falha.

Remova acentos

Use nosso conversor para texto simples com "Remover acentos/diacríticos" para normalizar texto.