Normalização Unicode explicada: NFC, NFD, NFKC, NFKD
4 min de leitura
O mesmo texto pode ter múltiplas representações Unicode. A normalização converte o texto para uma forma padrão para comparação confiável.
As quatro formas
| Forma | Nome | Caso de uso |
|---|---|---|
| NFC | Composta | Mais comum — recomendada para web e armazenamento |
| NFD | Decomposta | Usada pelo sistema de arquivos do macOS |
| NFKC | Compatibilidade Composta | Busca e matching |
| NFKD | Compatibilidade Decomposta | Remoção de acentos |
Por que importa
"café" pode ser codificado como 4 caracteres (NFC: é como um único code point) ou 5 caracteres (NFD: e + acento combinante). Sem normalização, a comparação de strings falha.
Remova acentos
Use nosso conversor para texto simples com "Remover acentos/diacríticos" para normalizar texto.