O que são caracteres de largura zero? Como encontrá-los e removê-los

4 min de leitura

Caracteres de largura zero são caracteres Unicode invisíveis que não ocupam espaço visível mas podem causar problemas sérios em código, processamento de dados e comparação de texto.

Caracteres de largura zero comuns

NomeUnicodePropósito
Espaço de largura zero (ZWSP)U+200BPonto de quebra de linha opcional
Não-junção de largura zeroU+200CEvita ligaduras
Junção de largura zeroU+200DCria ligaduras/combos de emoji
Hífen suaveU+00ADPonto de hifenização opcional
BOM (Byte Order Mark)U+FEFFIndica a codificação

Problemas que causam

  • Comparação de strings falha: "hello" !== "h\u200Bello"
  • Erros de parsing de JSON
  • Violações de restrições únicas em bancos de dados
  • Falhas em buscas e filtros

Remova-os

Use nosso conversor para texto simples com a opção "Remover caracteres de largura zero" ativada.