Que sont les caractères de largeur nulle ? Comment les trouver et les supprimer

4 min de lecture

Les caractères de largeur nulle sont des caractères Unicode invisibles qui n'occupent aucun espace visible mais peuvent causer de sérieux problèmes dans le code, le traitement des données et la comparaison de texte.

Caractères de largeur nulle courants

NomUnicodeFonction
Espace de largeur nulle (ZWSP)U+200BPoint de retour à la ligne optionnel
Non-jointure de largeur nulleU+200CEmpêche les ligatures
Jointure de largeur nulleU+200DCrée des ligatures/combos d'emoji
Trait d'union conditionnelU+00ADPoint de césure optionnel
BOM (Byte Order Mark)U+FEFFIndique l'encodage

Problèmes qu'ils causent

  • La comparaison de chaînes échoue : "hello" !== "h\u200Bello"
  • Erreurs de parsing JSON
  • Violations de contraintes d'unicité en base de données
  • Échecs de recherche et de filtrage

Supprimez-les

Utilisez notre convertisseur en texte brut avec l'option « Supprimer les caractères de largeur nulle » activée.