Que sont les caractères de largeur nulle ? Comment les trouver et les supprimer
4 min de lecture
Les caractères de largeur nulle sont des caractères Unicode invisibles qui n'occupent aucun espace visible mais peuvent causer de sérieux problèmes dans le code, le traitement des données et la comparaison de texte.
Caractères de largeur nulle courants
| Nom | Unicode | Fonction |
|---|---|---|
| Espace de largeur nulle (ZWSP) | U+200B | Point de retour à la ligne optionnel |
| Non-jointure de largeur nulle | U+200C | Empêche les ligatures |
| Jointure de largeur nulle | U+200D | Crée des ligatures/combos d'emoji |
| Trait d'union conditionnel | U+00AD | Point de césure optionnel |
| BOM (Byte Order Mark) | U+FEFF | Indique l'encodage |
Problèmes qu'ils causent
- La comparaison de chaînes échoue :
"hello" !== "h\u200Bello" - Erreurs de parsing JSON
- Violations de contraintes d'unicité en base de données
- Échecs de recherche et de filtrage
Supprimez-les
Utilisez notre convertisseur en texte brut avec l'option « Supprimer les caractères de largeur nulle » activée.