Was sind Zero-Width-Zeichen? Finden und Entfernen

4 Min. Lesezeit

Zero-Width-Zeichen sind unsichtbare Unicode-Zeichen, die keinen sichtbaren Platz einnehmen, aber ernsthafte Probleme in Code, Datenverarbeitung und Textvergleichen verursachen können.

Häufige Zero-Width-Zeichen

NameUnicodeZweck
Zero-Width Space (ZWSP)U+200BOptionaler Zeilenumbruchpunkt
Zero-Width Non-JoinerU+200CVerhindert Ligaturen
Zero-Width JoinerU+200DErzeugt Ligaturen/Emoji-Kombinationen
Soft HyphenU+00ADOptionaler Trennungspunkt
BOM (Byte Order Mark)U+FEFFKennzeichnet die Kodierung

Verursachte Probleme

  • String-Vergleich schlägt fehl: "hello" !== "h\u200Bello"
  • JSON-Parsing-Fehler
  • Unique-Constraint-Verletzungen in Datenbanken
  • Such-/Filter-Fehlzuordnungen

Entfernen

Verwenden Sie unseren Plain-Text-Konverter mit aktivierter Option „Zero-Width-Zeichen entfernen".