Was ist UTF-8-Encoding? Ein Entwickler-Guide

4 Min. Lesezeit

UTF-8 ist eine variable Zeichenkodierung, die jedes Unicode-Zeichen darstellen kann. Über 98% aller Websites verwenden sie.

Wie UTF-8 funktioniert

ZeichenbereichBytesBeispiel
U+0000 bis U+007F (ASCII)1 ByteA = 0x41
U+0080 bis U+07FF2 Bytesé = 0xC3 0xA9
U+0800 bis U+FFFF3 Bytes中 = 0xE4 0xB8 0xAD
U+10000 bis U+10FFFF4 BytesEmoji

Häufige Probleme

  • „Mojibake" — verstümmelter Text durch falsche Encoding-Erkennung
  • Datenbank-Encoding-Mismatch
  • BOM (Byte Order Mark) in Dateien

Encoding-Probleme bereinigen

Verwenden Sie unseren Plain-Text-Konverter, um problematische Zeichen zu entfernen.