Was ist UTF-8-Encoding? Ein Entwickler-Guide
4 Min. Lesezeit
UTF-8 ist eine variable Zeichenkodierung, die jedes Unicode-Zeichen darstellen kann. Über 98% aller Websites verwenden sie.
Wie UTF-8 funktioniert
| Zeichenbereich | Bytes | Beispiel |
|---|---|---|
| U+0000 bis U+007F (ASCII) | 1 Byte | A = 0x41 |
| U+0080 bis U+07FF | 2 Bytes | é = 0xC3 0xA9 |
| U+0800 bis U+FFFF | 3 Bytes | 中 = 0xE4 0xB8 0xAD |
| U+10000 bis U+10FFFF | 4 Bytes | Emoji |
Häufige Probleme
- „Mojibake" — verstümmelter Text durch falsche Encoding-Erkennung
- Datenbank-Encoding-Mismatch
- BOM (Byte Order Mark) in Dateien
Encoding-Probleme bereinigen
Verwenden Sie unseren Plain-Text-Konverter, um problematische Zeichen zu entfernen.