Qu'est-ce que l'encodage UTF-8 ? Guide développeur
4 min de lecture
UTF-8 est un encodage de caractères à longueur variable capable de représenter tous les caractères Unicode. Il est utilisé par plus de 98% des sites web.
Comment fonctionne UTF-8
| Plage de caractères | Octets | Exemple |
|---|---|---|
| U+0000 à U+007F (ASCII) | 1 octet | A = 0x41 |
| U+0080 à U+07FF | 2 octets | é = 0xC3 0xA9 |
| U+0800 à U+FFFF | 3 octets | 中 = 0xE4 0xB8 0xAD |
| U+10000 à U+10FFFF | 4 octets | emoji |
Problèmes courants
- « Mojibake » — texte illisible dû à une mauvaise détection d'encodage
- Incompatibilité d'encodage de base de données
- BOM (Byte Order Mark) dans les fichiers
Nettoyez les problèmes d'encodage
Utilisez notre convertisseur en texte brut pour supprimer les caractères problématiques.