Qu'est-ce que l'encodage UTF-8 ? Guide développeur

4 min de lecture

UTF-8 est un encodage de caractères à longueur variable capable de représenter tous les caractères Unicode. Il est utilisé par plus de 98% des sites web.

Comment fonctionne UTF-8

Plage de caractèresOctetsExemple
U+0000 à U+007F (ASCII)1 octetA = 0x41
U+0080 à U+07FF2 octetsé = 0xC3 0xA9
U+0800 à U+FFFF3 octets中 = 0xE4 0xB8 0xAD
U+10000 à U+10FFFF4 octetsemoji

Problèmes courants

  • « Mojibake » — texte illisible dû à une mauvaise détection d'encodage
  • Incompatibilité d'encodage de base de données
  • BOM (Byte Order Mark) dans les fichiers

Nettoyez les problèmes d'encodage

Utilisez notre convertisseur en texte brut pour supprimer les caractères problématiques.