¿Qué es la codificación UTF-8? Guía para desarrolladores

4 min de lectura

UTF-8 es una codificación de caracteres de longitud variable que puede representar todos los caracteres Unicode. La usan más del 98% de los sitios web.

Cómo funciona UTF-8

Rango de caracteresBytesEjemplo
U+0000 a U+007F (ASCII)1 byteA = 0x41
U+0080 a U+07FF2 bytesé = 0xC3 0xA9
U+0800 a U+FFFF3 bytes中 = 0xE4 0xB8 0xAD
U+10000 a U+10FFFF4 bytesemoji

Problemas comunes

  • "Mojibake" — texto ilegible por detección incorrecta de codificación
  • Desajuste de codificación en bases de datos
  • BOM (Byte Order Mark) en archivos

Limpia problemas de codificación

Usa nuestro conversor a texto plano para eliminar caracteres problemáticos.