¿Qué es la codificación UTF-8? Guía para desarrolladores
4 min de lectura
UTF-8 es una codificación de caracteres de longitud variable que puede representar todos los caracteres Unicode. La usan más del 98% de los sitios web.
Cómo funciona UTF-8
| Rango de caracteres | Bytes | Ejemplo |
|---|---|---|
| U+0000 a U+007F (ASCII) | 1 byte | A = 0x41 |
| U+0080 a U+07FF | 2 bytes | é = 0xC3 0xA9 |
| U+0800 a U+FFFF | 3 bytes | 中 = 0xE4 0xB8 0xAD |
| U+10000 a U+10FFFF | 4 bytes | emoji |
Problemas comunes
- "Mojibake" — texto ilegible por detección incorrecta de codificación
- Desajuste de codificación en bases de datos
- BOM (Byte Order Mark) en archivos
Limpia problemas de codificación
Usa nuestro conversor a texto plano para eliminar caracteres problemáticos.