utf8不是等长编码。
UTF-8码是一种字符集,是分配整数给字符的编码表,将文本存储为2个或4个字节序列的串,可以最多到6个字节长,所以是不等长编码。
特性
UCS字符U+0000到U+007F(ASCII)被编码为字节0x00到0x7F(ASCII兼容)。这意味着只包含7位ASCII字符的文件在ASCII和UTF-8两种编码方式下是一样的。
所有>U+007F的UCS字符被编码为一个多个字节的串,每个字节都有标记位集。因此,ASCⅡ字节(0x00-0x7F)不可能作为任何其他字符的一部分。
表示非ASCⅡ字符的多字节串的第一个字节总是在0xC0到0xFD的范围里,并指出这个字符包含多少个字节。多字节串的其余字节都在0x80到0xBF范围里。这使得重新同步非常容易,并使编码无国界,且很少受丢失字节的影响。
本文地址: http://www.goggeous.com/b/1/614766
文章来源:天狐定制
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。
2025-01-08职业培训
2025-01-08职业培训
2025-01-08职业培训
2025-01-08职业培训
2025-01-08职业培训
2025-01-08职业培训
2025-01-08职业培训
2025-01-08职业培训
2025-01-08职业培训
2025-01-08职业培训
2024-12-14 14:56:00职业培训
2024-12-14 14:55:59职业培训
2024-12-14 14:55:58职业培训
2024-12-14 14:55:57职业培训
2024-12-14 14:55:56职业培训
2024-12-14 14:55:56职业培训
2024-12-14 14:55:55职业培训
2024-12-14 14:55:46职业培训
2024-12-14 14:55:46职业培训
2024-12-14 14:55:45职业培训
2024-12-13 22:21职业培训
2024-12-22 00:58职业培训
2024-12-28 03:30职业培训
2024-12-31 17:36职业培训
2024-12-23 00:32职业培训
2025-01-08 03:02职业培训
2025-01-07 03:26职业培训
2025-01-02 19:30职业培训
2024-12-10 05:57职业培训
2024-12-06 20:33职业培训
扫码二维码
获取最新动态