当前位置:首页职业培训

utf8是等长编码吗

作者:职业培训 时间: 2025-02-09 03:20:44 阅读:585

utf8不是等长编码。

UTF-8码是一种字符集,是分配整数给字符的编码表,将文本存储为2个或4个字节序列的串,可以最多到6个字节长,所以是不等长编码。

特性

UCS字符U+0000到U+007F(ASCII)被编码为字节0x00到0x7F(ASCII兼容)。这意味着只包含7位ASCII字符的文件在ASCII和UTF-8两种编码方式下是一样的。

所有>U+007F的UCS字符被编码为一个多个字节的串,每个字节都有标记位集。因此,ASCⅡ字节(0x00-0x7F)不可能作为任何其他字符的一部分。

表示非ASCⅡ字符的多字节串的第一个字节总是在0xC0到0xFD的范围里,并指出这个字符包含多少个字节。多字节串的其余字节都在0x80到0xBF范围里。这使得重新同步非常容易,并使编码无国界,且很少受丢失字节的影响。

标签:

本文地址: http://www.goggeous.com/g/1/614766

文章来源:天狐定制

版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。

猜你喜欢
猜你喜欢
  • 最新动态
  • 热点阅读
  • 猜你喜欢
热门标签

网站首页 ·

本站转载作品版权归原作者及来源网站所有,原创内容作品版权归作者所有,任何内容转载、商业用途等均须联系原作者并注明来源。

鲁ICP备2024081150号-3 相关侵权、举报、投诉及建议等,请发E-mail:admin@qq.com