UTF8 == Unicode Transformation Format -- 8 bit 是Unicode传送格式。即把Unicode文件转换成BYTE的传送流。 UTF8流的转换程序: Input: unsigned integer c - the code point of the character to be encoded (输入一个unicode值) Output: byte b1, b2,b3, b4 - the encoded sequence of bytes (输出四个BYTE值) Algorithm(算法): if (c<0x) b1 = c>>0 & 0x7F | 0x b2 = null b3 = null b4 = null else if (c<0x) b1 = c>>6 & 0x1F | 0xC0 b2 = c>>0 & 0x3F | 0x b3 = null b4 = null else if (c<0x) b1 = c>> & 0x0F | 0xE0 b2 = c>>6 & 0x3F | 0x b3 = c>>0 & 0x3F | 0x b4 = null else if (c<0x) b1 = c>> & 0x | 0xF0 b2 = c>> & 0x3F | 0x b3 = c>>6 & 0x3F | 0x b4 = c>>0 & 0x3F | 0x end if ===================== unicode 是一种编码表格,例如,给一个汉字规定一个代码。类似 GB-, GB等,只不过字集不同。 ===================== 一个unicode码可能转成长度为一个BYTE,或两个,三个,四个BYTE的UTF8码,取决于unicode码的值。英文unicode码因为值小于0x,只要用一个BYTE的UTF8传送,比送unicode两个BYTEs快。 UTF8是为传送unicode而想出来的“再编码”方法罢了。 UTF8转unicode用我上面给的程序反算即可。UTF8是现有ASCII系统转向Unicode系统的一个过渡解决方案。UTF8是保证 ASCII兼容性,再向大字符集方向扩展。这是Unicode推荐的方案。但是因 为解决问题的角度不同,对现有的中文系统不是好的解决方案。 一下连接提供了详细的 UTF8编码的初步知识 参考资料: 什么是UTF8呢?UTF8是一种Unicode编码,即它的编码的字符集和Unicode是一致的。但编码的方式不一样。对于英文字符来讲,UTF8的编码和一般的一样,用到一个字节。但对于中文来讲,那么要用三个字节表示(记忆中是三个)。 UTF8和Unicode的缺点是在处理查找、搜索等问题时,好像算法上比较复杂,效率不高(记忆中)。
推荐整理分享utf8和unicode编码究竟是什么关系?有何区别?(unicode和utf–8 编码),希望有所帮助,仅作参考,欢迎阅读内容。
文章相关热门搜索词:utf8和unicode的关系,unicode编码 utf8区别,unicode编码和utf-8编码的区别,utf8 unicode区别,unicode编码和utf-8编码的区别,utf-8编码和unicode,unicode编码 utf8区别,utf-8编码和unicode,内容如对您有帮助,希望把文章链接给更多的朋友!
收藏了很久的CSS的十八般技巧 最近,经常有朋友问我一些工作中遇到的CSS问题。他们总是不能很好的控制CSS,影响CSS的效率发挥。我来分析总结一下错误所在,帮助大家更加容易使用C
XHTML下css+div布局总结 超强推荐 xml(extensibleMarkupLanguage)的出现,结构化文档和数据有了一个通用的、科适应的格式,不仅仅应用在web上,也可以应用在任何地方。标准称为可能。XHTML是T
用CSS实现下拉菜单的多种方法 横向下拉菜单横向下拉菜单菜单一菜单一菜单一菜单一菜单一菜单一菜单一菜单二菜单二菜单二菜单二菜单二菜单二菜单三菜单三菜单三菜单三菜单三