本文作者:小王

iso88591(iso88591转gbk)

小王 2023-07-09 60 抢沙发
iso88591(iso88591转gbk)摘要: 一主体不同 1gb2312是字符编码名称,属简体中文编码的一种2utf8是针对Unicode的一种可变长度字符编码3iso88591是单字节编码,向下兼容ASCII,其编码范围是0...

一主体不同 1gb2312是字符编码名称,属简体中文编码的一种2utf8是针对Unicode的一种可变长度字符编码3iso88591是单字节编码,向下兼容ASCII,其编码范围是0x000xFF,0x000x7F之间完全和ASCII一。

ISO88591编码是单字节编码,向下兼容ASCII,其编码范围是0x000xFF,0x000x7F之间完全和ASCII一致,0x800x9F之间是控制字符,0xA00xFF之间是文字符号此字符集支持部分于欧洲使用的语言,包括阿尔巴尼亚语巴斯克语。

Java使用ISO88591编码是因为这种编码国际上是通用的,可以兼容很多国家的语言编码我们国家的gbk编码格式是可以换成ISO88591格式的国际中通用的还有一种编码格式就是UTF8能兼容世界上几乎所有的语言,在网络传输为了。

不一样ISO88591属于单字节编码,最多能表示的字符范围是0255,应用于英文系列utf 兼容iso88591编码,同时也可以用来表示所有语言的字符具体可以在百科中搜索。

ISO 88591,正式编号为ISOIEC 885911998,又称Latin1或“西欧语言”,是国际标准化组织内ISOIEC 8859的第一个8位字符集它以ASCII为基础,在空置的0xA00xFF的范围内,加入96个字母及符号,藉以供使用附加符号。

若仍然以ISO88591格式解码,得到的中文字符肯定是乱码,因为ISO88591自身不能显示中文Java内部字符串String用得都是是Unicode编码,所以Java内部的字符串可以说是没有编码的只有bytes有编码但是java平台是有。

ISO88591 字符集,也就是 Latin1,是西欧常用字符,包括德法两国的字母ISO88592 字符集,也称为 Latin2,收集了东欧字符ISO88593 字符集,也称为 Latin3,收集了南欧字符更多定义可见参考 参考资料。

88591,又称latin1或“西欧语言”,是国际标准化组织内isoiec 8859的第一个8位字符集它以ascii为基础,在空置的0xa00xff的范围内,加入192个字母及符号,藉以供使用变音符号的拉丁字母语言使用这个默认编码是可以。

很明显,iso88591编码表示的字符范围很窄,无法表示中文字符但是,由于是单字节编码,和计算机最基础的表示单位一致,所以很多时候,仍旧使用iso88591编码来表示而且在很多协议上,默认使用该编码比如,虽然quot中文quot两个。

所以对于ISO88591和GB2312之间的转换就会出现麻烦了 呵呵 因为通常异种语言之间的转换是通过Unicode来完成的假设有两种不同的语言A和B,转换的步骤为先把A转化为Unicode,再把Unicode转化为B 打个比方吧 有GB2312中。

ascii被iso88591包括着呢,一般欧美电脑的系统中字体的locale是lati 也正是iso88591,也就是说支持更多的非标准字符详细的我一下子说不清,我摘一段wiki上的说明吧ISO 88591 encodes what it refers to。

88591是单字节编码,而中文是两个字节的,所以编码会出现问题 还可以通过编码转换的方式 设得到的字符串为s1 则转换后的字符串为 String s2 = new Strings1getBytesquotiso88591quot,quotutf8quot。

你大概理解错了,iso88591是单字节编码,不用直接用在中文上的,需要以其它的编码格式为基础iso88591编码表示的字符范围很窄,无法表示中文字符但是,由于是单字节编码,和计算机最基础的表示单位一致,所以很多时候。

默认情况下,tomcat使用的是iso88591的编码编码方式,浏览器的embed标签中src指向的地址要通过tomcat去解析如果包含中文,采用这种编码方式就会出现乱码问题,而在这种情况下,乱码问题就表现出无法访问该音频文件了解决方法。

iso88591(iso88591转gbk)

常用中文字符用utf开始有5万多汉字GBKGB2312收编的汉字占2个字节,严格地用iso88591无法表示汉字。

阅读
分享

发表评论

快捷回复:

评论列表 (暂无评论,60人围观)参与讨论

还没有评论,来说两句吧...