浅析NAS存储中的字符编码 |
发布时间: 2012/6/24 9:33:36 |
这要从字符编码的概念开始说起: 字符(character):顾名思义,字符是文字与符号的总称。英文字母,汉字和数学符号等都是字符。 编码(encoding):计算机只能先将字符用二进制码来表示,然后再进行处理或者存储。把字符和2进制码对应起来就叫编码。比如字母A的编码就是1000001. 最早给字符编码的是美国人,他们的编码方案叫做ASCII.那时候计算机还是稀罕物,也没人想到有一天它会在全球普及。所以ASCII编码只包含了拉丁字母和符号,加起来也就100多个,用一个字节来编码就足够了(英文国家是不是文盲率很低?学好字母就差不多识字了)。 没想到计算机普及得太快了。各国人民在学会说英文之前,已经先学会使用电脑。所以很多非英文国家为自己的文字制定了符合ANSI(美国国家标准协会)标准的编码,比如中国的GB2312和日本的JIT.ANSI标准保留了所有ASCII编码,所以无论是GB2312,JIT还是其他国家的ANSI编码都支持拉丁字母。中文字符比拉丁字母多太多了,一个字节表示不完,所以GB2312用两个字节表示一个汉字。 本文出自:亿恩科技【www.enkj.com】 |