字符编码之文字是如何显示的?
字符编码就是按照某种格式某种规定将字符存储在计算机中。
字符编码非常多,每个国家都有自己规定的字符编码。作为中国人,常用的字符编码有ASCII、 Unicode、UTF-8、GBK(简、繁体字融于一库)、GB2312(简体中文字符集)、BIG5(繁体中文字符集)。
通俗的说,由于计算机只能存储“011101”这种二进制数字,所以当我们在电脑上使用文字编辑工具,如记事本输入文字(或字母)后,计算机会把这些文字中的每个字转换成对应的一个数字存入磁盘,这个过程称为“编码”。当再次使用记事本打开文件后,计算机会把磁盘中的数据转换成文字显示,这个过程称为“解码”。
举个例子,假设输入的文字为“你好”,对应的编码为“0x5a13 0x89b7”,则再次打开记事本后,软件读取到磁盘上的数为“0x5a13”就会显示成“你”,读取到磁盘上的数为"0x89b7"就会显示成"好"。
最常用的编码方式就是ASCII(美国标准字符编码),只能编写英文的26个字母和一些其它字符,如空格编码值为32。
英文用ASCII码就够了,那中文呢?中文数量可是比英文多得多,这时候Unicode码这位救世主就出现了,中文主要使用其中的UTF-8进行编码,每个文字的编码都是独一无二的。
希望以上的回答对您有用。