【1】什么是编码?
【2】通过生活案例:
![](https://img.kancloud.cn/c2/2d/c22d15716e50838a53cadea01ea52aa6_974x364.png)
【3】由权威机构形成的编码表才可以称之为:字符集
ASCII
英文字符集
用一个字节的7位表示
IOS8859-1
西欧字符集
用一个字节的8位表示
GB2312
简体中文字符集
最多使用两个字节编码
PS:中文:2个字节
GB2312兼容了ASCII中的字符:
GBK
GB2312的升级,加入了繁体字
最多使用两个字节编码
疑问:
首位如果是0:一个字节代码代表一个字符
首位如果是1:那么一个字节不够,要加上后面的字节才能完整的表示一个字符。
Unicode
国际通用字符集,融合了目前人类使用的所有字符。为每个字符分配唯一的字符码。
退出了UTF标准:
三种编码方案: UTF-8,UTF-16,UTF-32
以UTF-8为案例讲解:
中文: 珊 ---》Unicode : 29642
![](https://img.kancloud.cn/8e/77/8e7735656b15a9759f9523e814a72b10_743x425.png)
底层存储:
![](https://img.kancloud.cn/9c/f0/9cf0553debc77e2ff3bd206e104c5af7_820x402.png)
UTF-8标准最多可以用6个字节表示:
![](https://img.kancloud.cn/66/a9/66a91a74da84c98441b5fa44024c9d3e_693x253.png)
以后我们用的最多的就是UTF-8.