字符集
大约 2 分钟
为了正确显示 HTML 页面,Web 浏览器必须知道要使用哪个字符集。
从 ASCII 到 UTF-8
ASCII 是 第一个 字符编码标准。ASCII 定义了 128 种可以在互联网上使用的字符:数字(0-9)、英文字母(A-Z)和一些特殊字符。比如:!、$、+、-、(、)、@、<、>。
ISO-8859-1 是 HTML4 的默认字符集。此字符集支持 256 个不同的字符代码。HTML4 同时支持 UTF-8。
ANSI(Windows-1252)是原始的 Windows 字符集。ANSI 与 ISO-8859-1 相同,不同之处在于 ANSI 具有 32 个 额外 的字符。
HTML5 规范鼓励 Web 开发人员使用 UTF-8 字符集,该字符集涵盖了世界上几乎所有的字符和符号。
HTML charset 属性
为了正确显示 HTML 页面,Web 浏览器必须知道页面中使用的字符集。
这是在 <meta> 标签中规定的:
<meta charset="UTF-8" />如果未规定,UTF-8 则是 HTML 中的默认字符集。
ASCII 字符集
- ASCII 使用
0到31(以及127)之间的值作为控制字符 - ASCII 使用
32到126的值表示字母、数字和符号 - ASCII 不使用
128到255之间的值
ANSI 字符集(Windows-1252)
- 对于
0到127的值,ANSI与ASCII相同 ANSI有一组专有的字符,其值从128到159- 对于
160到255的值,ANSI与UTF-8相同
ISO-8859-1 字符集
- 对于
0到127的值,8859-1与ASCII相同 8859-1不使用128到159之间的值- 对于从
160到255的值,8859-1与UTF-8相同
UTF-8 字符集
- 对于
0到127的值,UTF-8与ASCII相同 UTF-8不使用128到159之间的值- 对于
160到255之间的值,UTF-8与ANSI和8859-1相同 UTF-8从值256继续,包含超过10000个不同字符
