我对 HTML 很陌生。最近我遇到了
<meta charset="utf-8>"
标签,它确保字母和字符在浏览器中正确呈现。
但我想知道为什么即使我不指定 UTF-8 所有字母和字符仍然可以完美显示?
您发送到浏览器的页面使用特定的字符编码(例如 UTF-8)。浏览器必须以正确的编码解释页面才能正确读取(即按预期)并显示正确的字符。浏览器可以通过多种方式确定要使用的编码,并依次回退到哪种编码:
Content-Type
标头如果页面在没有 HTML 元标记的情况下正确显示,则意味着其他机制之一导致浏览器选择将页面解释为 UTF-8。可能您的网络服务器正在输出 HTTP
Content-Type
标头,或者您的浏览器/系统的默认值为 UTF-8。
这是因为 HTML5 的默认字符编码是 UTF-8。
另请参阅此文档:
HTML5 的默认字符集是 UTF-8。
示例
<meta charset="UTF-8">
Unicode联盟制定了UTF-8和UTF-16标准, 因为 ISO-8859 字符集有限,并且不兼容多语言环境。
Unicode 标准涵盖(几乎)世界上所有的字符、标点符号和符号。
所有 HTML5 和 XML 处理器都支持 UTF-8、UTF-16、Windows-1252 和 ISO-8859。
编辑有趣的事实:文档随着时间的推移而变化:
对我来说,这表明您“真的”应该始终使用所使用的字符集来注释您的页面。此外,最新的文档对此更加明确:
要正确显示 HTML 页面,浏览器必须知道要使用什么字符集(编码)