在SGML、 HTML与XML文档,如果某些Unicode字符在文档的当前编码方式(如ISO-8859-1)中不能直接表示,那么可以通过字符值引用或者字符实体引用两种转义序列来表示这些不能直接编码的字符。 下文列出在HTML与XML文档中有效的字符实体引用。
XML规范并不使用"字符实体"(character entity)ahmad或"字符实体引用"(character entity reference). XML规范定义了5个"预定义实体"来表示特殊字符. XML也允许在每个文档定义任意数量的其它命名实体.
下表列出了5个XML预定义实体. 通过名字引用这些实体的格式为&name;
,例如, &
将绘制为 &.
HTML 4 DTD定义了252个命名实体。HTML 4规范要求使用标准DTD,并且不许用户定义其它的命名实体.
下表中,"标准"栏指出该字符实体首次定义在哪个版本的HTML DTD中。HTML 4.01没有增加任何新的字符实体。
Notes:
在XHTML DTD中,明确声明了253个字符实体(包括5个XML 1.0的预定义实体). 除了'
实体这个例外,其它252个字符实体与HTML中的252个字符实体引用一致. 每个XHTML文件实例还可以定义任意数目的字符实体。但是XHTML字符实体的可用性受到该文件的处理方式的影响:
由于'
不能在HTML处理器中一致的安全使用,实际上仅有"
, &
, <
, and >
4个字符实体可以在所有处理环境下通用。