XHTML™ 1.0: 可扩展超文本标记语言
附录 B. 元素禁止 附录 C. HTML 兼容指导 1. 什么是 XHTML?XHTML是一系列当前和将来的文档类型和程序块,它由HTML 4 [HTML]再生和扩展而来,HTML 4是其子集。XHTML系列文档基于XML,最终被设计用来与基于XML的用户代理程序一起工作。XHTML家族的详情及其发展过程在 未来趋势一节中详述。 XHTML 1.0(本规范书)是XHTML家族的第一个文档。它是将3种HTML 4文档类型应用到XML 1.0 [XML]之后重新形成的。其意图是,作为一种语言,它的内容既符合XML,并且如果依照一些简单的指导方针,也能被 HTML4用户代理程序识别。开发者将它们的文档移植成为XHTML 1.0,会得到以下好处: XHTML家族是Internet发展的下一步。将现在将文档移植成XML,开发者在确保他们的文档向前后兼容的同时,还能享有进入 XML世界带来的好处。 1.1 什么是HTML 4?HTML 4 [HTML] 是SGML (Standard Generalized Markup Language) 的一个应用,遵从国际标准ISO 8879,被广泛的当作 World Wide Web上的标准出版语言。 SGML是一种描述标记语言,特别是那些用于电子文档交换,文档管理和文档发布语言的语言。HTML是SGML定义的语言的一个实例。 SGML出现在80年代中期,一直保持得很稳定。稳定是原因是它有丰富的特征和具有灵活性。但是,灵活性的带来一定程度的复杂性,限制了它在多种环境下的适应性,包括World Wide Web。 HTML 最初的构想是作为一种交换科学和其它技术文档的一种语言,供那些不熟悉书写文档的专家使用。HTML规定一小套结构语义标签,适于书写相对简单的文档,从 而解决了SGML复杂性的问题。除了简化了文档结构外,HTML还加入了对超文本的支持,以后还增加了媒体功能。I < p>在非常短的时间内,HTML变得广泛流行,并且很快超出了其原来的目的。HTML(标准)内部的新元素以很快的速度创造出来,HTML 也被很快的改编以用于垂直的,高度专门化的市场。多余的新元素导致文档在跨平台时的兼容问题。随着软件和平台不一致性增加,很显然, “经典的”HTML 4在这些平台上使用的适用性就会受到一些限制。 1.2 什么是 XML?XML?? [XML]是 Extensible Markup Language的缩写,创造XML的目的是重新获得SGML的能力和灵活性,而去除其大部分复杂的东西。尽管是一个受限制SGML的形式,但是XML仍保留了SGML的大部分功能和丰富性,还保留了SGML的所有常用特性。 在保留这些有用的特性的同时,XML去掉了SMGL中很多更复杂的特性,这些特性使得书写和设计合适的软件既困难又昂贵。 1.3 为什么需要XHTML?上面已经提到了移植到XHTML的好处,一般来说,移植到 XHTML的好处有: 2. 定义2.1 术语本规范书要用到下面的词条。这些词条基于ISO/IEC 9945-1:1990 [POSIX.1]中类似的定义,并扩展定义在[RFC2119]中: 2.2 常见词条3. XHTML 1.0的标准定义3.1 文档一致性本版本 XHTML 提供了严格的遵循XHTML文档的定义,受限于XHTML名址提供的标签和属性。使用XHTML其它名址空间的信息,如RDF表达的元数据,请参看 Section 3.1.2 。 3.1.1 严格遵循的文档。一个严格遵循XHTML的文档只需要本规范书描述的强制性功能,必须依照下列标准: <html>< /code>。
下面是一个最小的XHTML文档示例: <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE html 注意在这个例子中含有XML声明。 XML声明并不是在所有的XML文档中都是必须的。XHTML被强烈建议使用XML声明。当字符编码不是缺省的UTF-8或UTF-6时,这样的声明是必须的。 3.1.2 在XHTML中使用其它名址空间在XHTML名址空间中可以用[XMLNAMES]使用其它XML名址空间,尽管这样文档会不是严格遵循XHTML的文档。W3C将在以后致力为多名址空间指定一致性的问题。 & amp; lt; p>下面的例子说明XHTML1.0和MathML推荐标准联合使用的方法。<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en"> 下面的例子说明XHTML1.0和其它XML名址空间联合使用的方法: <?xml version="1.0" encoding="UTF-8"?> 3.2 用户代理程序一致性一个遵从的用户代理程序必须遵照下面所有标准: XML处理程序将不同系统的行结束码规格化为单个换行附传递给应用。因此XHTML还必须将下列字符看成空白字符:< /p> 对 'xml:space' 属性被设为”保留”的元素,用户代理程序必须保持所有空白字符的原样 (引导和结尾处空白字符除外,这些字符应该被删除). 否则,按下列规则处理空白字符: 属性的值中的空白符的处理方式按照[XML]。< /p> 4. 与HTML 4的区别因为XHTML是XML的一个应用,一些在基于SGML的HTML 4中完全合法的习惯在XHTML中必须改变。 4.1 文档必须是编排良好的编排良好性Well-formedness 是[XML]引入的一个新概念。从本质上说,这意味着元素必须有结束标签,或者必须以特殊方式书写(在下面说明)。 元素必须嵌套,尽管SGML规定层叠非法,但现有的浏览器普遍允许层叠。 正确:嵌套元素。 & amp; amp; lt;p>here is an emphasized <em>paragraph</em>.</p> 不正确:层叠元素。 <p>here is an emphasized <em>paragraph.</p></em> 4.2 元素和属性名必须小写对所有HTML元素和属性名,XHTML 文档必须使用小写。因为XML是大小写敏感的,所以这个差别是必须的。如 <li> 和 <LI> 是不同的标签。 4.3 对非空元素,必须使用结束标签在基于 SGML的 HTML 4 中,一些隐含结束意义的元素允许忽略结束标签。而在基于XML的XHTML中,这种忽略不被允许。除了在DTD中被声明为空的元素,所有元素必须有结束标签。 正确:结束了的元素。 <p>here is a paragraph.</p><p>here is another paragraph.</p> 不正确:未结束元素。 <p>here is a paragraph.<p>here is another paragraph. 4.4 属性值必须在引号中所有的属性必须用引号,即使是数字。 & amp; lt; div class="good"> 正确:在引号中的属性值<table rows="3"> 不正确:不在引号中的属性值。< p><table rows=3> 4.5 属性最小化XML 不支持属性最小化. 属性值对必须写全。象compact,checked这样的属性名不能不指定属性值而在元素中出现。 正确:没有最小化的属性 <dl compact="compact"> 不正确:最小化属性 <dl compact> 4.6 空元素空元素要么必须有结束标签,要么起始标签以 正确:结束的空元素 <br/><hr/> 错误:未结束的空标签 <br><hr> 4.7 属性值中的空白字符处理对属性值,用户代理程序将删去引导和后序空白符,将一个或多个空白符(包括换行)转换成单个字符间空间(在西方书写体中是一个ASCII空格) SeeSection 3.3.3 of [XML]。< /p> 4.8 Script and Style 元素在XHTML中,script和style元素声明为 <script><![CDATA[... unescaped script content ...]]></script> CDATA 部分被 XML 处理程序识别,是文档对象模型中一个结点。请参看1.3节Section 1.3的DOM LEVEL 1推荐标准[DOM]。< /p> 替代的方式是使用外部script和style文档。 < h2>4.9 SGML 禁止SGML 给作者的DTD可以指定在一个元素内部禁止出现的元素。这样的禁止在XML中是不可能的。 例如,严格的 HTML 4 DTD 禁止任何深度的’a’元素对另一’a’元素的嵌套。在XML中无法写出这样的禁止。尽管这些禁止不能在DTD中定义,一些元素不应该被嵌套。在标准化的附录BAppendix B 中是这些元素的汇总。 4.10 具有 'id' 和 'name' 属性的元素HTML 4 定义了name属性的元素有 在XML中,片段标识符是ID类型,每个元素只能有一个ID类型的属性。因此,在XHTML1.0中,id属性被定义为ID类型。为保证XHTML1.0文档是结构良好的XML文档,在定义一个片段标识符时,XHTML文档 必须使用id属性,即使是对那些以前用name属性的元素。请参看 HTML Compatibility Guidelines 的信息,确保XHTML文档以text/html媒体类型使用时,这些”锚”能向后兼容。 注意,在XHTML 1.0中, & amp; lt; /p> 5. 兼容性问题尽管XHTML不必和已有的用户代理程序兼容,在操作上它很容易实现。创建兼容文档的指导方针在Appendix C中。 5.1 Internet 媒体类型在本推荐标准发布时,基于XML的应用的通用MIME标签问题还未被解决。 虽然如此,依照Appendix C中指导方针的XHTML文档可以标为"text/html"媒体类型,因为这被大多数浏览器兼容。本文档对XHTML文档的其它 MIME标签不做推荐。 6. 未来趋势XHTML 1.0 提供了一类文档类型的基础,此类文档将扩展xhtml和包含XHTML子集。为了广泛的支持新设备和新应用,定义模块和指定联合这些模块的机制。这个机制将用统一的方式定义新模块,以扩展和子集XHTML。 6.1 模块化 HTML因为XHTML的应用从传统的桌面用户代理程序转移到其它平台,显然,在所有的平台上不一定要用到所有的XHTML元素。例如,手上设备或蜂窝电话可以只支持XHTML元素的一个子集。 模块化的过程将XHTML分为一系列小的元素集。在不同的情况需要时,它们又可以重新联合起来。 这些模块将在以后的W3c 文档中定义。 6.2 子集和可扩展性模块化带来几个好处:
6.3 文档 协议文档协议指明了一组文档的句法和语义。遵循文档协议提供了保证文档互用性的基础。文档协议指定处理此类文档所需的功能,如,可以使用哪种图像文件类型,脚本的级别,样式表的支持情况,等等。 对于产品设计者,这可以使不同的团体定义他们自己的标准协议。 对于作者. 这可以使他们避免为不同的客户写不同的文档版本。 对于专业群体,如化学家,医生或数学家,这可以允许用标准的 HTML元素加上一组适合专家需要的元素来建立一个特殊的协议。 附录 A. DTDs本附录是标准化的. 这些 DTD 和实体构成了本规范书的一个标准化的部分。本规范书完全的 DTD 文件集以及XML声明和SGML开放目录在一个zip file文件中。 A.1 文档类型定义(Document Type Definitions)这些 DTD 类似 HTML 4 的DTD. 当DTD模块化之后,构件DTD使用的方法也许更能和HTML 4相对应。 A.2 实体集XHTML的实体集和HTML 4的相同,但是被修饰成有效的XML 1.0实体声明。注意欧洲货币符号的实体 ( 附录 B. 禁止元素This appendix is normative. 下面的元素在包含其它元素时有禁止(参看 Section 4.9)。这些禁止应用于所有深度的嵌套,即,保括子元素。 a 元素。 img,object,< code>big,small, sub,或 sup 元素。 input,select,< code>textarea,label,< code>button,form, fieldset,iframe 或 isindex 元素。 form 元素。 附录 C. HTML兼容性指导This appendix is informative. 本附录总结设计时的方针,指导作者书写可在现有HTML用户代理程序中显示的XHTML文档。 C.1 处理说明一些用户代理程序会显示处理说明。但是,注意当文档中没有XML声明时,文档只能用缺省的字符编码 UTF-8 或 UTF-16。 C.2 空元素在空元素结束符 C.3 元素最小化和空元素内容内容模型不是空的元素,在为空的场合(如空title或空段落),不要用最小化形式(如用 <p> </p>,不用 <p />). C.4 嵌入的样式表和Script如果你的样式表使用 C.5 在属性值内部分行在属性值中避免使用分行和多个空格符。用户代理程序处理这些情况时不一致。< /p> C.6 Isindex在文档的head部分不要使用超过一个 C.7 |
