# DTD详解
### 基本概述
文档类型定义(Document Type Definition)是一套为了进行程序间的数据交换而建立的关于标记符的语法规则。它是标准通用标记语言(SGML)和可扩展标记语言(XML)1.0版规格的一部分,文档可根据某种DTD语法规则验证格式是否符合此规则。文档类型定义也可用做保证标准通用标记语言、可扩展标记语言文档格式的合法性,可通过比较文档和文档类型定义文件来检查文档是否符合规范,元素和标签使用是否正确。文件实例提供应用程序一个数据交换的格式。
PS:简而言之,DTD就是用来约束XML文档的,使其在一定的规范下使用,除了DTD技术外,还有Schema技术,也是用于约束XML文档的。
参考文档:DTD [http://www.w3school.com.cn/dtd/index.asp](http://www.w3school.com.cn/dtd/index.asp)
参考文档:Schema [http://www.w3school.com.cn/schema/index.asp](http://www.w3school.com.cn/schema/index.asp)
### DTD原理图
![](https://box.kancloud.cn/2016-02-23_56cbc8800390a.jpg)
PS:通过DTD约束,XML就能在DTD的约束下进行自定义了,不过DTD有个缺点,那就是不能对数据进行数值约束这种范围约束。
### DTD文档的声明及引用
内部DTD文档
<!DOCTYPE 根元素 [定义内容]>
外部DTD文档
<!DOCTYPE 根元素 SYSTEM "DTD文件路径">
内外部DTD文档结合
<!DOCTYPE 根元素 SYSTEM "DTD文件路径" [
定义内容
]>
注意事项:
1、定义关键字一定要大写,例如:DOCTYPE、ELEMENT、ATTLIST。
2、当引用的文件在本地时,采用如下方式:
<!DOCTYPE 文档根结点 SYSTEM "DTD文件的URL">
例如: <!DOCTYPE 书架 SYSTEM “book.dtd”>
当引用的文件是一个公共的文件时,采用如下方式:
<!DOCTYPE 文档根结点 PUBLIC "DTD名称" "DTD文件的URL">
例如:<!DOCTYPE web-app PUBLIC "-//Sun Microsystems, Inc.//DTD Web Application 2.3//EN" "http://java.sun.com/dtd/web-app_2_3.dtd">
### DTD元素
### 基本语法
<!ELEMENT NAME CONTENT>
解释:
ELEMENT:关键字(必须大写)。
NAME:元素名称。
CONTENT:元素类型,有四种,都必须大写。
1、EMPTY-该元素不能包含子元素和文本,但可以有属性(空元素)
2、ANY-该元素可以包含任何在DTD中定义的元素内容
3、#PCDATA-可以包含任何字符数据,但是不能在其中包含任何子元素
4、其它类型(组合),可以是子元素,子元素与修饰符组合,基本元素与子元素与修饰符组合。
案例:
<!ELEMENT 班级 (学生+,作者)>
<!ELEMENT 学生 (名字,年龄,介绍)>
<!ELEMENT 作者 (#PCDATA)>
<!ELEMENT 名字 (#PCDATA)>
<!ELEMENT 年龄 (#PCDATA)>
<!ELEMENT 介绍 (#PCDATA)>
修饰符
<table><tbody><tr><td valign="center" style="background:rgb(255,255,204)"><p>符号<span style="font-family:Calibri"> </span></p></td><td valign="center" style="background:rgb(255,255,204)"><p>用途<span style="font-family:Calibri"> </span></p></td><td valign="center" style="background:rgb(255,255,204)"><p>示例</p></td><td valign="center" style="background:rgb(255,255,204)"><p>示例说明</p></td></tr><tr><td valign="center"><p>( )</p></td><td valign="center"><p>用来给元素分组<span style="font-family:Calibri"> </span></p></td><td valign="center"><p>(古龙<span style="font-family:Calibri">|</span><span style="font-family:宋体">金庸</span><span style="font-family:Calibri">|</span><span style="font-family:宋体">梁羽生)</span><span style="font-family:Calibri">,</span><span style="font-family:宋体">(王朔</span><span style="font-family:Calibri">|</span><span style="font-family:宋体">余杰)</span></p></td><td valign="center"><p>分成两组</p></td></tr><tr><td valign="center"><p>|</p></td><td valign="center"><p>在列出的对象中选择一个<span style="font-family:Calibri"> </span></p></td><td valign="center"><p>(男人<span style="font-family:Calibri">|</span><span style="font-family:宋体">女人)</span><span style="font-family:Calibri"> </span></p></td><td valign="center"><p>表示男人或者女人必须出现,而且只能选一个<span style="font-family:Calibri"> </span></p></td></tr><tr><td valign="center"><p>+</p></td><td valign="center"><p>该对象最少出现一次,可以出现多次<span style="font-family:Calibri"> (1</span><span style="font-family:宋体">或多次)</span></p></td><td valign="center"><p>(成员<span style="font-family:Calibri">+</span><span style="font-family:宋体">)</span><span style="font-family:Calibri"> </span></p></td><td valign="center"><p>表示成员必须出现,而且可以出现多个成员</p></td></tr><tr><td valign="center"><p>*</p></td><td valign="center"><p>该对象允许出现零次到任意多次(<span style="font-family:Calibri">0</span><span style="font-family:宋体">到多次)</span></p></td><td valign="center"><p>(爱好<span style="font-family:Calibri">*</span><span style="font-family:宋体">)</span><span style="font-family:Calibri"> </span></p></td><td valign="center"><p>爱好可以出现零次到多次</p></td></tr><tr><td valign="center"><p>?</p></td><td valign="center"><p>该对象可以出现,但只能出现一次<span style="font-family:Calibri"> (0</span><span style="font-family:宋体">到</span><span style="font-family:Calibri">1</span><span style="font-family:宋体">次</span><span style="font-family:Calibri">)</span></p></td><td valign="center"><p>(菜鸟<span style="font-family:Calibri">?</span><span style="font-family:宋体">)</span><span style="font-family:Calibri"> </span></p></td><td valign="center"><p>菜鸟可以出现,也可以不出现,如果出现的话,最多只能出现一次<span style="font-family:Calibri"> </span></p></td></tr><tr><td valign="center"><p>,</p></td><td valign="center"><p>对象必须按指定的顺序出现<span style="font-family:Calibri"> </span></p></td><td valign="center"><p>(西瓜<span style="font-family:Calibri">,</span><span style="font-family:宋体">苹果</span><span style="font-family:Calibri">,</span><span style="font-family:宋体">香蕉)</span><span style="font-family:Calibri"> </span></p></td><td valign="center"><p>表示西瓜、苹果、香蕉必须出现,并且按这个顺序出现<span style="font-family:Calibri"> </span></p></td></tr></tbody></table>
### DTD属性
### 基本语法
<!ATTLIST 元素名称
属性名称 类型 属性特性
属性名称 类型 属性特性…...
>
解释:
ATTLIST:属性列表,(必须大写)。
元素名称:对应的元素的名称。
属性:属性能够有多个,其格式是名称 类型 属性特性
类型:
![](https://box.kancloud.cn/2016-02-23_56cbc88024c36.jpg)
PS:常用的有CDATA(字符型),枚举(枚举格式是(值1|值2|值3...)),ID(ID不能重复,不能以数字开头),IDREF(引用另一个ID值),IDREFS(可以引用多个ID值,以空格隔开)
属性特性有:
![](https://box.kancloud.cn/2016-02-23_56cbc8803c0b3.jpg)
案例:
~~~
<!ELEMENT 班级 (学生+,作者)>
<!ATTLIST 班级
班次 CDATA "1班"
编号 ID #REQUIRED
>
<!ELEMENT 学生 (名字,年龄,介绍)>
<!ELEMENT 作者 (#PCDATA)>
<!ATTLIST 学生
地址 CDATA #IMPLIED
授课方式 CDATA #FIXED "面授"
学号 ID #REQUIRED
班级编号 IDREF #REQUIRED
朋友 IDREFS #IMPLIED
>
<!ELEMENT 名字 (#PCDATA)>
<!ELEMENT 年龄 (#PCDATA)>
<!ELEMENT 介绍 (#PCDATA)>
~~~
### 实体
实体有引用实体和参数实体两种,引用实体一般是在XML使用,参数实体一般是在DTD中使用。
### 基本语法
<!ENTITY 实体名称 “实体内容” > // 引用实体
<!ENTITY % 实体名称 "实体内容" > // 参数实体
解释:
1、引用实体可以在引用了DTD的XML文件中,使用&实体名称;来使用实体内容。
2、不知道是不是我的电脑原因,外部DTD中不能用引用实体,如果用将引用实体定义放在内部DTD中,则可以使用。
3、参数实体在DTD中使用,使用%实体名称;使用
4、可以将那些重复使用的值定义成实体,这样能减少代码的冗余度。
5、在外部DTD中,引用实体最好放在DTD底部,参数实体最好放在DTD顶部。
案例:
~~~
<!ENTITY % sex "男|女">
<!ELEMENT 班级 (学生+,作者)>
<!ELEMENT 学生 (名字,年龄,介绍)>
<!ELEMENT 作者 (#PCDATA)>
<!ATTLIST 学生
性别 (%sex;) #REQUIRED
>
<!ELEMENT 名字 (#PCDATA)>
<!ELEMENT 年龄 (#PCDATA)>
<!ELEMENT 介绍 (#PCDATA)>
<!ENTITY writer "Switch">
~~~
综合案例1:
**XML3.dtd**
~~~
<!ENTITY % sex "男|女">
<!ELEMENT 班级 (学生+,作者)>
<!ATTLIST 班级
班次 CDATA "1班"
编号 ID #REQUIRED
>
<!ELEMENT 学生 (名字,年龄,介绍)>
<!ELEMENT 作者 (#PCDATA)>
<!ATTLIST 学生
地址 CDATA #IMPLIED
授课方式 CDATA #FIXED "面授"
学号 ID #REQUIRED
班级编号 IDREF #REQUIRED
朋友 IDREFS #IMPLIED
性别 (%sex;) #REQUIRED
>
<!ELEMENT 名字 (#PCDATA)>
<!ELEMENT 年龄 (#PCDATA)>
<!ELEMENT 介绍 (#PCDATA)>
~~~
**XML3.xml**
~~~
<?xml version="1.0" encoding="UTF-8"?>
<!-- 引入DTD -->
<!DOCTYPE 班级 SYSTEM "XML3.dtd"
[<!ENTITY writer "Switch">]>
<班级 编号="C1" 班次="1班">
<学生 地址="湖南" 授课方式="面授" 学号="n1" 班级编号="C1" 朋友="n2" 性别="男">
<名字>张三</名字>
<年龄>20</年龄>
<介绍>不错</介绍>
</学生>
<学生 授课方式="面授" 学号="n2" 班级编号="C1" 朋友="n1 n3" 性别="女">
<名字>李四</名字>
<年龄>18</年龄>
<介绍>很好</介绍>
</学生>
<学生 授课方式="面授" 学号="n3" 班级编号="C1" 朋友="n2" 性别="男">
<名字>王五</名字>
<年龄>22</年龄>
<介绍>非常好</介绍>
</学生>
<作者>&writer;</作者>
</班级>
~~~
综合案例2:
**XML4.dtd**
~~~
<!ENTITY AUTHOR "John Doe">
<!ENTITY COMPANY "JD Power Tools, Inc.">
<!ENTITY EMAIL "jd@jd-tools.com">
<!ELEMENT CATALOG (PRODUCT+)>
<!ELEMENT PRODUCT
(SPECIFICATIONS+,OPTIONS?,PRICE+,NOTES?)>
<!ATTLIST PRODUCT
NAME CDATA #IMPLIED
CATEGORY (HandTool|Table|Shop-Professional) "HandTool"
PARTNUM CDATA #IMPLIED
PLANT (Pittsburgh|Milwaukee|Chicago) "Chicago"
INVENTORY (InStock|Backordered|Discontinued) "InStock">
<!ELEMENT SPECIFICATIONS (#PCDATA)>
<!ATTLIST SPECIFICATIONS
WEIGHT CDATA #IMPLIED
POWER CDATA #IMPLIED>
<!ELEMENT OPTIONS (#PCDATA)>
<!ATTLIST OPTIONS
FINISH (Metal|Polished|Matte) "Matte"
ADAPTER (Included|Optional|NotApplicable) "Included"
CASE (HardShell|Soft|NotApplicable) "HardShell">
<!ELEMENT PRICE (#PCDATA)>
<!ATTLIST PRICE
MSRP CDATA #IMPLIED
WHOLESALE CDATA #IMPLIED
STREET CDATA #IMPLIED
SHIPPING CDATA #IMPLIED>
<!ELEMENT NOTES (#PCDATA)>
~~~
**XML4.xml**
~~~
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE CATALOG SYSTEM "XML4.dtd">
<CATALOG>
<PRODUCT NAME="C'estbon" CATEGORY="Shop-Professional" INVENTORY="Backordered" PARTNUM="10" PLANT="Chicago">
<SPECIFICATIONS POWER="0" WEIGHT="555ml">SPECIFICATIONS</SPECIFICATIONS>
<OPTIONS>OPTIONS</OPTIONS>
<PRICE>2</PRICE>
<NOTES>NOTES</NOTES>
</PRODUCT>
</CATALOG>
~~~