详解XML中的模式Schema

2017-02-23 18:32:13 xml/json
XML中拥有Schema特性,能够比DTD更加强大地引入元素结构,下面我们就来详解XML中的模式Schema的概念及作用和用法,需要的朋友可以参考下
文档定义模型为XML文档提供了规范,DTD的引入虽然解决了XML文档的规范化问题,但它文件格式类型和XML文件格式类型不一致,同时DTD提供的数据类型有限有时候无法满足行业的需求,所以引入了Schema。Schema模式可以确定XML文档的元素和属性的结构、元素的顺序、元素和属性的数据值,根据范围、枚举以及样式匹配等。
 

一、Schema初识

XML Schema语言也被称为XML Schema Definition (XSD),它的作用是定义一份XML文档的合法组件群(XML文档的结构),就像DTD的作用一样。 XML Schema以XML语言作为基础,也可以说XML Schema自身就是XML的一种应用。

1、Schema作用

XML Schema和DTD的作用一样,都是用来定义一个XML文档的结构的模式,那么为什么有了DTD还要有XML Schema呢? 因为,XML Schema比DTD作用更加强大。

Xml Schema 比 DTD的优越性:
(1)模式是可扩展的
(2)模式比 DTD 功能更丰富且更有用
(3)模式是用 XML 编写的
(4)模式支持数据类型
(5)模式支持名称空间
(6)不需要在学习其他的语言
(7)可以直接使用XML编辑器来编写XML Schema
(8)可以直接使用XML解析器来解析XML Schema
(9)可以使用XML DOM来灵活的操作XML Schema
(10)可以使用XSLT技术来转换XML Schema

2、对比学习

1.1 作用上

两者相同,都是定义了一个XML文档的结构的模式。

1.2 用法上

两者作用相同,但是语法上有些区别。Schema是DTD的扩展,同样支持元素和属性的定义,并且定义的语法相似,但Schema可以给元素和属性添加相应的数据类型,同时还引入了全局和局部元素声明的语法,另外根据元素和属性的数据内容引入了简单类型和复杂类型。
所谓的简单类型(SimpleType)和复杂类型(ComplexType),它们本身并不是具体的数据类型,它们只是对节点或者自定义类型的类型作一个抽象的说明。

也就是说Schema的引入使得模式的声明更加类似于我们使用的编程语言。

二、实例详解

2.1 Schema实例

清单1:User.xml文档结构

<?xml version="1.0"?>     
<用户列表>     
    <用户>     
         <用户名>xx</用户名>     
         <密码>123456</密码>     
         <用户类型>1</用户类型>     
   </用户>     
</用户列表> 

清单2:使用全局组件形式来定义Schema,User.xsd
<!-- 使用全局组件形式定义 -->     
<?xml version='1.0' encoding='utf-8'?>     
<xs:schema xmlns:xs='http://www.w3.org/2001/XMLSchema' elementFormDefault='qualified' attributeFormDefualt='unqualified'>     
 <xs:element name='用户列表' type='userlist'/>     
 <xs:complexType name='userlist'><!-- 使用complexType声明该类型为复合类型的元素 -->     
  <xs:sequence><!-- 使用sequence说明下面的元素必须按顺序在XML文档中显示 -->     
   <xs:element name='用户' type='user'/>     
  </xs:sequence>     
 </xs:complexType>     
 <xs:complexType name='user'>     
  <xs:sequence>     
   <xs:element name='用户名' type='user'/>     
   <xs:element name='密码' type='user'/>     
   <xs:element name='用户类型' type='user'/>     
  </xs:sequence>     
 </xs:complexType>     
</xs:schema>   

清单3:使用局部形式定义Schema,User.xsd
<!-- 使用局部形式定义 -->     
<?xml version='1.0' encoding='utf-8'?>     
<xs:schema xmlns:xs='http://www.nishishui.org/2000/XML Schema' elementFormDefault='qualified' attributeFormDefualt='unqualified'>     
 <xs:element name='用户列表'>     
  <xs:complexType>     
   <xs:sequence>     
    <xs:element name='用户'>     
     <xs:complexType>     
      <xs:sequence>     
       <xs:element name='用户名' type='xs:string'/>     
       <xs:element name='密码' type='xs:string'/>     
       <xs:element name='用户类型' type='xs:integer'/>     
      </xs:sequence>     
     </xs:complexType>     
    </xs:element>     
   </xs:sequence>     
  </xs:complexType>     
 </xs:element>     
</xs:schema>   

清单2和清单3的都定义了User.xsd,它们的作用是相同的,都是为了验证XML文档的合法性,但定义的方法不同,清单2是使用全局组件的形式定义,而清单3使用的局部形式定义,具体的区别请看下文。


2.2 基本用法

上文中我们分别从作用和用法上对Schema和DTD进行了对比分析,Schema和DTD最大的区别在于Schema引入了数据类型,其它的如元素和属性的声明等类似于DTD,在下面讨论时就不再详述。

Schema基本内容导图:



2.2.1 引用语法
当一个模式文件建立好以后,可以用它来验证某一个XML文档的有效性,也就是说检验某个XML文档是否遵循了模式文件的定义。 那么,XML文档怎么来引用一个模式文档呢?
Schema模型的引用更类似于前面所说的命名空间的应用方法,具体实例如下


    <?xml version='1.0' encoding='utf-8'?>     
    <用户列表 xmlns:xsi=http://www.nishishui.org/2000/XMLSchema xsi:noNamespaceSchemaLocation='user.xsd'><!-- 引用user.xsd -->     
     <用户>     
      <用户名>我是谁</用户名>     
      <密码>123456</密码>     
      <用户类型>1</用户类型>     
     </用户>     
    </用户列表>    

2.2.2 元素类型
(1)按照内容的不同分为简单和复杂元素,分别使用simpleType和complexType标示。
简单元素:元素中内容只能是文本,不包含其它的元素和属性。

    <?xml version='1.0' encoding='utf-8'?>     
    <xs:schema xmlns:xs='http://www.nishishui.org/2000/XML Schema' elementFormDefault='qualified' attributeFormDefualt='unqualified'>     
        <xs:element name='age'>     
            <xs:simpleType><!-- 使用关键字simpleType声明简单元素 -->     
                <!--restriction关键字结合minInclusive和maxInclusive控制了XML中元素可接受的值范围为0~100-->     
                <xs:restriction base="xs:integer">     
                    <xs:minInclusive value='0'/>     
                    <xs:maxInclusive value='100'/>     
                </xs:restriction>     
            </xs:simpleType>     
        </xs:element>     
    </xs:schema>   

复杂元素:元素中包含其它的元素和属性。它有四种类型,分别是空元素、只包含其他元素、只包含正文、包含正文又包含其他元素。

    <?xml version='1.0' encoding='utf-8'?>     
    <xs:schema xmlns:xs='http://www.nishishui.org/2000/XML Schema' elementFormDefault='qualified' attributeFormDefualt='unqualified'>     
        <xs:element name='age'>     
            <xs:complexType><!-- 使用关键字complexType声明复杂元素 -->     
                <!--sequence控制XML内容中元素出现的顺序-->     
                <xs:sequence>     
                    <!-- 定义具体的元素,这些都是简单元素-->     
                    <xs:element name='firstname' type='xs:string'/>     
                    <xs:element name='lastname' type='xs:string'/>     
                </xs:sequence>     
            </xs:complexType>     
        </xs:element>     
    </xs:schema>    

(2)按照定义位置可分为局部和全局元素。
全局元素:<element>元素的父元素必须是<schema>;
局部元素:局部元素声明只能出现在复杂类型(<complexType>元素)定义内部。即<element>元素的父元素只能是<all>、<choice>或<sequence>元素。
<?xml version='1.0' encoding='utf-8'?>     
<xs:schema xmlns:xs='http://www.nishishui.org/2000/XML Schema' elementFormDefault='qualified' attributeFormDefualt='unqualified'>     
    <xs:element name='用户' type='user'/><!-- 全局元素 -->     
    <xs:element name='用户名' type='xs:string'/><!-- 全局元素 -->     
    <xs:element name='密码' type='xs:string'><!-- 全局元素 -->     
        <xs:complexType name='user'>     
            <!--sequence控制XML内容中元素出现的顺序-->     
            <xs:sequence>     
                <!-- 定义具体的元素,这些都是简单元素-->     
                <!-- 定义局部元素,使用ref关键字引用,并使用minOccurs和maxOccurs制定元素出现的最少和最多的次数-->     
                <xs:element ref='用户名' minOccurs='0' maxOccurs='1'/><!-- 局部元素-->     
                <xs:element ref='密码' minOccurs='0' maxOccurs='1'/><!-- 局部元素-->     
            </xs:sequence>     
        </xs:complexType>     
    </xs:element>     
</xs:schema>