个人电子商务网站建设长春seo技术
XML是什么
Extensible Markup Language 可扩展标记语言
是一种元语言
为什么要XML?
- 设计与特定领域有关的标记语言
- 自描述数据
- 应用间交换数据
- 结构化和集成的数据
XML是用来描述数据的,重点是“数据是什么”
XML优点
- 数据与格式分离,共享数据,读取方便
- 自由的,可扩展的
- 面向对象的特性,XML的文件是以树状方式存储,有属性
XML缺陷
- 搜索的效率极高,但是插入和修改效率低
XML应用广泛
- 设计标记语言、数据交换、数据共享、存储数据、WEB应……
XML文件的逻辑结构——用XML声明作为开头
<?xml version="1.0" encoding="GB2312" standalone="no" ?>三个属性
- version属性
在一个XML的处理指示中必须包括version属性指明所采用的XML的版本号,而且,它必须在属性列表中排在第一位。当前的XML的最新版本是1.0. - encoding属性 (可选)
所有的XML语法分析器都要支持8位和16位的编码标准。
几个常见的编码:简体中文码 (GB2312, gbk)、繁体中文码(BIG5)、全球通用字符(UTF-8) - standalone属性 (可选)
这个属性表明该XML文件是否和一个独立的标记声明文件配套使用。因此,如果该属性置为”yes",说明不需要另外一个配套的DTD文件或者XSL文件。相反,如果这个属性置为”no",则有可能有这样的文件。
什么是“形式良好的”XML文件
严格要求嵌套、配对,只有一个根元素
XML文件的逻辑结构
- 用XML声明作为开头
- 处理指示
- XML文件的精髓
XML元素
字符数据
标记 - CDATA
- 注释
XML文件的逻辑结构——元素
- 元素的形式:< 标记>数据内容</标记>
- 元素中还可以再嵌套别的元素
- 所有的XML文件都至少包含-一个形式良好的根元素。根元素,又称为文件标记,紧跟在XML声明之后,如果该XML文件中还内嵌了DTD,则这个根标记紧跟在DTD之后。根标记必须是一个非空的标记,其中包含了整个文件的数据内容。
- XML中开始和结束标记之间的文字称作“字符数据”,而把标记内的标示文字称作“标记”
XML文件的逻辑结构——字符数据
-
一对标记之间出现的字符数据可以是任何合法的字符
-
为了避免把字符数据和标记中需要用到的一些特殊符号相混淆,XML还提供了一些有用的实体引用。
当在字符数据中需要使用这些特殊符号时,我们采用它的实体引用来代替。
> >
< <
& &
" "
' '
- 在“示例”这个标记中出现文本:“<姓名>张三</姓名>”
<示例> <姓名>张三</姓名> </示例>
- <STATEMENT VALUE = "She said, “Don’t go there!””>写为:
<STATEMENT VALUE = "She said, "Don't go there!"">
XML文件的逻辑结构一一标记
XML的标记和HTML的标记在模样上大体相同,除了注释和CDATA部分
以外,所有符号“<" 和符号“>”之间的内容都称为标记。其基本形式为:<标记名(属性名“属性取值”)*>
- 标记必不可少
- 大小写有所区分
- 要有正确的结束标记。
- 当一对标记之间没有任何文本内容时,可以不写结束标记,而在开始标记的最后惯以斜杠“/"来确认。这样的标记称为“空标记”。如:
<HR/> - 标记要正确嵌套
- 标记命名要合法
标记应该以字母、下划线或冒号开头,但是中间不能有空格,而且任何标记不能以“xml”起始.另外,最好不要在标记的开头使用冒号,尽管它是合法的,但可能会带来混淆。
在XML1.0标准中允许使用任何长度的标记,不过,现实中的xu处理程序可
能会要求标记的长度限制在一定范围内。 - 有效使用属性
标记中可以包含任意多个属性。在标记中,属性以名称/取值对出现,属性名不能重复,名称与取值之间用等号“=”分隔,且取值用引号引起来。 如:<商品 类型=“服装” 颜色=“黄色">
属性命名的规范与标记命名规范大体相似,需要注意有效字母、大小写等一系列问题。不过,在必要的时候,属性中也可以包含空白符,标点和实体引用。需要特别注意的是,在xml中属性的取值必须用引号引起来,但在HTML中这一点并不严格要求。
==属性的所有赋值都被看作是字符串。==如: <圆柱体 半径=“10”高=“13">程序应该能够把字符串“10”和“13”转化为它们所代表的数字.
XML文件的逻辑结构——注释
- 在HTML中,注释是用“<! --”和“–>”引起来的。
在XML中,注释的方法完全相同。如:
<!-- <dd></dd>一个XML的例子--> - XML处理器对于注释中的一-切内容都会视而不见,注释中出现的标记也一同被忽略。
- 在XML文件中使用注释时,同样要遵守几个规则
在注释文本中不能出现字符串“–”
不要把注释文本放在标记之中,否则,它就不是一个“形式良好的”XML文件了。类似地,不要把注释文本放在实体
声明中,也不要放在XML声明之前。 - 注释不能被嵌套。
XML文件的逻辑结构一一处理指示
- 处理指示是用来给处理XML文件的应用程序提供信息的。
- 所有的处理指示应该遵循下面的格式:
<?处理指示名处理指示信息?> - 一个处理指示来指定与这个XML文件配套使用的样式单的类型及
文件名:
<?xml -stylesheet type=" text/xsl" href=' mystyle. xsl"?>
<!DOCTYPE Resume SYSTEM "03.dtd">
XML文件的逻辑结构——CDATA
在一个特殊的标记CDATA下,所有的标记、实体引用都被忽略,而被XML处理程序一视同仁地当作字符数据看待。
CDATA的形式如下:
<! [CDATA [ 文本内容]]>
CDATA的文本内容中是不能出现字符串“]]>”
<示例><联系人><姓名>张三</姓名>< EMAIL > ; zhang@aaa. com< /EMAIL>< /联系人>
</示例>
<示例><! [CDATA[<联系人><姓名>张三</姓名></联系人><EMAIL> zhang@aa. com </EMAIL>]] >
</示例>
XML命名空间( namespace)
- 融众多元素命名于一体
- 命名冲突问题的解决
前缀标识法
如何声明命名空间
什么是合法名称 - 命名空间的使用
命名空间作用于元素
命名空间作用于属性
