xml基本知识点

xml, Extensible Markup Language,可扩展的标记语言。

xml文档结构.jpg

xml文档的规则 1.0 xml文档必须以一个xml声明开始 2.0 xml文档有且只有一个根元素。 3.0 开始标记和结束标记必须成对出现。 4.0 各元素之间正确嵌套。 5.0 xml标记都是大小写敏感的。 6.0 属性必须用引号" ";


列子

<?xml version="1.0" encoding="utf-8"?>
<!-- 我是注释 -->
<魔鬼名单>

<魔鬼 职务="天使长">
<name>路西法</name>
<age>9999</age>
<sex>man</sex>
</魔鬼>
<魔鬼>
<name>洛基</name>
<age>6666</age>
<sex>man</sex>
</魔鬼>

</魔鬼名单>

结果

<?xml version="1.0" encoding="utf-8"?> 是xml的声明,以<?xml 开始,以?>结束,version是版本(好像只能取1.0),encoding是字符编码。

xml元素命名规范 与html不同,xml没有预置任何元素,允许开发者自定义,但是有规范。 1.0 名字必须以 _(下划线)或者字母开头。 2.0 名字不能出现xml,Xml等任意大小写组合开始。 。。。。。。

xml的属性 形式 <开始标记 属性1=" 属性值1 ",属性2=" 属性值2 "........> 数据内容 </结束标记> 规则: 1.0 属性命名规则同元素命名。 2.0 属性值必须用引号值括起来。 3.0 属性值只能包含在开始标记。 4.0 特定的属性名称在同一元素只能出现一次。

一个元素特征可以用其子元素来表示,属性可以描述元素特征,但是定义过多属性会降低程序可读性。

<date year="2018" month="3" day="19"></date>

<date>
  <year>2018</year>
  <month>3</month>
  <day>19</day>
</date>

上面2个是等价的。

空元素 如果元素不包含任何文本,那么它就是空元素,空元素不可接受字元素。 形式: <标记名称 属性列表/> 或者 <标记名称/> 或者 <标记名称></标记名称>

<dflx/>
<dflx></dflx>
<dflx lover="雨"/>

由于空元素不包含任何内容,因此在编写xml的时候,空元素主要用于抽象带有属性的数据,该数据本身并不需要用具体的文本来进行描述。

元素嵌套 1.0 父元素的起始标记必须在子元素的起始标记前,父元素的结束标记必须在子元素的结束标记后,元素之间不可交叉嵌套。 2.0 子元素和子元素间是兄弟关系。 3.0 二个元素之间不能即是父子关系又是兄弟关系。

实体引用和CDATA段 开始标记和结束标记之间的文本可以是任何Unicode字符,但是如果文本包含一些特殊的字符,可以采用实体引用或者CDATA段。 比如: <exprect>1+1&lt;6</exprect> 结果是:

<exprect>1+1<6</exprect>

xml预置的5个实体引用。 '&lt' 所代表的符号<, &gt;所代表的符号为> '&' 所代表的符号为&,

&apos; 所代表的符号为';   &quot;所代表的符号为".

如果文本包含大量的>,<,&等特殊符号,需要发大量时间转换,这时用CDATA段解决。 格式: <![CDATA[文本内容]]>

<python>
  <![CDATA[
  if(you love my article)
  plase mark me;
  ]]>
</python>

结果

命名空间 xml最大特点就是易扩展性,它允许用户自定义标记,这个给用户非常大的自由空间,但是同时也出现了标记名称重复性的问题。为解决标记名称相同的情况,采用命名空间解决。

有前缀的命名空间: xmlns:前缀="命名空间的名字"; 无前缀的命名空间: xmlns=命名空间的名字; 命名空间前缀不能用 xml, xmlns,并且前缀之间不能有空格。如果命名空间名字相同则称命名空间相同。

xmlns:north="lz"
xmlns:north="liao"

这个只是前缀相同,名称空间不同。

xmlns:hello="microsoft"
xmlns:ok="microsoft"

这2个命名空间相同,都是apple.

在标记中声明命名空间必须放在开始标记,放在开始标记的标记名称空间后面。 如果一个标记有声明前缀的命名空间,必须通过放在标记名称前面添加的空间前缀和冒号来引用命名空间。一个标记可以声明多个命名空间

<student xmlns:class1="software" xmlns:class2="cs">
  <class1:张三>sex:man</class1:张三>
  <class2:李四>sex:man</class2:李四>
</student>

image.png

命名空间的作用域:命名空间的作用域就是该命名空间的作用范围。 1.0 一个无前缀的标记的命名空间作用域,是该标记及其子标记。 2.0 如果是有前缀名称的标记命名空间,其子元素如果想属于该空间,需要通过引用名称空间的前缀来继承命名空间。

<student xmlns:class1="software">
  <class1:张三>sex:man</class1:张三>
  <李四>sex:man</李四>
</student>

比如这个,张三属于software命名空间,李四就不输入。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏开发与安全

从零开始学C++之从C到C++(一):const与#define、结构体对齐、函数重载name mangling、new/delete 等

一、bool 类型 逻辑型也称布尔型,其取值为true(逻辑真)和false(逻辑假),存储字节数在不同编译系统中可能有所不同,VC++中为1个字节。 声明方式...

1920
来自专栏desperate633

LintCode 两个字符串是变位词题目分析代码

写出一个函数 anagram(s, t) 判断两个字符串是否可以通过改变字母的顺序变成一样的字符串。

862
来自专栏Vamei实验室

Python基础03 序列

sequence 序列 sequence(序列)是一组有顺序的元素的集合 (严格的说,是对象的集合,但鉴于我们还没有引入“对象”概念,暂时说元素) 序列可以包含...

1945
来自专栏JAVA技术站

shell学习二数组 原

类似与C语言,数组元素的下标由0开始编号。获取数组中的元素要利用下标,下标可以是整数或算术表达式,其值应大于或等于0。

481
来自专栏Redis

Redis类型之lists类型

9、rpoplpush 从第一个list的尾部移除元素并添加到第二个list的头部,最后返回被移除的元素值,整个操作是原子的,如果第一个list是空或者不存在...

1450
来自专栏吾爱乐享

java之学习vector类的特有功能

1292
来自专栏小樱的经验随笔

strncmp函数——比较特定长度的字符串

strncmp函数用于比较特定长度的字符串。 头文件:string.h。 语法  int strncmp(const char *string1, const ...

3299
来自专栏日常学python

深入理解python中的类和对象

刚开始学习python的时候或者其他的是面向对象的编程语言的时候,难免会对类和对象理解得不太清楚。所以今天和大家分享下python中的类和对象,深入理解下pyt...

1040
来自专栏流媒体

C语言数组

1463
来自专栏Kevin-ZhangCG

[ Java学习基础 ] Java构造函数

2356

扫码关注云+社区

领取腾讯云代金券