前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【愚公系列】2022年01月 Java教学课程 75-xml文件的介绍和解析

【愚公系列】2022年01月 Java教学课程 75-xml文件的介绍和解析

作者头像
愚公搬代码
发布2022-01-25 10:42:25
4070
发布2022-01-25 10:42:25
举报
文章被收录于专栏:历史专栏历史专栏

文章目录


一、xml

1.概述

  • 万维网联盟(W3C) 万维网联盟(W3C)创建于1994年,又称W3C理事会。1994年10月在麻省理工学院计算机科学实验室成立。 建立者: Tim Berners-Lee (蒂姆·伯纳斯·李)。 是Web技术领域最具权威和影响力的国际中立性技术标准机构。 到目前为止,W3C已发布了200多项影响深远的Web技术标准及实施指南,
    • 如广为业界采用的超文本标记语言HTML(标准通用标记语言下的一个应用)、
    • 可扩展标记语言XML(标准通用标记语言下的一个子集)
    • 以及帮助残障人士有效获得Web信息的无障碍指南(WCAG)等
  • xml概述 XML的全称为(EXtensible Markup Language),是一种可扩展的标记语言 标记语言: 通过标签来描述数据的一门语言(标签有时我们也将其称之为元素) 可扩展:标签的名字是可以自定义的,XML文件是由很多标签组成的,而标签名是可以自定义的
  • 作用
    • 用于进行存储数据和传输数据
    • 作为软件的配置文件
  • 作为配置文件的优势
    • 可读性好
    • 可维护性高

2.标签的规则

  • 标签由一对尖括号和合法标识符组成
代码语言:javascript
复制
<student>
  • 标签必须成对出现
代码语言:javascript
复制
<student> </student>
前边的是开始标签,后边的是结束标签
  • 特殊的标签可以不成对,但是必须有结束标记
代码语言:javascript
复制
<address/>
  • 标签中可以定义属性,属性和标签名空格隔开,属性值必须用引号引起来
代码语言:javascript
复制
<student id="1"> </student>
  • 标签需要正确的嵌套
代码语言:javascript
复制
这是正确的: <student id="1"> <name>张三</name> </student>
这是错误的: <student id="1"><name>张三</student></name>

3.语法规则

  • 语法规则

XML文件的后缀名为:xml

文档声明必须是第一行第一列

<?xml version="1.0" encoding="UTF-8" standalone="yes”?>

version:该属性是必须存在的

encoding:该属性不是必须的

​ 打开当前xml文件的时候应该是使用什么字符编码表(一般取值都是UTF-8)

standalone: 该属性不是必须的,描述XML文件是否依赖其他的xml文件,取值为yes/no

  • 必须存在一个根标签,有且只能有一个
  • XML文件中可以定义注释信息
  • XML文件中可以存在以下特殊字符
代码语言:javascript
复制
&lt; < 小于
&gt; > 大于
&amp; & 和号
&apos; ' 单引号
&quot; " 引号
  • XML文件中可以存在CDATA区

<![CDATA[ …内容… ]]>

  • 示例代码
代码语言:javascript
复制
<?xml version="1.0" encoding="UTF-8" ?>
<!--注释的内容-->
<!--本xml文件用来描述多个学生信息-->
<students>

    <!--第一个学生信息-->
    <student id="1">
        <name>张三</name>
        <age>23</age>
        <info>学生&lt; &gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;的信息</info>
        <message> <![CDATA[内容 <<<<<< >>>>>> ]]]></message>
    </student>

    <!--第二个学生信息-->
    <student id="2">
        <name>李四</name>
        <age>24</age>
    </student>

</students>

4.xml解析

  • 概述 xml解析就是从xml中获取到数据
  • 常见的解析思想 DOM(Document Object Model)文档对象模型:就是把文档的各个组成部分看做成对应的对象。 会把xml文件全部加载到内存,在内存中形成一个树形结构,再获取对应的值
在这里插入图片描述
在这里插入图片描述
  • 常见的解析工具

JAXP: SUN公司提供的一套XML的解析的API

JDOM: 开源组织提供了一套XML的解析的API-jdom

DOM4J: 开源组织提供了一套XML的解析的API-dom4j,全称:Dom For Java

pull: 主要应用在Android手机端解析XML

  • 解析的准备工作

我们可以通过网站:https://dom4j.github.io/ 去下载dom4j

今天的资料中已经提供,我们不用再单独下载了,直接使用即可

将提供好的dom4j-1.6.1.zip解压,找到里面的dom4j-1.6.1.ja

在idea中当前模块下新建一个libs文件夹,将jar包复制到文件夹中

选中jar包 -> 右键 -> 选择add as library即可

  • 需求

解析提供好的xml文件

将解析到的数据封装到学生对象中

并将学生对象存储到ArrayList集合中

遍历集合

  • 代码实现
代码语言:javascript
复制
<?xml version="1.0" encoding="UTF-8" ?>
<!--注释的内容-->
<!--本xml文件用来描述多个学生信息-->
<students>

    <!--第一个学生信息-->
    <student id="1">
        <name>张三</name>
        <age>23</age>
    </student>

    <!--第二个学生信息-->
    <student id="2">
        <name>李四</name>
        <age>24</age>
    </student>

</students>

// 上边是已经准备好的student.xml文件
public class Student {
    private String id;
    private String name;
    private int age;

    public Student() {
    }

    public Student(String id, String name, int age) {
        this.id = id;
        this.name = name;
        this.age = age;
    }

    public String getId() {
        return id;
    }

    public void setId(String id) {
        this.id = id;
    }

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }

    public int getAge() {
        return age;
    }

    public void setAge(int age) {
        this.age = age;
    }

    @Override
    public String toString() {
        return "Student{" +
                "id='" + id + '\'' +
                ", name='" + name + '\'' +
                ", age=" + age +
                '}';
    }
}

/**
 * 利用dom4j解析xml文件
 */
public class XmlParse {
    public static void main(String[] args) throws DocumentException {
        //1.获取一个解析器对象
        SAXReader saxReader = new SAXReader();
        //2.利用解析器把xml文件加载到内存中,并返回一个文档对象
        Document document = saxReader.read(new File("myxml\\xml\\student.xml"));
        //3.获取到根标签
        Element rootElement = document.getRootElement();
        //4.通过根标签来获取student标签
        //elements():可以获取调用者所有的子标签.会把这些子标签放到一个集合中返回.
        //elements("标签名"):可以获取调用者所有的指定的子标签,会把这些子标签放到一个集合中并返回
        //List list = rootElement.elements();
        List<Element> studentElements = rootElement.elements("student");
        //System.out.println(list.size());

        //用来装学生对象
        ArrayList<Student> list = new ArrayList<>();

        //5.遍历集合,得到每一个student标签
        for (Element element : studentElements) {
            //element依次表示每一个student标签
  
            //获取id这个属性
            Attribute attribute = element.attribute("id");
            //获取id的属性值
            String id = attribute.getValue();

            //获取name标签
            //element("标签名"):获取调用者指定的子标签
            Element nameElement = element.element("name");
            //获取这个标签的标签体内容
            String name = nameElement.getText();

            //获取age标签
            Element ageElement = element.element("age");
            //获取age标签的标签体内容
            String age = ageElement.getText();

//            System.out.println(id);
//            System.out.println(name);
//            System.out.println(age);

            Student s = new Student(id,name,Integer.parseInt(age));
            list.add(s);
        }
        //遍历操作
        for (Student student : list) {
            System.out.println(student);
        }
    }
}

5.DTD约束

  • 什么是约束

用来限定xml文件中可使用的标签以及属性

  • 约束的分类

DTD

schema

  • 编写DTD约束

步骤

创建一个文件,这个文件的后缀名为.dtd

看xml文件中使用了哪些元素

<!ELEMENT> 可以定义元素

判断元素是简单元素还是复杂元素

简单元素:没有子元素。

复杂元素:有子元素的元素;

  • 代码实现
代码语言:javascript
复制
<!ELEMENT persons (person)>
<!ELEMENT person (name,age)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
  • 引入DTD约束
  • 引入DTD约束的三种方法
    • 引入本地dtd
    • 在xml文件内部引入
    • 引入网络dtd
  • 代码实现
    • 引入本地DTD约束
代码语言:javascript
复制
// 这是persondtd.dtd文件中的内容,已经提前写好
<!ELEMENT persons (person)>
<!ELEMENT person (name,age)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>

// 在person1.xml文件中引入persondtd.dtd约束
<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE persons SYSTEM 'persondtd.dtd'>

<persons>
    <person>
        <name>张三</name>
        <age>23</age>
    </person>

</persons>
  • 在xml文件内部引入
代码语言:javascript
复制
<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE persons [
        <!ELEMENT persons (person)>
        <!ELEMENT person (name,age)>
        <!ELEMENT name (#PCDATA)>
        <!ELEMENT age (#PCDATA)>
        ]>

<persons>
    <person>
        <name>张三</name>
        <age>23</age>
    </person>

</persons>
  • 引入网络dtd
代码语言:javascript
复制
<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE persons PUBLIC "dtd文件的名称" "dtd文档的URL">

<persons>
    <person>
        <name>张三</name>
        <age>23</age>
    </person>

</persons>
  • DTD语法

定义元素

定义一个元素的格式为:<!ELEMENT 元素名 元素类型>

简单元素:

​ EMPTY: 表示标签体为空

​ ANY: 表示标签体可以为空也可以不为空

​ PCDATA: 表示该元素的内容部分为字符串

复杂元素:

​ 直接写子元素名称. 多个子元素可以使用",“或者”|"隔开;

​ ","表示定义子元素的顺序 ; “|”: 表示子元素只能出现任意一个

​ "?"零次或一次, "+"一次或多次, "*"零次或多次;如果不写则表示出现一次

在这里插入图片描述
在这里插入图片描述
  • 定义属性

格式

定义一个属性的格式为:<!ATTLIST 元素名称 属性名称 属性的类型 属性的约束>

属性的类型:

​ CDATA类型:普通的字符串

属性的约束:

​ // #REQUIRED: 必须的

​ // #IMPLIED: 属性不是必需的

​ // #FIXED value:属性值是固定的

  • 代码实现
代码语言:javascript
复制
<!ELEMENT persons (person+)>
<!ELEMENT person (name,age)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
<!ATTLIST person id CDATA #REQUIRED>

<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE persons SYSTEM 'persondtd.dtd'>

<persons>
    <person id="001">
        <name>张三</name>
        <age>23</age>
    </person>

    <person id = "002">
        <name>张三</name>
        <age>23</age>
    </person>

</persons>
​```

6.schema约束

  • schema和dtd的区别
    1. schema约束文件也是一个xml文件,符合xml的语法,这个文件的后缀名.xsd
    2. 一个xml中可以引用多个schema约束文件,多个schema使用名称空间区分(名称空间类似于java包名)
    3. dtd里面元素类型的取值比较单一常见的是PCDATA类型,但是在schema里面可以支持很多个数据类型
    4. schema 语法更加的复杂
在这里插入图片描述
在这里插入图片描述
  • 编写schema约束

步骤

1,创建一个文件,这个文件的后缀名为.xsd。

2,定义文档声明

3,schema文件的根标签为:

4,在中定义属性:

​ xmlns=http://www.w3.org/2001/XMLSchema

5,在中定义属性 :

​ targetNamespace =唯一的url地址,指定当前这个schema文件的名称空间。

6,在中定义属性 :

​ elementFormDefault="qualified“,表示当前schema文件是一个质量良好的文件。

7,通过element定义元素

8,判断当前元素是简单元素还是复杂元素

  • 代码实现
代码语言:javascript
复制
<?xml version="1.0" encoding="UTF-8" ?>
<schema
    xmlns="http://www.w3.org/2001/XMLSchema"
    targetNamespace="http://www.itheima.cn/javase"
    elementFormDefault="qualified"
>

    <!--定义persons复杂元素-->
    <element name="persons">
        <complexType>
            <sequence>
                <!--定义person复杂元素-->
                <element name = "person">
                    <complexType>
                        <sequence>
                            <!--定义name和age简单元素-->
                            <element name = "name" type = "string"></element>
                            <element name = "age" type = "string"></element>
                        </sequence>
                        
                    </complexType>
                </element>
            </sequence>
        </complexType>

    </element>

</schema>
  • 引入schema约束

步骤

1,在根标签上定义属性xmlns=“http://www.w3.org/2001/XMLSchema-instance”

2,通过xmlns引入约束文件的名称空间

3,给某一个xmlns属性添加一个标识,用于区分不同的名称空间

​ 格式为: xmlns:标识=“名称空间地址” ,标识可以是任意的,但是一般取值都是xsi

4,通过xsi:schemaLocation指定名称空间所对应的约束文件路径

​ 格式为:xsi:schemaLocation = "名称空间url 文件路径“

  • 代码实现
代码语言:javascript
复制
<?xml version="1.0" encoding="UTF-8" ?>

<persons
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xmlns="http://www.itheima.cn/javase"
    xsi:schemaLocation="http://www.itheima.cn/javase person.xsd"
>
    <person>
        <name>张三</name>
        <age>23</age>
    </person>

</persons>
​```

schema约束定义属性

  • 代码示例
代码语言:javascript
复制
<?xml version="1.0" encoding="UTF-8" ?>
<schema
    xmlns="http://www.w3.org/2001/XMLSchema"
    targetNamespace="http://www.itheima.cn/javase"
    elementFormDefault="qualified"
>

    <!--定义persons复杂元素-->
    <element name="persons">
        <complexType>
            <sequence>
                <!--定义person复杂元素-->
                <element name = "person">
                    <complexType>
                        <sequence>
                            <!--定义name和age简单元素-->
                            <element name = "name" type = "string"></element>
                            <element name = "age" type = "string"></element>
                        </sequence>
                        
                        <!--定义属性,required( 必须的)/optional( 可选的)-->
                        <attribute name="id" type="string" use="required"></attribute>
                    </complexType>
                    
                </element>
            </sequence>
        </complexType>
    </element>
    
</schema>

<?xml version="1.0" encoding="UTF-8" ?>
<persons
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xmlns="http://www.itheima.cn/javase"
    xsi:schemaLocation="http://www.itheima.cn/javase person.xsd"
>
    <person id="001">
        <name>张三</name>
        <age>23</age>
    </person>

</persons>
​```

7.服务器改进

  • 准备xml文件
  1. 在当前模块下的webapp目录下新建一个文件夹,名字叫WEB-INF
  2. 新建一个xml文件,名字叫web.xml
  3. 将资料中的web.xml文件中引入约束的代码复制到新建的web.xml文件中
  4. 将要解析的数据配置到xml文件中
  • 需求

把uri和servlet信息放到一个concurrentHashMap集合当中

当浏览器请求一个动态资源时,我们会获取uri对应的servlet来处理当前业务

  • 实现步骤
  1. 导入dom4j的jar包
  2. 定义一个XmlParseServletConfig类实现ParseServletConfig接口
  3. 在parse方法里面就可以解析xml文件了
  • 代码实现
代码语言:javascript
复制
// web.xml配置文件中配置的信息
<?xml version="1.0" encoding="UTF-8" ?>
<web-app xmlns="http://java.sun.com/xml/ns/javaee"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://java.sun.com/xml/ns/javaee http://java.sun.com/xml/ns/javaee/web-app_2_5.xsd"
         version="2.5">

    <!--在以后需要配置servlet的时候,就直接在这里配置就可以了-->
    <servlet>
        <servlet-name>LoginServlet</servlet-name>
        <servlet-class>com.itheima.myservlet.LoginServlet</servlet-class>
    </servlet>

    <servlet-mapping>
        <servlet-name>LoginServlet</servlet-name>
        <url-pattern>/servlet/loginservlet</url-pattern>
    </servlet-mapping>

</web-app>

// 定义一个XmlParseServletConfig类实现ParseServletConfig接口
public class XMLParseServletConfig implements ParseServletConfig {
    //定义web.xml文件的路径
    private static final String WEB_XML_PATH = "http-dynamic-server/webapp/WEB-INF/web.xml";

	//在parse方法里面就可以解析xml文件了
    @Override
    public void parse() {
        try {
            //1.创建一个解析器对象(注意:如果解析器对象等不能使用,请检查一下jar包是否导入)
            SAXReader saxReader = new SAXReader();

            //2.利用解析器把xml文件读取到内存中
            Document document = saxReader.read(new File(WEB_XML_PATH));

            //3.获取根节点元素对象
            Element rootElement = document.getRootElement();

            //创建一个Map集合,用来存储servlet的配置信息
            HashMap<String,String> servletInfoHashMap = new HashMap<>();

            //4.获取根元素对象下所有的servlet元素的对象
            List<Element> servletInfos = rootElement.elements("servlet");

            //5.遍历集合,依次获取到每一个servlet标签对象
            for (Element servletInfo : servletInfos) {
                //servletInfo依次表示每一个servlet标签对象

                //获取到servlet下的servlet-name元素对象,并且获取标签体内容
                String servletName = servletInfo.element("servlet-name").getText();
                //获取到servlet下的servlet-class元素对象,并且获取标签体内容
                String servletClass = servletInfo.element("servlet-class").getText();

                servletInfoHashMap.put(servletName,servletClass);
            }

            //--------------------servlet-mapping--------------------------------------
            //获取到所有的servlet-mapping标签
            List<Element> servletMappingInfos = rootElement.elements("servlet-mapping");
            //遍历集合依次得到每一个servlet-mapping标签
            for (Element servletMappingInfo : servletMappingInfos) {
                //servletMappingInfo依次表示每一个servlet-mapping标签

                //获取servlet-mapping标签标签中的servlet-name标签的标签体内容
                String servletName = servletMappingInfo.element("servlet-name").getText();

                //获取servlet-mapping标签标签中的url-pattern标签的标签体内容
                String urlPattern = servletMappingInfo.element("url-pattern").getText();

                //通过servletName来获取到servlet的全类名
                String servletClassName = servletInfoHashMap.get(servletName);

                //通过反射来创建这个servlet对象
                Class clazz = Class.forName(servletClassName);

                //获取该类所实现的所有的接口信息,得到的是一个数组
                Class[] interfaces = clazz.getInterfaces();

                //定义一个boolean类型的变量
                boolean flag =  false;
                //遍历数组
                for (Class clazzInfo : interfaces) {
                    //判断当前所遍历的接口的字节码对象是否和HttpServlet的字节码文件对象相同
                    if(clazzInfo == HttpServlet.class){

                        //如果相同,就需要更改flag值.结束循环
                        flag = true;
                        break;
                    }
                }

                if(flag){
                    //true就表示当前的类已经实现了HttpServlet接口
                    HttpServlet httpServlet = (HttpServlet) clazz.newInstance();
                    //4.将uri和httpServlet添加到map集合中
                    ServletConcurrentHashMap.map.put(urlPattern,httpServlet);
                }else{
                    //false就表示当前的类还没有实现HttpServlet接口
                    throw new NotImplementsHttpServletException(clazz.getName() + "Not Implements HttpServlet");
                }
            }
        } catch (NotImplementsHttpServletException e) {
            e.printStackTrace();
        }catch (Exception e) {
            e.printStackTrace();
        }
    }
}

public class LoaderResourceRunnable implements  Runnable {
    @Override
    public void run() {
//        //执行parse方法
//        ParseServletConfig parseServletConfig = new PropertiesParseServletConfig();
//        parseServletConfig.parse();

        ParseServletConfig parseServletConfig = new XMLParseServletConfig();
        parseServletConfig.parse();

    }
}
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2022-01-24 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 文章目录
  • 一、xml
    • 1.概述
      • 2.标签的规则
        • 3.语法规则
          • 4.xml解析
            • 5.DTD约束
              • 6.schema约束
                • 7.服务器改进
                相关产品与服务
                对象存储
                对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
                领券
                问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档