xml作为一种重要的数据交换格式,在使用nodejs中也需要对其进行解析,这里所使用的解析模块是xmlreader。其作用是将xml根据节点解析为一个JSON对象,里面包含了一系列的方法,下面来看具体的使用方法。
首先是安装xmlreader模块
npm install xmlreader -S
然后就是引用了
var express = require('express');
var router = express.Router();
var http = require('http');
var https = require('https');
var readXml = require('xmlreader');
/* GET users listing. */
router.get('/readSitemap', function(req, res) {
var options = {
hostname: 'www.oecom.cn',
path: '/sitemap.xml',
method: 'GET'
};
var clientReq = https.request(options, function (clientRes) {
var xmlData = '';
var xmlURLArray = [];
console.log('STATUS: ' + clientRes.statusCode);
console.log('HEADERS: ' + JSON.stringify(clientRes.headers));
clientRes.setEncoding('utf8');
clientRes.on('data', function (chunk) {
//console.log('BODY: ' + chunk);
xmlData+=chunk;
});
clientRes.on('end', function (chunk) {
readXml.read(xmlData, function(errors, xmlResponse){
if(null !== errors ){
console.log(errors)
return;
}
console.log(xmlResponse);
xmlResponse.urlset.url.array.map(item=>{
xmlURLArray.push(item.loc.text());
});
res.end(JSON.stringify(xmlResponse.urlset.url.array[0]));
});
});
});
clientReq.on('error', function (e) {
console.log('problem with request: ' + e.message);
});
clientReq.end();
});
上述示例代码是通过一个接口来实现的,通过打印到控制台,我们可以看到其格式化后的数据。
上图是直接将xmlResponse输出,url作为xml的一个节点,其内容为一个array数组,接下来来看一下输出array其中一个的结果
通过上图我们可以看出,基本上包含以下几种方法,各方法含义如下:
1、attributes:获取所有属性。
2、parent:获取父节点。
3、count:获取数目。
4、at:获取下标为指定值的节点。
5、each:遍历,参数为一个函数。
6、text:获取节点内的文本,仅当前节点的文本,不包含子节点的文本。
如果想获取其中的内容,只需要调用text方法即可。