前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >造了个轮子 XML 2 JSON

造了个轮子 XML 2 JSON

作者头像
许杨淼淼
发布2018-07-11 15:29:04
3470
发布2018-07-11 15:29:04
举报
文章被收录于专栏:醉程序醉程序

如何让命令行提高我们的工作效率?如何快速的用命令行解析出xml文档中需要的字段?

事出有因

周末折腾无人问津的博客,发现Google几乎每篇文章都收录了,然而百度只收录了首页。。为啥只收录了首页呢?网上搜了搜发现用Github Page的很多都存在这个问题,猜测是因为N年前的百度JS DDOS Github… 虽然平时百度用的也少,但重在折腾嘛。在百度站长后台提交索引其实也没什么卵用,因为百度?️抓托管在Github Page的站点很大几率会被403… 折腾起来就是这样,本来托管在GitHub Page很省事儿,这下又搞了个CDN,也算是加速下吧。https://xu42.github.io/blog/ 转到了 https://blog.xu42.cn/

之后,想要在百度站长后台提交站点地图,总不能一个链接一个链接的打开复制粘贴吧,用的是Hexo,有个自动生成RSS订阅用的atom.xml文件,里面包含了所有的文章列表,当然也包括了url,怎么提取这部分url呢?这就是这个轮子的来因了。

造轮子

Github: https://github.com/xu42/xml2json

轮子造好了就提取个试试吧,一并在推给百度站长后台。

代码语言:javascript
复制
curl https://blog.xu42.cn/atom.xml |  xml2json | jq -r '.entry[].id' > urls.txtcurl -H 'Content-Type:text/plain' --data-binary @urls.txt "http://data.zz.baidu.com/urls?site=https://blog.xu42.cn&token=YOURTOKEN"

ok,完事~

怎么高效就怎么来

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 事出有因
  • 造轮子
相关产品与服务
内容分发网络 CDN
内容分发网络(Content Delivery Network,CDN)通过将站点内容发布至遍布全球的海量加速节点,使其用户可就近获取所需内容,避免因网络拥堵、跨运营商、跨地域、跨境等因素带来的网络不稳定、访问延迟高等问题,有效提升下载速度、降低响应时间,提供流畅的用户体验。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档