专栏首页醉程序造了个轮子 XML 2 JSON

造了个轮子 XML 2 JSON

如何让命令行提高我们的工作效率?如何快速的用命令行解析出xml文档中需要的字段?

事出有因

周末折腾无人问津的博客,发现Google几乎每篇文章都收录了,然而百度只收录了首页。。为啥只收录了首页呢?网上搜了搜发现用Github Page的很多都存在这个问题,猜测是因为N年前的百度JS DDOS Github… 虽然平时百度用的也少,但重在折腾嘛。在百度站长后台提交索引其实也没什么卵用,因为百度?️抓托管在Github Page的站点很大几率会被403… 折腾起来就是这样,本来托管在GitHub Page很省事儿,这下又搞了个CDN,也算是加速下吧。https://xu42.github.io/blog/ 转到了 https://blog.xu42.cn/

之后,想要在百度站长后台提交站点地图,总不能一个链接一个链接的打开复制粘贴吧,用的是Hexo,有个自动生成RSS订阅用的atom.xml文件,里面包含了所有的文章列表,当然也包括了url,怎么提取这部分url呢?这就是这个轮子的来因了。

造轮子

Github: https://github.com/xu42/xml2json

轮子造好了就提取个试试吧,一并在推给百度站长后台。

curl https://blog.xu42.cn/atom.xml |  xml2json | jq -r '.entry[].id' > urls.txtcurl -H 'Content-Type:text/plain' --data-binary @urls.txt "http://data.zz.baidu.com/urls?site=https://blog.xu42.cn&token=YOURTOKEN"

ok,完事~

怎么高效就怎么来

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Java NIO 系列学习 05 - Scatter and Gather

    Java NIO 提供了内置的Scatter和Gather支持。Scatter和Gatter是用于读写Channel的概念。

    许杨淼淼
  • CentOS7 firewall防火墙常用操作

    firewalld: 动态防火墙后台程序 firewall-config: 图形化的配置工具 firewall-cmd: 命令行客户端

    许杨淼淼
  • fatal could not read Username for 'https://github.com' terminal prompts disabled

    许杨淼淼
  • 00后们都开始工作了,可能挣得比你还多!

    ? 又到一年一度的毕业季 鹅老师跟大家聊一个让人既期待又抗拒的话题 搬砖找工作 当90后还在感叹自己的“积蓄”如下图所示 ? 一大批小鲜肉已纷纷踏入职场 与“...

    鹅老师
  • Spring Boot 2.x (二):Spring Boot 基础配置

    在 Spring Boot 中,配置文件有两种不同的格式,一种是 properties ,另一种是 yaml。

    阿宝哥
  • Redis 单线程模型介绍

    redis 将所有数据放在内存中,内存的响应时长大约为 100 纳秒,这是 redis 的 QPS 过万的重要基础。

    CoderJed
  • tp5之验证码不显示

    版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

    suveng
  • 大家都收藏了的最新开源项目Top12!CV、NLP、机器学习一应俱全

    【导读】作者整理了近期最新发布及更新的 12 个非常有学习和收藏意义的开源项目。这些项目中包括基于 TensorFlow 的强化学习框架;可以对数据进行结构化处...

    CDA数据分析师
  • 大家都收藏了的最新开源项目Top12!CV、NLP、机器学习一应俱全

    【导读】作者整理了近期最新发布及更新的 12 个非常有学习和收藏意义的开源项目。这些项目中包括基于 TensorFlow 的强化学习框架;可以对数据进行结构化处...

    zenRRan
  • rodert单排学习redis进阶【白银一】

    说些题外话,最近帝都疫情又严重,大家都身处时代洪流中,这不是个别人能左右的,希望你能保护好自己,天天开心。

    用户2686511

扫码关注云+社区

领取腾讯云代金券