前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >使用nodejs将某个简书用户的文章进行导出

使用nodejs将某个简书用户的文章进行导出

作者头像
Jerry Wang
发布2019-05-30 18:07:44
6030
发布2019-05-30 18:07:44
举报

今天Jerry发现简书改版后,以前根据问题标题进行搜索的功能消失了,这样我搜索自己过去发表的文章就不太方便。因此,我想写个小程序,把自己过去发表的文章的标题和超链接都下载到本地。

代码如下:

var request = require('request');
var jsdom = require("jsdom");
var JSDOM = jsdom.JSDOM;
const PREFIX = "https://www.jianshu.com";

/* a given article: https://www.jianshu.com/p/963cd23fb092
  value got from API: /p/5c1d0319dc42
*/

var url = "https://www.jianshu.com/u/99b8712e8850?order_by=shared_at&page=2";

var pageOptions = {
        url: url,
        method: "GET",
        headers: {
            "Accept": "text/html"
        }
};

function getArticles() {
  return new Promise(function(resolve,reject){
      var requestC = request.defaults({jar: true});

      requestC(pageOptions,function(error,response,body){
        var document = new JSDOM(body).window.document;
        var content = document.getElementsByTagName("li");

        for( var i =0; i < content.length; i++){
          var li = content[i];
          var children = li.childNodes;
          for( var j = 0; j < children.length; j++){
              var eachChild = children[j];
              if( eachChild.nodeName == "DIV"){
                var grandChild = eachChild.childNodes;
                for( var k = 0; k < grandChild.length; k++){
                  var grand = grandChild[k];
                  if( grand.nodeName == "A"){
                    var fragment = grand.getAttribute("href");
                    if( fragment.indexOf("/p") < 0)
                      continue;
                    console.log("title: " + grand.text);
                    var wholeURL = PREFIX + fragment;
                    console.log("url: " + wholeURL);
                  }
                }
              }
          }
        }
      }); 
     });
}

getArticles().then(function(token) {

});

执行后的输出:

在这里插入图片描述
在这里插入图片描述
1042416@CTUN50947961A c:\Code\wechat\unittest$ node jianshuexport. js
title:我做SAP CRM One Order redesign的一些心得体会url: https://www.jianshu.com/p/5c1d0319dc42title:一个最简单的webSocket hello world demourl: https://www.jianshu. com/p/b820e0acc120title:推荐一个非常好用的以多tab标签方式打开windows CMD的工具url: https://www.jianshu.com/p/3f8cc02eaa8etitle:基于SAML的web Single Sign On的一个具体例子url: https://www.jianshu.com/p/19344c23doaftitle: SAP CX Upscale Commerce : SAP全新推出的电商云平台url: https://www.jianshu.com/p/5d8352653e67title: TCP socket和web socket的区另
url: https://www.jianshu.com/p/8a08f81d3efbtitle: Visual Studio code设置断点时出现unverified breakpoint的错误处理方式url: https://www.jianshu.com/p/d004f4dc7826title: Fiori Fundamentals和SAP UI5 Web Componentsurl: https://www.jianshu.com/p/5389ca51fa44title: SAP前端技术的演化史简介
url: https://www.jianshu.com/p/140e07afd035
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2019年04月13日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
云开发 CloudBase
云开发(Tencent CloudBase,TCB)是腾讯云提供的云原生一体化开发环境和工具平台,为200万+企业和开发者提供高可用、自动弹性扩缩的后端云服务,可用于云端一体化开发多种端应用(小程序、公众号、Web 应用等),避免了应用开发过程中繁琐的服务器搭建及运维,开发者可以专注于业务逻辑的实现,开发门槛更低,效率更高。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档