首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

使用node爬取嘀哩嘀哩番剧信息

聊骚

这个小demo是昨天做的,用node爬掉了嘀哩嘀哩近期番剧的一些信息~

废话不多说,走起~

准备工作

创建一个新的文件夹,并创建以下文件:

目标

我们的目标很简单,就是把每部番剧的信息给爬取到。

那么我们先要开始定位啦~

找到我们要爬取的内容块,并找到对应的div,类名有两个:book和small。

但我们的不仅仅是要这块内容,而是要这块内容内番剧的url。

获取这个url有什么用呢?为的是要获取url指向的网页里的番剧内容~

我们随意进到其中一个番剧页面下看看~

我们很容易又找到了我们要获取的番剧信息,其在dd标签下~

简单搭个服务器

在你的index.js文件内写入如下代码:

测试效果

是不是感觉很有趣呢~

关注不吃亏

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180805G0QUQG00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券