00:00
这是我用Python开发的小红书采集软件,那继承了我之前开发的三个功能于一体,我们打开这个软件看一下效果,这个软件上需要登录。我用我的账号登录一下,进入这个软件的主界面,我们看它支持三个功能,第一是采集评论,第二是采集主页的笔记作品,第三是一个链接转换,我们先看第一个采集评论,采集评论有分为两种,通过关键词采集和通过笔记链接采集,那我这里先我我先演示通过关键词采集,那我这里提前准备了三个关键词,笔记类型选择综合,排序方式综合。集详情选择是下载图片选择是为了节省时间,我这里选择前两条笔记评论最大页选1采集评论选择是那这里的评论关键词,我这里提前准备了一些评论关键词,IP属地,那这些都可以不填,好这里点击通过关键词采集。那这个时候软件就开始采集这个关键词下面的笔记了,那它的逻辑就是先采集完所有的笔记,在采集这些笔记下的评论。
01:02
我们从这个日志上可以看到他正在保存图片。它会自动的存储到这个当前文件夹,你搜索关键词命名的文件夹里,那也就是这个,我们看这里面是它的保存的图片,好,全部关键词的笔记已经采集完,采集完毕这里进行了一个自动的去重,去重之后开始采集这些笔记下的评论。一共是6条笔记,正在采集第4条笔记,第5条笔记。的评论。第6条笔记的评论。好,这个时候提示全部笔记评论一排全完毕。我们看一下这个结果,首先看一下数据的结果,笔记的数据。那这里就是我刚才设置的3个关键词,采集到的笔记数据关键词序号,笔记ID。笔记的短链接,笔记的长链接,笔记的头图链接,笔记的类型图文类。
02:02
以及作者的用户IDUID。点击作者的用户主页,链接作者的用户昵称。这条笔记的点赞数,这条笔记的标题。这条笔记的正文好,我们看正文很长,这是完整的一个正文。笔记的收藏数、评论数、转发数。笔记的发布时间。笔记的修改时间以及笔记的IP数据,好,这是一个笔记的一个数据,我们下面看评论的数据。这是采集到的一个评论的数据,笔记短链接,笔记长链接页码,评论者的昵称、评论的ID、评论者主页链接,评论的时间、评论的IP属地,评论的点赞数、评论级别以及最重要的评论内容。好,我们下面看它采集到的图片,未来小鹏理想未来二级目录是一个按笔记ID命名的文件夹,点进去之后是每个笔记的图片,是一个高清无水印的图片,好。现在开始演示采集评论,第二个呢,通过笔记链接采集,这里我直接填写啊,3条笔记的链接。
03:07
笔记评论最大页选1,所以评论选的是好,这个时候点击第二个按钮,通过笔记链接采集评论。那这个时候他就开始采集这3条笔记下面的评论了,每个笔记采集一页评论啊,这里为他节省时间,设置为1。我们看这个进度,开始采集第2/3的笔迹,第3/3的笔迹啊,我这里选择采集详情日式,所以他先对笔记的详情进行了采集,然后才开始采集这个笔记下面的评论。好,这个时候提示全部评论已答题完毕。我们看这个。前面是先采集的笔记,我们看这个是笔记的数据啊,这个也是这3条笔记的啊,一个详情数据字段就是这些啊,这里就不再赘述了。好,下面看这个刚才采集到评论,这3条笔记下的评论。
04:04
啊,跟刚才的评论的字段是一样的,这里不再一一介绍,好,下面开始演示第二软件的第二个功能,采集主页的笔记。我这里提前准备了3个用户的主页链接啊,放到这个地方。每个用户采集前2条笔记。下载图片选择是发详情选择是点击开始执行。那这个时候软件就开始采集这3个用户的主页笔记了。他正在采集第一个博主的第二条笔记。第二个博主的第一调皮T。第二个博主的第二条笔记。好,开始采集第三个步骤,也就是最后一个步骤的第一条接,第三个步骤的第二条位接。好,这个时候提示采集完毕,请检查就3420结尾的CSV,那也就是这个CSV,我们打开看一下,这是采集到的数据。
05:09
作者昵称作者ID作者主页链接页码笔记的标题笔记ID笔记的短链接,笔记的长链接截图链接笔记类型点赞数、收藏数、评论数、转发数。笔记的正文啊,这是一个完整的正文。笔记的发布时间,笔记的修改时间,以及笔记的IP属地,好,因为我这刚才这里选择了下载图片,选的是我们看一下它下载的图片,比如说。这个G发发的图片啊,这里是比D命名的图片文件夹名称啊,这里是。这个高清无水印图片,好,下面开始演示软件的第三功能,链接转换,首先是主页链接转小红书号。那我这里提前准备了3个主页链接,点击开始转换。好,这里提示转换为你这里,它已经存到这个CSV里了啊,现在开始演示第二个小红书号转成主页链接。
06:05
同样准备了3个小红书号,点击开始转换。第1/3个,第2/3个,第3/3个,把小红书号转成了用户的主页链接,从自动导出到这个CSV里了,第三个APP端的作品链接转到PC端作品链接,那我同样准备了三个APP端的作品链接,点击开始转换。低于1/3个,第2/3个。第3/3个。把3个APP端的作品链接转成了3个PC端的作品链接,好,这就是这个软件的一个完整演示,谢谢大家,朋友们下次见。
我来说两句