首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Discuz!后台DXC批量采集插件使用详细教程,适合小白操作

想必用过Discuz!建站的站长都用过采集插件吧,那批量采集的插件呢?这个插件真的是为Discuz的站长撑起了站点内容的半边天啊,为什么这么说呢?如果你用这个插件在后台操作的话,就算你没有花钱去Discuz的应用中心购买商业版每天用这个插件你可以在半个小时内就发布上百篇文章,当然如果你是商业版的话还可以设置定时自动采集发布功能,而且只要你采集的目标网站有足够的内容,你可以在设置好相关参数后便不用再天天去后台手动操作,这样是不是很省事呢?闲话不多说,我们来开始今天的经验分享。

首先,我们进到后台选择“应用”“DXC采集”“设置”,如下图:

DXC采集插件

进入设置

第二步,添加采集器,如图:

添加采集器

第三步,这是最重要的一步,要看仔细了哦!

找到目标网站的文章列表页面最后一页,注意:这里的列表页的页面地址必须是有规律的哦!如图:

目标列表页末页

在采集器填入列表页,设置好你要采集哪些列表页面的文章,采集页面的增长幅度,然后测试一下列表页采集是否设置成功;之后再将文章的获取规则设置为“智能获取”,如有必要限制采集内容的范围,就把需要限制的栏目名称相对地址写在下方的方框内,然后保存,如图:

设置列表页采集规则

选择“内容规则”选项卡,进入页面内容采集设置步骤。先点击右边的“点击自动获取”,这时会在左侧的页面地址框内获取到一个你之前设置的列表页内的其中一篇文章的地址,点击访问进入该页,获取页面采集元素,如图:

获取文章页面

进入内容页面后,直接鼠标右键查看源代码,复制title代码,粘贴到标题采集规则框中,之后设置按图中所示即可,如图:

获取标题代码

设置页面内容获取规则,选择以“DOM获取”,然后进入文章页面找到文章内容区块所对应的区块识别代码,如图5-1和5-2:

获取文章区块的识别代码:

将识别代码填入规则框内,记住使用“div#(内容区块识别代码)”,之后选择“检测标题是否重复:”如图

设置内容获取代码

至此,页面列表采集及内容获取已经设置完成,之后一步很简单,发布规则设置,如图设置就行,至于你需要用什么账号发布的话只需要在发布设置下面的“自定义uid”框内输入ID号就可以(tips:uid1是网站的创始人)。如图:

发布规则设置

第三步,在其他设置选项里面设置采集停顿的时间就行,这里我推荐5,15的频率,这样不容易造成识别超时,然后保存开始采集,如图:

其他设置

最后,激动人心的时刻到了,放开手去采集发布吧。至此,这个经验就结束了,如果你还有哪些地方不懂得欢迎留言,我会及时给大家提供支持,谢谢

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20191022A0KGXH00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券