最近接触了一个PHP采集框架,体验了一把感觉挺不错的,就分享一下,一般说道采集数据,大多数程序员估计想到的是python等程序,采集比较强大,其实之前我也有去尝试和学习python的采集,不过没啥基础,没有学会就放弃了,因为自己有一点业务水准的php基础,所有就找到了这个采集框架;
QueryList是一套简洁、优雅的PHP采集工具,基于phpQuery。QueryList不依赖任何框架和架构,它可以单独使用也可以引入到任意的PHP开发框架中去使用;
QueryList是一套用于内容采集的PHP工具,它使用更加现代化的开发思想,语法简洁、优雅,可扩展性强。相比传统的使用晦涩的正则表达式来做采集,QueryList使用了更加强大而优雅的CSS选择器来做采集,大大降低了PHP做采集的门槛,同时也让采集代码易读易维护,让你从此告别晦涩难懂且不易维护的正则表达式;
QueryList 提供的一整套内容采集解决方案
DOM内容选择:CSS选择器 HTTP客户端:GuzzleHTTP 内容过滤:CSS选择器 解决乱码:内置多套乱码解决方案 额外功能:丰富的扩展插件
安装和使用也比较简单的,可以借助宝塔安装好lnmp环境,然后新建一个网站,把代码丢进去就可以运行了,使用Composer安装不太会用,这里打包了一份QueryList4的源码,开箱即用:https://pan.baidu.com/s/1QPMUalL5HcVJ4L7zUY0LMg
只需要丢到网站里然后去做一些简单的采集任务就可以使用了,使用方法和风格以及选择器和JQuery非常的相似。通过css选择器去选择网页中需要采集的内容;
本文分享自 wordpress建站吧 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!