在ThinkPHP5框架中使用QueryList4做采集

有人会使用 Python 去做爬虫,而这个 QueryList 可以让 PHP 做采集更容易。

QueryList 的几个特点:

  • 拥有与 jQuery 完全相同的 CSS3 DOM 选择器
  • 拥有与 jQuery 完全相同的 DOM 操作 API
  • 拥有通用的列表采集方案
  • 拥有强大的 HTTP 请求套件,轻松实现如:模拟登陆、伪造浏览器、HTTP 代理等意复杂的网络请求
  • 拥有乱码解决方案
  • 拥有强大的内容过滤功能,可使用 jQuey 选择器来过滤内容
  • 拥有高度的模块化设计,扩展性强
  • 拥有富有表现力的 API
  • 拥有高质量文档
  • 拥有丰富的插件
  • 拥有专业的问答社区和交流群

安装步骤

请使用 PHP7.0 版本以上进行安装。PHP7 以下环境无法安装和使用 QueryList4!

  • 下载 ThinkPHP5

ThinkPHP 是一个免费开源的,快速、简单的面向对象的轻量级 PHP 开发框架,是为了敏捷 WEB 应用开发和简化企业应用开发而诞生的。ThinkPHP 从诞生以来一直秉承简洁实用的设计原则,在保持出色的性能和至简的代码的同时,也注重易用性。遵循 Apache2 开源许可协议发布,意味着你可以免费使用 ThinkPHP,甚至允许把你基于 ThinkPHP 开发的应用开源或商业产品发布/销售。

5.1 版本开始,官网不再提供下载版本,请使用Composer或者 git 方式安装和更新。一般情况下,composer 安装的是最新的稳定版本,不一定是最新版本,所以为了适合学习过程,安装 5.1.x-dev 版本。

composer create-project topthink/think=5.1.x-dev tp5
  • 安装 QueryList

QueryList 是一个基于 phpQuery 的 PHP 通用列表采集类,得益于 phpQuery,让使用 QueryList 几乎没有任何学习成本,只要会 CSS3 选择器就可以轻松使用 QueryList 了,它让 PHP 做采集像 jQuery 选择元素一样简单。

在 ThinkPHP5 代码根目录执行 Composer 命令安装 QueryList,使用 Composer 安装时强制指定版本号

composer require jaeger/querylist:4.*
  • 使用 QueryList

下面演示在 Api 控制器中使用 QueryList:

<?php
namespace app\index\controller;

use QL\QueryList;

class Api {
     public function index() {
          $data = QueryList::get('https://qq52o.me')->find('img')->attrs('src');
          dump($data->all());
     }
}

就这样,get 方法获取某个页面下的所有图片~

get 方法获取某个页面下的所有图片

愚人节水文完毕~~~愚人节到了,你放心我绝不会愚弄你的,由于我始终记得一条宗旨:欺负‘愚’人有罪,因此今天我只会祝福你,愿你愚人节快乐。

沈唁志|一个PHPer的成长之路! 原创文章采用CC BY-NC-SA 4.0协议进行许可,转载请注明:转载自:在ThinkPHP5框架中使用QueryList4做采集

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏腾讯移动品质中心TMQ的专栏

腾讯TMQ在线沙龙|老司机教你玩转Appium自动化测试

Appium自动化测试 活动时间:2016年10月13日 QQ群视频交流 活动介绍:TMQ在线沙龙第十期分享 本次分享的主题是老司机教你玩转Appium自动化测...

3377
来自专栏QQ会员技术团队的专栏

QQ 会员基于 hybrid 的高质量 H5 架构实践

本文为 SDCC 2016(杭州站)的分享实录,介绍 QQ 会员的前端开发团队在手 Q 的 hybrid 模式下对 H5 页面的性能优化、组件化和持续集成方面的...

5720
来自专栏hbbliyong

opoa介绍

一 定义       One Page, One Application(后面缩写为OPOA,或者1P1A), 含义很简单:一个页面就是一个应用。不再使用ifr...

3327
来自专栏编程微刊

小程序新方法 open-type获取头像昵称

小程序自上线以来,官方一直在调整API,因此也出现了一批被废弃的接口,作为程序员的我们,此时此刻千万不能为这不断的变化而感到头疼,应当与时俱进,不断的更新自己的...

3272
来自专栏安恒信息

旧版Java/ActiveX浏览器插件存安全漏洞,将遭IE屏蔽

虽然微软的IE浏览器在安全性上已经越来越好,但是由于其庞大的普及率及版本参差不齐,因此有许多旧版本的插件也会让新的IE浏览器成为受到攻击的目标。为...

3256
来自专栏IT大咖说

前端老牌框架衰退,IMVC(同构 MVC)成未来趋势?

1722
来自专栏非著名程序员

强烈推荐:一个非常棒的开源库

今天给大家推荐的一个开源库是大家可能会经常遇到的,可能以后会常常用到的一个开源库。

992
来自专栏知晓程序

Android 惊现小程序「入口」,有图有真相!

1253
来自专栏liuchengxu

用 Vim 写 Python 的最佳实践

对于一些 Python 的小项目,使用 vim 是一个不错的选择。本文内容整理自我在知乎的回答 用 用 Vim 写 Python 的最佳实践是什么?,下面的内容...

1962
来自专栏企鹅号快讯

四大微信小程序开发工具测评结果出炉!

微信小程序开放公测后,很多人已经迫不及待地开始注册账号了。但是在技术开发的问题上,却不知道该如何下手。经过一些程序员不辞辛苦连夜测试,终于从十余款工具呕心沥血筛...

1.6K7

扫码关注云+社区

领取腾讯云代金券