我正在尝试抓取一个页面,而且我对php框架不是很熟悉,所以我一直在尝试学习Symfony2。我已经启动并运行了它,现在我正在尝试使用Goutte。它安装在供应商文件夹中,并且我有一个包用于我的抓取项目。
问题是,从Controller抓取数据是一种好的做法吗?又是如何做到的?我一直在寻找,不知道如何使用捆绑包中的Goutte,因为它深埋在文件结构中。
<?php
namespace ontf\scraperBundle\Controller;
use Symfony\Bundle\FrameworkBundle\Controller\Controller;
use Goutte\Cl
我正在使用Goutte/Symfony2 2抓取网页,而我的过滤器也有问题,
我在$msg中有爬虫(web的一部分),如果我在$msg内部打印一个带有类.mola的div,为什么要过滤$msg从.mola获取The current node list is empty的文本呢?
$msg = '<div class="mola_wrap">
<span class="mola" title="titleinside">109</span>'; // in $msg ar