我正在努力刮一整页的Aliexpress图像。它获取所有的alt标记,以及前8个图像。
<?php
require 'vendor/autoload.php';
use Goutte\Client;
$url = "https://www.aliexpress.com/af/tie.html?SearchText=tie";
$client = new Client();
$crawler = $client->request('GET', $url);
$output = $crawler->filter('#hs-below-list-items li div div.img.img-border div a img')->each(function ($node) {
echo '<img src="' . $node->attr('src') . '" alt="' . $node->attr('alt') . '">';
});
var_dump($output);
这与图像中的AliExpress延迟加载有关吗?
我需要使用像无头浏览器这样的东西吗?如果是的话,请你指出正确的方向。
任何帮助都将不胜感激。
谢了杰克。
发布于 2018-07-25 00:31:59
您需要筛选数据属性本身。
$output = $crawler->filter('img.picCore[image-src]')->each(function ($node) {
echo '<img src="' . $node->attr('image-src') . '" alt="' . $node->attr('alt') . '">';
});
JH
https://stackoverflow.com/questions/51424275
复制相似问题