希望通过简单的Html Dom可以做到这一点,我正在抓取一个如下所示的页面:
<h5>this is title 1</h5>
<img>
<img>
<img>
<h5>this is title 2</h5>
<img>
<img>
<h5>this is title 3</h5>
<img>
<img>
<img>
<img>
等等。
我试着让它看起来像这样:
<h5>this is title 1</h5>
<img>
<h5>this is title 1</h5>
<img>
<h5>this is title 1</h5>
<img>
<h5>this is title 2</h5>
<img>
<h5>this is title 2</h5>
<img>
这意味着对于每个IMG,我想我需要找到并抓取第一个先前的H5。没有父div或任何结构来使它变得更容易,这几乎就是我所描述的。
我使用的代码看起来像这样(简化):
foreach($html->find('img') as $image){
//do stuff to the img
$title = $html->find('h5')->prev_sibling();
echo $title; echo $image;}
我用prev_sibling尝试过的每一件事都得到了一个“致命错误:在非对象上调用成员函数prev_sibling()”,我想知道用PHP Simple HTML Dom能不能实现我想要做的事情。我希望如此,我试过的所有其他刮板都让我抓狂。
发布于 2012-03-12 05:58:27
实际上,您希望选择所有的h5
元素,以及所有的img
元素。然后,遍历它们,并检查它们的类型。如果是h5
元素,则更新$title
变量,但不echo
任何内容。如果是img
,只需在图像之前回显$title
即可。现在不需要去寻找h5
了,因为你已经缓存了它。
下面是一个例子:
foreach ( $html->find('h5, img') as $el )
{
if ( $el->tag == 'h5' )
{
$title = $el->plaintext;
continue;
}
echo "<h5>$title</h5>";
echo $el->outertext;
}
发布于 2012-03-12 05:55:22
是的,因为您没有将整个页面作为dom加载,所以您实际上拥有的是一个DOMElement列表,而前一个子项将为空。
而不是以前的查找,你可以做的是,有一个移动的指针
$all = get all elements,
$title = null;
foreach ($all as $e) {
if ($e == "h5") {
$title = $e;
continue;
}
echo $title . $e;
}
有一些sedo代码,但你会明白我的意思。
https://stackoverflow.com/questions/9659149
复制相似问题