我有一个卷曲页面抓取与卷曲,并希望抓住所有的链接与一定的id。据我所知,最好的方法是使用dom和xpath。下面的代码抓取了大量的url,但删除了其中的许多,并抓取了不是url的文本。$curl_scraped_page是用卷曲抓取的页面。$dom = new DOMDocument();$xpath = new DOMXPath($dom);
$hrefs =$xpath->eva
我正在做web抓取,并尝试使用xpath和selenium进行抓取。只需更改我存储在列表中的内容,就可以更改xpath。我想创建一个循环,它可以自动更改xpath并查找内容。"EVENINGS_AND_WEEKEND_EXTRA", "ANYTIME_EXTRA"]
name= driver.find_element_by_xpath#this is the required xpath</e