我是木偶操纵者的新手,还在学习如何抓取网页。网页的结构是这样的:
我要做的是抓取<h2> Status </h2>和<h2>Naam</h2>之间的所有<p>标记。使用我当前的代码,我可以抓取这个页面上的所有<p>标记。只是现在我尝试抓取<h2> Status </h2>之后直到<h2>Naam</h2>的所有<p>标记。我当前的
我正在尝试从这个中抓取数据。页面在DOM中的元素中有无限滚动。我有以下puppeteer脚本,可以一直滚动到底部以显示所有数据,这样我就可以抓取数据了。我曾尝试使用await page.waitFor(2000);等待,然后才能进一步滚动,但它似乎不起作用。好心帮助别人吧!covid.rcmedicrew.org/ using their /scripts/getSearch.php API