puppeteer获取href数组，然后遍历每个href和页面上的href

puppeteer是一个基于Node.js的开源库，用于控制Headless Chrome或Chromium浏览器，可以模拟用户在浏览器中的操作。它可以用于自动化测试、爬虫、数据抓取等各种场景。

要获取页面上的href数组并遍历每个href，可以使用puppeteer进行以下步骤：

以上代码中，我们使用puppeteer.launch()启动一个浏览器实例，然后通过browser.newPage()创建一个新的页面。接着，使用page.goto()方法导航到目标页面的URL。

使用page.$$eval()方法，我们可以在页面上执行一个函数，该函数会在浏览器上下文中运行，并且可以访问到页面上的DOM元素。在这个例子中，我们使用'a'作为选择器，获取所有的<a>标签元素，并通过map()方法将每个元素的href属性提取出来，最终得到一个href数组。

最后，我们使用for...of循环遍历每个href，并进行相应的操作。在这个例子中，我们只是简单地将每个href打印到控制台，你可以根据需求进行进一步的处理。

关于腾讯云的相关产品，推荐使用腾讯云的云服务器（CVM）来运行puppeteer脚本，以及使用对象存储（COS）来存储爬取到的数据。你可以在腾讯云官网上找到更多关于这些产品的详细介绍和文档。

请注意，以上答案仅供参考，具体的实现方式和腾讯云产品选择应根据实际需求和情况进行决策。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云