我正在从一个有很多嵌套HTML元素的网站上抓取,但我感兴趣的是abbr元素。在我的示例中,这些abbr元素具有data-utime属性,因此它们被定义为<abbr data-utime="someValue">some other nested HTML</abbr>。所以,我想要做的是获取页面上最后一个abbr元素的abbr属性值。
我试过这样做:
const SELECTOR = 'abbr:last-child';
const result = await page.evaluate((selector) => {
return document.querySelector(selector);
}, SELECTOR);
console.log(result);
console.log(typeof(res));
console.log(result.getAttribute('data-utime'));但问题是,在我得到的输出中,result只是一个空对象({}),因此typeof(res)返回对象,当然它那时没有getAttribute函数。我相信last-child选择器也是获取页面上最后一个abbr元素的正确方法。有什么办法能实现我想要的吗?
发布于 2018-08-14 11:29:02
evaluate在页面上下文中运行;结果被序列化并返回。使用$$eval代替:
const SELECTOR = "abbr";
const result =
await page.$$eval(SELECTOR,
(elements) => elements[elements.length - 1].dataset.utime);
console.log(result);您也可以使用evaluate并在其中调用document.querySelectorAll,但是我更喜欢将选择器保留在我的Puppeteer代码中,这样我就可以重用它们了。
https://stackoverflow.com/questions/51840040
复制相似问题