我在page.evaluate方法中有一个循环。该循环迭代查询选择器,该选择器从页面中的文本元素的多个实例中捕获innerText。
我收到一个错误评估失败:无法读取'innerText‘的属性
我试图在page.evaluate外部循环,但无法从page.evaluate函数中访问我的迭代变量。
//以下是我试图实现的目标的粗略草稿:
const scrapeData = [];
const data = await page.evaluate(() => {
// Iteration to capture each target text in the page
for (var i = 1; i < 9; i++) {
// Select target text
const serpDesc = document
.querySelector(
`#rso > div:nth-child(4) > div > div:nth-child(${i}) > div > div > div.s > div > span`
)
.innerText.trim();
// Build an array for the captured text
scrapeData[i] = serpDesc
return {
serpDesc
};
};
});
我的目标是将页面中的一些链接描述(纯文本)放入一个数组中。没有迭代代码,一切都很好。
发布于 2019-09-03 14:11:15
尝试:
const serpDesc = await page.evaluate(
() => [...document.querySelectorAll(`#rso > div:nth-child(4) > div > div:nth-child(${i}) > div > div > div.s > div > span`)].map(elem => elem.innerText)
);
您可能需要重新构造选择器,或者可能需要将serpDesc
函数包装在for of
或forEach
循环中。
你也可以尝试像这样的东西
async function elSelector(i) {
//Where i is the incremented value you pass
await page.evaluate((i) => {
let eval = $('yourSelector').toArray();
$(eval[i]).innerText
}, i)
}
for (i=0; i<9; i++) {
elSelector(i);
}
https://stackoverflow.com/questions/57766156
复制