我正在从网页上的12个表中提取元数据和urls,虽然我已经开始工作,但我对xpath和scrapy都很陌生,所以有没有更简洁的方法可以做到这一点?当我尝试各种xpath时,我最初得到了大量的重复项,并意识到每个表行对每个表都是重复的。我的解决方案是枚举表并遍历每个表,只获取该表的行。感觉可能有一种更简单的方法,但我现在不确定。import scrapy
class LinkChe
我正在尝试使用scrapy从多个网页中提取电话标题(以及最终的其他数据)。我正在尝试使用已定义的函数来做到这一点。"parse“函数应该提取所有页面链接,如果我让它将结果输出到CSV,它确实可以正确地执行此操作。scrapy.http import Request
class PhonelinksSpid