我想从这里获取一些数据:
我在找车主的身份证。此ID位于类car_owner_section
的a
属性中。对于上面的页面,它是href
属性中的数字,如"/users/1228276“。问题是这个链接显然是由javascript呈现的,我绝对希望避免scrapy-splash。有谁知道怎么找到这个ID吗?我猜它应该在JSON上的某个地方,但我已经搜索了几天,什么也没有找到。
发布于 2019-05-21 09:00:57
我在scrapy shell上测试了它,响应返回了您正在寻找的链接,而没有使用splash。您可能需要检查您的设置。
USER_AGENT = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.10; rv:39.0) Gecko/20100101 Firefox/39.0'
# Obey robots.txt rules
ROBOTSTXT_OBEY = False
https://stackoverflow.com/questions/56224643
复制相似问题