我正在尝试抓取以下url (http://cmegroup.com/clearing/operations-and-deliveries/accepted-trade-types/block-data.html/#contractTypes=FUT&exchanges=XNYM&assetClassId=0),表内容是我感兴趣的内容,但是看起来表隐藏在某个地方:
右键单击表上的检查,我可以得到表(后面是),但是在scrapy shell中,如果我执行response.xpath(‘//*@ ==$0’),它不会返回任何内容,这意味着我不能通过这种方式抓取内容……请在这个问题上提供帮助,谢谢。
更新:最终的解决方案是使用Selenium (伟大的工具)来完成这个任务,当网页内容如表格等被java加密时,selenium尤其有用,在社区中可以找到大量的selenium说明,这是一个example。
https://stackoverflow.com/questions/50379817
复制相似问题