我感兴趣的是提取篮球-reference.com上的球员表。我已经成功地提取了特定玩家的每个游戏的统计表(例如,LeBron James ),这是网页上列出的第一个表。但是,页面上有一些我似乎无法提取的10+表。我已经能够以几种不同的方式将表放入R中。我还可以通过组合使用XML和RCurl包来读取相同的表。例如,页面上的下一个表格是Totals。我尝试使用CSS选择器来选择我想要读入的</e
我正在尝试抓取篮球参考网站,但遇到了一个我似乎无法解决的问题。我正在尝试获取每一场比赛的框得分元素。这是我可以用urlopen很容易做到的事情,但是b/c站点的其他部分需要Selenium,我想我应该用Selenium重写整个过程。问题似乎是,即使我等待抓取,直到我看到第一个元素使用WebDriverWait加载,当我继续抓取元素时,我什么也得不到。我发现一件有趣的事情是,如果我使用urlopen w