我试图使用ImportXML将期权价格从雅虎财经导入到我的谷歌工作表中,但在谷歌工作表中收到的一些价格的实际值与我在雅虎财经网站上看到的非常不同。我甚至尝试过ImportHTML,结果都是一样的。
Google Sheet中使用的公式:
=TRANSPOSE(IMPORTXML( "https://finance.yahoo.com/quote/KL220121C00045000?p=KL220121C00045000" ,"//tr"))
以下是Google Sheet中的结果(所有红色单元格都是不同的值):
雅虎财经页面上的实际值:
我完全不知道为什么会发生这种情况,以及如何解决它。
发布于 2021-01-27 15:48:00
@Tanaike的ImportXML not producing correct values链接回答了如何使用应用程序脚本解决这个问题。
为了回答“为什么”的问题,我相信雅虎财经已经实现了某种user agent detection,这样来自谷歌电子表格的请求,或者更具体地说,用户代理Mozilla/5.0 (compatible; GoogleDocs; apps-spreadsheets; +http://docs.google.com)
的请求将被服务于不同的(我相信更老的)版本的数据。
当我在浏览器中访问链接https://finance.yahoo.com/quote/KL220121C00045000?p=KL220121C00045000时,它当前显示
As of 3:17PM EST. Market open
但是当我用change my user agent来模仿Google sheets时,我得到了
As of 10:43AM EST. Market open.
这是与IMPORTXML
相同的结果。
我猜他们这样做要么是为了减少从自动电子表格中提取数据,要么是为了阻止人们使用Google Sheets来抓取他们的网站。
https://stackoverflow.com/questions/65651295
复制相似问题