我想从彭博网站上搜集数据。"IBVC:IND股票市场指数“下的数据需要被剔除。
到目前为止,我的代码如下:
import requests
from bs4 import BeautifulSoup as bs
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) '
'Chrome/58.0.3029.110 Safari/537.36 '
}
res = requests.get("https://www.bloomberg.com/quote/IBVC:IND", headers=headers)
soup = bs(res.content, 'html.parser')
# print(soup)
itmes = soup.find("div", {"class": "snapshot__0569338b snapshot"})
open_ = itmes.find("span", {"class": "priceText__1853e8a5"}).text
print(open_)
prev_close = itmes.find("span", {"class": "priceText__1853e8a5"}).text我无法在HTML中找到所需的值。我应该用哪个图书馆来处理这个问题?我目前正在使用BeautifulSoup和请求。
发布于 2019-09-23 14:35:47
因为这不是静态页面,所以您需要向彭博API发出请求。要了解方法,请转到页面,检查元素并选择"Network",然后通过"XHR“筛选并查找JSON类型。重新加载页面。我这么做了,相信这就是你想要的:链接
https://stackoverflow.com/questions/58064494
复制相似问题