我正在尝试从雅虎财经中提取股票的实时价格数据。该信息包含在带有"class“和"data-reactid”"span“标签中。我无法从这个span标记中提取信息。
当我输入我的代码时,我没有得到任何输出,也没有得到任何错误。
我几乎尝试了这个问题的所有其他答案,但没有一个对我有效。
<--HTML Code-->
<span class="Trsdu(0.3s) Fw(b) Fz(36px) Mb(-4px) D(ib)" data-reactid="34">197.00</span>#Python Script
my_url = "https://finance.yahoo.com/quote/AAPL?p=AAPL&.tsrc=fin-srch"
u_client = u_req(my_url)
page_html = u_client.read()
u_client.close()
page_soup = soup(page_html, "html.parser")
container = page_soup.find('span', {"data-reactid":'34'})我想得到的输出"197.00“(股票的实时价格)作为输出。
发布于 2019-04-08 15:52:24
你可以通过多种方式来获取它。以下是其中之一:
import requests
from bs4 import BeautifulSoup
res = requests.get('https://finance.yahoo.com/quote/AAPL')
soup = BeautifulSoup(res.text, 'lxml')
price = soup.select_one('#quote-market-notice').find_all_previous()[2].text
print(price)另一种方式:
price = soup.select_one("[class*='smartphone_Mt'] span").text
print(price)发布于 2019-04-08 13:38:38
不知怎么的,当读取url时,data-reactid变成了14。
page_soup = soup(page_html, "html.parser")
container = page_soup.find('span', {"data-reactid":'14'})
if container:
print(container.text)发布于 2019-04-08 13:59:24
鉴于data-reactid可以更改,我将使用唯一的类进行选择。按类选择也更快。
import requests
from bs4 import BeautifulSoup as bs
r = requests.get('https://finance.yahoo.com/quote/AAPL/')
soup = bs(r.content, 'lxml')
print(soup.select_one('.Mb\(-4px\)').text)https://stackoverflow.com/questions/55566627
复制相似问题