我一直在努力从雅虎的头条上摘取新闻!金融学的个人股票页面。例如,我想得到GOOGL的标题,但我似乎无法为BeautifulSoup找到合适的CSS选择器。有什么想法吗?我尝试了以下代码的多个变体,并将我的选择器替换为:"a“、"href”、"#yui_3_9_1_8_1459741486422_44“、"li”、"ul“等等。我在最近的迭代中使用了"a”标记,我知道它为您提供了页面的所有链接,而不仅仅是标题。
import re
import requests
from bs4 import BeautifulSoup
URL = 'http://finance.yahoo.com/q?s=GOOGL'
res = requests.get(URL)
res.raise_for_status()
content = res.content
soup = BeautifulSoup(content, 'html.parser')
print(soup.select('a'))
http://finance.yahoo.com/q/h?s=GOOGL&t=2016-04-03T21:02:10-04:00
这就是当我试图复制选择器(我有Chrome,利用内置的检查器):#yui_3_9_1_8_1459741486422_44。试过了所有我能想到的关于这个身份的变体,都没有用。
API,you引用,没有一个函数可以让您轻松地获得标题,我不认为.?
发布于 2016-04-04 03:59:33
从div
和yfi_quote_headline
类下面获取标题链接列表:
links = soup.select('div.yfi_quote_headline ul > li > a')
for link in links:
print(link.get_text(strip=True))
https://stackoverflow.com/questions/36394313
复制相似问题