文章/答案/技术大牛

发布

社区首页 >问答首页 >从雅虎上摘下头条新闻！金融与Python3

问从雅虎上摘下头条新闻！金融与Python3
EN

Stack Overflow用户

提问于 2016-04-04 03:53:07

回答 1查看 923关注 0票数 3

我一直在努力从雅虎的头条上摘取新闻！金融学的个人股票页面。例如，我想得到GOOGL的标题，但我似乎无法为BeautifulSoup找到合适的CSS选择器。有什么想法吗？我尝试了以下代码的多个变体，并将我的选择器替换为："a“、"href”、"#yui_3_9_1_8_1459741486422_44“、"li”、"ul“等等。我在最近的迭代中使用了"a”标记，我知道它为您提供了页面的所有链接，而不仅仅是标题。

import re
import requests
from bs4 import BeautifulSoup

URL = 'http://finance.yahoo.com/q?s=GOOGL'
res = requests.get(URL)
res.raise_for_status()
content = res.content
soup = BeautifulSoup(content, 'html.parser')
print(soup.select('a'))

http://finance.yahoo.com/q/h?s=GOOGL&t=2016-04-03T21:02:10-04:00

这就是当我试图复制选择器(我有Chrome，利用内置的检查器)：#yui_3_9_1_8_1459741486422_44。试过了所有我能想到的关于这个身份的变体，都没有用。

API，you引用，没有一个函数可以让您轻松地获得标题，我不认为.？

python-3.x

web-scraping

beautifulsoup

html

css

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-04-04 03:59:33

从div和yfi_quote_headline类下面获取标题链接列表：

links = soup.select('div.yfi_quote_headline ul > li > a')
for link in links:
    print(link.get_text(strip=True))

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/36394313

复制

相似问题

问从雅虎上摘下头条新闻！金融与Python3
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问从雅虎上摘下头条新闻！金融与Python3EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问从雅虎上摘下头条新闻！金融与Python3
EN