首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >从雅虎上摘下头条新闻!金融与Python3

从雅虎上摘下头条新闻!金融与Python3
EN

Stack Overflow用户
提问于 2016-04-04 03:53:07
回答 1查看 923关注 0票数 3

我一直在努力从雅虎的头条上摘取新闻!金融学的个人股票页面。例如,我想得到GOOGL的标题,但我似乎无法为BeautifulSoup找到合适的CSS选择器。有什么想法吗?我尝试了以下代码的多个变体,并将我的选择器替换为:"a“、"href”、"#yui_3_9_1_8_1459741486422_44“、"li”、"ul“等等。我在最近的迭代中使用了"a”标记,我知道它为您提供了页面的所有链接,而不仅仅是标题。

代码语言:javascript
运行
复制
import re
import requests
from bs4 import BeautifulSoup

URL = 'http://finance.yahoo.com/q?s=GOOGL'
res = requests.get(URL)
res.raise_for_status()
content = res.content
soup = BeautifulSoup(content, 'html.parser')
print(soup.select('a'))

http://finance.yahoo.com/q/h?s=GOOGL&t=2016-04-03T21:02:10-04:00

这就是当我试图复制选择器(我有Chrome,利用内置的检查器):#yui_3_9_1_8_1459741486422_44。试过了所有我能想到的关于这个身份的变体,都没有用。

API,you引用,没有一个函数可以让您轻松地获得标题,我不认为.?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-04-04 03:59:33

divyfi_quote_headline类下面获取标题链接列表:

代码语言:javascript
运行
复制
links = soup.select('div.yfi_quote_headline ul > li > a')
for link in links:
    print(link.get_text(strip=True))
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/36394313

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档