我用漂亮的汤从这个页面http://in.finance.yahoo.com/q?s=AAPL中提取标题,但我需要过去3个月的标题,即从2013年12月10日到2014年3月10日。但我只能提取他们在这个特定页面上的标题。如何提取特定公司所需的标题?
代码:
url = 'http://in.finance.yahoo.com/q?s=AAPL'
data = urllib2.urlopen(url)
soup = BeautifulSoup(data)
divs = soup.find('div',attrs={'id':'yfi_headlines'})
div = divs.find('div',attrs={'class':'bd'})
ul = div.find('ul')
lis = ul.findAll('li')
hls = []
for li in lis:
headlines = li.find('a').contents[0]
print headlines
发布于 2014-03-12 00:39:43
我认为你的问题更多地与你从哪里获得数据有关,如果你需要过去三个月的数据,你应该查询http://in.finance.yahoo.com/q/hp?s=AAPL,在那里你寻找的所有数据都显示在一个表中。
发布于 2014-03-12 01:52:43
在http://in.finance.yahoo.com/q?s=AAPL上,点击“更多来自苹果的头条新闻”。在那里,您将获得一个包含日期时间字段的链接。修改一下,你就会变得很好。(http://in.finance.yahoo.com/q/h?s=AAPL&t=2014-02-08T15:06:40+05:30)
https://stackoverflow.com/questions/22330467
复制相似问题