前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >用python来分析一波股票

用python来分析一波股票

作者头像
sergiojune
发布2018-10-09 10:18:13
3.7K2
发布2018-10-09 10:18:13
举报
文章被收录于专栏:日常学python日常学python

Python是一门广泛在各个行业应用的语言,包括计算机,生物学,金融。可以说,python除了不会生孩子,其他啥都行。本文将使用python来玩转股票数据,让你见识Python的强大。

所使用的工具

  • python3.6
  • Juypter notebook(交互式IDE,推荐使用)
  • numpy,pandas用于数据分析
  • matplotlib,seaborn用于数据可视化
  • pandas_datareader用于获取股票数据

数据获取

我们可以从pandas_datareader获取股票数据。首先需要安装这个库

代码语言:javascript
复制
pip install pandas
pip install pandas-datareader

然后就可以访问数据了

代码语言:javascript
复制
from pandas_datareader.data import DataReader
datas = DataReader(name='BABA', data_source='yahoo', start='2015-01-01', end='2018-01-01')

由于数据是从雅虎财经获取不稳定,这里我就先把本次实验所用到的数据下载了下来放在百度网盘,大家有需要的可以进行下载(链接: https://pan.baidu.com/s/1czzR03vuX0-O2lmMJT2otw 密码: 5jxj)

在这里,我首先把数据存为了csv文件,让我们首先看看阿里巴巴前几年的股票数据吧。

代码语言:javascript
复制
import pandas as pd 
file = 'BABA.csv'   #csv文件
index = 'Date'      #将日期作为索引列
alibaba = pd.read_csv(file, index_col=index)    #读取csv文件数据

然后我们简单的查看一下阿里巴巴的股票数据

代码语言:javascript
复制
alibaba.head(n = 5)  #查看前5行数据

下面是股票数据的前5行,我们可以看到每天的开盘价,收盘价,最高值,最低值,成交量等。

股票数据.png

然后再查看一下这些数据的描述,获取对数据的直观感受。

代码语言:javascript
复制
alibaba.describe()

这是对数据的统计量的一些分析,可以看到总共有789行数据,最高值和最低值相差不大。

历史趋势分析

在分析之前,我们先导入所需要的Python科学计算库。

代码语言:javascript
复制
# 数据分析
import numpy as np
import pandas as pd
from pandas import Series, DataFrame

# 可视化
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline

我们首先分析股票的闭盘价的总体趋势。

代码语言:javascript
复制
alibaba['Adj Close'].plot(legend = True)
plt.title('Alibaba Adj Close')
plt.ylim([50,200])
plt.xlabel('Date')
plt.ylabel('Price')

可以看到,虽然中间也有小小的波动,闭盘价总体趋势是上升的,这表明阿里巴巴的市值一直在上升。

然后我们了解一下每天阿里巴巴股票的日收益率,毕竟,在股市赚钱,主要靠的就是低买高卖得到的收益。

代码语言:javascript
复制
size = (10,8)
alibaba['daily-return'].plot(figsize = size,linestyle = '--',marker = 'o') #折线图,原点表示最大最小点
plt.title('Alibaba daily return')
plt.xlabel('Date')
plt.ylabel('daily return rate')

每天的收益率不是稳定的,证明股市有风险,需要谨慎对待。

实用小知识:pct_change()函数将每个元素与其前一个元素进行比较,并计算变化百分比。默认情况下,pct_change()对列进行操作; 如果想应用到行上,那么可使用axis = 1参数。

我们再使用密度图和直方图查看一下日收益率的总体情况。

代码语言:javascript
复制
data = alibaba['daily-return'].dropna() #清除异常值
bins = 50 #分为50个区间
#在同一张图上画出分布直方图和密度图
sns.distplot(data, bins  = bins, color = 'red',hist = True, kde = True) 
plt.title('Alibaba daily return distribution')
plt.xlabel('daily-return')
plt.ylabel('probablity')
plt.xlim([-0.05,0.1])

从图中我们可以看出,总体收益率基本稳定在0左右,盈或者损是对称的。

风险分析

在风险分析里,我们对比几家互联网行业的大公司,看看它们的股票有什么差异,这里我选的5家公司是苹果,谷歌,亚马逊,微软,Facebook,时间是2015年到2017年。(大家也可以从前面的百度网盘里面的链接获取哦。)

读取top5.csv文件获取数据,按时间进行排序,并进行查看。

代码语言:javascript
复制
file = "top5.csv"
index = 'Date'
top_tech_df = pd.read_csv(file,index_col = index)  #读取数据
top_tech_df=top_tech_df.sort_index()    #按索引,也就是时间排序
top_tech_df.head(n = 5)

这里的数据指的是股票的闭盘价,这是前5条数据。

首先综合比对一下这5家公司,看看谁更厉害。

代码语言:javascript
复制
top_tech_df.plot(kind = 'line')      #折线图
plt.title('five company adj close picture')
plt.xlabel('Date')
plt.ylabel('price')
plt.legend()     #添加图例

可以看到谷歌和亚马逊,闭盘价始终高于其他三家公司,而这两家也是貌似有点关系,你升我也升,你降我也降。

上面图中看到其他三家貌似是平稳发展的,其实由于图的比例太大,导致相对平缓,真实的情况其实是此起彼伏,也有很大波动,下面查看一下。

代码语言:javascript
复制
another_company = ['AAPL','FB','MSFT']
top_tech_df[another_company].plot()
plt.title('another company adj close picture')
plt.xlabel('Date')
plt.ylabel('price')
plt.legend()

从上面了解到谷歌和亚马逊的闭盘价变化有着某种相似性,我们再来看看它们的日收益率之间的关系。

代码语言:javascript
复制
#使用pct_change()获得日收益率
top_tech_dr = top_tech_df.pct_change()
sns.jointplot("AMZN",'FB',top_tech_dr,kind='scatter',color = 'red',size=8)
plt.title('joint with AMZN and FB')

谷歌和亚马逊的收益率也好像是正相关的,这可以作为预测这两家股票发展的一个参考因素。

股市有风险,投资需谨慎。本文不是教你炒股的,而是教你学习Python的,感兴趣的小伙伴赶快学起来吧。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-08-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 日常学python 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 数据获取
  • 历史趋势分析
  • 风险分析
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档