前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python金融大数据分析-PCA分析

Python金融大数据分析-PCA分析

作者头像
小小科
发布2018-05-04 10:26:05
1.6K0
发布2018-05-04 10:26:05
举报
文章被收录于专栏:北京马哥教育北京马哥教育

作者:钱塘小甲子 来源: http://blog.csdn.net/qtlyx/article/details/53647159

1.pandas的一个技巧

apply() 和applymap()是DataFrame数据类型的函数,map()是Series数据类型的函数。apply()的操作对象DataFrame的一列或者一行数据, applymap()是element-wise的,作用于每个DataFrame的每个数据。 map()也是element-wise的,对Series中的每个数据调用一次函数。

2.PCA分解德国DAX30指数

DAX30指数有三十个股票,听起来不多的样子,其实还是挺多的,我们很有必要对其进行主成分分析,然后找出最重要的几个股票。想必PCA的原理大家应该都是知道,说白了就是在一个回归中找到影响最大的那几个,当然,数学原理就涉及矩阵分解,什么SVD呀。

先上点代码

这样,你就可以看到前十个股票对DAX30指数的贡献量了。

这里,我们采用只用第一个成分去拟合以及前五个成分去拟合,发现效果好的出奇。这样我们就做到了降维的工作了。我们再来展开看一下PCA的效果。

这里,我们把PCA后的值与原始值进行散点图的绘制,

我们看到,整体效果还是不错的,但是很显然,两边和中间总是有点问题,所以,如果我们要提高,我们可以在中间分段进行PCA,这样的话,效果应该会更加好。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-05-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 马哥Linux运维 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.pandas的一个技巧
  • 2.PCA分解德国DAX30指数
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档