首页
学习
活动
专区
工具
TVP
发布

钱塘小甲子的博客

专栏成员
203
文章
341883
阅读量
84
订阅数
量化投资中常用python代码分析(一)
      量化投资逃不过数据处理,数据处理逃不过数据的读取和存储。一般,最常用的交易数据存储格式是csv,但是csv有一个很大的缺点,就是无论如何,存储起来都是一个文本的格式,例如日期‘2018-01-01’,在csv里面是字符串格式存储,每次read_csv的时候,我们如果希望日期以datatime格式存储的时候,都要用pd.to_datetime()函数来转换一下,显得很麻烦。而且,csv文件万一一不小心被excel打开之后,说不定某些格式会被excel“善意的改变”,譬如字符串‘000006’被excel打开之后,然后万一选择了保存,那么再次读取的时候,将会自动变成数值,前面的五个0都消失了,很显然,原来的股票代码被改变了,会造成很多不方便。
钱塘小甲子
2019-01-28
1.8K0
多因子模型之因子(信号)测试平台----因子值的处理(一)
在开始今天的内容前,我们要先了解几个概念。许多书本上,可能不会这样讲,这个仅仅是笔者的一些感悟。
钱塘小甲子
2019-01-28
1.8K0
多因子模型之因子(信号)测试平台----alphalens(一)
广告:本人的单因子测试视频教程 https://study.163.com/course/introduction/1005568012.htm
钱塘小甲子
2019-01-28
1.9K0
多因子模型之因子(信号)测试平台----python中Pandas做处理时内存节省的技巧
    之前看到过一篇文章,讲的就是如何在使用pandas的时候降低内存的开销。笔者亲自尝试了一下,发现确实不错,但是也会有很多问题,譬如,一些第三方包(例如statsmodels、alphalens等)的运算要求数据就是float64类型的,这使得我们很尴尬呀。
钱塘小甲子
2019-01-28
1K0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档