首页
学习
活动
专区
圈层
工具
发布
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    多因子模型之因子(信号)测试平台----python中Pandas做处理时内存节省的技巧

    index,然后,我们获取一下这个dataframe这个对象在内存中的情况。...某种意义上,完全没有意义,笔者只是为了展示多因子模型的整个流程和框架罢了,对于50个股票的标的池,做多因子策略,几乎是没有任何意义的。...这样有两个好处,一个是存储空间会减小,同时检索的速度会快,而且会减少很多不必要的错误。    ...3.修改数字    其实,pandas在读取csv的时候,可以定义读取每一列的类型的,我们看到上面默认是float64,对于整数,默认是int64,知道一点计算机知识的都明白,很多时候我们是不需要这么float64...4.catrgory类     然后是最后一个大杀器,就是当某一列中,有很多重复元素的时候,其实必然是存在冗余的,比如,我们的dataframe中股票代码,sec_id和行业类别,group这两列,肯定有很多重复的

    1.2K40
    领券