首页
学习
活动
专区
工具
TVP
发布

pydata

专栏作者
39
文章
25252
阅读量
14
订阅数
pca
混乱的数据中通常包含三种成分:噪音、旋转和冗余。在区分噪音的时候,可以使用信噪比或者方差来衡量,方差大的是主要信号或者主要分量;方差较小的则认为是噪音或者次要分量;对于旋转,则对基向量进行旋转,使得信噪比或者方差较大的基向量就是主元方向;在判断各个观测变量之间是否冗余时,可以借助协方差矩阵来进行衡量和判断。
pydata
2018-08-02
7700
sort algorithm
选择排序: 5(前) 8 5(后) 2 9 –> 2 8 5(后) 5(前) 9 快速排序: 5 3(前) 3(中) 4 3(后) 8 9 10 11 –> 3(后) 3(前) 3(中) 4 5 8 9 10 11 希尔排序: 改进的插入排序,先将数组等间隔分组,各个分组内进行直接插入排序,迭代分组,知道最后为一组,分组的过程中可能破坏排序的稳定性。
pydata
2018-08-02
1K0
python optimization
首先使用cprofile分析单进程,单线程环境中的性能差的部分,进行算法改写和优化,必要情况下可以通过cpython嵌入c/c++代码。 判断程序为io-bound任务还是cpu-bound任务。 io-bound任务程序使用gevent来优化 cpu-bound任务程序使用multiprocess来优化 使用队列服务进行任务分发,将大任务分成多个子任务部署于多机环境(集群)。注意:调度和单点故障。
pydata
2018-08-02
2360
Matlab C混合编程
在MATLAB中可调用的C或Fortran语言程序称为MEX文件。MATLAB可以直接把MEX文件视为它的内建函数进行调用。MEX文件是动态链接的子例程,MATLAB解释器可以自动载入并执行它。MEX文件主要有以下用途: 对于大量现有的C或者Fortran程序可以无须改写成MATLAB专用的M文件格式而在MATLAB中执行。 对于那些MATLAB运算速度过慢的算法,可以用C或者Frotran语言编写以提高效率。
pydata
2018-08-02
1.4K0
没有更多了
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档