首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >基于pandas数据框架的主成分分析

基于pandas数据框架的主成分分析
EN

Stack Overflow用户
提问于 2014-04-25 08:22:48
回答 2查看 49.8K关注 0票数 55

如何从pandas数据框中的数据计算主成分分析?

EN

回答 2

Stack Overflow用户

发布于 2014-04-25 08:42:14

大多数sklearn对象都能很好地处理pandas数据帧,这样的东西对您来说也行吗?

代码语言:javascript
运行
复制
import pandas as pd
import numpy as np
from sklearn.decomposition import PCA

df = pd.DataFrame(data=np.random.normal(0, 1, (20, 10)))

pca = PCA(n_components=5)
pca.fit(df)

您可以使用以下命令访问组件本身

代码语言:javascript
运行
复制
pca.components_ 
票数 91
EN

Stack Overflow用户

发布于 2021-08-01 21:36:05

代码语言:javascript
运行
复制
import pandas
from sklearn.decomposition import PCA
import numpy
import matplotlib.pyplot as plot

df = pandas.DataFrame(data=numpy.random.normal(0, 1, (20, 10)))

# You must normalize the data before applying the fit method
df_normalized=(df - df.mean()) / df.std()
pca = PCA(n_components=df.shape[1])
pca.fit(df_normalized)

# Reformat and view results
loadings = pandas.DataFrame(pca.components_.T,
columns=['PC%s' % _ for _ in range(len(df_normalized.columns))],
index=df.columns)
print(loadings)

plot.plot(pca.explained_variance_ratio_)
plot.ylabel('Explained Variance')
plot.xlabel('Components')
plot.show()
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/23282130

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档