我正在使用dplyr管道对数据集中的组运行pcas。我从group_split开始,所以我使用一个列表。为了运行prcomp()函数,只能包含每个列表的numeric列,但我希望在末尾带回factor列进行绘图。我尝试过在管道中途使用{. ->> temp}保存中间输出,但由于它是一个列表,所以我不知道在绘图时如何索引分组列。=temp$Species)#plot each pca, l
我正在用factoextra包绘制一个pca。我对每个因子都有3个点,并想在每个点周围画椭圆。但是我得到了错误Too few points to calculate an ellipse。使用stat_ellipse函数可以在ggplot2中围绕3个点绘制椭圆。我可以通过查看来自ggplot2的calculate_ellipse 来确认这一点,它说的是else if (dfd < 3) {message(&qu
我试图了解Principal Component Analysis是如何工作的,我正在sklearn.datasets.load_iris数据集上测试它。我理解每个步骤是如何工作的(例如标准化数据、协方差、特征值排序、使用K选择的维度将原始数据转换为新的轴)。
下一步是可视化这些eigenvectors在dataset上的投影位置(在PC1 vs