后端是处理数据提取用户想要的数据。简单常用的是Python,相对于java,c, c++,Python简直对初学者太友好,提供丰富多彩的API接口,比如常见的降维聚类算法:PCA, t-SNE, MDS, k-means等。如果用c实现过PCA算法有几百行代码,可在Python里只需要三行代码。那如何用Python实现对Iris数据集使用PCA算法以及展示效果?
建议新手使用Python练手操作门槛低,前期可以将更多的关注点集中在前端数据可视化上。到后期,有经验自由组合。前期使用的是Python,可到后期由于性能问题,Python已经很难解决我项目所遇到的数据和算法复杂度。于是将复杂度高的算法全部用C重写了一遍,并用Python调用这个模块。这样之前项目的项目代码框架不变,不需要代码全部重写重构,只需在相应的地方调用相应的C模块即可。
Python使用PCA算法实战
用户需要安装Python包,建议新手安装anaconda,anaconda集成了Python以及在开发过程中一大堆第三方包,比如下文用到的sklearn包。
引入第三方库的PCA算法,sklearn是Pythonz中常用的机器学习第三方模块,对常用的机器学习方法进行了封装,包括回归、降维、分类、聚类等方法。
from sklearn.decomposition import PCA
加载Python中自带的Iris数据集,做机器学习的应该比较熟悉这个数据集。主要包含4个维度,三个类。
from sklearn.datasets import load_iris
irisData = load_iris()
对数据集使用PCA算法,将数据降到2维。
pca = PCA(n_components=2)
reducedData = pca.fit(irisData)
将结果在散点图中画出来,Python功能强大提供可视化图表的能力。但更多是以处理数据为目的,将数据传给前端让前端绘制。
领取专属 10元无门槛券
私享最新 技术干货