scikit-learn又称为sklearn,它是基于numpy和scipy的一个机器学习算法库,包含了除强化学习和深度神经网络之外的绝大部分著名的机器学习算法API。使用sklearn可以轻松地完成从数据的获取,到数据的预处理,到模型的训练,到模型的评估,到模型的优化等一整套机器学习的流程。学习sklearn几乎是数据挖掘工程师和机器学习工程师必由之路。
一,sklearn功能模块
sklearn设计的非常优雅,它让我们能够使用同样的接口来实现所有不同的算法调用。
统一API:
二,sklearn使用地图
下面地图是sklearn的老司机留给新手们的一个使用指南。当你面对具体的数据和问题时,应该选择那种类型的模型,应该优先选择哪个模型,可以参考这份sklearn使用地图。
三,sklearn学习路线
以下为我们《sklearn机器学习》系列教程的主要框架。第一章的前三节带领大家快速入门sklearn。
第二章特征工程模块,讲解如何做出好的特征:数据的获取,数据预处理,特征的提取,特征的选择等内容。特征工程方面的工作在实际机器学习项目中可能会占到70%以上甚至更多的时间。
第三章算法工程模块,讲解如何训练出好的模型:模型的训练,模型的评估,模型的优化。
Python与算法之美
(Python_Ai_Road)
领取专属 10元无门槛券
私享最新 技术干货