Github|Python开源项目漫游指南(一)

Scikit-learn

Scikit-learn是基于Scipy为机器学习建造的的一个Python模块,他的特色就是多样化的分类,回归和聚类的算法包括支持向量机,逻辑回归,朴素贝叶斯分类器,随机森林,Gradient Boosting,聚类算法和DBSCAN。该项目由David Cournapeau建立于2007年。起初作为谷歌暑期项目,从那时起,许多志愿者都作出了贡献。scikit-learn之前被称作scikits.learn。

重要链接

依赖包

  • scikit-learn支持Python2.6、Python2.7和Python2.5、Python3.4、Python3.3
  • 编译软件所需要的依赖包是NumPy >= 1.6.1, SciPy >= 0.9,C/C++编译器,在生产环境中需要安装Cython >=0.23,运行示例需要还安装Matplotlib >= 1.1.1,运行测试版本还需要安装nose >= 1.1.2。
  • scikit-learn同时使用CBLAS,一个基本线性代数子程序库的C接口。

安装

  • 默认安装再home文件夹根目录 python setup.py install --user
  • 在Unix/Linux系统为所有用户使用
  • python setup.py build sudo python setup.py install

贡献代码

测试

  • 安装完成后,您可以从源代码目录外启动测试用例(你需要先安装nose) $ nosetests -v sklearn
  • 在Windows下,建议使用下面的命令(调整python.exe程序路径)因为测试用例使用multiprocessing时,nosetests.exe程序与其交互性能差: C:\Python34\python.exe -c "import nose; nose.main()" -v sklearn

Github项目地址

scikit-learn:https://github.com/scikit-learn/scikit-learn

原文发布于微信公众号 - Python中文社区(python-china)

原文发表时间:2016-09-19

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏开源优测

JMeter定时器06

前言 在默认情况下,jmeter发送每个请求之间是没有延时的,如果采用默认方式,如果线程数足够大,瞬间就会将服务器压死。再则在实际的业务过程中,请求之间是有一定...

3856
来自专栏Spark学习技巧

几种简单的负载均衡算法

什么是负载均衡 负载均衡,英文名称为Load Balance,指由多台服务器以对称的方式组成一个服务器集合,每台服务器都具有等价的地位,都可以单独对外提供服务...

4545
来自专栏州的先生

重新开始一个完整的Django Restful WEB项目

在前面7章中,我们首先编写了一个简单的电影爬虫,采集了猫眼电影的部分电影数据,再通过Django框架的2.0版本创建了一个Python WEB应用,并且借助于d...

1561
来自专栏章鱼的慢慢技术路

用ARM实现音乐电子相册

2112
来自专栏AILearning

TensorFlow架构

我们设计了TensorFlow进行大规模的分布式训练和推理,但它也足够灵活,以支持新机器学习模型和系统级优化的实验。 本文档描述了使得这种组合规模和灵活性成...

3877
来自专栏铭毅天下

吃透 | Elasticsearch filter和query的不同

除了确定文档是否匹配外,查询子句还计算了表示文档与其他文档相比匹配程度的_score。

1372
来自专栏WeTest质量开放平台团队的专栏

深度了解Android 7.0 ,你准备好了吗?

2016年8月22日,谷歌正式推送Android 7.0 Nougat(牛轧糖)正式版,首发推送了多款Nexus设备。除了修复常规BUG,Android 7.0...

893
来自专栏美团技术团队

基于rsync的文件增量同步方案

背景 犀牛云盘是美团点评内部一个基于美团云的文件协作平台,核心是文件的结构化云存储以及上传和下载的体验优化。文件同步是云盘功能的重要部分(包括文件内容的同步和文...

6684

Ray:AI的分布式系统

随着机器学习的算法和技术的进步,越来越多的机器学习应用程序需要多台机器,并且必须利用并行性。但是,在集群上进行机器学习的基础设施仍然是特设的。尽管针对特定用例(...

3386
来自专栏java一日一条

多种负载均衡算法及其 Java 代码实现

负载均衡 建立在现有网络结构之上,它提供了一种廉价有效透明的方法扩展 网络设备和 服务器的带宽、增加 吞吐量、加强网络数据处理能力、提高网络的灵活性和可用性。

1671

扫码关注云+社区