Scikit-Learn 0.18 有哪些新玩意?

Scikit-Learn 0.18.1 Bugfix 版发布了, 意味着大家可以广泛使用0.18版了。

那么会有哪些新的特性呢? 先卖个关子, 来点题外话。

创始人 David Cournapeau

David 这个法国小伙, 算是我的校友吧, 毕业于京都大学,一般法国小伙到了日本, 会陪着日本女朋友到处游览, 然后学业很可能荒废, 但是David应该算是技术达人了, 潜心修炼。之后(2010年), 在京都的一家商品推荐在线服务商SilverEgg公司工作了一段时间。读博和在京都工作期间(2007年-2011年)在Google Code上搞了一个“scikits.learn”的开源项目。 后来成为风靡的Scikit-Learn。后来(2011年)去了Enthought的美国公司。Enthought是博士比例达到90%以上的公司。 在数学分析领域, 读个博士或许有点帮助的~~~

0.18 新特性

1. 功能更强大, 更稳定了

这似乎是一句废话, 但是我们可以更新速度来看, 每个新的版本的更新周期越来越长了, 已经达到需要一年时间才能更新一版了。 从1年更新1次这个角度, 意味上, Scikit-Learn已经相当的成熟了, 可以放心使用了。

  • 0.10 released 1-11-2012
  • 0.11 released 5-7-2012 (117 days)
  • 0.12 released 9-4-2012 (120 days)
  • 0.13 released 1-21-2013 (139 days)
  • 0.14 released 8-7-2013 (198 days)
  • 0.15 released 7-15-2014 (342 days)
  • 0.16 released 3-26-2015 (254 days)
  • 0.17 released 11-5-2015 (224 days)
  • 0.18 released 9-28-2016 (328 days)

2. 抛弃了Python 2.6

虽然0.18.0还兼容了Python 2.6,但是修订版0.18.1立即抛弃了Python2.6。

3. 强化了算法评价和参数选择

对Cross-Validation的使用更为灵活,可以随意嵌入算法训练, 而不用额外初始化一个CV框架, 参数选择(Grid Search 和Random Search)更为方便。

4. 新的分类回归算法

GP (Gaussian Process) Classifier / Regressor

MLP (Multi-Layer Perceptron)

5. 强化集成学习

对Bagging算法,尤其Tree的集成算分进行了集成。

6. 大量BugFix和增强

对大量边界参数设置的Bug进行了修复,是的Scikit-Learn更为鲁棒。

参考:

https://www.enthought.com/company/team/devs/

原文发布于微信公众号 - AI2ML人工智能to机器学习(mloptimization)

原文发表时间:2016-11-15

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏ATYUN订阅号

俄罗斯研究人员利用神经网络使金属3D打印更加高效

3D打印机需要使用数学模型对定位和控制算法进行微调,以达到最佳性能。这是一个漫长而艰巨的过程,可能需要数周才能设置打印参数。即便如此,仍然存在打印错误的可能性。

902
来自专栏Albert陈凯

CPU与GPU区别大揭秘

有网友在网上提问:“为什么现在更多需要用的是 GPU 而不是 CPU,比如挖矿甚至破解密码? ”以下是比较准确靠谱的回答:   1、现在更多被需要的依然是CP...

5293
来自专栏大数据文摘

自然语言处理(NLP)入门指南

3254
来自专栏人工智能头条

沈国阳:美团推荐系统整体框架与关键工作

3192
来自专栏量子位

癌细胞检测,只要0.0758秒 | 谷歌AR+AI显微镜问世

病理学家们要想从一团密密麻麻的组织细胞里,找到空间排列奇怪,细胞核形状诡异的癌细胞,就得守在显微镜后头,一张一张活检切片看过去,看到天荒地老,海枯石烂。

1053
来自专栏媒矿工厂

高帧率视频标准与规范简介

帧率(High Frame Rate, HFR)是指利用比正常帧率(如24帧/秒)更高的技术拍摄而成的影片。欧洲已经对高于每秒50帧的视频有了广泛的研究。

1230
来自专栏CDA数据分析师

学会10种方法,用Python轻松实现数据可视化

引言 艺术之美根植于其所传达的信息。有时候,现实并非我们所看到或感知到的。达芬奇(Da Vinci)和毕加索(Picasso)等艺术家都通过其具有特定主题的非...

1945
来自专栏大数据挖掘DT机器学习

从采集到建模:某二手主机游戏交易论坛用户行为分析

作者:陈丹奕 宜人贷 数据分析师 https://ask.hellobi.com/blog/datanaystimprovement/4902?utm_sour...

3656
来自专栏机器之心

综述 | 一文看尽三种针对人工智能系统的攻击技术及防御策略

这篇文章是关于如何使用人工智能构建鲁棒的反滥用保护系统系列文章中的第四篇,也是最后一篇。第一篇文章解释了为何 AI 是构建鲁棒的保护系统的关键,这种保护用来满足...

1103
来自专栏WeTest质量开放平台团队的专栏

从 Pokémon Go 谈 AR 游戏开发

Pokémon Go一出,新鲜的玩法、经典的IP效应让这款使用了Unity以及AR技术的手游火遍了“大洋”南北。可惜的是这款新鲜的游戏还没有惠及中国市场的玩家们...

4830

扫码关注云+社区

领取腾讯云代金券