等你在2118:探索机器学习算法生命周期

【导读】1月22日,统计学家Venkat Raman发布了一篇比较有意思的博文,作者探讨了到2118年,即未来一百年中机器学习中一些算法可能的兴衰存亡。具体分析了“回归”算法和“神经网络”两种算法未来的走势。作者引经据典,主要借助林迪效应(Lindy effect)分析算法的生命周期。本文的有趣之处不在于它给出我们一个确切的结论,而是作者能为自己的分析提供佐证。

作者homepage:https://medium.com/

Which Machine Learning Algo will continue to be in use in year 2118?

你认为哪个机器学习算法会在2118年继续使用?

你的脑海会浮现什么答案呢? 随机森林(Random forest),SVM,K-means,KNN甚至深度学习的其他变种?

一些人可能会笑了,问:“你到底能如何预测的,预测未来100年的事情是很疯狂的事?”

▌究竟是什么让你认为“回归”将在2118年继续使用呢?



答案是林迪效应(Lindy effect)。我是受林迪效应的启发进行预测的。

那么,下一个问题,什么是林迪效应?

▌林迪效应



维基百科定义了林迪效应:

使用时间越久,越不容易消失。比如一样东西,人们已经使用了十年,可能还会继续使用十年;已经使用了一百年,还会继续使用一百年。

林迪效应是一个概念、一些技术或想法等,提出一个很难消失事物的未来预期寿命与他们现在的年龄成正比,所以每一个额外的生存期都意味着其有着更长的剩余寿命。

我最喜爱的作家之一Nassim Taleb在他著名的书Antifragile写道:从无序的事物定义了林迪效应,例子如下:

如果一本书已经印刷了四十年,我可以期待它继续出版另一个四十年,如果它还能存活十年,那么预计它还会存在五十年的时间。 这就是说,一般来说,长期存在的东西不像人一样“老化”,而是继续生存下去。 如果每年没有消失,额外的预期寿命增加一倍。 这是一个非常鲁棒的指标。 一件物品的未来存在的时间与其寿命成正比!

我极力推荐读一下他的关于林迪效应的文章‘An Expert called Lindy’。

https://medium.com/incerto/an-expert-called-lindy-fdb30f146eaf

▌那么为什么“回归”会存活那么久



是因为它已经存活了这么久。回归(最小二乘法)这个概念最初是由Carl Friedrich Gauss和Adrien-Marie Legendre在1800年提出的。 他们用它来确定太阳周围的行星和其他物体的轨道。

“回归”这个词是弗朗西斯·高尔顿(Francis Galton)所创造的,用来形容这样一种现象:高个子的父亲较大概率拥有相对较矮的儿子,而较矮的父亲较大概率拥有相对较高的儿子。

很明显回归已经存在有200多年了! 所以根据林迪效应,回归将会持续存在200年。 所以保守估计,回归在2118年会继续使用。

▌回归长寿背后的秘密是什么?



举例来说,2016年Kdnuggets调查报告如下

事实上,在2011年的Kdnuggets进行的另一项调查中,回归结果排名第二,离第一很接近。 所以根据林迪效应,它已经成为5年来的榜首!

回归仍然是广泛使用的机器学习算法。 人们正在使用回归或继续使用回归,因为

  • 很简单
  • 高度可理解(即使是那些大老板也能理解)
  • 有用

▌“它有效”的方面



很多不同领域的人们都在使用回归,因为它在它们工作中起到重要作用。 通过使用回归,人们可以计算投资回报。 例如,在市场营销中,市场混合模型(Market Mix Modeling)背后的动力是回归。 它仍然是一种流行的技术,许多快速消费品公司都相信MMM的结果。 其他领域也一样。

▌那么神经网络及其变体它们会在2118年使用吗?



到目前为止,从林迪效应来看,神经网络(AI)结果并不是很好。 它已经经历过AI寒冬。 神经网络及其变体的寿命在20世纪受到“AI寒冬”的阻碍。 这样的中断对于技术或者算法的长久性来说不是一个好兆头。

但是,在过去的十年里,AI相关的进步使得其应用前景不断壮大。 而我作为一名永远的学生,将继续热衷于最新的AI突破。 所以一个安全的赌注可能是我们可以看到神经网络及其变种再生存10 - 20年,希望Elon Musk表达的“奇异(Singularity)”不会导致另一个AI冬天。

▌是什么阻碍机器学习算法突破林迪效应?



你真的需要用机器学习?杀鸡焉用牛刀:机器学习算法的错误应用和过度使用,将阻碍机器学习突破林迪效应。 我遇到过很多人们不必要的使用机器学习算法的情况,因为有时候简单的基础方法就能起作用,为了赶时髦却非要用机器学习方法。 Rama Ramkrishnan先生在他的文章中很好地说明了这一点。

https://towardsdatascience.com/first-create-a-common-sense-baseline-e66dbf8a8a47

此外,数据科学相关工作的爆发式流行也是另外一个隐患。 目前机器学习算法已经变成数据科学家手中的一个万金油,不论什么任务都被拿来使用(机器学习像数据科学家手中的锤子, 一切都看起来像一个钉子)。 错误或过度地应用机器学习算法,都会导致人们在机器学习不灵在有些任务不灵的时候,因自己心中过高的期望而产生心理落差,这时候人们自己将导致“AI的冬天”。但目前为止“回归”可能笑道最后,甚至一直到2118年。

如果你喜欢我的文章,可以在文章下面进行评论。

你可以联系我

http://www.linkedin.com/in/venkat-raman-Analytics

https://twitter.com/venksaiyan

https://analyticsloka.blog/blog/

原文链接:

https://towardsdatascience.com/which-machine-learning-algo-will-continue-to-be-in-use-in-year-2118-59d0461160f3

原文发布于微信公众号 - 专知(Quan_Zhuanzhi)

原文发表时间:2018-01-23

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

人物 | Ian Goodfellow亲述GAN简史:人工智能不能理解它无法创造的东西

选自Wired 作者:Cade Metz 机器之心编译 参与:黄小天、蒋思源 著名物理学家、加州理工学院教授以及畅销书作者理查德·费曼( Richard Fey...

399110
来自专栏新智元

今日头条李磊:用机器学习做自然语言理解,实现通用 AI 仍需解决三大难题(33PPT下载)

1 新智元原创 【新智元导读】10月18日,在中国自动化学会与新智元联合主办的 2016世界人工智能大会上,今日头条科学家、头条实验室总监李磊博士受邀发表...

45660
来自专栏华章科技

人工智能、机器学习、深度学习,三者之间的同心圆关系

理解三者之间关系的最简便方法就是将它们视觉化为一组同心圆——首先是最大的部分人工智能——然后是后来兴旺的机器学习——最后是促使当下人工智能大爆发的深度学习——在...

13740
来自专栏机器之心

李飞飞高徒Andrej Karpathy加盟特斯拉,担任人工智能与自动驾驶视觉总监

选自TechCrunch 机器之心编译 今日,特斯拉宣布前 Open AI 研究员、斯坦福大学博士生 Andrej Karpathy 担任特斯拉人工智能和自动...

29280
来自专栏量子位

中国AI公司公开击败谷歌微软,这次是Yi+AI视觉团队

2018年7月,在国际权威计算机视觉竞赛PASCAL VOC comp4目标检测竞赛中,Yi+AI团队获得了目标检测单模型第一名,超越了现有排行榜中的微软研究院...

10300
来自专栏机器之心

GMIS 2017嘉宾李佳:从Snapchat到谷歌,人工智能领域的「Another Badass Woman」

机器之心原创 作者:微胖、吴攀 李佳,谷歌云机器学习/人工智能研发负责人(Head of R&D, AI/ML, Senior Director at Clou...

37350
来自专栏机器之心

深度 | 让机器思考与互相理解:DeepMind提出机器心智理论神经网络ToMnet

29570
来自专栏人工智能头条

最强大脑第二场战平听音神童!百度大脑小度声纹识别技术算法解析

21960
来自专栏新智元

深度学习巅峰之年:技术、开源、兼并和硬件发展全回顾(附论文合集)

【新智元导读】本文是对2016年深度学习领域的进展的综述和回顾,介绍了2016年该领域的一些重要研究成果,包括无监督学习、增强学习、生成对抗网络等,以及产业中的...

42960
来自专栏PPV课数据科学社区

作为数据人,你知道人工智能、机器学习、深度学习,三者之间的同心圆关系吗?

本方转自机器之心 作者Micheal Copeland 今年早些时候,当谷歌 DeepMind 团队的 AlphaGo 打败了李世石时,媒体就用人工智能、...

29060

扫码关注云+社区

领取腾讯云代金券