Keras之父:大多数深度学习论文都是垃圾,炒作AI危害很大

编辑: 常佩琦

【新智元导读】 Keras之父、谷歌大脑人工智能和深度学习研究员François Chollet 近日接受采访,对自己的新书《Python深度学习》、Python为何广受欢迎、深度学习面临的挑战等议题进行回答。他认为,大多数深度学习论文都没有遵循科学的研究方法,并未产出有意义的新知识,学术界应该更严谨。

Keras之父、谷歌大脑人工智能和深度学习研究员François Chollet最新撰写了一本深度学习Python教程实战书籍《Python深度学习》,书中介绍了深度学习使用Python语言和强大Keras库,详实新颖。

近日,François Chollet接受了采访,就“深度学习到底是什么”、“Python为何如此广受欢迎”、“目前深度学习面临的主要挑战”等议题进行了回答。他认为,目前很多深度学习领域的论文都是无意义的,因为这些研究使用了不科学、不规范的研究方法。以下是采访全文编译。

关于本人

问:您主要的工作内容是什么?

答:我在谷歌大脑团队工作,花了很多时间开发Keras。我也参加TensorFlow的工作。最近我主要在写机器学习、计算机视觉、将深度学习应用于定理证明等方面的论文。我的主要研究兴趣是理解AI中的抽象和推理问题,如何从感知得到抽象的、高度概括的模型。

深度学习的本质、挑战、和未来

问:深度学习到底是什么?

答:深度学习是机器学习的一种具体方法。与以前的方法相比,它更加强大和灵活。在大多数应用程序中,我们所说的“深度学习”是指一种把大量由人类注释的数据转换为以与人类相似的方式自动注释新数据的软件。您可以通过这种方式自动完成很多不同的任务。深度学习尤其擅长理解“感知”数据,如图像、视频或声音。

我来举例说明。假设有很多图片都带有相关联标签(如“猫”、“狗”)。深度学习可以让你自动将数据转换到一个“了解”如何把图片映射到标签的系统,只需从示例中学习,无需任何手动调整或自定义工程。然后这种系统可以被应用到新的数据,将标记图片任务有效自动化。

同样,你可以将深度学习应用于机器翻译、语音识别、文本到语音转换,光学字符识别等问题。

问:深度学习社区现在面临的主要挑战是什么?

答:打击炒作、发展伦理意识、获得科学严谨性。

炒作:对人工智能的大肆炒作正在危害这个领域。一些人正荒谬地夸大目前AI取得的进展,还说人工智能已把人类逼到了绝境。但事实并非如此。如果我们把目标设得极高,却又不能实现,就是逼着公众站在我们的对立面上。而且,炒作AI这件事,本质上是不诚实的,对公众讨论也产生了危害。

伦理: 现在部署人工智能系统的大多数人来自单一背景,他们往往没有意识到自己所构建的系统给人们带来了道德影响和副作用。这将成为一个问题,因为这个群体所拥有的权力会越来越大。我们需要更多地讨论这些问题,并提高人们对不道德使用AI的潜在行为的觉察力,例如具有偏见性的预测模型会影响公众生活,或以危险的方式操纵AI。

科学: 每天都有大量的深度学习论文发表,其中大多数并没有真正产生任何有意义的新知识,因为这些论文没有遵循科学的研究方法。他们以模糊的方式“评估”模型,或者在他们的训练数据上测试过度拟合模型(尤其是生成模型和强化学习,这是深度学习研究中发展最快的两个主题),仅在MNIST上评估模型等。深度学习简直是科学的重灾区。同行评审通常不会以有意义的方式解决这些问题,也许部分原因是大多数同行评审员进入这个领域最多才一两年。如果想要取得更快的进展,那么当涉及研究可重复性、基线、模型评估和统计显著性时,我们需要更加严谨。我们目前的激励机制是与科学相对立的:发表论文是被鼓励的。如果你的研究听起来既复杂又神秘,很难被正确评估研究重要性,那么发表论文就容易多了。

问:你认为深度学习的未来是什么?

答:我期望AI未来能把“直观的”模式识别模块与正式推理模块相结合。我也希望AI能够演变得更像自动化软件开发的形式,借用目前软件工程中的很多模式和实践。

写书动机

问:你出版了一本新书《Python深度学习》。为什么要写这本书呢?

答:写这本书的原因是,我想推出一个课程,来教那些已有Python编程能力,但没有机器学习背景的人。

Python为何广受欢迎

问:Python应该是目前发展最快的编程语言,至少在高收入国家是这样。为什么Python如此受欢迎?

答:我爱Python。学习Python很容易上手,当你习惯使用它之后,会越来越高效。与我使用过的大多数其他语言相比,Python非常直观和优雅。但是Python真正的杀手锏并不在于语言本身,而是周围的生态系统和社区。无论你需要做什么,比如解析特定的文件格式或与特定系统连接,几乎有一个Python库在做这件事,你不必花时间去做。在数据科学和机器学习方面尤其如此,有很多很棒的工具:numpy,pandas,scikit-learn,plotting libraries等,这使得Python成为一种非常高效的语言。

我喜欢Python的另一个原因是,它并不是一个领域特定的语言,而是多领域的交叉点,从网站开发到数据科学和系统管理。这意味着无需切换到新语言来将Keras模型部署为Web API。无论你需要做什么,无论是启动一个web应用程序,查询一个REST API,还是解析一些文件,训练最先进的深度学习模型,Python通常都会是一个很好的选择。

给初学者的建议

问:有些声音认为进入机器学习有壁垒。您如何看待?

答:我不同意。在过去的5年中,进入机器学习领域变得非常容易。当然,5-7年前这很艰难。你可能需要研究生教育。你需要用C ++或Matlab来编写大量的低级算法。我经历过这些。而现在不一样了。你只需要Python,很容易上手,你有权限访问高级和易于使用的工具(如Keras)。另外,你可以在网上学到很多非常高质量的资源,你可以在Kaggle上练习现实世界的问题。学习从未如此简单。

问:对于初学者来说,最重要的是什么?

答:最重要的是要深刻了解深度学习能做什么,不能做什么。去感受一些best practice,比如如何正确评估模型,如何防止过度拟合。这需要把正式解释(formal explanations)和对现实问题的广泛实践结合起来。

原文地址:https://www.datacamp.com/community/blog/interview-francois-chollet

原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2017-12-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人工智能头条

【BDTC 2015】百度、FreeWheel、新浪微博、京东和猎聘推荐系统架构和实现(视频+PPT下载)

2125
来自专栏人工智能快报

物理学家发现经典机器学习与量子物理学习相同之处

据物理组织网(https://phys.org/)报道,物理学家发现特定类型的量子学习算法结构与对应的经典算法十分类似。这一发现能够帮助科学家进一步开发学习算...

4075
来自专栏机器之心

专访 | 从专家系统到大数据知识工程,「千人计划」专家吴信东如何为数据冠以知识

吴信东教授是国家「千人计划」特聘专家、长江学者、IEEE & AAAS Fellow,他早期关注于专家系统,也就是知识工程的应用实践。而随着机器学习与大数据的流...

1333
来自专栏新智元

谷歌趋势:人工智能首超大数据,深度学习关注度上升最快

【新智元导读】 KDnugget 在谷歌趋势(Google Trends)上对比了几个相关关键词的关注度,对大数据、机器学习、人工智能、数据科学和深度学习进行排...

5046
来自专栏数据科学与人工智能

数据科学面临的共同挑战

随着我们进入2017年下半年,是时候看看那些使用数据科学和机器学习的公司面临的共同挑战。假设你的公司已经在大规模收集数据,需要用到分析工具,而且你已经认识到数据...

35210
来自专栏数据科学与人工智能

【机器学习】机器学习正在五个方面重塑我们的世界

机器学习的技术越来越成熟,与大数据结合在一起为我们的世界带来了巨大的变化。对此,大数据专家Bernard Marr总结了机器学习在听、说、读、写、看五个方面如何...

2438
来自专栏AI科技大本营的专栏

程序员如何开启机器学习之路?我也遇到过这个问题

学习机器学习,但无从下手怎么办?尝试过各种学习方法,为什么依然是个门外汉?为什么传统的学习机器学习的途径收效甚慢? 作为一名对机器学习心有向往的程序员,我该以什...

3085
来自专栏AI科技评论

业界 | Facebook 图像识别平台 Lumos 是什么?

大多数人懒得给照片加标签。如果你属于这一类(大概率事件),那么你一定知道搜索某张照片有多辛苦。 但这很有可能即将成为过去。 本周,Facebook 披露了其机器...

4006
来自专栏CSDN技术头条

【BDTC 2015】推荐系统分论坛:百度、微博、京东推荐系统架构和实现

2015年12月10-12日,由中国计算机学会(CCF)主办,CCF大数据专家委员会承办,中国科学院计算技术研究所、北京中科天玑科技有限公司与CSDN共同协办,...

22810
来自专栏PaddlePaddle

知名深度学习框架的典型应用案例一览

TensorFlow在谷歌系的产品中应用非常多,比如Gmail, Google Play Recommendation, Search, Translate, ...

1505

扫码关注云+社区

领取腾讯云代金券