业界 | 从语音到金融:邓力的人工智能30年

选自Medium

作者:AI Frontiers

机器之心编译

参与:路、王淑婷、张倩

从早期的神经网络研究到创造性解决语音识别任务,再到投身金融领域,机器学习大牛邓力已经在人工智能领域叱咤三十余年。他首次将深度神经网络技术应用于语音识别领域,性能超越之前的方法。在语音识别技术日趋成熟之际,他果断「转行」投身金融,加盟对冲基金巨头 Citadel。本文简单介绍了邓力的 AI 之旅。11 月 10 日,邓力将在 AI Frontiers 大会做主题演讲,介绍如何使用 AI 前沿技术抓住机遇,解决挑战。

邓力的人工智能之旅已跨越 30 余年。在担任过公司研究员、大学教授并在语音研究领域占有一席之地之后,邓力一头扎进了金融界:2017 年 5 月,他辞去了微软首席人工智能科学家的职位(尽管他曾在那领导微软的人工智能学校并创立了深度学习技术中心),加入了管理 300 亿美元的对冲基金 Citadel 并担任首席人工智能官(Chief AI Officer)。同时辞去的还有任教超过 17 年的华盛顿大学附属教授职位。

和邓力一样,AI 领域的其他知名教授也经历过职场变动。卡内基梅隆大学机器学习系主任 Manuela Veloso 今年 5 月加入摩根大通,领导该公司的人工智能研究实验室。《The Master Algorithm》作者、华盛顿大学计算机科学教授 Pedro Domingos 最近加入了对冲基金巨头 DE Shaw,领导其新的机器学习研究小组。

自从资本市场有大量数据可用之后,金融领域的 AI 应用程度就越来越高。金融领域需要复杂的机器学习方法来自动处理数据和预测。邓力表示,「我觉得现在金融领域已经非常成熟了,可以让人工智能来大显神威。」

作为一名成就斐然的科学家,邓力已经发表了 300 多篇学术论文,并写了一些 AI 相关的书籍。他特别擅长深度学习。邓力认为,深度学习将很快掌握预测价格走势或做出明智交易决策的能力。

在神经网络领域的早期工作

20 世纪 80 年代中期,邓力进入威斯康星大学麦迪逊分校攻读博士学位,主攻电气工程方向。这段时期,邓力试图创建人类听觉模拟和语音识别神经模型,然而进展并不顺利,因为当时的计算机无法为大型神经网络提供足够的计算能力,这也是导致邓的神经网络研究停滞不前的原因之一。

然而,邓力并没有放弃。在以助理教授的身份加入加拿大滑铁卢大学之后,他和他的一名学生于 1993 年提出了一种增强神经网络记忆的新模型。该模型虽然是一个完整的系统,但性能仍无法超越隐马尔可夫模型。

他博士论文的外审是深度学习知名大牛 Geoffrey Hinton。在读过论文后,Hinton 告诉邓力,在这个阶段,想要在神经网络方面有所突破太难了。这一令人失望的结果使得邓力远离神经网络研究,在之后的许多年转向贝叶斯统计方法和生成模型研究。

将深度神经网络应用于语音识别

在深度学习兴起之前,浅层的机器学习方法(如隐马尔可夫模型和高丝混合模型)已经主导了该领域将近 30 年。

邓力离开滑铁卢大学后,于 2000 年加入微软,专注于使用贝叶斯方法进行语音识别研究。但是结果不尽如人意,因为多层贝叶斯网络的计算机复杂度呈指数级增长。

2006 年,Hinton 发表了论文《A fast learning algorithm for deep belief nets》。论文表明,即使使用三个隐藏层,网络仍然能够对手写数字图像及其标签的联合分布生成表现良好的生成模型。邓力对此很感兴趣,他意识到或许可以尝试将深度神经网络应用于语音识别。

在 NIPS 2009 会议上,邓力和 Hinton 联合组织了「Deep Learning for Speech Recognition and Related Applications workshop」。他们首次证明,使用新方法训练的深度神经网络在大量语音识别基准上优于之前的方法。研究结果发表在论文《Deep Neural Networks for Acoustic Modeling in Speech Recognition》中,该论文由 Hinton 和邓力合著,于 2012 年发表。

「深度学习可以实现语音信号的时间和空间表示,从而改变语音识别的原有机制,从这个层面上讲机器学习是变革性的。」邓力说道。

接下来的时间里,邓力及其团队将多种不同的深度学习方法应用于语音,包括 LSTM 循环神经网络、深度卷积神经网络、序列学习和集成学习。这些创新极大提升了语音识别的准确率,且被成功整合进语音理解和语音翻译中。

2015 年,凭借在深度学习与自动语音识别方向做出的杰出贡献,邓力获 IEEE 技术成就奖。

金融领域新征程

近年来,语音识别技术已经成熟。邓力也准备迎接新的挑战。目前他领导对冲基金公司 Citadel 的人工智能团队,Citadel 是世界最大的另类资产管理基金之一,管理超过 300 亿美元的资产。

Citadel

从语音识别领域转到金融领域并不容易。尽管这两个领域有很多相似之处,比如市场数据和语音数据本质上都是序列性的,但金融数据面临一些重要挑战:

  1. 尽管市场和资本数据体量呈指数级增长,但有用信息的增长并非如此。金融数据的信噪比更低,这意味着大部分信息只是噪声。投资者必须区分信号和噪声。
  2. 非平稳性是另一项挑战。金融市场中的很多参与者互相竞争,因此需要清除大量伪数据。
  3. 金融数据的多样性比语音数据的更复杂,数据类型包括文本、图像、语音、市场数据等。「要解决数据问题,经济和金融知识和模型会有用武之地。」邓力说道。

今天,邓力的研究重点在于利用机器翻译系统解释文本数据,以提升量化投资。如何将前沿 AI 研究应用到当前的机会和挑战呢?我们期待邓力的演讲。

2018 年 11 月 10 日,邓力将在于加州圣荷西举办的 AI Frontiers 大会上发表演讲。AI Frontiers 大会汇集了 AI 领域的思想领导者,展示前沿研究和产品。除了邓力以外,其他演讲者还包括:Ilya Sutskever(OpenAI 创始人)、Jay Yagnik(Google AI 副总裁)、李开复(创新工场 CEO)、Mario Munich(iRobot 高级副总裁)、Quoc Le(谷歌大脑团队成员)、Pieter Abbeel(加州大学伯克利分校教授)等。

原文发布于微信公众号 - 机器之心(almosthuman2014)

原文发表时间:2018-09-08

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

京东金融城市计算论文入选IJCAI 2018,郑宇解读地理传感器时间序列预测问题

24350
来自专栏AI2ML人工智能to机器学习

易图秒懂の机器学习诞生 奠基篇

在“易图秒懂の人工智能诞生”、 “易图秒懂の符号主义诞生” 和 “易图秒懂の连接主义诞生”,我们看到人工智能的发展经历了符号主义和连接主义的壮大的洗礼。 其实它...

10710
来自专栏腾讯技术工程官方号的专栏

拯救乳房:乳腺癌AI诊断系统

14010
来自专栏新智元

Science专访谷歌Magenta负责人:AI创作焦点是机器学习算法

【新智元导读】Science 专访了 Magenta 项目负责人 Douglas Eck ,谈到了谷歌大脑正在进行的包括 AI 音乐、绘画、笑话生成在内的多个项...

37470
来自专栏CDA数据分析师

R 语言数据分析师养成计划——从零开始的 14 个任务

作者 CDA数据分析师 1992年,肉丝(Ross Ihaka)和萝卜特(Robert Gentleman)两个人在S语言(贝尔实验室开发的一种统计用编程语...

33570
来自专栏PPV课数据科学社区

不加班,上班可以打游戏,年薪20万起,什么职位这么牛逼...

“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”——全球知名咨...

33860
来自专栏大数据文摘

视觉研究的前世今生(下)

30440
来自专栏京东技术

「仓储网络智能库存管理问题」最好的答案 | GOC大赛

本篇特约全球运筹优化挑战赛-仓储物流智能库存管理赛题冠军 TP_AI队伍分享赛题解析。来自清华大学经管学院的闵旭和来自北京大学人工智能创新中心的马思源因为比赛走...

44920
来自专栏新智元

精品 | 2016三大深度学习峰会:顶级科学家360度剖析技术重点、应用关键及投资机会

【新智元导读】Re-Work上放出了本年度波士顿、伦敦、柏林的三大深度学习峰会的全部演讲视频,156位行业精英带来精彩演讲,其中包括 Yoshua Bengio...

443190
来自专栏PPV课数据科学社区

干货分享 | 千人专家朱晓天:大数据与人工智能在金融领域的应用

12月9日,以“数智金融-大数据的创新与应用”为主题的第二届中欧大数据金融论坛在深圳举行,国家千人计划金融领域特聘专家、北京大学汇丰商学院金融实验...

39050

扫码关注云+社区

领取腾讯云代金券