专栏首页点滴科技资讯财富杂志专访IBM人工智能系统Watson负责人:Watson将如何实现功能演进?

财富杂志专访IBM人工智能系统Watson负责人:Watson将如何实现功能演进?

5年前在智力竞赛节目Jeopardy中获胜之后,IBM的认知计算系统Watson正快速发展,并且在至少20个行业中的数千家企业中得到了应用。今天,财富(Fortune)杂志对Watson的负责人进行了专访。

David Kenny负责IBM Watson集团,2月在Big Blue收购了Weather Company之后,Kenny担任公司首席执行官。在此后的数月内,Watson的业务飞速发展,全世界有超过10万名开发者在watson 的36个API上进行开发。财富杂志副总编Clifton Leaf在10月中旬与Kenny进行了会谈,当时IBM Watson总经理正在旧金山,着手建立Watson West—该人工智能系统最新的商业前沿,并举办公司第二届全球Watson大会。以下是两人的采访对话,经删减。

财富:最近我们听到了很多关于人工智能方面的术语—“人工智能”,“机器学习”,“深度学习”,“无监督学习”,以及IBM描述Watson的词汇:“认知计算。”这些术语之间有什么区别?

KENNY:深度学习是机器学习的子类,主要是一系列的算法。深度学习使用更前沿的技术,像卷积神经网络,这基本上就意味着你可以更深刻地了解某些东西。机器学习,比方说要读取文本的时候,就能发挥作用。当我们要读取X射线时,深度学习就很有用。所有这些都是人工智能的内容。这是一个在机器计算和人类解释之间的系统,我们称之为人机交互认知系统。

至于无监督学习—就是说,我们不是训练这个系统去进行处理,而是开始自主学习—这是朝着人们所认为的真正人工智能的方向发展,或者是AGI:人工通用智能。我想说的是,我们还处于AGI发展的初期。Watson具备某些类似功能。

财富:要实现这种技术,需要大量的计算能力了。

KENNY:这需要大量的计算能力才能做到,因为这需要Watson一直在运算,就像人脑一样,这也是为什么我相信云计算将是非常重要的促进因素,因为在云计算出现之前—你要同时使用很多台机器,那就要受到主机的限制。(当然,IBM有最大的主机)但是云技术让我们看到人工智能领域会出现快速发展。

在智力竞赛节目‘Jeopardy!’ 中参赛者 Ken Jennings, 左和 Brad Rutter 在2011年与IBM Watson 竞赛。

财富:这套系统现在还没在云上,对把?Watson逐渐深入到现实世界中—融入物联网。在Watson物联网业务中,就有4000个客户,1400个合作伙伴,对吧?

KENNY:是的,这也是我通过Weather Company进入IBM的部分原因。我们在每个地方都有传感器:我们在车里有传感器,我们在物流环节中都有传感器—比如货运集装箱中。我们在工厂和交通系统中都装有传感器。并且我认为我们现在身上也都穿着传感器。这些传感器—还有我们的移动设备—能够给我们带来很多知识,让我们了解很多东西。那些传感器(通过蓝牙或其他通讯设备)能够和云端交互,在这里会存在很多计算活动,你会很快看到计算结果。所以你会感到所有这一切都会为我们而思考,实际上他们可以进入离数据中心最近的大脑。

所以,这种交互在很多地方都可以得到应用。以癌症治疗为例。使用Watson肿瘤治疗功能,肿瘤医生能够实时看到病人的治疗数据。并且Watson能够找到最符合病人病情的临床试验。(目前为止Watson已经读取了2600万篇医学和科学文章,并且仔细研究了来自联邦政府公共数据库clinicaltrial.gov中近3000次临床试验。并且公司最近宣布其正和试验测试公司Quest Diagnostics,纽约斯隆凯特琳肿瘤中心,麻省理工布罗德研究所和哈佛大学开展合作,Watson可以获得全美国癌症病人和医生的数据,从而可以进行基因分析。

财富:那你们如何训练Watson阅读医学文献?

KENNY:当然,这并不是一次就能达到的,刚开始要进行知识提取:读取文献,找到习惯用语,然后把这些词语连起来。在段落中也是这样的。然后进行必要的纠正。这里人类标注很关键:刚开始我绝对不会相信一个独立开展无监督学习的系统。你可以一字一字地告诉Watson,“是的,就是这个意思。是的,你有这个权力,或,不,你不能。”

当你告诉系统“no’s,”时,系统会重新调整算法直到系统能够找到正确答案。随着时间发展,这会越来越准确。

财富:你们利用专业技术和海量数据训练系统。

KENNY:是的,我们现在要设定的下一个目标是Watson将不是一个单一的人工智能系统。我们会有专门面向肿瘤的Watson,有面向放射学的Watson.....还有面向内分泌,法律和税法,客户服务的Watson。我们可以使用合适的数据更准确地训练系统。并且,我们可以和各领域的专家合作—斯隆-凯特琳癌症中心,或美国心脏协会。

由于这些系统聚焦某个专业领域,所以这些系统运作地非常好。这和人类一样。我们不会向记者咨询癌症建议,我们也不会向肿瘤专家咨询房地产建议。人们通常有各自擅长的领域。人工智能也是如此。如果你对某个领域非常熟悉,那你更可能找到答案。

财富:让我们暂时重点讨论面向肿瘤的Watson。像癌症这种疾病面临的挑战在于,肿瘤会转移扩散,尤其是在转移的后期。疾病通常不会沿着线性路径转移—即便是同样的肿瘤,某些细胞可能都会存在根本不同的基因变异,这意味着肿瘤会对治疗方案产生不同的反应。Watson如何处理这种情况?

KENNY:让我讲一个这方面的例子。这是我在Weather Company工作中接触到的例子—也是种混沌系统。所以,你或许意识到天气预报在过去几年越来越准确,这也是因为机器学习算法。所以,重要的是,在每次预测失败之后,要对系统进行纠正训练。比如,你会说在某一天会下雨,但实际上没下雨;实际上在北部四公里或南边四公里下雨了。所以你有了新的事实数据,然后系统就会从新调整算法—因为在大气层各个层面都有不同的算法—要确定哪里出错,下一次要进行改正。现在,训练就很简单:天气就是预测大气层运动。有100公里厚,能够覆盖住整个地球,受到海洋的影响,而且一直在移动。

但是重要的是你要一直从不利事件中学习,这样算法就会自我纠正,未来会更准确,这样在未来预测中的可信度会越来越高。

2015年,IBM的Bob Picciano (左) 和 David Kenny (右) 在IBM内部大会上。Kenny当时还在Weather Comany.

财富:那么有大量的新数据进入到你们的模型中

KENNY:我们在智能手机和手表,飞机上装了很多传感器,我们有了大量的数据,我们获得数据的能力越来越强。我们原来的模型每6个小时运作一次,现在的模型是至少每15分钟运行一次;我们以前的数据来自200万个地方的传感器,现在则有32亿个传感器数据来源。

还有计算能力的飞速提升。所以,你会看到存在些许混乱—或蝴蝶效应。你会看到未来会发生什么,你会有更准确的判断。最好的例子就是热带风暴。我们刚经历了飓风马修。我们对它的行进路径非常了解。但是如果仅仅从内部向外看,那就会冒很大的风险,结果也是灾难性的。但是对于数周之后会发生什么,结果是比较明了的。当风暴在非洲的时候,我们在观察,而且你会看到风暴朝我们行进。我想说的是数据证明现在提前5天的预测就像十年前提前24小时预测一样准确。所以,这是巨大的飞跃,而且在某些领域还会有更大的进步。

吸取了这些经验教训,并将其应用到人体之中,应用到肿瘤治疗之中。随着我们的数据越来越多,我们的传感器数量越来越多,人们更加了解自己的身体,我相信我们的预测能力会越来越强。在短期,在肿瘤和其他疾病方面将要发生的,就是将你的个人系统更好地和过去某个跟你很像的人进行匹配。并且这将帮助你进行诊断,并且更快地得到治疗。

我觉得,这里的目标就是最终这些系统将会实时预测疾病的转移,从而能够采取预防措施,我觉得这对每个人都有好处。但是至少我希望,在近期我们能够更好地诊断疾病,并且给人们提供更好的治疗。

财富:很明显,拥有预测且预防肿瘤的能力是最终目标。但是即便是在短期,如果Watson能够提前4周帮助农场主预测天气结果或警告庄稼受冻—潜在的经济价值也是非常大的。是否能够提前一两个月准确地预测天气?

KENNY:实际上,我对两个方面感到兴奋。一个就是我们能预测很多事情,我们能够预测地更准确,这样我们就能采取行动。即便是今天,我们能够提前3,到4周预测天气。你可以理解严寒天气延长意味着什么,天气转暖和干旱又意味着什么,所有这些都有助于水资源管理和农业生产。

我们在能源规划方面有更好的预测能力,也由此得到了很多好处。我想说的是,我们在其他领域也会看到这种情况—交通系统,物流系统,等等。

所以,这是一件事,预测能力有所提高。另外一件事,我非常兴奋的就是预测服务的可获得性。如果回到天气预测这个话题,现在全球只有30个国家能够负担天气预测服务。在美国,我们有全国天气预报服务,我们有NOAA(美国海洋暨大气总署),我们还有私人部门提供的天气预报服务。在非洲很多国家还有很多拉美国家就不是这样。亚洲大部分国家也不是这样。所以,我们有能力安装很多低成本传感器,将这些传感器接入全球网络,就像我们在美国已经做了50年一样,为农业部门提供5天的天气预报服务。这对渔民很重要。

在黑色素瘤的检测方面也是如此。现在你可以拍照片,让医生看一下,并且进行分析是否有问题。如果你生活在印度,10亿人里只有1000个左右的肿瘤专家,有其他的检测方式对这么大的人口数来说很重要。

对于糖尿病人来说,可穿戴传感器设备传来的数据可以帮助我们更好地预测某人何时出现问题,应该采取何种措施。

我必须说明,IBM并不是自己在做这些事情。IBM在和很多专业人士,放射学专家,以及像Medtronic这类企业合作。但是,总而言之,我认为科技让整个世界受益,而这将为整个人类世界带来好处。

IBM主席兼首席执行官 Ginni Rometty (右), and Medtronic公司首席执行官Omar Ishrak 在2016年CES上向人们展示了在糖尿病管理中应用认知计算技术的最新进展

财富:人工智能发展日趋成熟。IBM将采取什么措施保持领先?

KENNY:其他四家知名高科技企业—谷歌,微软小冰和Azure,亚马逊,以及脸谱都会开发自己的人工智能系统。Watson系统的独特之处在于其开发出的软件能够嵌入其他软件应用之中,很多企业将其数据导入一个独立的学习系统之中会感到不适应,尤其是那些要和搜索引擎联网的企业,因为这实际上是利用这些企业的知识产权和累积知识而获得收益,所以这类企业会比较喜欢使用Watson系统。

所以我们的方法就是为私人或敏感数据开发人工智能系统,拥有数据的机构不必将其数据在公共网络上公开。

财富:谈到公众,你们要举办的全球Watson大会将在10月24日召开。你们主要关注公司内部的专有知识,那你们将如何围绕Watson技术构建一个广泛,交互性的生态系统?

KENNY:本次大会是我们此前数据和分析大会的延伸。我们很多客户会来参加此次大会,因为他们必须站在科技前沿。大会的目标是要帮助人们了解Watson 并不是只为几家大型高科技企业服务。在拉斯维加斯召开的大会将和所有合作伙伴都有关系—所有使用Watson系统的企业。下午将是帮助人们了解我们在做什么,他们如何利用我们的技术。然后我们会在11月的加利福尼亚召开一场专为开发者的大会,主要关注技术方面。

财富:仅在物联网领域你们就有了4000家客户。那一共有多少企业和个人正在使用你们的技术?

KENNY:好吧,听着,我不想给出具体数字,但是我想说的是,物联网只是我们业务的一部分。而且发展得很快。你知道IBM历史上曾是一家拥有很强销售队伍的企业,这仍然对我们很重要。但是,人们逐渐开始使用我们的人工智能服务进行开发,并且如果我们的系统最终变成一款产品,他们就会向我们租赁。所以我们实际上会看到很多种业务模式,我们的数字渠道,开发者平台都非常好,因为每天都会有很多人使用Watson系统。

财富:普通人如果想像使用谷歌一样很容易地使用Watson系统,还需要多长时间?

KENNY:考虑一下Netscape或CompuServe在上世纪90年代的经历。就像浏览器越来越简单,并最终成为我们日常生活中的一部分,我们开始在每个设备上装有浏览器,我们会发现最终我们使用人工智能也是如此。而且,我确实相信这将会在不久的将来实现。但是,是不是会有一款像谷歌工具栏一样的Watson应用软件?不会,我想不会有的,我想说的是人们使用Watson的地方就是公共数据和他们私有数据结合的地方。

这和搜索的发展不太一样,但是我觉得你会在每天的日常生活中看到它,你甚至不会注意到它,因为它的界面会非常简单。事实是自然语言会让其非常容易使用,比输入代码或点击右键还要容易。

财富:谈到有些数据人们不想公开,Watson有优势的潜在应用领域是国土安全领域。刚开始,你谈到解决混乱问题,这对于理解非对称威胁或风险很重要—无论是公司或是政府。Watson在这方面关注得多么?你们是否有单独的部门负责这个方面?

KENNY:我不想谈得很具体。我想说通常这些机器学习系统—深度学习系统—在识别异常现象方面做得很好:识别此前的风险,然后发现新的风险。所以我认为这是一个很好的工具,能帮你发现任何系统中的风险,无论是银行系统亦或是保险风险。

在IBM,我们有专门的团队关注具体的应用场景。很多应用场景都在学习如何使用Watson。在这方面,我比较感兴趣的一件事就是面向网络安全的Watson系统,我们的安全业务部门不久就会发布。并且这就是你刚才提出的问题。该系统能够理解未知的威胁,理解事情出现明显变化的具体时间。很快学会然后能够向客户指出具体威胁。

财富:另一个Watson取得重大进展的领域是影像识别。IBM最近几个月在医疗影像企业投入巨资。为了能在人工智能竞争中占据主导,影像识别是不是Watson比竞争对手有优势的领域?

KENNY:我们使用图片来交流信息。我认为脸谱在面部识别方面做得很好,它能够认出你上传的图片中的每张脸。但是,我们相信我们在非结构数据方面会有很大的进展,包括影像。基本上,我们预计世界上70%的数据是非结构性的—因此在互联网上不容易获取这些信息。对于Watson来说,X射线和核磁共振是我们优先要考虑的非结构数据。这也是我为什么要解释深度学习和机器学习之间的区别。要理解非结构数据,你需要将图像分解成像素。你需要一层一层的像素集合,因为当你看一张图片时,在图片背后是一层一层的像素。如果你发现X射线上的骨折或发现核磁共振图片上的异常,你就需要在这方面做得很深。

但是一旦你解决了这个问题,你就能找到建筑规划中的问题,你就能找到工程文件中的问题,你就能解决各种图表中的问题,也能解决工厂屋顶设计方面存在的问题。

所以,在这方面有很多新的应用场景—很多数据所有者并不想让这些数据公开。

财富:面部识别,读取X射线,语言处理,自然语言处理,语言文本—这些都是我们现在知道的应用。Watson未来的应用领域有哪些?它能够知道人类的情感信息么?还有与此相关的:未来最大的突破在哪个方向?

KENNY:有很多潜在的应用领域。

财富:那换句话说,哪些让你最兴奋?

KENNY:我将其分成三个领域。其中一个是基于规则的体系。我们称之为合规,对吧?所以要比较,遵守规定。

现在的公司要遵守很多规定。所以,哪里出了问题,哪里就会有规定,对吧?所以,富国银行出问题了,那么现在监管部门机会出台更多的规定。并且现在所有的一切都要遵守相关规定。所以,如果Watson系统能够快速地理解所有的规定,那么我们的系统就能帮助每个人遵守相关规定,并且更快,更可信。

我觉得令我感到兴奋的第二个领域是关于发现。刚开始是为了发现我们从没想到过的东西,对吧?比如,我们刚开始都是在探索:在内部数据中搜索。“发现”就是要识别出数据中存在的一定模式,这在以前我们没有看到过。打个比方,我们几年前和烹饪学院合作做了几个项目,了解哪些口味最好。这样可以让我们知晓其中的化学关系,Watson帮助他们开发出新的配方,这些新的配方很有意思。这很受启发。这些系统不仅能发现潜在的模式,而且还能找到新答案,我觉得这对很多领域都有帮助。

这和我所说的天气也有关系。当我运行和大气层有关的模型时,比如,我发现我们缺失的数据是海洋底部的数据。如果你真的想理解环境变化的总体影响,了解海洋中发生的事情非常重要。这些模型在这方面非常清晰明了。所以,我们在这个问题方面能够产生一定的经济价值:“理解海洋底部发生了什么有什么价值?”

要解答这个问题实际上会推动一定的投资,公共或私人的,来获得一定的数据,这最终会帮助我们作出更有效的决策。所以,我觉得让我们更准确地了解未知的事情—了解未知会带来价值—我们会做得更好,得出更有创造性的答案。Watson下一步不仅仅是要自主学习,它实际上是要提出很多问题。

财富:当你谈到从自身的观察,学习,提问题中提出假设时,你实际上就将Watson看成是一名科学家。我的意思是那就是科学家做的事情,对么?他们提出假设,然后设计试验来证明他们的假设,希望得出某种结论。

KENNY:确实如此。在未来,如果Watson能够进入我们设想的领域,那么它实际上将成为科学研究过程中真正的合作伙伴,帮助科学发现。

本文分享自微信公众号 - 点滴科技资讯(DDKJZX)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2016-10-31

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 全球前十大证券交易所在区块链领域的探索和布局

    本文作者:中国(上海)自贸区研究院(浦东改发院)金融研究室主任 刘斌 微信号 shpdlb

    点滴科技资讯
  • 你有必要知道的10家日本金融科技企业

    金融科技开始在东京快速发展。 监管模式的变革,投资大幅增加,大型银行的支持,这些都导致金融科技在日本爆发式发展。 日本拥有巨量的个人资产,其中52%是以现金为主...

    点滴科技资讯
  • 他要用以太坊颠覆一切!!!

    Vitalik Buterin,数字货币网络以太坊的创造者,想利用其开发的技术颠覆一切。 德国柏林,6月17日周五早上8点15份,一片混乱,Slock.it这...

    点滴科技资讯
  • IBM沃森错开致命药!国内67家医院也在用,秘密文件曝光严重bug

    刚被曝光的IBM内部文件显示,许多医生在使用Watson时,发现AI给出了“多个不安全、不正确的治疗意见”,甚至在极端的诊断案例中,Watson给有出血症状的癌...

    量子位
  • 【CES】IBM CEO 主旨演讲:Watson 将 AI 引入商务世界?

    周三晚上,拉斯维加斯的威尼斯人酒店中,IBM首席执行官Ginni Rometty进行了一场消费者电子产品展览(CES)的主旨演讲。 消费者技术协会主席Gary ...

    新智元
  • 学界 | 一窥 ACL 2018 最佳论文

    AI 科技评论按:随着定于 7 月 15 日的开会日期逐渐临近,自然语言处理顶会 ACL 2018 继公开了接收论文名单之后,今天也公布了包含 3 篇长论文 与...

    AI科技评论
  • leetcode之最短补全词

    这里就暴力求解,先统计licensePlate中字母的个数;之后遍历words,挨个统计每个word的字母个数,然后去校验是否包含licensePlate中的字...

    codecraft
  • Scala语法介绍

    云飞扬
  • leetcode之最短补全词

    这里就暴力求解,先统计licensePlate中字母的个数;之后遍历words,挨个统计每个word的字母个数,然后去校验是否包含licensePlate中的字...

    codecraft
  • nginx0.1.0之event模块初始化源码分析(2)

    本文分析nginx的event在初始化时的第一个步骤,就是执行每个类型为NGX_EVENT_MODULE的模块的create_conf函数。该版本一共有8个这样...

    theanarkh

扫码关注云+社区

领取腾讯云代金券