华为AI首席科学家裴健:产业AI化的核心是数据及对它的挖掘

AI科技评论按:都说人工智能的大潮已经到来,但是人工智能应该如何落地与产业结合,产生实际的效果?在ACM SIGKDD主席、加拿大西蒙弗雷泽大学计算科学学院教授裴健看来,产业AI化的核心是数据以及对于数据的挖掘,而对于企业来说,AI落地的过程中最关键的不是你用了多少新鲜的算法和新的数据,而是你能不能直接支撑业务部门进行业务手段和业务内容的创新。

在过去的数年中,裴健教授一直在与蓝十字、SAP、IBM、华为等多家公司进行着大数据方面的合作,对如何推进企业AI进程也有着深入的研究。2017年正值裴健教授的学术间隔年(Sabbatical Leave,欧美教授每隔数年可以有一年时间不承担学校的教学工作,专心去做自己想做的研究与课题),而裴健教授曾向AI科技评论提过,他希望能更好参与到一个用AI推进企业流程的完整过程中,因此裴健教授与华为展开了更全面的的深入合作并担任华为AI首席科学家一职,帮助华为更好地将AI与其业务结合起来。

AI与传统产业结合有两种思路:AI+和+AI。前者先打造一个AI平台,在平台上跑各种AI的应用,并将传统产业转到AI平台上运行;后者则是在某些比较适合AI应用的领域先研究如何应用AI,用AI改进流程,并将其逐步推广到其他传统产业中来。裴健教授向AI科技评论介绍,“+AI”的思路在华为内部供应链、风险控制、热线客服等业务领域已经得到了明显的业务进展,华为在此基础上提供了一系列端到端的解决方案,将供应商包含其中,以AI的方式来解决传统企业的业务问题。

在正在召开的“华为全联接2017大会”上,裴健教授结合华为云的业务,为我们进一步介绍了企业在做AI应用中的难点与挑战。裴健教授认为,AI只有使得业务产生价值,才能够最终对用户有真正的作用 。

(裴健教授演讲中)

以下是AI科技评论整理的裴健教授演讲主要内容

我非常高兴有机会能够跟大家分享华为在公有云上提供的AI服务,以及这些服务怎么能够帮助我们的企业迎接未来的挑战。

我们都知道在最近的几年里面AI取得了前所未有的重大突破,产生了很多明星级的应用。为什么AI这个已经存在了几十年的学科在最近的几年会取得很大的突破?其中有两个很关键的因素,第一个是在机器学习领域,我们有了一些开源的机器学习库,如说Tensorflow、MXNet、Caffe、CNTK等,使得用户可以很容易地编写机器学习模型。但是编写了一个机器学习程序并不意味着你就能够训练到一个好模型,你需要大量高质量的数据来训练这个模型。处理大规模高质量的数据需要一个机器学习的平台,而且最好这个平台是基于云上的。业界基于云的机器学习平台大幅度的降低了AI技术的使用门槛。

AI目前的进展和数据与计算密不可分。首先,我们要获得好的机器学习模型,就必须要有大量高质量的数据。但是,在我们很多的企业AI应用里面缺乏大量高质量的数据,这是企业AI应用的一个重要的瓶颈。

如果我们大量的数据,我们可以训练一个深度模型,我们需要对数以百万计的参数进行调优,这需要巨大的计算资源。AI需要通用的计算资源,如CPU等,也需要一些专用的计算资源,如说PU、FPGA、TPU等。目前这些资源在体系结构上是排它的。一个子任务分给GPU去做了就会一直由GPU做。我认为,未来体系结构应该逐步走向融合,有灵活的调度。

基于云的AI平台是处理AI所需要数据的关键中的关键。在企业环境当中有不同的机器学习的任务和应用,我们应该怎么样去选取这个模型呢?一个原则是模型的复杂度一定要与问题和数据的复杂度匹配起来,否则我们要么出现过拟合或欠拟合的问题。不同的应用场景会往往有不同的复杂度和不同的计算量。要使企业的AI应用成功,不能够只靠一个模型。我们需要一个丰富的平台,提供丰富的AI模型和服务。

基于这样一个考量,华为AI架设一个通向业务智能的桥。无论我们是做AI+或者是+AI,我们坚信业务的最终业务价值是AI的最终价值,一定要解决最终业务问题。AI只有使得业务产生价值,才能够最终对用户有真正的作用,否则的话,空谈AI没有任何的业务价值。企业的业务价值永远是需要端到端的解决方案。从算法到算法对大部分的实际应用没有意义, 需要把数据平台、集成商、领域专家和业务用户协同起来。在企业业务当中的AI是一个以技术和服务平台作为基础,连接数据、领域知识、应用和用户,使各方面浑然一体、紧密结合、相互互动的解决方案。

基于这样的理念,华为AI推出了使能服务的框架。这是建立在华为深厚的行业解决经验。在最底层,我们有丰富的异构计算平台,包括了各种的不同硬件资源和计算资源,如传统的服务器及GPU、FPGA等设备,还有昨天刚发布的Altas。

在这之上我们提供一层平台智能服务API,覆盖了流行的机器学习和深度学习平台,如TensorFlow、Caffe、MxNet等。我们还提供了非常强大的图计算能力,可以在秒级响应内处理千亿条边百亿节点规模的图。这里面我们还提供了像搜索等一系列的基础服务来提供平台层的支持以及强大的推理功能。

在平台API之上,我们有通用AI层,支持视觉、语音、自然语言理解等这些感知和认知功能。用户可以在这层上构建通用的AI应用。

在这之上是我们的强项,领域和场景AI层,是我们理解行业、理解企业,提供行业领域的API,如我们面向智能、物流、风控、推荐问答、金融、制造等不同领域的API。对于一个行业来说,这层提供了一个Sandbox和一个工具集,可以用这些工具很容易搭建解决方案。另外,我们还提供解决方案的样本。这是我们华为把已有的成功经验拿出来跟业界分享。用户你可以根据这些蓝本很容易修改定制获得企业需要的解决方案。

我们后续会沿着这个服务框架逐步发布大量的服务,欢迎大家使用,也欢迎合作方在这个平台上贡献他们的服务,共同建设企业AI应用的生态。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-09-11

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技评论

阿里巴巴华先胜:AI+强大算力给城市装上智能大脑

AI 科技评论按:3 月 31 日,由雷锋网主办的AI盛会 ——「2018中国人工智能安防峰会」,在深圳科兴科学园国际会议中心顺利召开。

992
来自专栏新智元

【重磅】2015 机器学习年度回顾:一个强大的成长史

导读 “机器学习是一种核心的,具有革命性的技术,并且因为它,我们需要重新思考我们所做的所有事情。我们正在审慎的将它应用到我们所有的产品中,如搜索,广告,视频或...

2848
来自专栏CDA数据分析师

机器学习2015 年度回顾:一个强大的成长史

导读 “机器学习是一种核心的,具有革命性的技术,并且因为它,我们需要重新思考我们所做的所有事情。我们正在审慎的将它应用到我们所有的产品中,如搜索,广告,视频或者...

1907
来自专栏AI科技评论

卡耐基梅隆邢波眼里的人工智能:它的价值在于通用性

GAIR 今年夏天,雷锋网将在深圳举办一场盛况空前的“全球人工智能与机器人创新大会”(简称GAIR)。大会现场,雷锋网将发布“人工智能&机器人Top25创新企...

3705
来自专栏企鹅号快讯

Hays:期待与聊天机器人和人工智能系统合作

CTI论坛(ctiforum.com)1月2日消息(编译/老秦):Hays最近说,和一个聊天机器人聊天,和一个智能助手一起工作,在各种人工智能(AI)系统中增加...

1788
来自专栏大数据文摘

对话第四范式胡时伟:让数据科学家成为业务专家,再为他们配一支技术军团

1814
来自专栏互联网数据官iCDO

【iCDO专访】数据掌门人王晔:试验、增长、最简单的数据生产力

引言:吆喝科技CEO王晔的精彩回答,让我们有机会从A/B测试一个看似非常小的触点, 窥看到流量红利结束,企业决策者面临的增长挑战和机遇;也从渠道测试、落地页优化...

892
来自专栏企鹅号快讯

人工智能的下一步发展趋势是什么?

人工智能与以往IT技术相比最大的差别在于数据的关键作用,人工智能必须通过数据的学习训练才能获取知识和能力。数据是观察世界的桥梁和知识的载体,只靠通用计算机硬件和...

1856
来自专栏大数据文摘

行业 | 我的数据科学成果为什么无法商业化?

1254
来自专栏AI科技评论

线性资本王淮:明年人工智能泡沫将达到顶点

虽然说当下几乎各行各业都在拥抱人工智能,但你是否知道人工智能曾经有过一段时间被忽视,且只能以数据挖掘、机器学习等其他称呼来进行代替? ? 近日由网易科技和网易智...

2889

扫码关注云+社区