华为AI首席科学家裴健:产业AI化的核心是数据及对它的挖掘

AI科技评论按:都说人工智能的大潮已经到来,但是人工智能应该如何落地与产业结合,产生实际的效果?在ACM SIGKDD主席、加拿大西蒙弗雷泽大学计算科学学院教授裴健看来,产业AI化的核心是数据以及对于数据的挖掘,而对于企业来说,AI落地的过程中最关键的不是你用了多少新鲜的算法和新的数据,而是你能不能直接支撑业务部门进行业务手段和业务内容的创新。

在过去的数年中,裴健教授一直在与蓝十字、SAP、IBM、华为等多家公司进行着大数据方面的合作,对如何推进企业AI进程也有着深入的研究。2017年正值裴健教授的学术间隔年(Sabbatical Leave,欧美教授每隔数年可以有一年时间不承担学校的教学工作,专心去做自己想做的研究与课题),而裴健教授曾向AI科技评论提过,他希望能更好参与到一个用AI推进企业流程的完整过程中,因此裴健教授与华为展开了更全面的的深入合作并担任华为AI首席科学家一职,帮助华为更好地将AI与其业务结合起来。

AI与传统产业结合有两种思路:AI+和+AI。前者先打造一个AI平台,在平台上跑各种AI的应用,并将传统产业转到AI平台上运行;后者则是在某些比较适合AI应用的领域先研究如何应用AI,用AI改进流程,并将其逐步推广到其他传统产业中来。裴健教授向AI科技评论介绍,“+AI”的思路在华为内部供应链、风险控制、热线客服等业务领域已经得到了明显的业务进展,华为在此基础上提供了一系列端到端的解决方案,将供应商包含其中,以AI的方式来解决传统企业的业务问题。

在正在召开的“华为全联接2017大会”上,裴健教授结合华为云的业务,为我们进一步介绍了企业在做AI应用中的难点与挑战。裴健教授认为,AI只有使得业务产生价值,才能够最终对用户有真正的作用 。

(裴健教授演讲中)

以下是AI科技评论整理的裴健教授演讲主要内容

我非常高兴有机会能够跟大家分享华为在公有云上提供的AI服务,以及这些服务怎么能够帮助我们的企业迎接未来的挑战。

我们都知道在最近的几年里面AI取得了前所未有的重大突破,产生了很多明星级的应用。为什么AI这个已经存在了几十年的学科在最近的几年会取得很大的突破?其中有两个很关键的因素,第一个是在机器学习领域,我们有了一些开源的机器学习库,如说Tensorflow、MXNet、Caffe、CNTK等,使得用户可以很容易地编写机器学习模型。但是编写了一个机器学习程序并不意味着你就能够训练到一个好模型,你需要大量高质量的数据来训练这个模型。处理大规模高质量的数据需要一个机器学习的平台,而且最好这个平台是基于云上的。业界基于云的机器学习平台大幅度的降低了AI技术的使用门槛。

AI目前的进展和数据与计算密不可分。首先,我们要获得好的机器学习模型,就必须要有大量高质量的数据。但是,在我们很多的企业AI应用里面缺乏大量高质量的数据,这是企业AI应用的一个重要的瓶颈。

如果我们大量的数据,我们可以训练一个深度模型,我们需要对数以百万计的参数进行调优,这需要巨大的计算资源。AI需要通用的计算资源,如CPU等,也需要一些专用的计算资源,如说PU、FPGA、TPU等。目前这些资源在体系结构上是排它的。一个子任务分给GPU去做了就会一直由GPU做。我认为,未来体系结构应该逐步走向融合,有灵活的调度。

基于云的AI平台是处理AI所需要数据的关键中的关键。在企业环境当中有不同的机器学习的任务和应用,我们应该怎么样去选取这个模型呢?一个原则是模型的复杂度一定要与问题和数据的复杂度匹配起来,否则我们要么出现过拟合或欠拟合的问题。不同的应用场景会往往有不同的复杂度和不同的计算量。要使企业的AI应用成功,不能够只靠一个模型。我们需要一个丰富的平台,提供丰富的AI模型和服务。

基于这样一个考量,华为AI架设一个通向业务智能的桥。无论我们是做AI+或者是+AI,我们坚信业务的最终业务价值是AI的最终价值,一定要解决最终业务问题。AI只有使得业务产生价值,才能够最终对用户有真正的作用,否则的话,空谈AI没有任何的业务价值。企业的业务价值永远是需要端到端的解决方案。从算法到算法对大部分的实际应用没有意义, 需要把数据平台、集成商、领域专家和业务用户协同起来。在企业业务当中的AI是一个以技术和服务平台作为基础,连接数据、领域知识、应用和用户,使各方面浑然一体、紧密结合、相互互动的解决方案。

基于这样的理念,华为AI推出了使能服务的框架。这是建立在华为深厚的行业解决经验。在最底层,我们有丰富的异构计算平台,包括了各种的不同硬件资源和计算资源,如传统的服务器及GPU、FPGA等设备,还有昨天刚发布的Altas。

在这之上我们提供一层平台智能服务API,覆盖了流行的机器学习和深度学习平台,如TensorFlow、Caffe、MxNet等。我们还提供了非常强大的图计算能力,可以在秒级响应内处理千亿条边百亿节点规模的图。这里面我们还提供了像搜索等一系列的基础服务来提供平台层的支持以及强大的推理功能。

在平台API之上,我们有通用AI层,支持视觉、语音、自然语言理解等这些感知和认知功能。用户可以在这层上构建通用的AI应用。

在这之上是我们的强项,领域和场景AI层,是我们理解行业、理解企业,提供行业领域的API,如我们面向智能、物流、风控、推荐问答、金融、制造等不同领域的API。对于一个行业来说,这层提供了一个Sandbox和一个工具集,可以用这些工具很容易搭建解决方案。另外,我们还提供解决方案的样本。这是我们华为把已有的成功经验拿出来跟业界分享。用户你可以根据这些蓝本很容易修改定制获得企业需要的解决方案。

我们后续会沿着这个服务框架逐步发布大量的服务,欢迎大家使用,也欢迎合作方在这个平台上贡献他们的服务,共同建设企业AI应用的生态。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-09-11

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏DT数据侠

"唱反调"博士,用算法实现财务自由 | 数据科学50人·张智林

张智林,美国加州大学圣迭戈分校电子与计算机工程系博士,曾在三星北美研究院担任高级工程师,现为AT&T首席数据科学家。凭借在算法上的创新,他用三年实现了个人财务自...

1030
来自专栏IT大咖说

微软:如何搭上人工智能这班车

1593
来自专栏罗超频道

K12在线教育,作业帮如何用技术做到因材施教?

近日作业帮上线名为练习的新功能,主打个性化教育,与美国的“自适应教育”平台KnewTon思路相似。大多数在线教育平台只解决了老师与学生的连接问题,而作业帮和Kn...

3446
来自专栏人工智能快报

麻省理工提出快速设计与制造机器人的新方法

尽管机器人在世界各地变得越来越常见,但要制造它们仍然很难。从设计建模到制造测试,整个过程缓慢且昂贵:即使是一个小的改动也可能意味着需要几天或几周的时间来重新思考...

2986
来自专栏机器人网

前辈分享:机器人算法工程师有关资料和经验

机器人控制入门,我属于比较晚的那种,2014年6月才真正接触和了解机器人控制算法相关知识,非常感谢现在的领导和好哥们带我走入机器人控制世界。所有的机器人控制、...

693
来自专栏吉浦迅科技

当HPC遇到AI

作者:Shahin Khan, OrionX 翻译:GPU世界 高性能(HPC)和人工智能(AI)的结合正创建一个充满活力的新市场:“高性能人工智能”(HPA...

3469
来自专栏人工智能快报

会讲恐怖故事的人工智能

据美国麻省理工学院(MIT)网站2017年10月27日报道,该校媒体实验室的一个研究团队设计了一个叫Shelley的AI恐怖故事作家。Shelley的创造性思维...

2807
来自专栏镁客网

自学社交的人工智能,会不会有一天取人类而代之?

1650
来自专栏量子位

俞栋谈腾讯AI Lab方向和进展;腾讯AI加速器第二期开始招募

雷刚 发自 LV 量子位 出品 | 公众号 QbitAI CES期间,腾讯也有一些AI相关的信息对外发布。 在腾讯众创空间的一个活动上,腾讯AI Lab副主任、...

3346
来自专栏人工智能头条

【MDCC 2016】微软亚洲工程院院长刘震:智能应用的普及化

1657

扫码关注云+社区