华为AI首席科学家裴健:产业AI化的核心是数据及对它的挖掘

AI科技评论按:都说人工智能的大潮已经到来,但是人工智能应该如何落地与产业结合,产生实际的效果?在ACM SIGKDD主席、加拿大西蒙弗雷泽大学计算科学学院教授裴健看来,产业AI化的核心是数据以及对于数据的挖掘,而对于企业来说,AI落地的过程中最关键的不是你用了多少新鲜的算法和新的数据,而是你能不能直接支撑业务部门进行业务手段和业务内容的创新。

在过去的数年中,裴健教授一直在与蓝十字、SAP、IBM、华为等多家公司进行着大数据方面的合作,对如何推进企业AI进程也有着深入的研究。2017年正值裴健教授的学术间隔年(Sabbatical Leave,欧美教授每隔数年可以有一年时间不承担学校的教学工作,专心去做自己想做的研究与课题),而裴健教授曾向AI科技评论提过,他希望能更好参与到一个用AI推进企业流程的完整过程中,因此裴健教授与华为展开了更全面的的深入合作并担任华为AI首席科学家一职,帮助华为更好地将AI与其业务结合起来。

AI与传统产业结合有两种思路:AI+和+AI。前者先打造一个AI平台,在平台上跑各种AI的应用,并将传统产业转到AI平台上运行;后者则是在某些比较适合AI应用的领域先研究如何应用AI,用AI改进流程,并将其逐步推广到其他传统产业中来。裴健教授向AI科技评论介绍,“+AI”的思路在华为内部供应链、风险控制、热线客服等业务领域已经得到了明显的业务进展,华为在此基础上提供了一系列端到端的解决方案,将供应商包含其中,以AI的方式来解决传统企业的业务问题。

在正在召开的“华为全联接2017大会”上,裴健教授结合华为云的业务,为我们进一步介绍了企业在做AI应用中的难点与挑战。裴健教授认为,AI只有使得业务产生价值,才能够最终对用户有真正的作用 。

(裴健教授演讲中)

以下是AI科技评论整理的裴健教授演讲主要内容

我非常高兴有机会能够跟大家分享华为在公有云上提供的AI服务,以及这些服务怎么能够帮助我们的企业迎接未来的挑战。

我们都知道在最近的几年里面AI取得了前所未有的重大突破,产生了很多明星级的应用。为什么AI这个已经存在了几十年的学科在最近的几年会取得很大的突破?其中有两个很关键的因素,第一个是在机器学习领域,我们有了一些开源的机器学习库,如说Tensorflow、MXNet、Caffe、CNTK等,使得用户可以很容易地编写机器学习模型。但是编写了一个机器学习程序并不意味着你就能够训练到一个好模型,你需要大量高质量的数据来训练这个模型。处理大规模高质量的数据需要一个机器学习的平台,而且最好这个平台是基于云上的。业界基于云的机器学习平台大幅度的降低了AI技术的使用门槛。

AI目前的进展和数据与计算密不可分。首先,我们要获得好的机器学习模型,就必须要有大量高质量的数据。但是,在我们很多的企业AI应用里面缺乏大量高质量的数据,这是企业AI应用的一个重要的瓶颈。

如果我们大量的数据,我们可以训练一个深度模型,我们需要对数以百万计的参数进行调优,这需要巨大的计算资源。AI需要通用的计算资源,如CPU等,也需要一些专用的计算资源,如说PU、FPGA、TPU等。目前这些资源在体系结构上是排它的。一个子任务分给GPU去做了就会一直由GPU做。我认为,未来体系结构应该逐步走向融合,有灵活的调度。

基于云的AI平台是处理AI所需要数据的关键中的关键。在企业环境当中有不同的机器学习的任务和应用,我们应该怎么样去选取这个模型呢?一个原则是模型的复杂度一定要与问题和数据的复杂度匹配起来,否则我们要么出现过拟合或欠拟合的问题。不同的应用场景会往往有不同的复杂度和不同的计算量。要使企业的AI应用成功,不能够只靠一个模型。我们需要一个丰富的平台,提供丰富的AI模型和服务。

基于这样一个考量,华为AI架设一个通向业务智能的桥。无论我们是做AI+或者是+AI,我们坚信业务的最终业务价值是AI的最终价值,一定要解决最终业务问题。AI只有使得业务产生价值,才能够最终对用户有真正的作用,否则的话,空谈AI没有任何的业务价值。企业的业务价值永远是需要端到端的解决方案。从算法到算法对大部分的实际应用没有意义, 需要把数据平台、集成商、领域专家和业务用户协同起来。在企业业务当中的AI是一个以技术和服务平台作为基础,连接数据、领域知识、应用和用户,使各方面浑然一体、紧密结合、相互互动的解决方案。

基于这样的理念,华为AI推出了使能服务的框架。这是建立在华为深厚的行业解决经验。在最底层,我们有丰富的异构计算平台,包括了各种的不同硬件资源和计算资源,如传统的服务器及GPU、FPGA等设备,还有昨天刚发布的Altas。

在这之上我们提供一层平台智能服务API,覆盖了流行的机器学习和深度学习平台,如TensorFlow、Caffe、MxNet等。我们还提供了非常强大的图计算能力,可以在秒级响应内处理千亿条边百亿节点规模的图。这里面我们还提供了像搜索等一系列的基础服务来提供平台层的支持以及强大的推理功能。

在平台API之上,我们有通用AI层,支持视觉、语音、自然语言理解等这些感知和认知功能。用户可以在这层上构建通用的AI应用。

在这之上是我们的强项,领域和场景AI层,是我们理解行业、理解企业,提供行业领域的API,如我们面向智能、物流、风控、推荐问答、金融、制造等不同领域的API。对于一个行业来说,这层提供了一个Sandbox和一个工具集,可以用这些工具很容易搭建解决方案。另外,我们还提供解决方案的样本。这是我们华为把已有的成功经验拿出来跟业界分享。用户你可以根据这些蓝本很容易修改定制获得企业需要的解决方案。

我们后续会沿着这个服务框架逐步发布大量的服务,欢迎大家使用,也欢迎合作方在这个平台上贡献他们的服务,共同建设企业AI应用的生态。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-09-11

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏腾讯研究院的专栏

ISOC:人工智能与机器学习的政策建议

image.png 中国信息通信研究院与腾讯研究院AI联合课题组编译   蔡雄山 腾讯研究院法律研究中心副主任、首席研究员   曹建峰 腾讯研究...

16710
来自专栏ATYUN订阅号

【业界】机器学习成为主流:如何提高你的竞争优势

随着近年来AI的不断发展,如何在竞争中提高你的优势?首先是大数据—非常大的数据集,可以使用数据分析来揭示模式和趋势,使企业能够改善客户关系和生产效率。然后是快速...

3347
来自专栏云计算D1net

统计和分析网络大数据的方法

大数据给互联网带来的是空前的信息大爆炸,它不仅改变了互联网的数据应用模式,还将深深影响着人们的生产生活。深处在大数据时代中,人们认识到大数据已经将数据分析的认识...

3477
来自专栏企鹅号快讯

Wikibon年度预测:2018年人工智能的八个演变趋势

素材来源|Wikibon 编译|AI商业周刊 编者按:Wikibon是一家大数据及人工智能领域的专业技术咨询和研究机构,旨在通过社区形式与开源共享免费咨询知识来...

19410
来自专栏灯塔大数据

美国创业孵化器Y Combinator孵化的13个机器学习和数据科学初创企业简介与启示

介绍 如果你正在筹划开发一个产品,建议优先考虑一下这几个初创企业。也许就会发现一个产品新视角,那就是通过机器学习和预测分析法使产品性能更强大。 这些初创企业是...

3219
来自专栏PPV课数据科学社区

网络大数据的统计和分析利用

大数据给互联网带来的是空前的信息大爆炸,它不仅改变了互联网的数据应用模式,还将深深影响着人们的生产生活。深处在大数据时代中,人们认识到大数据已经将数据分析的认识...

2655
来自专栏鹅厂网事

质量管理,软件项目生命周期中的专属医生(下)----《度量和改进》

“鹅厂网事”由深圳市腾讯计算机系统有限公司技术工程事业群网络平台部运营,我们希望与业界各位志同道合的伙伴交流切磋最新的网络、服务器行业动态信息,同时分享腾讯在网...

1749
来自专栏AI科技评论

吴恩达解读百度大脑:人工智能到底能为我们做些什么?| 百度世界2016

雷锋网2016年9月1日消息,百度世界2016在京举行。大会上百度首席科学家吴恩达解读了百度大脑的四大能力和百度深度学习平台,并且宣布这个月会把百度深度学习平台...

3248
来自专栏大数据文摘

关于数据分析,管理者的4个常规错误

1143
来自专栏CDA数据分析师

吴恩达 | AI是新的电力 | 演讲稿全文整理(附视频中字)

在上周O’reilly举办的AI Conference上,吴恩达进行了主题为“AI是新的电力”长达25分钟的演讲,演讲中吴恩达亲自板书,内容也是干货满满了。 在...

2125

扫描关注云+社区