业界 | 百度Create 2017:AI核心技术全面开放,与开发者共享未来

机器之心原创

作者:李泽南

为用户带来具有价值的技术,才会有真正持久的影响力。7 月 5 日,百度 AI 开发者大会(Baidu Create 2017)在北京国家会议中心举行,其中以「开放创新 共襄 AI 未来」为主题的 AI 技术与开放平台分论坛,吸引了众多开发者们的关注。

在昨天下午举行的论坛中,百度副总裁、百度 AI 技术与平台体系(AIG)总负责人王海峰在开场致辞中表示,百度在人工智能领域深耕多年,从十七年前百度诞生之日起就开始积累,几乎所有主要人工智能技术都已在百度搜索引擎中得到应用,来自搜索引擎的用户需求、数据和平台,支撑了百度 AI 技术的快速发展,现在百度人工智能在算法、数据、技术等方面具有领先优势。

「在每天数十亿次用户请求的千锤百炼下,百度的人工智能技术已是真正实用的人工智能技术。」王海峰认为,人工智能的技术还在不断进步,但另一方面,只有将技术与实际应用相结合,根据用户需求和反馈反复迭代优化,才能打造强大、更具活力的 AI 技术。

作为一家大型科技公司,百度诞生于 PC 互联网时代,那是一个开放生态的时代。百度认为,在互联网的助力下得到迅速发展的 AI 技术,也应该秉承开放精神。更重要的是,AI 的影响将不限于互联网,AI 将影响各行各业和人们生活的方方面面。百度希望通过与开发者和社会共享 AI 技术成果,带动生态繁荣,推动社会进步。

在大会上,百度宣布其多年打造的完整 AI 技术平台将全面开放。百度的 AI 能力分为四层。在基础层,是 AI 算法、大数据、大计算能力。在感知层,包括语音、图像、视频、AR/VR 等技术。认知层有自然语言处理、知识图谱及用户画像等。在平台层,基础层、感知层、认知层的技术会平台化,通过百度 AI 开放平台 ai.baidu.com 开放,与开发者共享。截至目前,百度 AI 开放平台上开放的技术共有 60 个,已成为最全面的 AI 技术开放平台。

开放技术打造完整平台

百度正试图通过开放的生态体系在人工智能的时代引领发展的潮流。此次宣布开放的语音、自然语言处理、视频、增强现实、机器人视觉等技术,与已经开放的 AI 技术一起,构成具有 60 项开放技术的完整的、综合的 AI 开放平台,为开发者提供形式多样、可定制、可组合的 AI 技术,满足开发者从 API、源码、数据到计算能力的多层次需求。

在自动驾驶的精细数据集中,每一帧的图片要几个小时才能完全标注,百度第一次开放了 3000 帧用于自动驾驶的全标注数据集,并计划在今年 9 月开放更多。

作为中国科技巨头中第一个选择转型的企业,百度在 AI 技术上具有先发优势,完整布局和深厚技术积累。百度的 AI 技术始终随着公司业务的发展而不断进化,由于庞大的用户规模和强大的人才积累,百度 AI 技术的开放对于开发者们来说是一个好消息。在大会上,百度表示,其 AI 开放平台多项技术的使用量过去半年都有 2 倍以上的增长。

唤醒万物:语音技术+自然语言处理

语音交互或许是人机交互的下一个风口,随着亚马逊 Alexa 等智能设备的兴起,语音技术的需求正日益增加。百度语音技术部总监高亮在分论坛现场介绍了本次新开放的远场识别及语音唤醒、定制化语音合成、语音合成音色、情感语音交互(Emotional CUI)等技术。通过这些开源的技术,开发者们可以实现不同场景的智能应用,轻松设计出满足自己需求的产品。

在利用语音技术,让机器理解用户所指之后,更重要的是能让机器懂得用户真正的需求,这就需要用到自然语言处理技术。在分论坛中,百度自然语言处理部总监赵世奇详细介绍了语言理解与交互技术平台——UNIT。该平台将开放语言理解技术、交互技术,从百度大数据中自动汲取最有价值的数据提供给开发者使用,为开发者提供了多种定制化方案,还首创「训练师」模式,助力开发者训练对话机器人,赋予机器「理解」自然语言,听懂用户需求,以及与用户进行多轮次对话的能力。

看懂世界:视频分析、人脸识别和 AR

在论坛中,百度研究院院长林元庆介绍了视频分析与理解、机器人视觉和人脸识别等技术。同时,本次开发者大会还发布了全面的视频语义理解技术,包括视频封面选摘、视频分类、视频比对、细粒度识别、视频审核、视频公众人物识别、视频结构化分析等。此外,林元庆还介绍了用于自动驾驶机器学习训练的语义分割 RGBD 视频数据集,以及完整的机器人视觉解决方案。

增强现实(AR)技术作为全新的视觉交互形式,越来越受到营销、娱乐、游戏等行业关注。百度增强现实实验室主任吴中勤现场发布全新 DuMix AR 开放平台,为开发者供 AR SDK、内容制作工具、云端内容平台和内容分发服务。吴中勤表示,未来百度将提供更多场景的 AR 行业解决方案,赋能各行各业,共同探索 AR 价值。

在 AI 技术与开放平台分论坛上,除了发布新开放的核心技术能力,百度也表示将对已有技术进行改革。百度杰出科学家徐伟批露了 PaddlePaddle 的最新发展路径图,宣布百度会开源代码、开放大规模数据集、开放计算能力、开放应用模型库。作为国内首个开源深度学习平台,百度在 PaddlePaddle 的研发中持完全开放的态度,试图与开发者们共同推进技术的发展。「在重新设计之后,今年 9 月我们将推出全新版本的 PaddlePaddle,」徐伟表示。「在简化代码,运行更加高效的基础上,它将对移动端和嵌入式设备有更加完善的支持。」

而在计划于 2017 年 12 月推出的新版本中,PaddlePaddle 将支持英伟达全新 Volta 架构的 16 位浮点运算,并加入 TensorRT 的支持。

Create 2017 开发者大会上备受瞩目的 AI 技术与开放平台分论坛,是整合了 NLP、KG、IDL、语音、大数据等核心技术部门的百度 AI 技术平台体系 AIG 成立后的首次集体亮相,全面展示了百度的 AI 技术能力。可以想象,未来随着百度 AI 技术的进一步开放,开发者、创业者、业内公司将不断从中受益,让人工智能技术赋能更多场景,创造更多价值;而另一方面,百度也会从这些行动中不断提升自己的竞争力。无论如何,这次开源行动必将推动国内人工智能领域的加速发展。

相关链接

  • 开放/开源计划:http://ai.baidu.com/
  • Apollo GitHub:https://github.com/apolloauto

本文为机器之心原创,转载请联系本公众号获得授权。

原文发布于微信公众号 - 机器之心(almosthuman2014)

原文发表时间:2017-07-06

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏镁客网

苹果正在研发人工智能芯片,有助于优化苹果设备AI服务

1423
来自专栏WeTest质量开放平台团队的专栏

开发者的盛会,VR爱好者的狂欢——腾讯WeTest参会Unity开发者大会实录

4月11日,Unity开发者大会上海站在上海静安香格里拉酒店召开。腾讯WeTest有幸参加并为开发者们一一解答游戏开发过程中遇到的测试问题。

1522
来自专栏华章科技

5年400倍增长, Airbnb首位数据科学家揭秘他们如何运用大数据

当时人们连公司的名字都不会发音,如果不算正在接受心理咨询的哥们儿,实习生,旁边咖啡店里的咖啡师,团队只有大约七个人。我们的公司就在创始人在SOMA的公寓旁。工作...

972
来自专栏数据科学与人工智能

【数据科学】张溪梦:四个案例讲透数据科学与商业结果结合的原力

论坛君 9月11日—9月12日,由经管之家(人大经济论坛)主办的“2015中国数据分析师行业峰会(CDA•Summit)”在北京举行。本文是Growing.io...

2689
来自专栏罗超频道

未来的地图应该是什么样?百度告诉我们要有AI

每个工作日的下午6点多,当我在办公室时,都会收到一条来自百度地图的推送,有时候是“现在去同和XX,路途较为拥堵,您可规避路线出行。”“现在去同和XX,一路畅通,...

751
来自专栏人工智能头条

BDL张潼谈大数据三大趋势:个性化、智能化、产业化

1173
来自专栏BestSDK

持续开放SDK/API,百度60项AI技术助力开发者打开“智能之门”

“在每天数十亿次用户请求的千锤百炼下,百度的人工智能技术,是真正实用的人工智能技术,”王海峰认为,只有将技术与实际应用相结合,根据用户需求和反馈反复迭代优化,才...

3939
来自专栏云计算D1net

培训云计算架构师需要学习五件事

人们处理和思考IT的方式已经发生了根本性的变化。一些成功的IT专业人员现在影响了企业的业务模式和策略。数字化转型正在影响所有业务垂直领域,而云计算架构师在支持下...

39812
来自专栏点滴科技资讯

未来的人工智能:只有‘智能’,没有‘人工’

? 人工智能逐渐开始消失于无形中,可以是由外到内,反过来由内到外也正经历这一过程。人工智能技术的影响和作用对于人类来说越来越难以理解,难以感知。即便是专家们也...

3224
来自专栏WeTest质量开放平台团队的专栏

腾讯WeTest参展北京GADC——为游戏而生,让品质发声

腾讯GAD全球游戏开发者峰会将于2016年5月27日在北京国际饭店举办,以“链接·生态”为主题,汇聚行业最有实力的企业代表。腾讯WeTest作为本次大会的唯一...

982

扫码关注云+社区

领取腾讯云代金券