前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >陆奇亮出百度AI总布局,景鲲对比DuerOS与iOS和Android产业链

陆奇亮出百度AI总布局,景鲲对比DuerOS与iOS和Android产业链

作者头像
新智元
发布2018-03-28 13:49:48
6560
发布2018-03-28 13:49:48
举报
文章被收录于专栏:新智元新智元

【新智元导读】 4月28日,百度DuerOS和小鱼在家联合召开新品发布会,百度副董事长、集团总裁兼COO陆奇、创新工场董事长兼首席执行官李开复、百度度秘事业部总经理景鲲、小鱼在家CEO宋晨枫以及明星用户姚晨出席了发布会。

4月28日,百度DuerOS和小鱼在家联合召开新品发布会,正式发布搭载百度DuerOS的新款视频通话机器人“分身鱼”,帮助人们分身有术,轻松兼顾工作和生活。百度副董事长、集团总裁兼COO陆奇演讲发表了百度的人工智能生态总构想,百度度秘事业部总经理景鲲、小鱼在家CEO宋晨枫对百度平台以及合作方式进行了详细探讨。明星用户姚晨现场连线家中宝贝演示产品。

百度副董事长、集团总裁兼COO陆奇(中)、创新工场董事长兼首席执行官李开复(左)、小鱼在家CEO宋晨枫(右)

发布会上小鱼在家CEO宋晨枫介绍了新产品“分身鱼”的功能和背后技术。据介绍,分身鱼视频通话机器人是百度DuerOS与小鱼在家合作推出的一款全新品类产品,搭载对话式人工智能操作系统DuerOS,支持手机遥控操作,10米内自如视频通话,更兼具了平板电脑全功能。

陆奇分享了百度DuerOS的推出和落地,以及百度在人工智能领域的重要布局。景鲲表示,语音对话式的交互可以进一步降低用户获取信息的门槛,此次百度DuerOS携手小鱼在家是产品化的重要一步,未来百度DuerOS还将为更多合作伙伴赋能、让消费者在家庭、手机、汽车、可穿戴等多个场景里都可以使用语音进行交互,并获取信息和使用服务。

姚晨作为明星用户,与家中宝贝连线,共同现场演示了小鱼在家的视频通话、语音语言、人脸识别、娱乐益智等功能。

发布会后,新智元对景鲲和宋晨枫进行了采访。

陆奇:百度的人工智能生态总构想

在发布会上,陆奇表示百度的总体人工智能生态布局是基于百度大脑的,百度大脑是一整套的核心能力和核心算法,将语音识别、图像识别、视频识别、自然语言处理、大数据、用户画像等种种核心能力组装在一起,给同行业的创业者、创新者赋能。

陆奇介绍,百度的智能云被称为ABC云——AI、BigData和Cloud,通过百度大脑和百度的智能云整体连接在一起,提供创新。基于这样的一个搭建,同时为不同的行业建立行业的大脑,比如说有金融业的金融大脑,还有自动驾驶大脑、教育等各种各样不同的行业大脑,通过智能云的方式提供给工业和其他创新生态。

更重要的一个布局是DuerOS,这是有史以来第一次让自然语言成为一个全方位的人机交互的界面。他认为iOS或者是Android是为手指和触摸而设计的,对全球的影响非常之广。但是DuerOS将对世界工业带来更大影响。因为DuerOS会无处不在,它可以在任何一个器件上,在任何一个场景上,在任何一个环境中,跟任何一个人都有交互的能力。

DuerOS通过API、SDK,为每一个参与者赋能,一起创新。双方共赢是百度战略的着重点,因为,人工智能的时代是一个赋能的时代。

景鲲:平台寻求多样化数据让平台更丰满

从做产品和业务来讲,最关键的就是数据。景鲲介绍他们当时最自然而然的就是百度的平台上找数据。但是用户在搜索的时候都被计算机训练了,什么时候是关键字,什么时候需要空格,这并不是人自然表达的。

因此百度又做了语音搜索,在百度搜索的App上放一个语音按钮。通过语音按钮看到的数据跟原来搜索的数据类型不一样。大概做了一年之后发现,数据在这个渠道上的数据趋于同质化。因为百度搜索APP里面用户表达的语音的数据是被一个大环境限制住了。在寻求数据多样化上,这条路走得不会长远。

通过小鱼在家等硬件,不一样的场景,用户表达的就是不一样的语音数据。

因此百度要把这种平台化的能力放到新的设备和新的场景里面看到更多的数据,去训练更好的模型,让模型更通用更实用。小鱼在家是一个新品类的优秀公司,其数据对百度来说价值非常高。

百度作为一个平台需要数据让平台变得更丰满。通过合作和共享数据,让合作者的产品体验更好,让百度的大脑更智能。

从语音交互走向多态交互

DuerOS在语音识别上已经有很多的积累,景鲲向新智元介绍,在实验室环境下各种语音识别测试的准确率是97%,但是在现实家庭场景中,语音的问题还是有一些挑战的。百度模拟家庭环境,收集各种各样的真实家庭情况下语音的表达,从而研究语音的校验。例如测试设备旁边让扫地机器人在那里走,空气净化器在那里放,这种情况下去模拟真实用户的一个情况。

关于唤醒词开启语音交互模式,在很多场景下给用户带来不便。毕竟人和人之间的启动一次交流,也不仅仅是唤名字这一种方式。面对这种质疑,景鲲表示,确实人与人之间的唤醒显得很自然,有时候可能一个眼神或者拍拍肩就唤醒了。建立了一次唤醒之后,可能下面不需要唤醒。

随着技术的发展,百度和小鱼唤醒会变得更自然。例如小鱼在家的设备有非常多的传感器,有视觉传感器。一旦有视觉之后,就跟纯音响设备不一样了,可以盯着你。

新智元也曾报道过牛津大学和DeepMind 的最新研究,他们开发出一款能够阅读唇语的系统,即通过摄像头看用户的唇语,也能读出用户在说什么,并且远远超过人类水平。景鲲表示,唇语以后也可能成为DuerOS唤醒方式。

即便现在,也有人脸识别的唤醒方式。就如刚刚产品演示中,姚晨在小鱼前面,小鱼就会认出姚晨。实际上现在用户可以走到屏幕面前,准备交互的时候,就把小鱼唤醒了,叫做凝视唤醒,也就是我给他一个眼神就唤醒了。

通过听说读写的这样的能力,都可以做交互。未来这个形态不管怎么变,听说读写的能力是不会变的。宋晨枫表示,会持续的在这条路上去找这种多态交互的方式,引领和定义多态交互的方式。

DuerOS比iOS和Android更复杂

DuerOS是一个操作系统,可能比原来iOS和Android更复杂,除了开发厂商和开发者,还会跟芯片方、模组授权方、方案公司等合作。整个产业涉及面非常广。

景鲲表示,做操作系统关键要把心态摆正,目前在合作研发的时候投入了很多人力,这是百度对硬件、对开发者的态度。跟小鱼在家的合作其实是投入了两个团队的力量,来共同研发这样的一款产品,就是为了能够在今天打造一款标杆式的体验,这个标杆式的体验非常重要。

景鲲认为,在移动时代开发一个App本来推广成本很高的,但是开发者的群体里面,一直在找新的平台在做,往往看到新的平台出现的时候开发者一拥而上。

景鲲认为,百度自己本身更希望做平台,不是把力量放在硬件设备上而是硬件平台,这样的硬件平台上就可以把企业的能力放到上面去,把内容带给用户,对开发者也是一种吸引力。对于很多芯片厂商也有吸引力,很多时候芯片厂商也希望跟互联网有更多的沟通,把整个流量变现的生意带到芯片行业去。所以百度要做平台,面对硬件商、芯片商,怎么为他去服务,把他的设备卖得更多,打造成标杆的硬件设备。

景鲲说:“我们为很多开发者去寻找更多的开发平台,这是开发者的诉求,我们为芯片厂商找到更多的销售团队。从我们做操作系统的角度来讲,我们是把我们的能力给他们。”

快、稳、准:80%有用,20%有趣

宋晨枫从DuerOS的重要合作者角度,提出以语音能力为例,他们需要的是在家庭里面做到“有问必答”,并且提出了“快、稳、准”的开发目标。这需要很多的技术,前端、ASR、NLP的技术结合在一起才能做到,而且需要数据训练。小鱼现在是从硬件层做起,包括麦克风阵列,包括算法,当然如果跟后面的ASR系统没有联系的话,中间是有断层的。两个团队的技术和算法合到一起,放到实验室去试,才看到真正的,不是理论上的准确率,而是实际场景中的准确率。

宋晨枫表示做产品要80%有用,20%有趣。先满足最基础的需求,从有用到更好。只有有用这一块的东西,是带来用户的传播、使用、黏性和购买。而其它的关于多账号交互、机器人个性,属于有趣层面,有趣这一块实际上是带来他的口碑和传播点。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-04-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档