前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >硬纪元AI峰会实录 | 公子小白严汉明:这是智能机器人最好的时代

硬纪元AI峰会实录 | 公子小白严汉明:这是智能机器人最好的时代

作者头像
镁客网
发布2018-05-29 16:34:24
5230
发布2018-05-29 16:34:24
举报
文章被收录于专栏:镁客网镁客网镁客网

在当下这么好的人工智能时代里,我们要怎么运用技术做出一款大家都喜欢的机器人呢?

2017年7月9日,由镁客网、振威集团联合主办的“3E‘硬纪元’AI+产业应用创新峰会”在北京国家会议中心盛大开幕。现场200位来自全球AI行业的顶级专家、知名创投机构、创业公司团队和知名媒体齐聚一堂,共谋AI+行业的创新应用,探讨AI的当下与未来。

来自公子小白的创始人严汉明,在峰会期间进行了主题为“这是智能机器人最好的时代”的主题演讲。严汉明表示,目前的人工智能还无法做到迁移学习,举一反三,它仍旧处于高感知、低认知的状态。我们要做的,就是让它具备分析和推理能力,并具备多项功能。

以下为演讲实录(为方便阅读,有所删减)

刚刚陈博士讲的非常好。在之前的圆桌论坛上,专家们也都就人工智能这一领域的现状和发展方向做了深入的探讨。那我就结合公子小白的产品研发经验和应用场景与大家一起探讨一下,在当下这么好的人工智能时代里,我们要怎么运用技术做出一款大家都喜欢的机器人呢?

目前市面上所推出的关于语音智能类的交互产品,例如苹果的HomePod、亚马逊的Echo、谷歌的Google Home。而就国内来说,包括近期阿里推出的天猫精灵、喜马拉雅的小雅等,都是比较贴近人了生活的人工智能产品。

人工智能目前仍旧处于高感知、低认知的状态

人工智能技术很广,包括图像识别、语音识别等,已经有了其非常成熟的商业模式了,甚至有些已经开始盈利。例如,在语音识别领域,我们国内的巨头科大讯飞、百度等,都在做着非常大的布局和商业化尝试。那更往前一部,自然语言处理又是什么呢?

人工智能实质上就是在深度的神经网络上面构建的一个符号处理系统,这是我们在产品的探讨和研发过程中总结出来的。深度学习可以解决机器的学习问题,例如你给它一些图片、声音素材等数据,并对它进行训练之后,就可以让它很快的掌握一个单一的技能。

然而,人类不只能深度学习,还具备增强学习和迁移学习的能力,也就是我们所说的举一反三。但目前机器人不具备这个能力,所以在让机器学会简单学习之外,我们需要通过深度学习技术让其掌握的这些技能,包括感知的技能。像小猫小狗一样,让它们有视觉,听觉,还会自己保持平衡等等。

从原始社会打结记事算起到今天,我们除了通过手写文字和电脑打字输入等方式之外,还有很多其他的交流方式,形成了一整套非常复杂用于人类交流的语言处理系统。这个系统除了可以正常地进行表达以外,还能够通过联想和推理等表达含义。

结合以上所说的,通过人工智能技术够构建我们的学习系统,不仅可以使得深度神经网络将一些感知上的东西做得更加深入,还可以通过知识图谱将其与人类的认知结合起来。但目前的人工智能有一个特点,也是其存在的问题,就是它的图像识别和处理能力可能比人类还高,然而它并不具备深刻认识的能力,覆盖率也非常的低,一个算法只能完成一件事情。例如语音识别算法,它只能识别语音,图像识别算法也能识别图片,虽然准确率非常高,但它不能让一个算法同时具备语音识别和图像识别两种能力,所以它就不能进行很好的迁移学习。

当然了,它的效率非常高,像AlphaGo一样,已经超过了人类最大的运算能力,但它的综合决策能力就很弱了。不过对于下棋来说,规则比较单一,所以它能够做的很好。那如果让它来处理一些事情或者一国的政治呢,它就很难去决策了。因为这些事情里面包含了非常多的因素和非常多的条件所限制,目前人工智能技术是做不到的,它目前还处于高感知、低认知的这样一个状态。

弱人工智能时代

产品落地需要更符合人性需求

在这样的一个情况下,我们怎么在弱人工智能时代,将产品落地呢?像打卡门禁的这种人脸识别系统或者指纹识别系统,它也可以用到人工智能的技术,但它是很封闭的、很单一的一个领域;如果再发散一点,往娱乐化的方向去走,例如直播系统,其实也用了一些信号处理或者是图片压缩等的人工智能处理的技术。

经过四年的摸索,我们决定要做一些符合人性的产品,做一些虚拟的生命,通过人工智能技术,促进人工智能产业闭环。那我们怎样才能在当前的技术基础上通过技术组合产生一个有生命感的虚拟产品呢?目前,还没有一个产品可以拥有很多功能,可以播放、投影、打乒乓球、端茶倒水,又可以给你唱歌跳舞等。比方说我们在家里最常见的扫地机器人,它目前是机器人行业里面运用最大而且产量最高的一款产品,但它的功能也只是扫地,不能完全的多样化。很多的国内的主打娱乐的产品,所想到的只是跟低龄化人群相结合,比方说我们看的喜羊羊、熊大熊二,这些IP比较适合小孩子,不能覆盖到全部的人群。

基于以上的分析和梳理,我们打造了一个能够进行自然语言交流和用三维虚拟成像去显示的虚拟生命——琥珀虚言。它不仅搭载了语音识别、手势识别、人脸识别等技术,还具备了声纹识别和多轮对话等功能。通过将技术、用户画像、交互场景等相结合,经过其自己的记忆推理,以三维虚拟的形式输出显示。

我们还有款产品名为helloA,它是一款的三维全息360适度的机器人,所扮演的是一个三维虚拟的女孩子。它是通过结合AI和VR,用虚拟的方式把人体数字化打碎,再利用技术将这些数据进行组合后所显示出来的。与其他实体机器人相比,它的场景、动作和情感表达方式更为丰富,且成本较低,关节的能动性也较好。

我们还有一款机器人,公子小白,一共是两个机器人,一个叫公子,一个叫小白。我们认为,这是男生买给女生的最好的礼物。以两个机器人为纽带,来表达和维系男女朋友在恋爱过程中的一些很微妙的感觉,例如表达关怀和爱意等。这有别于现在的微信、短信、电话等,仿佛让我们回到了以前上学时候写信或者是交笔友时的状态,而这种种朦胧和距离的感觉更能够牵动情侣直接的感情。

除了机器人以外,我们还做了一些行业定制解决方案。比方说我们为海航集团定制的空港小白,它可以结合航空系统提供交互订机票、查询机场状态、航班状态等等服务。我们还做了一些明星和艺人定制,让这些艺人的IP款机器人跟真人进行语音和视频等沟通。此外,我们还可以通过机器人进行社群和信息的管理。

我的分享就到这里,主要是结合我们产品和技术所做的一些思考,谢谢大家。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-07-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 镁客网 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 以下为演讲实录(为方便阅读,有所删减)
  • 人工智能目前仍旧处于高感知、低认知的状态
  • 弱人工智能时代
  • 产品落地需要更符合人性需求
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档