前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >这次,罗永浩一句人工智能也没提

这次,罗永浩一句人工智能也没提

作者头像
量子位
发布2018-03-30 15:10:42
8690
发布2018-03-30 15:10:42
举报
文章被收录于专栏:量子位
允中 假装发自 绿地中心 量子位 报道 | 公众号 QbitAI

罗振宇:有没有人认为罗永浩是一个外行?

罗永浩:第一代硬件发布会的时候,有人说你懂个屁手机。我不懂人工智能,人家问,我就聊了。有人就说你聊什么人工智能,你还是说相声去吧。

罗永浩这次一句“人工智能”也没提。

上周,锤子科技新款手机发布。照例,有褒有贬。关于手机本身,量子位不想过多评论,我们更关心期间展示的一些人机交互方式。

罗永浩谈论的很多“软性”卖点,招招式式全跟AI有关。

这位锤子科技创始人的观点是:如果一个全知全能的“语音助手”还不能实现,那就先通过工具性产品提升用户效率。

去年10月,也是锤子的一场发布会,突然让科大讯飞火了一把。这次锤子新品背后,又是哪些人工智能公司在支撑?

AI伙伴

在坚果Pro发布会上,锤子科技在手机上的AI变革,一目了然。

首先可以从系统层面来看,锤子的打法是通过系统功能,让锤子手机用户在具体场景中体验更好、效率更高。其次是工具性产品打造,通过工具性产品,解决用户核心痛点和改善用户体验。

这些应用的背后技术方案提供商,也无一例外来自人工智能领域;而软件交互方面的创新,都与人工智能最新进展密不可分,在此量子位一一拆解挖掘:

1)短信退订

“短信退订”背后的技术提供商是小源科技,这是一家垂直于短信、利用语义分析场景、建立机器模型的公司,他们更加为人所知的产品名称是“信析宝”,主要应用形式是将航班信息等短信卡片化——更美观、更实用、并且可以直接跳转到相关App。

不过,这一次放在锤子科技发布会上展示的是“短信退订”的问题,这是目前短信骚扰最头疼的问题之一,而锤子和小源的结合,则为功能式解决首开案例。

小源科技负责对外战略合作的合伙人段旭告诉量子位,“短信退订”背后主要涉及的是“自然语言理解”和“场景识别”等两大内容。

首先是“自然语言理解”,即通过机器“读取”短信内容,判断短信内容、类型和所属场景。

其次是“场景识别”,需要判断短信是一般退订短信,还是带有通知内容的退订短信,再在用户最终决策后,一键完成退订,并且不会给发送短信方造成“回复证明活跃”的现象。

小源方面称,这背后是短信内容大数据的积累,以及内容场景模型的精准构建。

2)虚拟来电

“虚拟来电”是发布会会中和会后受到争议的功能,在“道德与否”的问题上,引发了广泛讨论。然而就技术而言,这已然是人工智能领域相对成熟、且被广泛应用的技术。

具体提供商方面,锤子引用了科大讯飞的“配音阁”,这是讯飞主打语音合成方案的平台名称,该平台可以按需提供个性化语音合成,能够通过简单而基本的语料信息,合成具体语言、具体语种和具体个人口音的语音信息。

更早之前,在锤子科技去年10月的新品发布会后,科大讯飞的“配音阁”已经在锤子科技系列新品发布会前后大放异彩,主要是通过合成罗永浩、奥巴马等的口音,实现机器语音的“个性化”。

值得注意的是,虽然锤子科技功能化产品“虚拟来电”受到争议,但该技术的实际应用却广泛得多。

比如现在不少快递企业,已经在通过“虚拟来电”的方式,让机器来通知物流快递信息,而一些售后和客服任务较重的行业,也已经上马了该技术。

这也是客服行业和配音行业正在经历的大变革。

除了科大讯飞,宣布AI转型的百度也在这方面秀过肌肉,在2016年百度世界大会上,李彦宏就展示过人工智能充当客服带来的效果,不仅成本降低,而且准确度,以及对用户非结构化数据的整合方面,效果都极其明显。

此外,就着当红演艺明星胡歌的面,李彦宏还让机器模仿胡歌的“口音口吻”,除了感情色彩上稍逊一筹,已属惟妙惟肖——李彦宏说,人工智能正在抢走配音师的饭碗。

3)智能语义拖拽

当然,锤子发布会听起来最具普惠意义的莫过于“智能语义拖拽”,这是一个高速公路一样的功能,在分割林立的手机App之间架起直通管道,减轻App间切换的痛苦,同时提升手机使用效率。

具体来看,“智能语义拖拽”就是把微信、短信等对话过程中产生的信息进行分析,按照所属直接在地图导航、美食评价和日程日历等产品中使用。

但值得注意的是,锤子最终展现的“智能语义拖拽”是一个一步到位的功能,用户可以直接将一段文字拖入相关App中,而机器会在该过程中分析信息内容、提取核心相关信息、并且让各个App各司其职——快速帮助用户完成目的。

实际上这个过程中,锤子还进一步整合了上次推出的“大爆炸”和“一步”两大功能。

此次智能语义拖拽背后的技术提供方是三角兽科技,这是这家初创公司第二次出现在锤子发布会上,上一次双方合作的产品是“Big Bang”(大爆炸)。

据量子位了解,主打智能语义分析三角兽,在该功能从无到有诞生的过程中,总共向锤子科技派出了3名工程师,共计耗时3个月,最大挑战来自手机场景下的技术方案落地问题——在此之前并没有厂商做出过尝试。

三角兽技术负责人称:智能语义拖拽涉及的是NLP中最核心最具挑战的问题,通俗来讲就是让机器断句,且学会中文语境下的“预感”,进而才能搭建机器学习模型。

不过,在和锤子一起开发“智能语义拖拽”的过程中,最大的挑战来自如何在手机场景下,最低限度降低机器模型对CPU、计算功耗等方面的消耗。

而且作为一个功能型产品,还需要考虑联网和本地两种交替情况下如何保证速度,因为反应速度会直接影响用户体验。

“更倾向于合作方是使用网络版的接口,但因为手机涉及用户隐私,或网络情况不佳,就可能需要用到离线版本。

然而紧接着需要解决的问题是离线版本对系统资源的占用,此外运算速度如果太长就会比较伤害用户体验。”三角兽工程师说,同时表示这是最大的考验。

然而,这个最大考验解决后,获利方也将最大化。

在锤子方面的合作实现后,三角兽工程师也坦言,可以无障碍适配到更多的手机产品中。

虽然之前并没有其他手机厂商拥有这样的需求,但在此次坚果Pro的合作中,三角兽和锤子一起完成了从最低配版本的坚果手机,但最高配版本的旗舰机M1L的适配——迁移的成本已经很小了。

这也意味着,一旦其他手机厂商跟进迁移该功能,未来大量涉及不同应用间切换的内容,都将变得 so easy,比如微信中约定吃饭的时间地点,同时将内容拖拽入“日历”、“地图”和“大众点评”等应用中即可。

4)闪念胶囊

“闪念胶囊”是个新鲜事,但伟大的是解决问题的出发点,而非实现的技术难度上。

坦白讲,这只是一次“语音备忘录”和“语音识别”的功能综合,但正如罗永浩所言,这几年来,并没有人为此付出过实际性举动,并且难能可贵的是,锤子将通过开源,让跟多非锤子手机用户也能使用。

这也是锤子AI工具产品思路中的集大成之作。除了语音识别,“闪念胶囊”背后还应用了智能语音拖拽、大爆炸和一步。

在接受量子位的采访中,科大讯飞方面的负责人表示,此次也在“闪念胶囊”中和锤子进行了协作,主要涉及语音识别方面。

与“智能语义拖拽”面临的问题相似,“闪念胶囊”最大的问题是如何在手机设备下实现对资源的合理调用。

如罗永浩发布会上所言,最后锤子和讯飞给出的方案是:首选联网识别,但如果网络情况不佳,则先使用讯飞语音识别本地方案,再在网络情况良好时联网修正。

语音识别和自然语言理解

不难发现,锤子新品发布会上重点推出的工具产品/功能,背后的主要技术是语音识别和自然语言理解及处理,这也是目前人工智能最成熟、进展最快的两大领域,也是中国人工智能公司全球领先的领域。

语音识别方面,从科大讯飞、百度,到搜狗,都已经在大语料数据库的基础上,将语音识别的准确率提升到了97%以上,这在国际公认的标准参数都已然处于领先,并且讯飞还实现了方言领域的高识别率,可以说这是锤子可以实现一系列语音交互为基础的产品的底气所在。

通常情况下,相比键盘为代表的文字输入,语音要高效很多。这也是目前最被看好的新一代人机交互技术,包括亚马逊、谷歌、微软、百度和讯飞在内的公司,都在积极推动语音识别为核心的交互平台的运用,希望自己的语音交互平台,会成为下一个iOS、下一个安卓。

自然语言理解方面,百度的度秘、微软的小冰,以及三角兽等为代表的创业新势力,都已经取得了不俗的进展。无论是小冰的聊天,百度的“读”新闻,三角兽的中文断句,都在自然语言理解、自然语义处理方面,为锤子的产品式整合扫清了障碍。

可以说,这是人工智能进展给于锤子的机会,但同时也是手机行业正在经历的技术变革——与芯片、工业设计等硬件大战不同,这一次革命将体现在“软件”上。

智能手机正迎来新时代

今年3月,量子位曾有文章称《没有人工智能的硬件,未来可能不配叫智能硬件》,当时三星新旗舰Galaxy S8发布会上,安卓阵营巨头推出了人工智能助手Bixby,这是一个类似苹果Siri的产品。

同时也是罗永浩所称的全局性解决问题的语音助手产品,即便他暂时不看好,也已经赛道密集潮水汹涌。

在国内,华为率先在国产手机中推出了语音助手产品“小E”,让用户用自然语言的方式,向它求助在手机使用过程中遇到的各种问题,但具体使用情况来看,用户需求度还不高,场景尴尬的问题始终没有得到解决。

此外,另一种利用AI全局性解决问题的产品是“系统优化”,通过个性引擎,在用户使用习惯的基础上形成用户画像,然后在使用过程中实现“预判”和“推荐”。

比如从EMUi5.0系统开始,华为便开始对外宣称手机系统能够学习用户的操作行为,通过这种方式,系统将可以实现对用户操作的提前预判,依此进行资源的合理分配,从而为用户带来更加流畅的体验。

同样方向出发的还有魅族。这家总部位于珠海的手机厂商,在2016年年底伴随手机系统Flyme6推出了“One Mind”,这是一个通过用户画像帮助手机用户完成分析、决策的内置程序,最突出的亮点是帮助CPU提升运行效率、进而提升用户体验。

当然,没有在系统方面明确宣称人工智能进展的小米,也在利用AI提升用户体验,比如在个性拍照和相册归类等方面的应用,背后是机器视觉方面的能力。而且值得注意的是,小米已经在电视等产品中实现了语音助手、兴趣引擎等方面的落地,相信手机场景下的应用,也只是时间问题而已。

最后,让我们再回到锤子科技的坚果Pro发布会。虽然长达3小时的演讲展示中,罗永浩只字未提“人工智能”,但通不难看出锤子科技想要改变的现状——智能手机产品创新遭遇瓶颈的现状,需要新技术新交互提升易用性的现状。

罗永浩说,锤子只有现在做好准备,才能在下一代人机交互革命中成为上桌选手,才能由此实现“大到吓人”的野心。

想这么干的不止罗永浩。

下一代人机交互革命正在加速到来,正在AI浪潮中日渐清晰。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-05-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • AI伙伴
  • 语音识别和自然语言理解
  • 智能手机正迎来新时代
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档