前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Facebook的语音助手Aloha疑曝光

Facebook的语音助手Aloha疑曝光

作者头像
AiTechYun
发布2018-09-26 10:52:13
1.5K0
发布2018-09-26 10:52:13
举报

编译:chux

出品:ATYUN订阅号

Facebook语音计算革命的速度有点慢。它没有语音助手,它的智能扬声器仍在开发中,而像Instagram这样的一些应用程序并没有完全配备音频通信。但根据在Facebook代码中发现的实验,再加上新的专利申请,情况可能有所改变。

据报道,它即将推出的Portal智能音箱专为与家庭远程视频聊天而设计,包括老年人和可能遇到手机问题的孩子。改进的转录和语音到文本到语音转换功能可以将Messenger用户连接到输入媒体上,并将它们保留在聊天应用程序上,而不是偏向于短信。

鉴于Facebook已经迟了一步,它需要通过强大的实用程序来解决实际问题。以下是Facebook在语音领域的最新发展,以及它过去的实验如何为其下一次重大推动奠定基础。

Aloha

Facebook正在以Aloha为名开发自己的语音识别功能,用于Facebook和Messenger应用程序,以及外部硬件,可能是它正在开发的视频聊天智能扬声器。在Facebook和Messenger的Android应用中,移动研究人员Jane Manchun Wong第一次看到了Aloha用户界面的原型。

视频内容

Aloha语音测试中,当用户在消息线程中说话时,水平蓝条会扩展和收缩,以便在识别和转录到文本时可视化语音量。该代码将该功能描述为与外部Wi-Fi或蓝牙设备建立连接。该软件可能会在Facebook的硬件和软件上运行,类似于在手机和Google Home扬声器上运行的谷歌智能助理。

多年前,Facebook有兴趣开发自己的语音识别软件,专门用于准确转录朋友之间的互动方式。与我们正式处理亚马逊Alexa或Google Home等计算机助理的方式相比,这些语音模式通常更随意,口语化,快速且充满俚语。

Wong还在Facebook的代码中发现了Aloha徽标,其中包含火山图像。有人在Facebook员工的手机上看到了一个Facebook Aloha Setup聊天机器人,上面有类似的标志。

如果Facebook可以解决这个问题,它可以在Messenger和网站的其他地方提供自己的转录功能,这样用户就可以跨媒体进行通信。它可能会让你无法查看屏幕时向朋友发出评论或消息。然后,接收者可以阅读文本而不必像语音消息那样收听它。该功能还可用于为Facebook应用程序的语音导航提供动力,以实现更好的免提使用。

智能音箱Portal

Facebook的视频聊天智能音箱最初代号为Aloha,但后来更名为Portal,Business Insider的Alex Heath和现在Cheddar于2017年8月首次报道。由于担心会加剧剑桥分析公司引发的隐私丑闻,它被推迟了。

一项新的专利申请显示,Facebook正在考虑建立一个智能音箱,早在2016年12月26日,它就为立方体形状的设备申请了专利。该专利描绘了由Baback Elmieh,Alexandre Jais和John Proksch-Whaley 发明的“音箱的装饰设计”。Facebook于当年9月收购了Elmieh的创业公司Nascent Objects,现在他是Facebook秘密的Building 8硬件实验室的技术项目负责人。

通往Voicebook的漫长道路

Facebook长期在语音领域进行修整。2015年,它收购了自然语言处理初创公司Wit.ai,该公司运行了一个用于构建语音界面的开发者平台,但后来将Wit.ai推入Messenger的平台团队,专注于聊天机器人。Facebook也开始测试在2015年自动将Messenger语音片段转录成文本,这可能是上面看到的Aloha的基础功能。

第二年,Facebook负责人David Marcus声称“这不是我们现在正在积极开展工作的事情”,但他补充道,“在某种程度上,很明显,随着我们在Messenger中开发越来越多的功能和交互,我们将开始处理语音交换和接口。”然而,一位消息人士称Facebook的秘密语言技术小组已经在探索语音机会。Facebook也开始为想要播放声音而不是视频的用户测试其实时音频功能。

到2017年,Facebook为Pages的视频提供自动字幕,并正在开发语音搜索功能。今年,Facebook开始尝试将语音片段作为状态更新和故事,这些用户可能难以用母语打字。但高管们并未谈及语音举措。

最详细的评论来自Facebook的设计负责人Luke Woods,他在TechCrunch Disrupt 2017描述了语音搜索,说它“非常有前途”。

目前还不清楚Facebook的Aloha究竟会怎样。对于Facebook的智能扬声器和应用程序,它可以是操作系统或语音界面和转录功能。它也可能会像M一样成为一个更加成熟的语音助手。或许它可能成为Facebook与其他语音生态系统的桥梁。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-08-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 ATYUN订阅号 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Aloha
  • 智能音箱Portal
  • 通往Voicebook的漫长道路
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档