Facebook的语音助手Aloha疑曝光

编译:chux

出品:ATYUN订阅号

Facebook语音计算革命的速度有点慢。它没有语音助手,它的智能扬声器仍在开发中,而像Instagram这样的一些应用程序并没有完全配备音频通信。但根据在Facebook代码中发现的实验,再加上新的专利申请,情况可能有所改变。

据报道,它即将推出的Portal智能音箱专为与家庭远程视频聊天而设计,包括老年人和可能遇到手机问题的孩子。改进的转录和语音到文本到语音转换功能可以将Messenger用户连接到输入媒体上,并将它们保留在聊天应用程序上,而不是偏向于短信。

鉴于Facebook已经迟了一步,它需要通过强大的实用程序来解决实际问题。以下是Facebook在语音领域的最新发展,以及它过去的实验如何为其下一次重大推动奠定基础。

Aloha

Facebook正在以Aloha为名开发自己的语音识别功能,用于Facebook和Messenger应用程序,以及外部硬件,可能是它正在开发的视频聊天智能扬声器。在Facebook和Messenger的Android应用中,移动研究人员Jane Manchun Wong第一次看到了Aloha用户界面的原型。

视频内容

Aloha语音测试中,当用户在消息线程中说话时,水平蓝条会扩展和收缩,以便在识别和转录到文本时可视化语音量。该代码将该功能描述为与外部Wi-Fi或蓝牙设备建立连接。该软件可能会在Facebook的硬件和软件上运行,类似于在手机和Google Home扬声器上运行的谷歌智能助理。

多年前,Facebook有兴趣开发自己的语音识别软件,专门用于准确转录朋友之间的互动方式。与我们正式处理亚马逊Alexa或Google Home等计算机助理的方式相比,这些语音模式通常更随意,口语化,快速且充满俚语。

Wong还在Facebook的代码中发现了Aloha徽标,其中包含火山图像。有人在Facebook员工的手机上看到了一个Facebook Aloha Setup聊天机器人,上面有类似的标志。

如果Facebook可以解决这个问题,它可以在Messenger和网站的其他地方提供自己的转录功能,这样用户就可以跨媒体进行通信。它可能会让你无法查看屏幕时向朋友发出评论或消息。然后,接收者可以阅读文本而不必像语音消息那样收听它。该功能还可用于为Facebook应用程序的语音导航提供动力,以实现更好的免提使用。

智能音箱Portal

Facebook的视频聊天智能音箱最初代号为Aloha,但后来更名为Portal,Business Insider的Alex Heath和现在Cheddar于2017年8月首次报道。由于担心会加剧剑桥分析公司引发的隐私丑闻,它被推迟了。

一项新的专利申请显示,Facebook正在考虑建立一个智能音箱,早在2016年12月26日,它就为立方体形状的设备申请了专利。该专利描绘了由Baback Elmieh,Alexandre Jais和John Proksch-Whaley 发明的“音箱的装饰设计”。Facebook于当年9月收购了Elmieh的创业公司Nascent Objects,现在他是Facebook秘密的Building 8硬件实验室的技术项目负责人。

通往Voicebook的漫长道路

Facebook长期在语音领域进行修整。2015年,它收购了自然语言处理初创公司Wit.ai,该公司运行了一个用于构建语音界面的开发者平台,但后来将Wit.ai推入Messenger的平台团队,专注于聊天机器人。Facebook也开始测试在2015年自动将Messenger语音片段转录成文本,这可能是上面看到的Aloha的基础功能。

第二年,Facebook负责人David Marcus声称“这不是我们现在正在积极开展工作的事情”,但他补充道,“在某种程度上,很明显,随着我们在Messenger中开发越来越多的功能和交互,我们将开始处理语音交换和接口。”然而,一位消息人士称Facebook的秘密语言技术小组已经在探索语音机会。Facebook也开始为想要播放声音而不是视频的用户测试其实时音频功能。

到2017年,Facebook为Pages的视频提供自动字幕,并正在开发语音搜索功能。今年,Facebook开始尝试将语音片段作为状态更新和故事,这些用户可能难以用母语打字。但高管们并未谈及语音举措。

最详细的评论来自Facebook的设计负责人Luke Woods,他在TechCrunch Disrupt 2017描述了语音搜索,说它“非常有前途”。

目前还不清楚Facebook的Aloha究竟会怎样。对于Facebook的智能扬声器和应用程序,它可以是操作系统或语音界面和转录功能。它也可能会像M一样成为一个更加成熟的语音助手。或许它可能成为Facebook与其他语音生态系统的桥梁。

原文发布于微信公众号 - ATYUN订阅号(atyun_com)

原文发表时间:2018-08-22

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏腾讯云TStack专栏

演讲|腾讯企业IT部总经理分享OpenStack在腾讯的应用实践

7月24日~25日,2017 OpenStack Days China官方盛典在北京国家会议中心盛大召开。 腾讯技术工程事业群企业IT部总经理刘若潇发表了《Op...

67960
来自专栏DevOps时代的专栏

台湾资深老专家:你实施敏捷的路子对吗?

作者简介: ? Ruddy Lee(李智桦)老师,DevOpsDays北京站金牌讲师,台湾著名精益布道师,敏捷专家,著有《精益开发与看板方法 》。 台湾敏捷大师...

23070
来自专栏CDA数据分析师

程序员奶爸的心路历程:如何在一年内获得五项开发者认证和第二学位

原作者 Beau Carnes 编译 CDA 编译团队 本文为 CDA 数据分析师原创翻译作品,转载需授权 前言 工作和家庭难以兼顾吗?美国程序员小哥实力演绎如...

29190
来自专栏Java社区

再造下一个腾讯?

18560
来自专栏北京马哥教育

从西直门立交桥谈IT架构与重构(干货)

2015年8月13日 PM 20:00 Neeke君从一个战场奔赴至另一个战场,回到办公室,打开电脑,登陆微信,精彩的的微社群分享马上就要开始了! 个人简介: ...

35570
来自专栏华章科技

剧透人生!你什么时候结婚换工作甚至狗带,Facebook都知道

你关心的这些人生重大节点,有人希望比你提前知道它们何时发生,并基于此对你精准投放广告。

9830
来自专栏SDNLAB

物联网中的边缘计算:提高网络效率以减少流量

企业对边缘计算越来越感兴趣,因为随着更多物联网设备的部署,企业需要快速分析和处理它们生成数据的方法。目标是消除将数据传输回云或内部数据中心的需要。

12950
来自专栏华章科技

生活在大数据下的我们

1在刷朋友圈时间上,“60前”平均花费时间的最小值为47分钟,“90后”为42分钟。

8320
来自专栏腾讯大讲堂的专栏

运营是什么

? 作者:邬嘉文,精通用户研究,推荐算法,Growth用户运营,结果在微信都用不上。 从市场调查转行腾讯做互联网,那时候还不懂什么是运营。记得有一份大神级PP...

16720
来自专栏Android 开发者

想拥有更多回头客?为什么前十分钟是至关重要的?

18820

扫码关注云+社区

领取腾讯云代金券