首页
学习
活动
专区
圈层
工具
发布

VOICE DESIGN GUIDE 语音设计指南翻译

熟悉的Echo Show和Echo Spot图像 考虑显示一个图像和一个与用户上次使用该技能所做的相关的提示。例如,您可能会显示“您是否想继续烘烤胡萝卜蛋糕?”并以蛋糕的形象出现。...通过使用清晰的项目名称,图像和提示文本,为用户提供想要说的内容的创意,创建易于选择的列表项。请记住,尽管用户可以点击列表项目进行选择,但他们也可以说出项目的名称。查看导航和滚动列表的意图。...项目名称需要多长时间和语音友好。 每个项目读取和显示的元素总数,例如,Alexa可能会在显示图片,评分和距离元素时读取项目名称。 物品的数量听起来是否足够,没有听起来太长。...对于用户可能浏览的项目,考虑在Echo Show的屏幕上显示更多项目,方法是使用每个项目的较窄图像。当用户需要研究每个项目的细节时,例如选择配方时,请考虑使用更宽的图像。...要将文本放置在最右侧的列中,请使用第三级文本字段。 列出具有主要和辅助文本字段的模板1: ? 包含主要,辅助和第三方文本字段的列表模板1: ? 4.

2.3K30

Python Web 深度学习实用指南:第三部分

图像归因:给定图像,这涉及到图像的不同特征的提取。 自然语言处理: 词性标记:给定一段文本,这涉及提取文本包含的词性。 主题摘要:给定一段文本,这涉及确定文本所涉及的主题。...Alexa 可以执行的各种任务在 Alexa 术语中称为技能,我们将在本节中介绍这些技能。 Alexa 的技能是我们如何将功能引入平台的主要核心。...完成最后一步后,触发器部分将显示已连接的 Alexa 技能的详细信息。 如果不是,则应检查是否已正确执行上述步骤。...让我们以一种合理的方式将从 API 获得的响应嵌入到图像中。 我们将在图像中显示检测到的面部的可能的性别和可能的年龄。...我们了解了如何使用 Face API 来预测图像中人物的性别和年龄,以及如何使用 Text Analytics API 来预测给定文本的语言的任何句子以及所提供文本或情感中的关键短语。

17.5K10
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    教程 | 教Alexa看懂手语,不说话也能控制语音助手

    用于解释手势的神经网络(即将手势视频转换为文本) 2. 文本到语音系统,向 Alexa 说出理解到的手势 3. 语音到文本系统,为用户转录 Alexa 的响应 4....我提出了以下几个选择: 1) 由于手势有视觉和时间两个方面,我的直觉是将 CNN 与 RNN 进行组合,其中最后一个卷积层的输出(在分类之前)作为序列馈入 RNN。...虽然它们都从网络摄像头获取输入图像并根据训练数据输出预测,但在内部,每个操作都不同: 1) Pacman Webcam - 它使用卷积神经网络(CNN),来自网络摄像头的图像输入之后,经过一系列卷积层和池化层传递出去...然而,在馈入 kNN 之前,图像首先通过名为 SqueezeNet 的小型神经网络。然后,将该网络倒数第二层的输出馈入 kNN,这样就可以训练自己的类了。...因为它将在浏览器中运行,所以我可以很好地将它与语音到文本以及文本到语音的 API 相连接,这正是现代浏览器支持和我需要使用的。 4. 它加快了测试、训练和调试的过程,这往往是机器学习中的一个挑战。

    2.6K20

    亚马逊提出新的表征方法,使Alexa的技能选择错误率降低了40%

    AI部门的亚马逊科学领导者Young-Bum Kim和团队描述了一个为自然语言任务设计的方案,可以将Alexa的技能选择错误率降低40%。...相反,它们采用嵌入,数据表示来保留关于文本的语义信息,但是以一致的,形式化的方式来呈现。并且一次又一次地使用嵌入而不是原始文本来提高特定NLU任务的性能。”...它们根据定义Alexa如何识别和处理数据的实体的插槽类型重新分类。(例如,使用actor插槽类型的技能可能会根据提供的演员的名称查询影片集锦。)...Kim和共同作者利用自然的分类层次来构建一个AI模型,该模型可以生成插槽表征,意图表征和域表征。这是一个多步骤的过程。 首先,话语通过“de-lexicalizer”,将通用插槽名称替换为插槽值。...Kim表示,“我们在技能选择的重要任务上测试我们的方案,根据成千上万的客户要求确定Alexa技能。我们发现我们的方案大大降低了技能选择错误率,这有助于客户与Alexa的互动更加自然,并且令人满意。”

    90210

    多领域对话自动评估技术突破

    自动评估与Alexa的对话随着与Alexa的交互越来越多地涉及多轮对话,Alexa使用这些对话来填充请求的细节或协调多个技能。与所有已部署的AI模型一样,对话模型需要定期评估以确保满足客户需求。...在我们的新工作中,我们同时在逐轮数据和整体用户评估上训练模型。我们使用注意力机制来加权逐轮评分对最终评分的贡献。这些权重从数据中学习,并可以跨多个技能和任务泛化。...USE是一种用于嵌入输入文本的模型,或将它们表示为多维空间中的点,使得相关文本的点聚集在一起。我们的新输入特征包括客户和系统话语的USE嵌入以及它们之间相似性的度量。...LSTM按顺序处理序列输入,因此每个输入对应的输出考虑了其前面的输入和输出。然后我们提出了一个模型迭代,用双向LSTM(bi-LSTM)替换LSTM,双向LSTM向前和向后处理相同数据。...双向LSTM联合预测逐轮评分和整体对话评分。双向LSTM的输出通过注意力层,该层给予某些对话轮次比其他轮次更大的权重,然后传递到网络的最终层执行分类。

    11810

    Alexa技能发明家推动AI教育发展

    通过提供鼓励创造力和批判性思维的项目,Alexa技能发明家旨在为新一代配备塑造未来所需的技术技能。...“Alexa技能发明家让学生能够编写自己的Alexa技能。...这些技能使用积木代码构建,使任何人都能轻松学习语音AI基础知识及其编程方法。”积木编码将基于文本的代码转换为可视化的“积木”,可以通过拖放方式创建计算机程序。...MIT RAISE的AI日编程帮助向全球数千名教师和数万名学生介绍了Alexa技能发明家。某中心的贡献还包括向波士顿公立学校捐赠25,000美元,以支持和鼓励学生AI教育计划。...纽约伯恩特山-鲍尔斯顿湖高中的一位教师说,她的学生在预备课程后迅速掌握Alexa技能发明家,开创了自己的创新,“如数字猜谜游戏和讲笑话应用程序”。这些对项目的回应令人鼓舞。

    14410

    Beyond Compare 4 for Mac(好用的文件对比工具)4.4.3中文版

    装订线按钮和热键可让您快速将代码段从一侧复制到另一侧。2.三向文本合并  仅限专业这是顶部的三个文件和底部的合并可编辑输出的比较。中心文件是两个更高版本的共同祖先。左右更改自动包含在输出中。...可以在关键字段上对数据进行排序和对齐,并且可以忽略不重要的列。4.图片比较“图片比较”视图并排显示图像,并突出显示其差异。可以比较各种类型的图像文件。...5.文件夹比较以熟悉的Explorer样式并排比较文件夹。差异以颜色突出显示。6.文件夹同步专用的文件夹同步会话对于同步文件夹很有用。预览窗格清楚地显示了将要执行的操作。

    1.2K70

    Alexa对话式AI技术进展全解析

    ASR进步与自然语言理解(NLU)改进相结合,使Alexa的全球错误率在过去12个月内降低了24%以上。为让开发者轻松构建对话技能,发布了Alexa Conversations功能。...开发者只需提供API、技能中调用的实体类型列表以及少量示例对话,基于深度学习的对话管理器就能预测客户可能与技能交互的多种方式。...多语言与上下文感知通过神经文本到语音技术的进步,教会了原本基于英语录音的Alexa声音说出完美口音的美式西班牙语。还推出了双向语言翻译功能,使Alexa能够在同一设备上为说不同语言的客户充当翻译器。...开发了自然轮换(NTT)新功能,Alexa使用视觉线索结合声学和语言信息,确定客户是否在向Alexa或家庭中的其他人说话——即使没有唤醒词。隐私保护与可信赖性在隐私保护机器学习领域探索了差分隐私框架。...扩展了知识图谱并改进了神经语义解析和基于网络的信息检索,使Alexa对信息中心问题的回答更加可信。科学家还开发了识别和修复知识图中偏见实例的技术,确保这些偏见不会渗入Alexa的答案中。

    13810

    云计算的人工智能虽然发展缓慢,但得到更多的关注

    亚马逊Rekognition为亚马逊图像处理提供了一个平台,亚马逊波利利用深度的学习将文本转化为语音,亚马逊(Amazon) Lex使用与Alexa相同的自动语音识别技术,因此开发人员可以使用语音和文本构建对话界面...•亚马逊Polly:一种文本到语音服务,可让应用程序了解终端用户语音输入 •亚马逊Lex:基于Alexa技术提供自动语音识别和自然语言理解,用于开发团队构建对话用户界面,交互式应用程序和识别语音的聊天室...,图像和视频处理;用于文本翻译,语言学分析和对话UI的可定制语音和语言模型;API来将数据背景化,构建问题和预测决策 (3)谷歌云平台 •谷歌云的机器学习引擎:基于Google TensorFlow的服务...,使开发人员能够构建复杂的机器学习模型 •机器学习API:使应用程序具有图像和视频分析、语音到文本转换、语言翻译和文本分析的应用程序的AI功能 (4)IBM Bluemix •沃森开发人员云:IBM捆绑沃森工具和...开发人员可以使用自然语言理解,翻译语言,执行文本和语音分析,从语音转换文本,分析图像并从数据中获取洞察力来构建聊天室。

    939140

    从Kindle到Alexa,为何亚马逊总是“贱卖”其硬件产品?

    以此为起点,主打语音互动、智能问答的Google Home,和花样拓宽音箱“技能”的亚马逊Alexa走出了完全不同的道路。...数据显示,2016年1月至2019年9月这段时间里,Alexa搭配的Skills总数从130个飙升到了10万个。...2016.1~2019.9,Alexa搭配“技能”总数的变化  图源:statista.com 然而,用户真的会对一台智能音箱产生如此多的好奇和需求,甚至产生更深层的冲动,如后续消费吗?...人工智能战略研究者邹霖曾概括道,就是Alexa“10%的技能享有用户80%的关注,绝大多数技能处于死寂边缘”。邹霖于2017年7月对Alexa的1.5万Skills做了数据分析。...结果显示,1.5万技能中,有用户评论的仅有5894,大于10人评分的655个,呈现出极强的两极分化。

    1.2K10

    数据变金矿:一文读懂序列模型(附用例)

    序列模型的实际应用 为了确保列表尽可能涵盖序列模型的潜在用例,我们基于输入和输出序列的类型进行分类。输入和输出可以是以下任意一种:标量(Scalar)、趋势、文本、图像、音频和视频。...列表如下: 输入输出用例类型元素类型元素标量单个趋势多个模式生成音频多个音乐生成文本多个文本生成图像多个图片生成趋势多个标量单个股票交易决策固定时段的绩效预测趋势多个DNA序列分析时间序列预测文本多个标量单个情感分类话题分类答案选择文本多个文本总结机器翻译聊天机器人命名实体识别主题提取词性标注文本蕴含关系分类趋势多个查询应答音频多个语音生成图像多个标量单个面部表情标注实体分类文本多个图像描述图像多个图像修整音频多个标量单个情感分类对话人数标注话题分类文本多个语音识别会议总结音频多个语音助理视频多个标量单个行为识别文本多个字幕生成...聊天机器人(Chatbot)是另一个重要的用例,目前被广泛地应用于经营活动、呼叫中心、交流中心和类似Siri、Google Home、Alexa类型的用户辅助。...最后,我们介绍更多非文本的序列到序列模型 语音识别(Speech Recognition)是目前最受投资追捧的一个领域,其在个人Al助理(Alexa、Google Home等)和呼叫中心语音记录工具等用例中扮演了非常重要的角色...问题识别是资深的分析专业人士必备的技能。我希望这篇序列模型的入门文章可以激励你去寻找领域内能以此工具解决的新问题。

    38710

    亚马逊团队改进Alexa语音助手自动选择技能,错误率减少了12%

    亚马逊的Alexa助手拥有超过50000个技能,如果你不确定从哪里开始,那么你也很难发现新的用途,在博客文章中,亚马逊Alexa AI部门的数据科学家Young-Bum Kim详细介绍了一个新的机器学习系统...第一个被称为“短名单”,产生可能适合给定请求的候选技能列表,同时考虑已经与请求者的Alexa帐户相关联的技能(Kim指出,链接是偏好的强大推论)。...此前,Alexa研究人员对端到端的短网络进行了训练,网络的每个组成部分都是根据它对输出准确性的贡献来评估的。但是,新改进的AI模型还会在确定概率时考虑预期的技能,即在用户请求某事时调用的链接技能。...为了测试改进的AI系统的鲁棒性,Alexa AI团队测试了三个不同的版本,这两个版本使用两个不同的函数来生成应用于链接技能的权重:softmax,其生成的值为0到1之间必须总和为1的权重;sigmoid...在9月举办的硬件活动中,公司展示了Hunches,它主动推荐基于连接设备和传感器数据的行动,以及耳语模式。

    85320

    Alexa通过机器学习预测用户潜在需求

    某中心的智能语音助手Alexa近期通过新的机器学习系统,能够识别用户请求中未明确表达的潜在目标。...该技术架构包含三个核心组件:触发模型:基于深度学习的分类器,分析对话上下文(包括当前会话文本和历史交互模式)判断是否适合提出潜在目标建议目标发现模型:通过点间互信息等特征分析用户语句,结合主动学习机制持续优化预测准确率语义角色标注...:提取对话中的命名实体和参数,通过上下文传递模型转换为结构化数据,支持跨技能调用系统采用bandit学习机制自动抑制低效推荐,开发者可通过无名称交互工具包提升技能可见性。...实测数据显示该技术显著提升了部分第三方技能的用户参与度。该功能已在美国英语版本中部署,无需开发者额外适配即可生效。...这项创新标志着对话式AI在上下文理解和多技能协同方面取得重要进展,使机器交互更接近人类自然对话体验。

    8310

    Google亚马逊相继开放语音API,全面争夺AI市场

    这也是在与亚马逊,Facebook和苹果的技术竞赛中,炫耀自己AI能力的方法。 ? 亚马逊在本周三表示,其数字助理Alexa背后的人工智能和语音识别软件现在向所有云计算客户开放。...Lex使用了与Alexa相同的机器学习技术,它的算法让应用程序能够进行对话和处理语音和文本。 亚马逊的Lex服务允许开发者依靠语音识别和深度学习技术,开发对话应用。...这也表明,亚马逊计划在向Alexa平台做了大量投入后,想获得回报。曾有分析显示,在三年内Alexa可能会带来高达100亿美元的收入。...这也是在与亚马逊,Facebook和苹果的技术竞赛中,炫耀自己AI能力的方法。 除了语音API,Google还有其他预先训练的机器学习模型,可用于视频分析,图像分析,文本分析和动态翻译。...在价格方面,亚马逊会根据为开发者处理的文本和语音的量进行收费。Google暂时未知,但应该会采用同样的方式。

    1.6K50

    SQL BETWEEN 操作符

    介于 1 和 20 之间的所有网站: ​​实例​​ SELECT * FROM Websites WHERE alexa BETWEEN 1 AND 20; 执行输出结果: ---- ​​NOT BETWEEN...操作符实例​​ 如需显示不在上面实例范围内的网站,请使用 NOT BETWEEN: ​​实例​​ SELECT * FROM Websites WHERE (alexa BETWEEN 1 AND 20...) AND country NOT IN ('USA', 'IND'); 执行输出结果: ---- ​​带有 IN 的 BETWEEN 操作符实例​​ 下面的 SQL 语句选取 alexa 介于 1 和...country NOT IN ('USA', 'IND'); 执行输出结果: ---- ​​带有文本值的 BETWEEN 操作符实例​​ 下面的 SQL 语句选取 name 以介于 'A' 和 'H'...之间字母开始的所有网站: ​​实例​​ SELECT * FROM Websites WHERE name BETWEEN 'A' AND 'H'; 执行输出结果: ---- ​​带有文本值的 NOT

    69410

    7种比较Linux中文本文件的最佳工具

    掌握比较两个文本文件并快速找出差异的技能,可以为你节省时间,避免因错误而造成的巨大损失。 本文[1]将为你详细介绍在 Linux 中比较文本文件的多种方法,涵盖从基础的命令行工具到高级的视觉差异工具。...diff file1.txt file2.txt 为了使输出更易于读取,您可以使用以下命令,该命令将在两个列中显示两个文件(左右) - 因此您可以轻松扫描差异。...,使您可以快速识别差异,无论是真实的,缺失的逗号还是任何细微的文本变化。...Vim 对于熟悉 Vim 的用户而言,vimdiff 是一款强大的工具,它能够并排比较两个文件,并利用颜色和标记来突出显示差异。...Meld 对于喜欢图形界面的用户,Meld 是一款直观且易于使用的视觉差异和合并工具,尤其适合通过并排视图来比较代码、配置文件和脚本。

    52110

    SQL BETWEEN 操作符

    介于 1 和 20 之间的所有网站: ​​实例​​ SELECT * FROM Websites WHERE alexa BETWEEN 1 AND 20; 执行输出结果: ---- ​​NOT BETWEEN...操作符实例​​ 如需显示不在上面实例范围内的网站,请使用 NOT BETWEEN: ​​实例​​ SELECT * FROM Websites WHERE (alexa BETWEEN 1 AND 20...) AND country NOT IN ('USA', 'IND'); 执行输出结果: ---- ​​带有 IN 的 BETWEEN 操作符实例​​ 下面的 SQL 语句选取 alexa 介于 1 和...country NOT IN ('USA', 'IND'); 执行输出结果: ---- ​​带有文本值的 BETWEEN 操作符实例​​ 下面的 SQL 语句选取 name 以介于 'A' 和 'H'...之间字母开始的所有网站: ​​实例​​ SELECT * FROM Websites WHERE name BETWEEN 'A' AND 'H'; 执行输出结果: ---- ​​带有文本值的 NOT

    73920

    Alexa新机器学习系统精准预测用户潜在目标

    Alexa新机器学习系统精准预测用户潜在目标某中心的研究团队为语音助手开发了新的机器学习系统,使其能够推断用户请求中隐含的潜在目标。...核心技术架构触发模型基于深度学习的模型分析对话上下文综合考虑用户当前会话文本和历史交互模式判断是否适合进行潜在目标推测潜在目标发现模型分析用户语句的多个特征点使用点互信息评估交互模式概率通过主动学习持续优化预测准确率语义角色标注识别对话中的命名实体和参数上下文传递模型将实体转换为结构化格式支持第三方技能的本体系统集成系统优化机制利用...bandit学习自动抑制表现不佳的推荐通过名称无关交互工具包提升技能可见性早期指标显示该功能显著提升了用户参与度该功能已在美国英语用户中上线,无需技能开发者额外配置即可自动激活。

    9010

    下一代语音界面:从亚马逊 Echo 看未来的人机交互

    Mac、万维网和iPhone就是这样。Alexa属于改变游戏规则的精英。Siri尽管引起了新潮流,但是自己却没能克服困难。...基于文本消息的机器人平台的创始人Ted Livingston说,“Bot没有对话功能会更好。” 我不同意这种观点。我使用亚马逊Echo Alexa的体验,让我相信相反的观点。...App开发人员可以使用Alexa的技能工具箱(Skills Kit)添加“技能”,比如,一旦你添加了Lyft技能,你就可以说:“Alexa,让Lyft给我叫一辆车。”...使用Alexa的语音服务,开发人员可以将语音命令添加到自己的应用程序。(谷歌和微软也有语音API。) 不幸的是,亚马逊没有设计API。...Facebook如果有和Alexa同样的界面,我会说:“Facebook,显示我朋友的更新”,然后AI就会工作,不是去推测我的喜好,而是将个人更新和新故事的链接分开。

    2K40

    SQL BETWEEN 操作符

    介于 1 和 20 之间的所有网站: ​​实例​​ SELECT * FROM Websites WHERE alexa BETWEEN 1 AND 20; 执行输出结果: ---- ​​NOT BETWEEN...操作符实例​​ 如需显示不在上面实例范围内的网站,请使用 NOT BETWEEN: ​​实例​​ SELECT * FROM Websites WHERE (alexa BETWEEN 1 AND 20...) AND country NOT IN ('USA', 'IND'); 执行输出结果: ---- ​​带有 IN 的 BETWEEN 操作符实例​​ 下面的 SQL 语句选取 alexa 介于 1 和...country NOT IN ('USA', 'IND'); 执行输出结果: ---- ​​带有文本值的 BETWEEN 操作符实例​​ 下面的 SQL 语句选取 name 以介于 'A' 和 'H'...之间字母开始的所有网站: ​​实例​​ SELECT * FROM Websites WHERE name BETWEEN 'A' AND 'H'; 执行输出结果: ---- ​​带有文本值的 NOT

    53810
    领券