首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

亚马逊创建并开源数据集,用于理解不同语言中名字

亚马逊已经创建并开源了一个数据集,用于训练AI模型以识别不同语言和脚本类型名称,因此Alexa可以例如在英语发音发音时理解日本艺术家或人名字,反之亦然。...总之,该数据集包含近400000个阿拉伯语,英语,希伯来语,日语片假名和俄语等语言名称。 研究结果已发表在Arxiv上,将于本月晚些时候在新墨西哥州圣达菲举行国际计算语言学会议上分享。...例如,根据亚马逊博客文章,英语到俄语比希伯来语更容易理解,因为虽然它们不同,但英语和俄语字母表比英语更像希伯来语。...Alexa Skills Kit和Alexa Voice Service今天也宣布将Alexa带入墨西哥第三方设备。...为了提高Alexa对新语言理解,去年亚马逊工程师创建并游戏化了Cleo,这是一种Alexa技能,用于收集来自世界各国语音样本。 论文:arxiv.org/pdf/1808.02563.pdf

75120

翻译工作者福利ABBYY Lingvo Dictionary灵悟万能词典提高查词效率并且可以将自己收藏词汇加入词典中

从一般翻译和惯用词典,短语书籍和英语俚语和口语词典中学习集合表达含义。 查看同义词和反义词,语法笔记,动词形式和文化信息。...在100多个计算机,工程,法律,市场营销,经济学,金融和银行学以及医学术语主题词典中查找准确翻译。 听母语人士录制英语,西班牙语,德语,俄语和法语关键词发音。...ENGLISH CORE OXFORD:字典 英语:牛津英语词典。355,000个条目 法语 - 英语英语 - 法语:简明牛津阿歇特法语词典。...175,000个条目 核心字典 英语 - 俄语和俄语 - 英语:46个词典,超过2,000,000个词条 法语 - 俄语和俄语 - 法语:18个词典,包含980,000个词条 西班牙语...值得信赖和准确翻译 详尽条目解释,包括例举和同义词 原汁原味单词发音 简单和快捷查询 灵活和可自定义词典 灵悟向导工具,帮助记忆单词 短语手册,包含日常短语和发音

68110
您找到你想要的搜索结果了吗?
是的
没有找到

想让语音助手听懂方言,这个数据集或能帮你?

就拿美式英语来说,虽然书面表达接近标准化,但不同地区,由于方言,口音,俚语等存在,发音方式方法、词汇拼法千差万别。 这导致语音系统在识别方言时会出现差错,甚至会闹出笑话。 ?...不同口音识别准确率区别很大 其中,Google Home 识别西岸口音准确率,比识别南方口音高 3%;而亚马逊语音助手 Alexa,识别中西部口音准确率,要比东岸口音低 2%。...而最严重问题,发生在识别非本土口音时。 对于移民群体发音,Google Home 或者 Amazon Echo 英语识别,准确率都特别低。...对于这个困境,谷歌和亚马逊都曾提到了基于数据解决方案。 亚马逊在一份声明中称,随着使用不同方言的人和 Alexa 进行交流,它理解能力会得到改善。」...语料库质量越高,语言模型越多种多样,理论上来说语音识别系统准确率越高。 ? 美国英语口音分布地图 所以要解决方言识别的,有效一种方式是拥有优质数据集。

1.2K10

亚马逊提出新表征方法,使Alexa技能选择错误率降低了40%

亚马逊研究人员通过使用新颖数据表征技术,成功地提高了Alexa选择第三方应用程序能力。...”中,Alexa AI部门亚马逊科学领导者Young-Bum Kim和团队描述了一个为自然语言任务设计方案,可以将Alexa技能选择错误率降低40%。...新表征方法利用了Alexa处理请求方式。正如Kim解释那样,Alexa首先按照主题区域或域名(例如音乐或天气)对请求进行分类,然后按意图或预期行动对请求进行分类。...它们根据定义Alexa如何识别和处理数据实体插槽类型重新分类。(例如,使用actor插槽类型技能可能会根据提供演员名称查询影片集锦。)...Kim表示,“我们在技能选择重要任务上测试我们方案,根据成千上万客户要求确定Alexa技能。我们发现我们方案大大降低了技能选择错误率,这有助于客户与Alexa互动更加自然,并且令人满意。”

68210

Eudic欧路词典 for Mac(英语学习工具)

欧路词典 (Eudic) 是一个功能强大英语学习工具,它包含了丰富英语词汇、短语和例句,并提供了发音、例句朗读、单词笔记等功能。...多语种支持:欧路词典支持多种语言,包括英语、中文、日语、法语等等,用户可以方便地进行多语言学习。海量词库:欧路词典拥有海量词库,包括牛津、朗文、柯林斯等多个权威词库,可以方便地查找和学习单词和词组。...强大翻译功能:欧路词典提供了强大翻译功能,支持多种翻译方式,包括文本翻译、语音翻译等等。听力训练:欧路词典提供了听力训练功能,可以方便地进行听力练习和提高听力水平。...总的来说,欧路词典是一款功能强大英语学习工具,其多语种支持、海量词库、强大翻译功能、听力训练和生词本和笔记等特点,使得用户可以方便地进行英语学习和提高英语水平,适用于各种英语学习人员和文化交流人员等不同人群...Eudic欧路词典 for Mac(英语学习工具)

32020

为什么需要为孩子开发专门语音识别算法

它们在句法、发音和语法方面取得了飞跃,语音识别系统自然语言处理组件需要考虑这些方面。 这种复杂性因处于不同发育阶段儿童之间说话者之间差异而变得更加复杂,而这些差异不需要用成人语言来解释。...儿童言语行为不仅比成人多变,而且极不稳定。孩子们过度发音,拉长某些音节,在他们大声思考时标点每个单词或完全跳过一些单词。 他们语音模式不受为成人用户构建系统所熟悉常见节奏影响。...儿童语音不能简单地视为语音识别要适应另一种口音或方言;它在根本上和实践上都是不同,并且随着孩子身体和语言技能成长和发展而改变。 与大多数消费者环境不同,准确性对儿童有着深远影响。...但当今大多数语音识别工具都不适合这个目标。Siri、Alexa 和其他语音助手中技术有一项工作要做——理解说话清晰且可预测成年人——而且,在大多数情况下,他们做得很好。...(USA) Kids,以便输出面向美国儿童英语语音模型,帮助开发面向儿童应用程序、儿童玩具、儿童可穿戴设备和教育技术产品。

44920

苹果Mac电脑超好用翻译软件合集

1、网易有道词典 for Mac(免费全能查词翻译软件)作为一款英语、日语、韩语、法语免费全能查词翻译软件,有道词典在多年来致力于为用户提供更优质翻译服务,针对Mac平台特性,我们特别推出全新版本,...这使得灵悟词典成为工作、旅行、学习和日常生活一个值得信赖语言指南。3、Shorter Oxford English Dictionary Mac(牛津英语词典) 正在寻找一款好用英语词典吗?...Shorter Oxford English Dictionary mac版是Macos上一款牛津英语词典,包含超过60万个短语,单词和定义,被广泛且易于使用OS X英语解释性词典,Macw提供Shorter...Oxford English Dictionary破解版下载资源,对于学者和对英语有浓厚兴趣朋友不要错过呀!!...4、Eudic欧路词典 for Mac(英语词典翻译查询工具)Eudic欧路词典 mac版是Macos上一款英语词典翻译查询工具,可以通过软件进行深度英文学习,单词模糊搜索、拼写校正、单词发音朗读、鼠标取词

4.3K20

谷歌助手超进化:可以同时识别两种语言了,AI空耳再无国界

△ 千反田,日本语发音“吃蛋挞” 你家智能音箱,大概就要听你们两个人说话了。 语音助手,如果要中文日文来回调的话,还挺累。...△ 其实并不简单 上面说都没错,除了中文还没支持…… 目前支持语言有:英语、西班牙语、法语、德语、意大利语,和日语。 至少,日语还是有的嘛。...如今,AI已经能在2000多对语言之间,辨别谁是谁:比如英语vs法语英语vs日语、日语vs法语。...一个难点,就是要用更大音频数据集来训练模型。 听懂说是啥,要快 要同时理解两种以上语言,AI工作流程变得很复杂。...这里用是随机森林,结合了背景信息,比如用户用什么设备,算法给出备选命令以前是不是经常出现,用户是不是经常用这种语言等等。 这些因素,都会坚定AI判断。

1.1K40

Snips发布嵌入式车载语音SDK:支持英、法、德语言识别

SnipsSDK与亚马逊Alexa与谷歌助手(Google Assistant)不同,该软件可在本地运行,而非像后者那样在云端运行并采集信息。此外,Snips还采用了语音指令,可保护用户隐私。 ?...在技术演示中,Snips展示车辆可为驾驶员提供预计到达时间、呼叫联系人或借助语音指令驶向驾驶员指定地方。...据称,Snips语音识别平台新增了多种语言,研发人员打造Snip语音助手可“听懂”英语法语及德语三种语言。 将语音技术应用到车辆中公司并非只有Snips这一家。...据称,这两家车企还计划与韩国本土及国外多家公司合作,将语音识别、人工智能型数字助手嵌入到其车辆中,这类语音助手可识别座舱驾驶内自然语言(natural language)。

91660

这所学校英语听说课人均配备贴身“助教”

在中考英语听说微技能系列在线训练课堂中,学生通过电脑、平板学生端参与口语任务活动,学生每一个单词发音在2秒内得到了精确到音节级别的评估反馈。...在大屏上,学生朗读发音不标准单词或漏读音节都会被自动标注成红色和绿色,老师可以随机点击播放每个学生朗读录音,实时对学生发音进行点评和纠正。...优秀教师示范引领,“双减”之下 探索技术赋能英语听说教学新生态 胡莹莹老师“模仿朗读”技能训练课以培养学生朗读技巧-停顿为目标,对标中考模仿朗读训练。...”固化答题模式,并迅速发布平台任务进行实践训练;最后,对影响得分发音细节,单词词尾进行了发音训练、即时点评、归纳总结。...在家庭作业环节,落实“双减”号召,借助腾讯英语任务计时功能,课上课下相结合进行适量发音练习、目标问句精准输入与中考题型针对性输出训练,作业全程控制在15分钟内。

3.4K20

Snips推出语音助手SDK,支持离线工作

Snips是一家法国初创公司,其提供服务主要是为用户建立自定义语音助手。Snips并不使用亚马逊Alexa语音服务或谷歌助手SDK,而是帮助用户建立自己语音助手,并嵌入到设备上。...目前,Snips仅限于英语法语两种语言;若要使用其他语言,用户必须使用第三方自动语音识别API。 下一步,Snips就需要了解用户提问或查询方式。...这家初创公司会手动检查用户请求,然后在亚马逊数据服务平台Mechanical Turk和其他众包市场上发出这些请求。之后,Snips会去清理用户数据集并将其发送回给用户。...据悉,开发商早已在测试Snips能力。而且,该公司希望大型设备制造商能够将Snips嵌入到他们未来产品中。...公司认为,虽然亚马逊Alexa和谷歌语音助手功能广泛,但是用户有时候并不需要在所有的设备中嵌入“完整”语音助手。

3.8K50

安全:智能音箱很容易受到黑客各种攻击

攻击者可能会将一个合法应用程序同音词(比如Capital Won 而不是Capital One)命名为一个应用程序 ,或者在应用程序名称末尾添加发音相近词。...通过在调用中附加一个发音为“please”单词,黑客可以使用亚马逊魔术字功能,当孩子们在提问Alexa时使用单词“please”来启动一个恶意应用程序(例如,Capital One Please)。...第二种技巧,“声音伪装”,研究人员确定了攻击者可以欺骗用户认为他们已经关闭或关闭应用程序两种方式:“通信技能切换”和“伪造终止”。...在通信技能切换攻击中,恶意应用程序在确认语音命令后假装切换到另一个应用程序。另一方面,使用伪造终止攻击应用程序通过向用户发出诸如“再见!”...研究表明,至少有三个主要语音助手- Alexa,Siri和谷歌助手- 易受嵌入YouTube视频,音乐甚至白噪声中声音信息影响。

1.5K20

日本教育部将在500所学校部署机器人,用于提高教师和学生英语技能

据NHK称,在提高教师和学生英语技能压力下,日本教育部正在采取机器人解决方案。 从4月开始,日本教育部将启动一项试行计划,在全国约500所学校安装说英语机器人。...日本学生一般不擅长用英语写作或口语对话。一些学校已经采用了类似的机器人,让学生在磨练英语发音和谈话技巧同时获得乐趣。...据报道,教育部还将向学生提供学习应用和在线会话课程,以及母语为英语的人,这些努力以及机器人提议都旨在提高学生英语沟通能力。 教育部将于2年内全面实施课程指导方针,侧重于培养这些技能。...该部目前正处理一些棘手问题。它在提高小学教师英语语言技能方面面临压力,而且缺乏为每所学校雇用足够英语母语人士资金。 多年来,机器人已成为教室中不断增长存在。...日本在2009年尝试了一个名为Saya机器人,为机器人编程,给五年级学生上课。世界各地一些学校已经探索过机器人是否可以在课堂上提供帮助,既可以提供课程,也可以辅助远程教育。

38840

自然语言处理深度学习7个应用

(传统语音识别模型是通过人工建立一张语音词表,将相似发音字母划分为一类;并借助一个分类模型实现语音到字母转译。) —458页,深度学习,2016....有关语音识别的更多信息,请参见: 维基百科上语音识别 以下是用于语音识别深度学习3个例子: 英语语音到文字。 连接时间分类:循环神经网络不分段标签序列数据,2006。 英语语音到文字。...这通常用于自然语言,比如从英语法语翻译。深度学习最近开始对这种任务产生重要影响。 —98页,深度学习,2016. 语言模型用于输出翻译以后语言目标文本,以源文本为基础。...包含一些例子: 将一个文本文件从法语翻译成英语。 将西班牙音频翻译成德语文本。 将英语文本翻译成意大利音频。 更多关于神经机器翻译,请参见: 维基百科上神经机器翻译。...下面是机器翻译深度学习3个例子: 从英语法语文本翻译。 基于神经网络片段到片段学习,2014 从英语法语文本翻译。 联合学习对齐和翻译神经机器翻译,2014 从英语法语文本翻译。

1.2K90

VOICE DESIGN GUIDE 语音设计指南翻译

通过将Alexa引入语音对话,用一种新互动方式让您客户感到满意。 在设计 Alexa 技能时,为用户和 Alexa 之间对话dialog创建脚本script。...通过询问以下问题来确定技能能力: 这个技能目的是什么? 人们为什么要使用它? 在与技能互动之前,之中和之后,这个人会做什么? 人们从技能上得到什么,他们不能得到另一种方式?...(半秒暂停)你想要其他任何投资组合细节? 用户: 退出。 Alexa: 好,祝你有美好一天。 3)开发流程 一个基本脚本并不完全代表人们如何与现实生活中技能互动。...3) 使用内置意图 每个Alexa技能都需要包括取消,停止和提供帮助能力。 对于这些和其他常见意图,如重复,播放和下一个,使用内置意图库。...4) 识别话语 为了确保一个良好体验,请通过完整命令,通过不完整和不明确片段提供示例。 要确保你有覆盖面,包括微妙变化,甚至发音错误。

1.8K30

China Daily 联合微软出了一款小程序!有了它,无字幕「看片」指日可待 | 国家队 #15

精心制作了六年,最终为皮克斯打了一场翻身仗,获得了票房和口碑双丰收。 ? 那么这部电影里有什么有趣小细节、幕后又有什么故事呢?想要深入了解电影制作背后,流利英语可是必不可少技能哦。...而今天要给大家推荐「每日英语电台」,就是一款由 China Daily 和微软亚洲研究院联合推出产品,提供英语阅读及听力功能。有了它,以后就算是碰到无字幕英语视频,也不会害怕!...英语阅读 「每日英语电台」几乎每天都会推送一条或几条英文版时事热点。这些英文文章不管是长度还是内容都很适合短时间阅读。虽然没有中文译文,但是小程序提供了单词翻译。...「每日英语电台」另一个亮点在于文章朗读,点击屏幕底部进度条可以播放该文章朗读语音。 ? 阅读者英语发音是十分标准美式发音,很适合听力练习。...通过「每日英语电台」,提高阅读能力和听力,看懂爱豆微博和访谈再也不是困难事情。连「官方」都出招帮你追爱豆,还有什么能阻碍你呢?赶紧打开「每日英语电台」,一步步接近爱豆吧! ?

40660

机器学习领域突破性进展(附视频中字)

他想表达是 "打电话给朋友”,但我们识别成了他想要买钢琴之类。 再看下一个例子,你可能猜到了,我讲法语。因此我用法语来测试我产品。我跟识别器说"发生什么了?"却得到这个结果。...系统中有三个模型:第一个是语音模型,负责提取语音片段,尝试找出音素分布概率以及语言中每个发音;第二个是发音模型,它从音素得出单词;第三个是语言模型,通过概率将单词连接起来。 ?...我们建立了很复杂准则,为了正确地转录数据。通过三百万注释波形,我们可以训练语言模型,从数据中学习新发音,增加语言模型训练集,这些都会带来改善。...因此我们并不是选择三种方式表达相同意思。 这在英语中运用得很好,我们也可以在其他语言中做相同操作。比如专门用于问候回复。在英语中我可能会说 "Hi!""How's things?"...在法语中我可能会说"Ca Va?" "Salut!”,我可以用谷歌翻译模型构建法语变量和英语变量间关联。

778100

自然语言不等于英语,为什么NLPer应当认识到这个问题,以及该怎么做?

这样需求导致了在NLP领域中出现了高资源语言和低资源语言数字鸿沟。 高资源语言种类只有几种,包括英语、汉语、阿拉伯语和法语,或许还可以将德语、葡萄牙语、西班牙语、芬兰语包括进去。...截止到2019年8月,LRE Map列出了961项英语资源,此外还有美式英语资源121项、德语资源216项、法语资源180项、西班牙语资源130项、汉语资源103项、日语资源103项。...这里一个重要因素是人们潜意识里认为英语是一种具有足够代表性语言。当学习资源是英语时,人们往往不会在名字中显示“英语”,这更助长了这种误解。 但英语既不是自然语言代名词,也不是自然语言代表。...2、它有一个完善、长期使用、大致是基于发音拼写系统(phone-based orthographic system)。 “Phone-based”意思是字母对应于单独发音。...西班牙语等其他语言,具有基于发音拼写法系统更加透明化,还有一些语言仅代表辅音(例如传统希伯来语和阿拉伯语)或具有代表音节而不是单一声音符号(例如马拉雅拉姆语,韩语或日语假名),或者使用逻辑系统(例如中文

76700

英语和汉语谁更高效?17大主流语言测试结果:没有优劣之分,带宽都是每秒39bit

语速和信息密度成反比 研究语音“带宽”,即信息速率,最核心问题是计算不同语言单音节信息量。早在1951年,信息论创始人香农就已经开始研究英语书面文字信息熵问题。...关于不同语言发音信息量对比研究已经持续数年,里昂大学早在2011年就发表论文,统计了世界上几种主流语言信息密度和语速,最后将二者相乘算出传输速率。...最近,他们把研究范围扩展到9个语系17种语言,包括越南语、英语、德语、意大利语、法语、日语、韩语、汉语普通话、粤语等等。...研究人员发现,日语只有643个音节,每个音节信息密度约为5比特;英语音节数量为6949,每个音节密度为7比特;越南语最为复杂,平均每个音节包含8比特信息,排在所有语言之首。...最近一篇神经科学论文提出,在美式英语中人类听觉上限是每秒9个音节。

1.2K10
领券