首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

谷歌通过定制的深度学习模型升级了其语音转文字的服务

一个月前,谷歌宣布在源于Magenta项目的文字转语音(Text-to-Speech,简称TTS)技术上取得代际突破,接着该公司又对其语音转文字(Speech-to-Text,简称STT)API云服务进行了重大升级...谷歌宣布, 与标准电话模型相比,词汇错误减少了54%,而对于增强视频模型,错误减少了64%。...词汇错误减少不是提升语音转文字整体质量的唯一因素。标点符号的预测仍然是语言转录面临的重要挑战。谷歌的语音转文字API现在能够给转录后的文本添加标点符号,进一步提高了转自长音频序列的文本的可读性。...其他现有的语音转文字服务包括支持29种语言的微软语音识别API、支持7种语言的IBM Watson API,以及2017年11月发布的亚马逊Transcribe,到目前为止,其只支持美式英语和西班牙语。...来自佛罗里达技术学院(the Florida Institute of Technology)对其中这些服务的比较显示,谷歌服务API错误率较低。另一组比较测试强调了语音转录服务延迟的重要性。

1.6K50

IBM陈黎明:Watson今年底将惠及10亿人,商业AI如何渗透这些行业?

IBM在人工智能这个领域尖端技术集中体现到了Watson这套系统上面去,当然IBM的能力也在不断的研发、不断拓展当中,它的能力一定会变得越来越强。 ?...可以通过专家训练,并在交互中通过经验学习来获取反馈,优化模型,不断进步。机器学习的速度很快,可以过目不忘,除非人去修正它,或者它自己学习新的东西,自我做修正,这跟人类有很大的区别,它是超过人类的。...这是语音识别很不简单的事,IBM在这个领域做了很多年,也走过弯路,IBM已经成功将语音识别中的单词错误率降低到5.5%,是最新的世界纪录。...Watson X 时装设计 Watson服务商业的能力在不断加强:通过机器学习和IBM持续的研发投入,Watson的能力在不断强化和灵活地为服务商业演变。...Watson作为创新平台已经启动了50项API 服务(可划分为语言类API、语音类API、图像类API 和数据类API),吸引了超过一百万个开发者、风投公司和初创公司。

77660
您找到你想要的搜索结果了吗?
是的
没有找到

【CES】IBM CEO 主旨演讲:Watson 将 AI 引入商务世界?

几乎没有任何技术在获得的赞誉上能与IBMWatson比肩,IBMWatson身上寄托了将AI引入通用的商务世界的希望。...这样的展示似乎指出了未来:计算机将会“理解”复杂的信息并将之与人类进行交流,不断重复,最终超过大部分人类专家。...这些通过API——或者说编程时可以将它们“钩”到自己程序中作为独立组件的“钩子”——进行调用的服务包括文本情感分析(比如捕捉一堆推特之类的信息然后对它们评估文字中的情绪状态)和性格追踪(用52种特质来衡量一个人在网络上输出的文字...要是有一定数量的早期消费者将其中的技术运用到工作中、训练Watson系统在他们的行业中工作,Watson的许诺也许会自我实现——这种方法会不断地拓展它的能力。...在商务世界中,一台能抛出问题答案、却无法对此进行解释的智能机器毫无用处,Hammond说道。“如果你走进CEO的办公室,对他说我们需要关闭三家工厂并且裁员,CEO会说的第一句话是‘为什么?’。”

83270

IBM苏中:认知时代 计算系统需要左脑和右脑的结合

当时这位老先生还在IBM。 我们讲这个机器自主,很大一部分机器能够自主学习。我们讲大数据给他一千个大数据他可以写出一千个模型,不断的往前发展。...讲到这个不得不再提一下WATSONWATSON系统是2011年参加过比赛,事实上这个系统是在6年以前IBM成立了专门的系统,全球有几十位IBM专家参加了,这是那天的会议视频。...经常在国内跟高校同事交流的时候,大家对WATSON有一些问题,可能觉得第一点WATSON在比赛里面没有语音识别,是通过问题用电子方式交给语音识别,我们不太自信,担心语音识别带来的错误率更高,我相信大数据带来的挑战这个应该不是问题...这是去年的辩题,视频节目要不要禁止暴力视频。辩论题有个论点,这个系统反射了什么,它理解的论点是什么,它从这个论点里面找到论据,正方的观点是什么,反方的观点是什么。...我们不光是能够把观点拿出来,而且对方抛出观点的时候我还可以反方面做。

53960

【深度长文】人工智能过去60年沉浮史,未来60年将彻底改变人类

IBM大中华区董事长陈黎明宣布IBM认知商业战略在中国正式落地 “认知商业”基于IBM推出的认知计算,其核心为新一代IBM Watson技术及Watson APIs。...位于纽约的IBM Watson大楼 在创建IBM Watson业务集团的同时,IBM公布了几项基于Watson的新功能:IBM Watson Discovery Advisor、IBM Watson...在已经推出的Watson API中,包括:文本转语音API,历经12年的研发,最新加入的情商功能让文本转语音的时候能适应语境与情绪;语调分析器API,可对文本中的语调进行分析,获得更好的观察;情绪分析API...据统计,Watson API每月被调用高达13亿次,并且还在快速增长。...对于该图片集,人眼辨识错误率大概为5.1%,目前只有谷歌和微软等个别参赛团队的算法能够达到低于5%的结果。

1.5K20

盛况堪比iPhone发布会,IBM Think 2019亮点有哪些?

IBM Project Debater 负责团队曾表示:Debater 采用了 IBM Watson Text to Speech 和 Speech to Text API 语料库,涵盖 3 亿多信息来源...技术,在任何云环境中运行 Watson,包括 IBM 云以及其它公共云、混合云或多云环境。...事实上,此前 Watson 已经能够运行在多种公有云环境中,在 IBM Think 2019 上的发布则主要是把 Watson 带到私有云平台,为私有云数据构建一系列全新 Watson 微服务,这些服务基于开放的源代码技术...这五项技术分别为: 农业领域的「数字孪生子」将有助于用更少的资源,养活不断增加的人口 你如何给一个从未踏足银行的农民提供信用贷款?...实现方式:Project Owl 在 IBM Cloud 上融合最新的 IBM Watson Studio、Watson Cloud API 和 Weather Company API,提供了一个通过直观的对话体验进行防灾准备

50730

【业界】开源大势降低技术门槛,人工智能企业更依赖大数据

如果真的比不上免费的软件,Watson为什么可以为IBM带来100亿以上的收入。 首先,从为什么AI技术,也就是上文所说的认知技术为何会商品化这一方面,可以得到一些启示。...即便是为 IBM 带来丰厚收入的Watson也在走开源的道路。据统计,在Watson 开发者云上,现在有近20个API是可用的。...另外,这个数字是不断变化的,因为会不断增加新的API、测试版会下架以及相关的API可能会被整合。...Thomas说,考虑到认知工具商品化的速度非常快,不久后,更多WatsonAPI进一步开源的话,我一点也不会觉得惊讶。...IBM Watson 数据处理服务部门的总经理David Keeny说:“数据会成为主流。此外,现在全世界的数据,只有20%在互联网上,剩下的80%都被各大公司和组织占据。”

73780

医生还未失业,IBM Watson已跌入深渊 | 极客头条

挑战赛的成功,让外界看到 IBM 的人工智能给医学带来的革命性改变。不过,医生们对此却持观望状态。 2014 年,IBM 为其人工智能事业部 IBM Watson 新成立了总部。...如果 Watson 能够将这种即时的专业知识带给世界各地的医院和诊所,人工智能似乎有可能减少诊断错误,优化治疗,甚至帮助医生更快更好地完成工作,而不是取代他们来缓解医疗短缺。...IBM 改革医疗行业的勇敢尝试始于 2011 年。Watson 在 Jeopardy!...他说,公司已经在需要的时候转变了方向:“我们在不断学习,所以我们的产品会随着学习而改变。...在 2015 年国家科学、工程和医学院关于诊断错误的报告指出,改进诊断代表着“道德、专业和公共卫生的迫切需要”。

65530

医生还未失业,IBM Watson 已跌入深渊

挑战赛的成功,让外界看到 IBM 的人工智能给医学带来的革命性改变。不过,医生们对此却持观望状态。 2014 年,IBM 为其人工智能事业部 IBM Watson 新成立了总部。...如果 Watson 能够将这种即时的专业知识带给世界各地的医院和诊所,人工智能似乎有可能减少诊断错误,优化治疗,甚至帮助医生更快更好地完成工作,而不是取代他们来缓解医疗短缺。...IBM 改革医疗行业的勇敢尝试始于 2011 年。Watson 在 Jeopardy!...他说,公司已经在需要的时候转变了方向:“我们在不断学习,所以我们的产品会随着学习而改变。...在 2015 年国家科学、工程和医学院关于诊断错误的报告指出,改进诊断代表着“道德、专业和公共卫生的迫切需要”。

72930

RESTful规范

§401 Unauthorized - [*]:表示用户没有权限(令牌、用户名、密码错误)。 §403 Forbidden - [*] 表示用户得到授权(与401错误相对),但是访问是被禁止的。...对第三点的实现稍微多说一点: Java服务器端一般用异常表示 RESTful API错误API 可能抛出两类异常:业务异常和非业务异常。 ...非业务类异常 表示不在预期内的问题,通常由类库、框架抛出,或由于自己的代码逻辑错误导致,比如数据库连接失败、空指针异常、除0错误等等。 业务类异常必须提供2种信息: 1.     ...如果经过验证后依然没权限,应该 403(即 authentication和 authorization的区别)。...403 forbidden 无权限 404 not found 资源不存在 500 internal server error 非业务类异常 503 service unavaliable 由容器抛出

1.9K00

Kong入门学习实践(9)安全防护插件

在Kong中就提供了一些内置的安全防护的插件: IP限制 机器人检测 CORS IP限制 此插件主要用于限制非白名单中的IP来源对服务进行访问,或者禁止黑名单中的IP来源进行访问。...最后,我们通过PostMan来验证一下,当客户端主机不在白名单范围列表时,会直接返回403状态码和配置的message信息。 而当客户端IP地址符合条件时,则会正常转发到上游服务。...最后,我们可以通过安装一个扫描工具如IBM Security AppScan对指定域名URL来进行一次Full Scan扫描来验证,我们会发现全部返回了403 Forbidden的状态码响应。...,表示集成该Service指定的域名,这里Service配置的域名是api.edisontalk.cn。...如果没有通过指定的域名访问则会CORS错误信息,Kong会直接返回错误信息"... has been blocked by CORS policy”表示无法正常访问。

41030

【快报】谷歌云发布全新自然语言和语音API | 英特尔Q2净利润同比降51%

昨日,谷歌正式发布其Beta版的云自然语言API(Cloud Natural Language API)和云语音API(Cloud Speech)。...新的云自然语言API目前支持英文、西班牙文、日文的文本。其中包括情感分析、实体识别、语义分析等功能服务。 云语音API现在支持80种语言的语音到文本转换,在APP和物联网都可实现。...近年来,谷歌、苹果、微软和IBM都聘请了生物医学领域领袖,希望能加强在医疗方面的作为。作者John T. Wilbanks和 Eric J....来源:techcrunch.com 5 IBM Watson与Macy’s合作推出AI购物助理 梅西百货(Macy’s)正在测试一款利用人工智能的移动工具,这款工具可以为顾客提供根据他们所在店铺定制的答案...这款工具是由IBMWatson超级电脑开发出来的,它可以不断积累有关店铺顾客的信息。

65960

IBM副总裁、大中华区硬件系统部总经理郭仁声:未来的认知工作负载需要全新的IT基础架构

同时也适应小朋友的习惯,语言的习惯、生活的习惯,感兴趣的方面等等,不断完善知识的架构,跟小朋友一起成长。把老师、家长感兴趣的模块加载进去,更好的完成小朋友在成长过程中一个很好的学习和陪伴的伙伴。...比如这几个开放平台,本身是强大的认知能力平台,而且计算的平台是基于云和开放标准,它上面几个主要的功能模块,比如问答游戏中用到的自然语言的识别技术,比如它的深度问答技术,包括它自己不断完善机器学习的技术,...这就提到热门的API经济话题,像我们Watson平台完全是基于云上的开放平台,我们今天是把Watson甚至作为一个surface,构建在我们这个Bluemix平台上,开放给更多合作伙伴去使用。...Watson今天有大概16个不同的API接口,可以在网上跟大量的开发者结合,让开发者可以利用WatsonAPI,把他的计算能力变成surface去使用,把能力结合到行业应用。...最重要的是未来我们希望用更开放的心态,跟不同的合作伙伴一起搭建开放API的接口平台,无论是Watson作为一个服务提供出去,还是今天在Bluemix云平台上为开发者提供的能力,这都是我们希望搭建端到端解决方案所做的努力和尝试

80340

50种机器学习和预测应用的API,你想要的全都有

8、IBM Watson Visual Recognition:理解图像-视觉概念内容,进行图像标注、查找人脸、估计年龄和性别,并在集合中查找类似图像,还可以通过自定义概念来重新训练服务。...该 API 可识别 120 种语言和变体,以支持全球用户群。 3、IBM Watson Language Translator:将文本从一种语言翻译为另一种语言。...7、IBM Watson Conversation:构建可理解自然语言的聊天机器人,并将它们部署在消息发送平台和网站上。...8、IBM Watson Speech:包括语音到文本和文本到语音 ( 如在呼叫中心转录通话,或创建语音控制的应用程序)的转换。...6、IBM Watson Retrieve and Rank:开发人员可以将他们的数据加载到服务中,使用已知的相关结果来训练机器学习模型(Rank)。服务输出包括相关文档和元数据。

1.5K70

50种机器学习和人脸识别API,收藏好!以后开发不用找啦

8、IBM Watson Visual Recognition:理解图像-视觉概念内容,进行图像标注、查找人脸、估计年龄和性别,并在集合中查找类似图像,还可以通过自定义概念来重新训练服务。   ...该 API 可识别 120 种语言和变体,以支持全球用户群。   3、IBM Watson Language Translator:将文本从一种语言翻译为另一种语言。...7、IBM Watson Conversation:构建可理解自然语言的聊天机器人,并将它们部署在消息发送平台和网站上。...8、IBM Watson Speech:包括语音到文本和文本到语音 ( 如在呼叫中心转录通话,或创建语音控制的应用程序)的转换。   ...6、IBM Watson Retrieve and Rank:开发人员可以将他们的数据加载到服务中,使用已知的相关结果来训练机器学习模型(Rank)。服务输出包括相关文档和元数据。

1.4K41

50种机器学习和预测应用的API,你想要的全都有

8、IBM Watson Visual Recognition:理解图像-视觉概念内容,进行图像标注、查找人脸、估计年龄和性别,并在集合中查找类似图像,还可以通过自定义概念来重新训练服务。...该 API 可识别 120 种语言和变体,以支持全球用户群。 3、IBM Watson Language Translator:将文本从一种语言翻译为另一种语言。...7、IBM Watson Conversation:构建可理解自然语言的聊天机器人,并将它们部署在消息发送平台和网站上。...8、IBM Watson Speech:包括语音到文本和文本到语音 ( 如在呼叫中心转录通话,或创建语音控制的应用程序)的转换。...6、IBM Watson Retrieve and Rank:开发人员可以将他们的数据加载到服务中,使用已知的相关结果来训练机器学习模型(Rank)。服务输出包括相关文档和元数据。

1.5K20

IBM提出五大能力驱动认知商业变革

IBM大中华区董事长陈黎明 如今随着大数据的普及,所有形式的数据都在不断积累成一种等待被利用的资源,但有80%的数据无法被目前的IT系统处理或理解,因此,企业需要全新的计算工具来挖掘这些资源——这就是IBM...Watson所代表的具备规模化学习、根据目标推理以及与人类自然互动能力的认知系统。...产品与服务:认知技术支持的产品和服务可以感知用户及周围的世界,通过推理和不断地进行自我学习,增强服务能力,为人们带来新的生活和工作方式。...IBM正在用Watson认知计算能力,和十多家前沿性癌症机构合作,协助肿瘤医生通过海量丰富的基因组数据快速获取洞察,针对患者的具体基因档案,发现新的有效药物。...IBM还指出,企业的认知转型将是一段旅程,这其中有五个关键要素,包括:制定一套完备的认知策略,加强认知型数据分析能力,优化用于行业、数据和认知API的云服务来打造面向新型开发的平台,优化用于认知工作负载的

53340
领券