前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >百度 Deep Voice 实现文本到语音的实时转换;迄今最强核弹 GTX 1080 TI | 开发者头条

百度 Deep Voice 实现文本到语音的实时转换;迄今最强核弹 GTX 1080 TI | 开发者头条

作者头像
AI研习社
发布2018-03-29 15:08:37
1.1K0
发布2018-03-29 15:08:37
举报
文章被收录于专栏:AI研习社AI研习社

内容预览:

  • 百度实现文本到语音的实时转换
  • Facebook 发布支持 90 种语言的预训练词向量
  • 英伟达发布迄今为止最强核弹 GTX 1080 TI 每日推荐阅读:
  • 高手实战演练,十大机器学习时间序列预测难题
  • 从零起步,基础机器学习模型和算法的 Python 代码实现

百度 Deep Voice,实现文本到语音的实时转换

今日百度公开宣布了 Deep Voice,一个产品级的文本到语音转换( text-to-speech,TTS)系统。

该系统完全由深度神经网络搭建而成,最大的优势在于能够满足实时转换的要求。在以前,音频合成的速度往往非常慢,需要花费数分钟到数小时不等的时间才能转换几秒的内容,而现在,百度研究院已经能实现实时合成,在同样的 CPU 与 GPU 上,系统比起谷歌 DeepMind 在去年 9 月发布的原始音频波形深度生成模型 WaveNet,要快上400倍。

但在目前,Deep Voice 需要借助一个音素模型与音频合成组件的帮助。百度研发团队希望在未来能够实现真正意义上的端到端(end-to-end)语音合成。

详情:http://research.baidu.com/deep-voice-production-quality-text-speech-system-constructed-entirely-deep-neural-networks/

论文:https://arxiv.org/abs/1702.07825

█ Facebook 发布支持 90 种语言的预训练词向量

还记得 FastText 吗?就是那个 Facebook 为大型数据库文本处理发布的开源工具。今日,FastText 研究团队在 GitHub 发布了他们的最新研究成果——使用维基百科训练,并包括 90 种语言的 300 维词向量;全都使用 FastText 的默认参数进行训练。

FastText 团队表示,希望各路开发者提供使用反馈。另外,一大波新模型即将发布,请关注 AI 研习社的后续报道。

支持语言列表与下载地址:https://github.com/facebookresearch/fastText/blob/master/pretrained-vectors.md

█ 英伟达发布 GTX 1080 TI,性能赶超 Titan X

今日(当地时间 28 日晚),英伟达在 GDC 大会上发布了 GTX 1080 TI。该显卡仍采用帕斯卡 16 nm 制程工艺,热设计功耗 250W,配备 11GB GDDR5X 显存。英伟达表示其性能超过 GTX 1080 约 35%。这使得 GTX 1080 TI 与 Pasal Titan X 的性能不相上下,部分非公版型号甚至可能犹有过之。

另外,GTX 1080 TI 的公版外观与 GTX 1080 一般无二。但英伟达在发布会上宣布,其公版散热得到了改进,包括去掉 DVI 接口以增大显卡出风口面积;使得在同等噪音水平下,相比 1080/1070 上的公版散热,新方案效果提升约 5%。

GTX 1080 Ti 将于下周上市,售价仅为 699 美元(约合人民币4808元),首批只有公版。美国销售的 GTX 1080 已开始降价,据了解,多家零售商降幅达到 100 美元。

虽然 GTX 1080 TI 主打游戏市场,但对于深度学习开发者,只需花费泰坦一半多的价格就能买到相差无几的计算性能,具有非常大的诱惑力。目前国行价格尚未公布,大伙一起期待(土豪继续关注,小编还是回家把玩 1070)。

详情:http://www.leiphone.com/news/201703/dv5c5cO4OvBe7brF.html

每日推荐阅读

█ 高手实战演练,十大机器学习时间序列预测难题

这是我们的老熟人、澳大利亚机器学习专家 Jason Brownlee 最新整理的开发者实操练习。这是十道颇具挑战性的时间序列预测问题。对于这十道难题,经典的线性统计方法不足以进行解决,必须要用到高阶机器学习方法。

这些难题均来自 Kaggle。

如果你想要来点能挑战自己的高难度习题,提高处理时间序列数据集的能力,并演练机器学习技术——这十道题就是给你的。

地址:http://machinelearningmastery.com/challenging-machine-learning-time-series-forecasting-problems/

█ 从零起步,基础机器学习模型和算法的 Python 代码实现

国外机器学习开发者 Erik Linder-Norén,把他创建多种机器学习模型所用的 Python 代码,上传到了 GitHub 与大家分享。一起来看看别人家的模型是什么样的。当然,这些算法真的是从零起步,非常基础,对于新手有最大的参考价值。

Erik Linder-Norén 上传的模型代码包括决策树、逻辑回归、多层感知机、随机森林、支持向量机等。

地址:https://github.com/eriklindernoren/ML-From-Scratch

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-03-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI研习社 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • ▲ 内容预览:
  • █ 百度 Deep Voice,实现文本到语音的实时转换
  • █ Facebook 发布支持 90 种语言的预训练词向量
  • █ 英伟达发布 GTX 1080 TI,性能赶超 Titan X
    • 每日推荐阅读
    • █ 高手实战演练,十大机器学习时间序列预测难题
    • █ 从零起步,基础机器学习模型和算法的 Python 代码实现
    相关产品与服务
    语音合成
    语音合成(Text To Speech,TTS)满足将文本转化成拟人化语音的需求,打通人机交互闭环。提供多场景、多语言的音色选择,支持 SSML 标记语言,支持自定义音量、语速等参数,让发音更专业、更符合场景需求。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景。
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档