普林斯顿联合Adobe 连声音都能PS了 | 2分钟读论文

来源 / Two Minute Papers

翻译 / 季伟

校对 / 贤儿响叮当

整理 / 雷锋字幕组

AI 研习社出品系列短视频《 2 分钟论文 》,带大家用碎片时间阅览前沿技术,了解 AI 领域的最新研究成果。

第3期介绍文字语音转换技术。也就是,我们写下一段文字,计算机把文字转化成语音。这在阅读新闻或者在无官方旁白的情况下,对于创作有声读物非常有用。

一般来讲,我们可以获取语音波形,也可以对语音波形进行编辑。但手工波形则非常困难,因为传统技术通常无法准确地找到波形中单词或字母的分界,更不用说编辑了。

有了这种技术,我们可以剪切、复制甚至编辑文本。这项工作由普林斯顿大学和Adobe的研究人员共同完成,被Adobe自诩为配音界的Photoshop。

想看看基于文本的音频叙述编辑到底怎么操作的?戳下方视频了解详情。

本期论文

"VoCo: Text-based Insertion and Replacement in Audio Narration"

音频编辑技术VoCo:基于文本的插入和替换

▷ 观看论文解读大概需要 3 分钟

学霸们还请自行阅读论文以获得更多细节

论文原址

http://gfx.cs.princeton.edu/pubs/Jin_2017_VTI/

原文发布于微信公众号 - AI研习社(okweiwu)

原文发表时间:2017-08-10

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI研习社

福利 | 本周 AI 开发大事件汇总(文末附百G免费开发者资源)

各位周末好!对 AI 开发者来说,本周发生了不少大事值得关注,重点包括: ● 谷歌 HBaseCon West 2017 大数据研讨会发出邀请函; ● 亚洲首度...

4018
来自专栏AI研习社

看过10万个视频 AI才能识别你的脑残操作 | 2分钟读论文

来源 / Two Minute Papers 翻译 / 朱婷 校对 / 李宇琛 整理 / 雷锋字幕组 AI 研习社出品系列短视频《 2 分钟论文 》,带大家用...

3085
来自专栏大数据文摘

网购评论是真是假?文本挖掘告诉你

1757
来自专栏大数据文摘

视频更新|斯坦福CS231n深度学习与计算机视觉课时27-图像分割与注意力模型(下)

2034
来自专栏AI科技评论

开发 | 继AI生成二次元头像之后,新一代线稿上色AI来袭

预览视频: 项目主页: lllyasviel/style2paints(https://github.com/lllyasviel/style2paints) ...

3738
来自专栏机器之心

前沿 | Science:自学习式人工智能可协助预测心脏病发作

选自Science 作者:Matthew Hutson 机器之心编译 参与:蒋思源、黄小天 近年来,将人工智能应用于医疗健康已经在蓬勃发展,机器之心也曾报道过医...

39312
来自专栏AI研习社

【头条】谷歌发布全新TensorFlow 库tf.Transform;百度将Ring Allreduce算法引入深度学习

谷歌发布全新 TensorFlow 库“tf.Transform” 谷歌表示,tf.Transform 将改善 TensorFlow 的数据预处理和格式转化难题...

4014
来自专栏大数据文摘

视频更新|斯坦福CS231n深度学习与计算机视觉课时19-卷积神经网络的可视化与进一步理解(下)

1642
来自专栏新智元

深度学习动手实践:用 TensorFlow 打造“会看”的机器人

(文/Lukas Biewald)物体识别是当前机器学习最热门的方向。计算机早已能够识别如人脸、猫之类的物体,但识别更大范围里的任意物体对人工智能来说仍是难题。...

4646
来自专栏大数据文摘

DOTA2中打败Dendi的AI如何炼出?OpenAI公布两周集训细节(含实战视频)

1993

扫码关注云+社区