普林斯顿联合Adobe 连声音都能PS了 | 2分钟读论文

AI研习社

发布于 2018-03-19 15:24:56

8180

发布于 2018-03-19 15:24:56

文章被收录于专栏：AI研习社

来源 / Two Minute Papers

翻译 / 季伟

校对 / 贤儿响叮当

整理 / 雷锋字幕组

AI 研习社出品系列短视频《 2 分钟论文》，带大家用碎片时间阅览前沿技术，了解 AI 领域的最新研究成果。

第3期介绍文字语音转换技术。也就是，我们写下一段文字，计算机把文字转化成语音。这在阅读新闻或者在无官方旁白的情况下，对于创作有声读物非常有用。

一般来讲，我们可以获取语音波形，也可以对语音波形进行编辑。但手工波形则非常困难，因为传统技术通常无法准确地找到波形中单词或字母的分界，更不用说编辑了。

有了这种技术，我们可以剪切、复制甚至编辑文本。这项工作由普林斯顿大学和Adobe的研究人员共同完成，被Adobe自诩为配音界的Photoshop。

想看看基于文本的音频叙述编辑到底怎么操作的？戳下方视频了解详情。

本期论文

"VoCo: Text-based Insertion and Replacement in Audio Narration"

音频编辑技术VoCo：基于文本的插入和替换

▷ 观看论文解读大概需要 3 分钟

学霸们还请自行阅读论文以获得更多细节

论文原址

http://gfx.cs.princeton.edu/pubs/Jin_2017_VTI/

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2017-08-10，如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI研习社微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

登录后参与评论

0 条评论

热度