首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

浅析OGG VORBIS

虽说OGG VORBIS的登场并未晚过前辈MP3过多时日,其的出现也正是为了阻拦MP3一路高歌猛进的强劲步伐,可是至少在中国这块破解软件的乐土,MP3虚有其表的版权以及真真切切的封闭却并未驱使人们义无反顾的投身OGG VORBIS的怀抱,尽管他完全的开源,尽管他彻底的免费,虽说在Linux平台上Ogg Vorbis的确流行,但是在中国这片Windows大放异彩的土地上,能够耳闻Ogg Vorbis名号的人估计也不在多数,笔者曾经在网上搜索过Ogg Vorbis相关的文章,大抵都是一些浮光掠影的简介,有些内容的也大多以英文写就,读来确有不便,再加上我在学习游戏编程的过程中对Ogg Vorbis有过一点浅显的认识,所以萌生了写作此文的想法,但文章终究是我的个人看法,期中讹误在所难免,希望大家对于其中不便于理解或者认为错误的地方一一指出,以使我进一步修正改进,总的来说我必须为那句“古语”负责:贻笑大方事小,误人子弟事大:)

02
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    学界 | 语音合成领域的首个完全端到端模型,百度提出并行音频波形生成模型ClariNet

    最近,百度硅谷人工智能实验室的研究员提出了 ClariNet,一种全新的基于 WaveNet 的并行音频波形(raw audio waveform)生成模型。WaveNet 是能够完美模仿人类声音的最前沿语音合成技术(Google I/O 大会所展示的超逼真合成语音的背后技术)。自从其被提出,就得到了广泛的离线应用。但由于其自回归(autoregressive)的特点,只能按时间顺序逐个生成波形采样点,导致合成速度极慢,无法在 online 应用场合使用。ClariNet 中所提出的并行波形生成模型基于高斯逆自回归流(Gaussian inverse autoregressive flow),可以完全并行地生成一段语音所对应的原始音频波形。比起自回归的 WaveNet 模型,其合成速度提升了数千倍,可以达到实时的十倍以上。

    00
    领券