首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

用GPT-2做个“姥爷”!57行代码给《瑞克和莫蒂》写新剧集

随着机器学习(Machine Learning, ML)和自然语言处理(Natural Language Processing, NLP)技术的快速进展,新算法具备生成文本的能力,这些文本也变得越来越接近人类写出的内容。GPT21就是其中一个算法,它被应用在很多开源项目2中。GPT2以WebText为训练集,WebText包含4500万条来自Reddit(一个对新闻进行评论的网络社区)的外链。其中占据外链内容前10的主要数据3来自Google,Archive,Blogspot,Github,NYTimes,WordPress,Washington Post,Wikia,BBC以及The Guardian。受过训练的GPT2模型能根据具体数据集再被进一步调校,比如说最终能够抓取某个数据集的风格或者能够做文档分类。

03

学界 | 语音合成领域的首个完全端到端模型,百度提出并行音频波形生成模型ClariNet

最近,百度硅谷人工智能实验室的研究员提出了 ClariNet,一种全新的基于 WaveNet 的并行音频波形(raw audio waveform)生成模型。WaveNet 是能够完美模仿人类声音的最前沿语音合成技术(Google I/O 大会所展示的超逼真合成语音的背后技术)。自从其被提出,就得到了广泛的离线应用。但由于其自回归(autoregressive)的特点,只能按时间顺序逐个生成波形采样点,导致合成速度极慢,无法在 online 应用场合使用。ClariNet 中所提出的并行波形生成模型基于高斯逆自回归流(Gaussian inverse autoregressive flow),可以完全并行地生成一段语音所对应的原始音频波形。比起自回归的 WaveNet 模型,其合成速度提升了数千倍,可以达到实时的十倍以上。

00
领券