mathor

LV1
发表了文章

Tacotron2论文阅读

这篇论文描述了Tacotron 2, 一个直接从文本合成语音的神经网络架构。系统由两部分构成,一个循环seq2seq结构的特征预测网络,把字符向量映射为梅尔声谱...

mathor
发表了文章

Tacotron2运行笔记

由于我们实验室服务器的cuda版本是9.0,因此只能使用1.1.0版的PyTorch,否则无法使用GPU。但是这个项目源码中使用了一些PyTorch 1.3以上...

mathor
发表了文章

XLNet详解

2018 年,谷歌发布了基于双向 Transformer 的大规模预训练语言模型BERT,刷新了 11 项 NLP 任务的最优性能记录,为 NLP 领域带来了极...

mathor
发表了文章

WAVENET论文阅读

谷歌DeepMind2016年的深度生成模型 WaveNet 将机器语音合成的表现与人类之间水平的差距至少缩减了 50%

mathor
发表了文章

Tacotron论文阅读

Tacotron是谷歌于2017年提出的端到端语音合成系统,该模型可接收字符的输入,输出相应的原始频谱图,然后将其提供给 Griffin-Lim 重建算法直接生...

mathor
发表了文章

Human Language Processing——Controllable TTS

一段声音信号中,它的组成其实包含了好几个维度,比如说的内容,说的方式,以及说的人的音色。过往的语音合成只关注说的内容正确,而这次我们希望能按照我们的方式去控制合...

mathor
发表了文章

Human Language Processing——Beyond Tacotron

acotron 并没有解决所有的问题,有时候它合成出的发音会出错。这一次我们会先讲一讲 Tacotron 以外的一些模型。这些模型是基于 Tacotron 的变...

mathor
发表了文章

Human Language Processing——Alignment

相较于HMM、CTC和RNN-T,LAS在计算P(Y|X)时,是直接计算的,不存在对齐的问题

mathor
发表了文章

Human Language Processing——Alignment Train

在算所有的候选对齐预测的总和之前,我们先看看一个候选对齐预测是怎么计算的。HMM,RNN-T和CTC的计算方式都是一模一样的。我们往后只用 RNN-T 来当作例...

mathor
发表了文章

Human Language Processing——HMM

这篇文章主要介绍目前一些语音识别技术与HMM有什么关系,然后你就会发现,很多技术其实有借用HMM的思想

mathor
发表了文章

SLURM使用教程

我现在经常在实验室服务器上跑程序,而老师要求我们使用SLURM作业管理系统,网上资料零零散散,这篇文章算是一个简单的汇总

mathor
发表了文章

深度学习常用Linux命令

touch file_name创建文件。如果文件已存在,可以修改文件的末次修改时间

mathor
发表了文章

vim编辑器

末行命令 主要是针对文件进行操作的:保存、退出、保存&退出、搜索&替换、另存、新建、浏览文件

mathor
发表了文章

Human Language Processing——CTC

相比LAS算法,CTC能够克服LAS不能online的弊端。只要在Encoder阶段,不采用Bi-LSTM,那么CTC就可以online

mathor
发表了文章

Human Language Processing——RNA&RNN-T&MochA

CTC每个时间步进行的解码是independent的,这样的设定能够简化模型,但却不是很合理。事实上,实际应用中的序列,往往前后token都是有约束关系的。为了...

mathor
发表了文章

linux编译运行c++程序

以一个简单的算法题为例,How do you count the occurrence of a given character in a string?要求保...

mathor
发表了文章

Human Language Processing——LAS

语音识别也和图像处理一样,有传统的语音识别算法和基于DeepLearning的语音识别算法。当然,现在的主流都是采用Deep Learning去做的。 那么,在...

mathor
发表了文章

Human Language Processing——Speech Recognition

从图中可以看到,语言信号可以表示为一个d T的matrix。其中,d为向量的维度(不同的表示方法,维度不一样), T为向量的个数。 同理,文本也可以表示为一个...

mathor
发表了文章

BERT的PyTorch实现

本文主要介绍一下如何使用 PyTorch 复现BERT。请先花上 10 分钟阅读我的这篇文章 BERT详解(附带ELMo、GPT介绍),再来看本文,方能达到醍醐...

mathor
发表了文章

Deep Learning for Human Language Processing_Intro

Human Language Processing研究的内容根据输入输出的不同,可以分为如下6种

mathor

个人简介

个人成就

扫码关注云+社区

领取腾讯云代金券