mathor

360 篇文章
42 人订阅

全部文章

mathor

WAVENET论文阅读

谷歌DeepMind2016年的深度生成模型 WaveNet 将机器语音合成的表现与人类之间水平的差距至少缩减了 50%

1400
mathor

Tacotron论文阅读

Tacotron是谷歌于2017年提出的端到端语音合成系统,该模型可接收字符的输入,输出相应的原始频谱图,然后将其提供给 Griffin-Lim 重建算法直接生...

1300
mathor

Human Language Processing——Controllable TTS

一段声音信号中,它的组成其实包含了好几个维度,比如说的内容,说的方式,以及说的人的音色。过往的语音合成只关注说的内容正确,而这次我们希望能按照我们的方式去控制合...

8720
mathor

Human Language Processing——Beyond Tacotron

acotron 并没有解决所有的问题,有时候它合成出的发音会出错。这一次我们会先讲一讲 Tacotron 以外的一些模型。这些模型是基于 Tacotron 的变...

8120
mathor

Human Language Processing——Alignment

相较于HMM、CTC和RNN-T,LAS在计算P(Y|X)时,是直接计算的,不存在对齐的问题

5620
mathor

Human Language Processing——Alignment Train

在算所有的候选对齐预测的总和之前,我们先看看一个候选对齐预测是怎么计算的。HMM,RNN-T和CTC的计算方式都是一模一样的。我们往后只用 RNN-T 来当作例...

12130
mathor

Human Language Processing——HMM

这篇文章主要介绍目前一些语音识别技术与HMM有什么关系,然后你就会发现,很多技术其实有借用HMM的思想

5810
mathor

SLURM使用教程

我现在经常在实验室服务器上跑程序,而老师要求我们使用SLURM作业管理系统,网上资料零零散散,这篇文章算是一个简单的汇总

6920
mathor

深度学习常用Linux命令

touch file_name创建文件。如果文件已存在,可以修改文件的末次修改时间

4710
mathor

vim编辑器

末行命令 主要是针对文件进行操作的:保存、退出、保存&退出、搜索&替换、另存、新建、浏览文件

9840
mathor

Human Language Processing——CTC

相比LAS算法,CTC能够克服LAS不能online的弊端。只要在Encoder阶段,不采用Bi-LSTM,那么CTC就可以online

7610
mathor

Human Language Processing——RNA&RNN-T&MochA

CTC每个时间步进行的解码是independent的,这样的设定能够简化模型,但却不是很合理。事实上,实际应用中的序列,往往前后token都是有约束关系的。为了...

7810
mathor

linux编译运行c++程序

以一个简单的算法题为例,How do you count the occurrence of a given character in a string?要求保...

9420
mathor

Human Language Processing——LAS

语音识别也和图像处理一样,有传统的语音识别算法和基于DeepLearning的语音识别算法。当然,现在的主流都是采用Deep Learning去做的。 那么,在...

9331
mathor

Human Language Processing——Speech Recognition

从图中可以看到,语言信号可以表示为一个d T的matrix。其中,d为向量的维度(不同的表示方法,维度不一样), T为向量的个数。 同理,文本也可以表示为一个...

6410
mathor

BERT的PyTorch实现

本文主要介绍一下如何使用 PyTorch 复现BERT。请先花上 10 分钟阅读我的这篇文章 BERT详解(附带ELMo、GPT介绍),再来看本文,方能达到醍醐...

10720
mathor

Deep Learning for Human Language Processing_Intro

Human Language Processing研究的内容根据输入输出的不同,可以分为如下6种

3210
mathor

BERT详解(附带ELMo、GPT介绍)

BERT全称为Bidirectional Encoder Representation from Transformer,是Google以无监督的方式利用大量无...

9230
mathor

Transformer的PyTorch实现

文本主要介绍一下如何使用 PyTorch 复现 Transformer,实现简单的机器翻译任务。

10160
mathor

Beyond Accuracy:Behavioral Testing of NLP Models with Checklist 论文阅读

本文主要介绍以及翻译一篇 ACL2020 Best Paper Beyond Accuracy:Behavioral Testing of NLP Models...

22730

扫码关注云+社区

领取腾讯云代金券