腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
mathor
专栏作者
举报
447
文章
592184
阅读量
50
订阅数
订阅专栏
申请加入专栏
全部文章(447)
其他(110)
编程算法(77)
神经网络(43)
人工智能(43)
机器学习(36)
深度学习(34)
java(32)
ios(18)
NLP 服务(14)
c++(14)
批量计算(12)
存储(12)
pytorch(12)
alpha(12)
sum(12)
text(11)
serverless(10)
linux(8)
容器(8)
jsp(7)
html(7)
游戏(6)
windows(6)
数据结构(6)
token(6)
语音识别(5)
matlab(5)
语音合成(5)
腾讯云测试服务(5)
http(5)
卷积神经网络(5)
安全(5)
https(5)
embedding(5)
max(5)
size(5)
word2vec(5)
对象存储(4)
python(4)
git(4)
spring(4)
jdk(4)
erp(4)
面向对象编程(4)
数据分析(4)
int(4)
key(4)
nlp(4)
php(3)
css(3)
文件存储(3)
日志服务(3)
网站(3)
网络安全(3)
二叉树(3)
data(3)
google(3)
gpu(3)
hidden(3)
rank(3)
self(3)
tensor(3)
vector(3)
word(3)
编码(3)
数据(3)
bash(2)
node.js(2)
打包(2)
ide(2)
eclipse(2)
github(2)
开源(2)
缓存(2)
shell(2)
正则表达式(2)
gui(2)
numpy(2)
hashmap(2)
数据处理(2)
nat(2)
腾讯云开发者社区(2)
error(2)
layer(2)
mask(2)
model(2)
partial(2)
random(2)
事件(2)
网络(2)
免费套餐(1)
官方文档(1)
数据挖掘(1)
tensorflow(1)
c 语言(1)
.net(1)
r 语言(1)
bootstrap(1)
汇编语言(1)
嵌入式(1)
数据库(1)
oracle(1)
api(1)
tomcat(1)
搜索引擎(1)
bash 指令(1)
云直播(1)
时序数据库 CTSDB(1)
海外加速(1)
机器翻译(1)
企业(1)
运维(1)
黑客(1)
jvm(1)
wordpress(1)
hive(1)
yum(1)
监督学习(1)
线性回归(1)
asp(1)
cdn(1)
kernel(1)
iis(1)
网站建设(1)
特征工程(1)
功能测试(1)
性能测试(1)
黑盒测试(1)
es(1)
汽车(1)
architecture(1)
autoencoder(1)
block(1)
channel(1)
clone(1)
combine(1)
dagger(1)
dataset(1)
device(1)
dfs(1)
distance(1)
distribution(1)
document(1)
echarts(1)
encoding(1)
epoch(1)
equation(1)
excel(1)
fixed(1)
fork(1)
for循环(1)
function(1)
gan(1)
global(1)
hashtable(1)
identity(1)
input(1)
label(1)
lambda(1)
list(1)
load(1)
local(1)
ls(1)
min(1)
mnist(1)
module(1)
nan(1)
normalization(1)
object(1)
pandas(1)
pear(1)
pool(1)
position(1)
precision(1)
prediction(1)
profiling(1)
reshape(1)
rows(1)
sample(1)
search(1)
sequence(1)
sign(1)
spa(1)
src(1)
steam(1)
subset(1)
target(1)
testing(1)
time(1)
torch(1)
txt(1)
virtual(1)
web(1)
window(1)
zero(1)
表格(1)
动态规划(1)
二进制(1)
函数(1)
技巧(1)
解决方案(1)
开发(1)
可视化(1)
论文(1)
数组(1)
搜索(1)
统计(1)
优化(1)
语音(1)
搜索文章
搜索
搜索
关闭
未闻Prompt名
机器学习
神经网络
深度学习
人工智能
个人觉得2021年NLP最火的两个idea,一个是对比学习(Contrastive Learning),另一个就是Prompt
mathor
2021-12-24
2.1K
0
PyTorch中的梯度累积
pytorch
批量计算
神经网络
我们在训练神经网络的时候,超参数batch_size的大小会对模型最终效果产生很大的影响,通常的经验是,batch_size越小效果越差;batch_size越大模型越稳定。理想很丰满,现实很骨感,很多时候不是你想增大batch_size就能增大的,受限于显存大小等因素,我们的batch_size往往只能设置为2或4,否则就会出现"CUDA OUT OF MEMORY"(OOM)报错。如何在有限的计算资源下,采用更大的batch_size进行训练,或者达到和大batch_size一样的效果?这就是梯度累加(Gradient Accumulation)技术了
mathor
2021-07-28
1.3K
0
L2正则化的一些思考
神经网络
正则表达式
很多时候,我们希望得到一个"稳健"的模型。何为稳健?一般来说有两种含义,一是对于参数扰动的稳定性,比如模型变成了f_{\theta}(x);二是对于输入扰动的稳定性,比如输入从x变成了x+\Delta x后,f_{\theta}(x+\Delta x)是否能给出相近的预测结果。读者或许已经听过深度学习模型存在"对抗攻击样本",比如图片只改变一个像素就给出完全不一样的分类结果,这就是模型对输入过于敏感的案例
mathor
2021-05-20
577
0
积分梯度:一种新颖的神经网络可视化方法
神经网络
NLP 服务
本文介绍一种神经网络的可视化方法:积分梯度(Integrated Gradients),它首先在论文《Gradients of Counterfactuals》中提出,后来《Axiomatic Attribution for Deep Networks》再次介绍了它,两篇论文作者都是一样的,内容也大体上相同,后一篇相对来说更易懂一些,如果要读原论文的话,建议大家优先读后一篇。当然,它已经是2016~2017年间的工作了,“新颖”说的是它思路上的创新有趣,而不是指最近发表
mathor
2021-05-20
1.6K
0
去掉 Attention 的 Softmax,复杂度降为 O (n)
机器学习
神经网络
深度学习
人工智能
众所周知,尽管基于 Attention 机制的 Transformer 类模型有着良好的并行性能,但它的空间和时间复杂度都是 O(n2)\mathcal {O}(n^2) 级别的,nn 是序列长度,所以当 nn 比较大时 Transformer 模型的计算量难以承受。近来,也有不少工作致力于降低 Transformer 模型的计算量,比如模型剪枝、量化、蒸馏等精简技术,又或者修改 Attention 结构,使得其复杂度能降低到 O(nlogn)\mathcal {O}(nlogn) 甚至 O(n)\mathcal {O}(n)
mathor
2021-05-12
1K
0
概率图模型详解
编程算法
机器学习
神经网络
深度学习
人工智能
概率图模型(Probabilistic Graphical Model)就是一类用图来表达随机变量之间关系的概率模型:
mathor
2021-04-02
1.4K
0
Siamese Network & Triplet NetWork
神经网络
在孪生网络中,我们把一张图片$X_1$作为输入,得到该图片的编码$G_W(X_1)$。然后,我们在不对网络参数进行任何更新的情况下,输入另一张图片$X_2$,并得到改图片的编码$G_W(X_2)$。由于相似的图片应该具有相似的特征(编码),利用这一点,我们就可以比较并判断两张图片的相似性
mathor
2020-10-14
2.1K
0
Tacotron2论文阅读
语音合成
机器学习
神经网络
深度学习
人工智能
这篇论文描述了Tacotron 2, 一个直接从文本合成语音的神经网络架构。系统由两部分构成,一个循环seq2seq结构的特征预测网络,把字符向量映射为梅尔声谱图,后面再接一个WaveNet模型的修订版,把梅尔声谱图合成为时域波形。我们的模型得到了4.53的平均意见得分(MOS),专业录制语音的MOS得分是4.58。为了验证模型设计,我们对系统的关键组件作了剥离实验研究,并且评估了使用梅尔频谱替代语言学、音长和F0特征作为WaveNet输入带来的不同影响。我们进一步展示了使用紧凑的声学中间表征可以显著地简化WaveNet架构
mathor
2020-08-13
1.4K
0
Tacotron论文阅读
机器学习
神经网络
深度学习
人工智能
Tacotron是谷歌于2017年提出的端到端语音合成系统,该模型可接收字符的输入,输出相应的原始频谱图,然后将其提供给 Griffin-Lim 重建算法直接生成语音
mathor
2020-08-10
774
0
Human Language Processing——Alignment
机器学习
神经网络
深度学习
人工智能
相较于HMM、CTC和RNN-T,LAS在计算P(Y|X)时,是直接计算的,不存在对齐的问题
mathor
2020-08-06
834
0
Human Language Processing——Alignment Train
机器学习
神经网络
深度学习
人工智能
编程算法
在算所有的候选对齐预测的总和之前,我们先看看一个候选对齐预测是怎么计算的。HMM,RNN-T和CTC的计算方式都是一模一样的。我们往后只用 RNN-T 来当作例子。首先我们找出一条候选对齐,比如h = ∅c∅∅a∅t∅∅。$P(h|X)$就等于每个位置的发射概率和转移概率的连乘
mathor
2020-08-05
525
0
Human Language Processing——RNA&RNN-T&MochA
机器学习
神经网络
深度学习
人工智能
CTC每个时间步进行的解码是independent的,这样的设定能够简化模型,但却不是很合理。事实上,实际应用中的序列,往往前后token都是有约束关系的。为了达到比较好的识别效果,在CTC的输出之后,通常需要再经过一个Language Model进行后处理。因为本质上来说,Language Model得到的就是前后token之间的转化概率,Language Model的引入弥补了CTC中时间步之间独立假设的缺陷。那能不能不用Language Model,抛弃时间步独立假设呢?
mathor
2020-07-28
1.2K
0
Human Language Processing——LAS
语音识别
机器学习
神经网络
深度学习
人工智能
语音识别也和图像处理一样,有传统的语音识别算法和基于DeepLearning的语音识别算法。当然,现在的主流都是采用Deep Learning去做的。 那么,在传统语音识别领域,一般用什么方法呢?用得最多的就是3个算法,HMM(Hidden Markov Model) ;GMM(Gaussian Mixture Model);CTC(Connectionist Temporal Classification)
mathor
2020-07-27
811
0
Seq2Seq的PyTorch实现
机器学习
神经网络
深度学习
人工智能
腾讯云测试服务
本文介绍一下如何使用 PyTorch 复现 Seq2Seq,实现简单的机器翻译应用,请先简单阅读论文Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation(2014),了解清楚Seq2Seq结构是什么样的,之后再阅读本篇文章,可达到事半功倍的效果
mathor
2020-07-01
2K
0
BiLSTM的PyTorch应用
机器学习
神经网络
深度学习
人工智能
本文介绍一下如何使用BiLSTM(基于PyTorch)解决一个实际问题,实现给定一个长句子预测下一个单词
mathor
2020-06-30
2.8K
0
TextCNN的PyTorch实现
神经网络
机器学习
深度学习
人工智能
pytorch
本文主要介绍一篇将CNN应用到NLP领域的一篇论文 Convolutional Neural Networks for Sentence Classification,然后给出 PyTorch 实现
mathor
2020-06-28
2.9K
0
TextRNN的PyTorch实现
pytorch
机器学习
神经网络
深度学习
人工智能
参考这篇论文Finding Structure in Time(1990),如果你对RNN有一定的了解,实际上不用看,仔细看我代码如何实现即可。如果你对RNN不太了解,请仔细阅读我这篇文章RNN Layer,结合PyTorch讲的很详细
mathor
2020-06-28
801
0
Seq2Seq与注意力机制
神经网络
编程算法
在基于词语的语言模型中,我们使用了循环神经网络。它的输入时一段不定长的序列,输入却是定长的,例如输入:They are,输出可能是watching或者sleeping。然而,很多问题的输出是不定长的序列。以机器翻译为例,输入是一段英文,输出是一段法语,输入和输出皆不定长,例如
mathor
2020-04-10
580
0
模型建立与调参
腾讯云测试服务
机器学习
神经网络
深度学习
人工智能
本篇文章将会从简单的线性模型开始,了解如何建立一个模型以及建立完模型之后要分析什么东西,然后学习交叉验证的思想和技术,并且会构建一个线下测试集,之后我们会尝试建立更多的模型去解决这个问题,并对比它们的效果,当把模型选择出来之后,我们还得掌握一些调参的技术发挥模型最大的性能,模型选择出来之后,也调完参数,但是模型真的就没有问题了吗?我们还需要绘制学习率曲线看模型是否存在过拟合或者欠拟合的问题并给出相应的解决方法
mathor
2020-04-03
1.9K
0
毕业论文——基于xxLSTM模型的移动对象位置预测
开源
机器学习
神经网络
深度学习
本文简要概述一下我的毕业论文思路,完整可执行代码大概在5月左右开源在Github,主要是为了证明学术诚信,而且太早开源不好,等我快要答辩了再开源
mathor
2020-03-03
2K
5
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档