腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
mathor
专栏作者
举报
447
文章
591783
阅读量
50
订阅数
订阅专栏
申请加入专栏
全部文章(447)
其他(110)
编程算法(77)
神经网络(43)
人工智能(43)
机器学习(36)
深度学习(34)
java(32)
ios(18)
NLP 服务(14)
c++(14)
批量计算(12)
存储(12)
pytorch(12)
alpha(12)
sum(12)
text(11)
serverless(10)
linux(8)
容器(8)
jsp(7)
html(7)
游戏(6)
windows(6)
数据结构(6)
token(6)
语音识别(5)
matlab(5)
语音合成(5)
腾讯云测试服务(5)
http(5)
卷积神经网络(5)
安全(5)
https(5)
embedding(5)
max(5)
size(5)
word2vec(5)
对象存储(4)
python(4)
git(4)
spring(4)
jdk(4)
erp(4)
面向对象编程(4)
数据分析(4)
int(4)
key(4)
nlp(4)
php(3)
css(3)
文件存储(3)
日志服务(3)
网站(3)
网络安全(3)
二叉树(3)
data(3)
google(3)
gpu(3)
hidden(3)
rank(3)
self(3)
tensor(3)
vector(3)
word(3)
编码(3)
数据(3)
bash(2)
node.js(2)
打包(2)
ide(2)
eclipse(2)
github(2)
开源(2)
缓存(2)
shell(2)
正则表达式(2)
gui(2)
numpy(2)
hashmap(2)
数据处理(2)
nat(2)
腾讯云开发者社区(2)
error(2)
layer(2)
mask(2)
model(2)
partial(2)
random(2)
事件(2)
网络(2)
免费套餐(1)
官方文档(1)
数据挖掘(1)
tensorflow(1)
c 语言(1)
.net(1)
r 语言(1)
bootstrap(1)
汇编语言(1)
嵌入式(1)
数据库(1)
oracle(1)
api(1)
tomcat(1)
搜索引擎(1)
bash 指令(1)
云直播(1)
时序数据库 CTSDB(1)
海外加速(1)
机器翻译(1)
企业(1)
运维(1)
黑客(1)
jvm(1)
wordpress(1)
hive(1)
yum(1)
监督学习(1)
线性回归(1)
asp(1)
cdn(1)
kernel(1)
iis(1)
网站建设(1)
特征工程(1)
功能测试(1)
性能测试(1)
黑盒测试(1)
es(1)
汽车(1)
architecture(1)
autoencoder(1)
block(1)
channel(1)
clone(1)
combine(1)
dagger(1)
dataset(1)
device(1)
dfs(1)
distance(1)
distribution(1)
document(1)
echarts(1)
encoding(1)
epoch(1)
equation(1)
excel(1)
fixed(1)
fork(1)
for循环(1)
function(1)
gan(1)
global(1)
hashtable(1)
identity(1)
input(1)
label(1)
lambda(1)
list(1)
load(1)
local(1)
ls(1)
min(1)
mnist(1)
module(1)
nan(1)
normalization(1)
object(1)
pandas(1)
pear(1)
pool(1)
position(1)
precision(1)
prediction(1)
profiling(1)
reshape(1)
rows(1)
sample(1)
search(1)
sequence(1)
sign(1)
spa(1)
src(1)
steam(1)
subset(1)
target(1)
testing(1)
time(1)
torch(1)
txt(1)
virtual(1)
web(1)
window(1)
zero(1)
表格(1)
动态规划(1)
二进制(1)
函数(1)
技巧(1)
解决方案(1)
开发(1)
可视化(1)
论文(1)
数组(1)
搜索(1)
统计(1)
优化(1)
语音(1)
搜索文章
搜索
搜索
关闭
Flooding-X: 超参数无关的Flooding方法
批量计算
ICML2020的论文《Do We Need Zero Training Loss After Achieving Zero Training Error?》提出了一种Flooding方法,用于缓解模
mathor
2021-12-10
681
0
PyTorch中的梯度累积
pytorch
批量计算
神经网络
我们在训练神经网络的时候,超参数batch_size的大小会对模型最终效果产生很大的影响,通常的经验是,batch_size越小效果越差;batch_size越大模型越稳定。理想很丰满,现实很骨感,很多时候不是你想增大batch_size就能增大的,受限于显存大小等因素,我们的batch_size往往只能设置为2或4,否则就会出现"CUDA OUT OF MEMORY"(OOM)报错。如何在有限的计算资源下,采用更大的batch_size进行训练,或者达到和大batch_size一样的效果?这就是梯度累加(Gradient Accumulation)技术了
mathor
2021-07-28
1.3K
0
RoBERTa概述
批量计算
其实到2020年了,很多论文早已不再使用NSP任务,但是RoBERTa算是比较早的一批质疑NSP任务的模型。RoBERTa实验了4种方法:
mathor
2020-11-03
671
0
BERT的PyTorch实现
批量计算
pytorch
编程算法
本文主要介绍一下如何使用 PyTorch 复现BERT。请先花上 10 分钟阅读我的这篇文章 BERT详解(附带ELMo、GPT介绍),再来看本文,方能达到醍醐灌顶,事半功倍的效果
mathor
2020-07-27
838
0
NNLM的PyTorch实现
pytorch
编程算法
java
批量计算
NLP 服务
本文主要首先介绍一篇年代久远但意义重大的论文A Neural Probabilistic Language Model(2003),然后给出PyTorch实现
mathor
2020-06-11
1.3K
0
Transformer
批量计算
对象存储
Transformer是谷歌大脑在2017年底发表的论文attention is all you need中所提出的seq2seq模型。现在已经取得了大范围的应用和扩展,而BERT就是从Transformer中衍生出来的预训连语言模型
mathor
2020-04-26
1K
0
PyTorch实现Word2Vec
pytorch
批量计算
其中两个必选参数num_embeddings表示单词的总数目,embedding_dim表示每个单词需要用什么维度的向量表示。而nn.Embedding权重的维度也是(num_embeddings, embedding_dim),默认是随机初始化的
mathor
2020-04-14
4.3K
1
利用PyTorch使用LSTM
批量计算
机器学习
神经网络
深度学习
人工智能
和RNNCell类似,输入input_size的shape是[batch, input_size],输出$h_t$和$c_t$的shape是[batch, hidden_size]
mathor
2020-02-17
3.4K
0
Simple RNN时间序列预测
批量计算
机器学习
神经网络
深度学习
人工智能
首先分析一下,假设我们一次输入50个点,batch设为1,每个点就一个值,所以input的shape就是[50, 1, 1],这里我们换一种表示形式,把batch放在前面,那么shape就是[1, 50, 1],可以这么理解这个shape,1条曲线,一共有50个点,每个点都是1个实数
mathor
2020-02-17
830
0
RNN Layer
机器学习
神经网络
深度学习
人工智能
批量计算
假设x的shape是[10, 3, 100],翻译一下就是,10个单词,每次训练3句话,每个单词用一个100维的tensor来表达
mathor
2020-02-14
937
0
Batch Normalization
批量计算
我们知道Sigmoid函数在定义域为$(-\infty,-4) \cup (4,\infty)$内导数趋于0,由于容易出现梯度消失的现象,因此ReLU函数使用的较多
mathor
2020-01-15
443
0
Early Stop && Dropout && Stochastic Gradient Descent
批量计算
spring
上图表明,随着训练epoch的增加,Training Set Accuracy也在持续上升,但到达某一点后,Test Set Accuracy开始下降,此时发生了OverFitting现象。我们一般用Validation Set来对该临界点进行检测,当取到最大值时便停止训练,将此时取得的参数保存起来用于最终的模型参数
mathor
2020-01-13
767
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档