腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Pytorch
model.train
()
和
教程
中
编写
的
分离
序列
()
函数
python
、
machine-learning
、
pytorch
我是
PyTorch
的
新手,我想知道您是否可以向我解释一下
PyTorch
中
的
默认
model.train
()
函数
和
这里
的
train()
函数
之间
的
一些关键区别。另一个
PyTorch
()
函数
位于文本分类
的
官方train
教程
中
,对于模型权重是否在训练结束时存储感到困惑。predictions.append(guess)
浏览 24
提问于2019-06-26
得票数 0
2
回答
pytorch
attention seq2seq
教程
中
的
错误?
pytorch
、
seq2seq
我正在用
Pytorch
编写
序列
神经网络
的
序列
。在official
Pytorch
seq2seq tutorial
中
,有一个注意力解码器
的
代码,我不能理解/认为可能包含错误。它通过连接输出
和
此时
的
隐藏状态来计算每个时间步
的
注意力权重,然后乘以一个矩阵,得到一个大小等于输出
序列
长度
的
向量。注意,这些注意力权重不依赖于编码器
序列
(在代码<e
浏览 37
提问于2019-05-03
得票数 1
1
回答
Pytorch
深度学习-验证应该在时代循环内部还是外部?
validation
、
deep-learning
、
pytorch
我已经看到大多数
教程
/指南在epoch循环之外都有验证步骤。不过,我所遵循
的
指南在epoch循环中有验证步骤。哪一个是对
的
?我注意到,如果您在epoch循环中进行了验证,您可以绘制每个时代损失
的
验证图,但是您不能有一个正确
的
混淆矩阵(因为再次验证相同
的
图像数据集),反之亦然。或者我还没找到合适
的
方法。有什么建议吗? 谢谢
浏览 2
提问于2022-01-01
得票数 0
1
回答
正确
的
方法来创建
Pytorch
数据集,返回RNN
的
数据
序列
?
python
、
deep-learning
、
dataset
、
pytorch
、
rnn
我正在尝试对时间
序列
数据进行RNN训练,虽然有很多关于如何构建RNN模型
的
教程
,但我在为这个任务构建dataloader对象方面遇到了一些困难。数据都将是相同
的
长度,所以也不需要填充。到目前为止,我采取
的
方法是返回dataset类上
的
getitem
函数
中
的
一系列数据,并将长度定义为不过,我觉得这有点“无趣”,应该有一个更恰当
的
办法。更具体地说,我认为以某种方式在Py电
浏览 0
提问于2018-08-20
得票数 2
回答已采纳
2
回答
在训练
和
测试时间
pytorch
上以不同方式管理内存
python
、
deep-learning
、
conv-neural-network
、
pytorch
目前,我正在用
pytorch
编写
一个基于U-net
的
分割模型,我想使用类似于mobilenet v2上引入
的
倒置残差来提高模型在cpu上
的
速度。 然后我意识到模型在训练阶段
和
测试阶段使用了更多
的
内存。虽然模型应该在训练阶段使用更多
的
内存,因为所有的中间步骤张量(特征图)都被保存了,并且使用可
分离
的
卷积,为每个“卷积”操作创建了更多
的
张量。在测试阶段,具有正常卷积
的
u-net
浏览 1
提问于2019-04-13
得票数 0
2
回答
如何基于基于字符
的
RNN模型进行字符预测?
nlp
、
lstm
、
recurrent-neural-network
我想创建一个预测
函数
来完成“句子”
的
一部分,这里使用
的
模型是基于字符
的
RNN(LSTM)。我们应该做些什么呢?
浏览 43
提问于2020-10-22
得票数 0
回答已采纳
1
回答
在
Pytorch
中
不使用训练掩码-将数据输入到训练模型(文档)时
的
几何形状
model
、
pytorch
、
training-data
、
pytorch-geometric
我正在阅读
Pytorch
-Geometric (here)。 在下面的代码
中
,我们看到在没有train_mask
的
情况下,data被传递给模型。但是,当将输出
和
标签传递给损失
函数
时,train_mask将同时应用于这两个
函数
。在将data输入到模型
中
时,我们不是也应该将train_mask应用于它吗?在我看来,这应该不是问题。然而,看起来我们是在浪费未用于训练模型
的
输出上
的
计算。
model.train
() for e
浏览 39
提问于2021-09-01
得票数 0
回答已采纳
2
回答
深度学习图书馆
中
NLP
的
动态批处理
和
填充批
nlp
、
pytorch
、
huggingface
、
dynamic-batching
、
pad-truncate
这是我们训练NLP
的
现代深度学习模型
的
常用方法,例如,在Huggingface库
中
,输入no有一个固定
的
长度。指记号/音音单位。https://huggingface.co/docs/transformers/pad_截断 在下面的例子
中
,我们有5个不同长度
的
句子,它们都被填充到最大长度设置为1024。我问题
的
第一部分是关于GPU内存
的
使用
和
pad,当我们训练带有填充输入<e
浏览 0
提问于2023-04-07
得票数 2
1
回答
PyTorch
中
的
火炬脚本是什么?
pytorch
、
jit
我刚刚发现
PyTorch
文档公开了一些叫做
的
东西。不过,我不知道: 他们
的
好处是什么?
浏览 1
提问于2018-12-23
得票数 53
回答已采纳
1
回答
pytorch
中
的
大数据,帮助调优步骤
python
、
pytorch
、
bigdata
、
dataloader
我以前曾分裂过我
的
大人物:# X_test.shape : 2M samples x 2K featuresvalidation_generator = data_utils.DataLoader(test, batch_size=20000, shuffle=True) 我从一个网络课程
中
复制了这个例子correct += ((1*(predicted>.5)) == np.array(local_labels)).sum
浏览 10
提问于2022-01-01
得票数 2
回答已采纳
1
回答
如何在自动梯度
中
逐个分配方程元素
python
、
autograd
、
automatic-differentiation
我正在尝试实现一个基于自动梯度
的
非线性PDE求解器。
和
大多数PDE一样,我需要能够在输入向量
的
单个条目中操作,但显然这破坏了自动梯度。我创建了这个简单
的
例子来展示我所面临
的
问题:def my_equation(x): return eq 谢谢!
浏览 2
提问于2019-12-10
得票数 0
回答已采纳
1
回答
Pytorch
深度学习类模型()
和
训练
函数
python
、
oop
、
pytorch
我是
Pytorch
的
新手,我正在学习本
教程
,以了解如何使用这个库进行深度学习。我在找出部分代码时遇到问题。 有一个名为Net
的
类
和
一个名为model
的
对象从它实例化。然后是训练
函数
,称为train(epoch)。在列车
函数
体
的
下一行
中
,我看到了这个:
model.train
(),我不能理解它。你能帮我理解这部分代码吗?当一个类
的
方法还没有在类
中
定义时,我们如何调用
浏览 1
提问于2019-12-13
得票数 0
1
回答
Tensorflow 1.10 TFRecordDataset -恢复TFRecords
python
、
tensorflow
、
python-3.6
、
tensorflow-datasets
、
tensorflow-estimator
然而,这些文档还有很多需要改进
的
地方,我已经看到了一些
教程
/博客(我已经看到了),它们试图更深入,实际上只触及表面,或者重新散列现有的稀疏文档。对于在我
的
中考虑
的
演示数据--以及这里--我
编写
了一个不错
的
类,它需要: 具有n个通道
的
序列
(在本例
中
,它是基于整数
的
、长度固定且具有n个通道
的
序列
)。软标记类概率(在本例中有n个类
和
基于浮点数
的</
浏览 1
提问于2018-08-28
得票数 7
回答已采纳
1
回答
自定义丢失
函数
的
后端实现
python
、
machine-learning
、
neural-network
、
pytorch
、
backpropagation
我有一个有向量输出
的
神经网络Network。我不使用典型
的
损失
函数
,而是实现自己
的
损失
函数
,这是类
中
的
一种方法。我关心
的
主要问题是渐变。由于我采用了自己
的
自定义损失
函数
,是否需要对成本
函数
实现自己
的
梯度? 一旦我做了数学,我意识到,如果成本是J,那么J
的
梯度是一个相当简单
的
函数
,就网络
的
最后一层
的</e
浏览 1
提问于2021-05-05
得票数 1
回答已采纳
1
回答
如何在nn.LSTM
pytorch
中进行R2评分
python
、
pytorch
、
lstm
我试着用R2in nn.LSTM做损失
函数
,但是我找不到任何关于它
的
文档。我已经使用了来自
pytorch
的
RMSE
和
MAE loss。 我
的
数据是一个时间
序列
,而我正在做时间
序列
预测。这是我在数据训练中使用RMSE损失
函数
的
代码 model = LSTM_model(input_size=1, output_size=1, hidden_size=512, num_layers=2,loop_fn(mode, dat
浏览 741
提问于2021-01-22
得票数 0
回答已采纳
3
回答
pytorch
的
验证损失更快-RCNN
python
、
machine-learning
、
computer-vision
、
pytorch
、
object-detection
我目前正在使用从
pytorch
预先训练
的
更快
的
RCNN模型(就像torchvision
中
的
模型)
中
的
迁移学习在自定义数据集上进行对象检测。我可以在训练模式下运行model进行验证,如下所示:for images, targets in data_loader_val: val_loss_dict = model(images,
浏览 1
提问于2020-02-21
得票数 8
1
回答
如何用
pytorch
评估
和
获得前馈神经网络
的
精度
python
、
neural-network
、
deep-learning
、
pytorch
、
linear-regression
我开始使用
Pytorch
,目前正在做一个项目,我正在使用一个简单
的
前馈神经网络进行线性回归。问题是,我在
Pytorch
中
找不到任何可以让我获得Keras或SKlearn中线性回归模型
的
准确性
的
东西。在keras
中
,只需在编译
函数
中
设置metrics=["accuracy"]即可。我在
Pytorch
的
文档
和
官方网站上搜索了一下,但什么也没找到。这个API似乎不存在
浏览 16
提问于2019-10-06
得票数 1
1
回答
RNN
中
填充
和
掩蔽
序列
的
实现
python
、
rnn
、
pytorch
作为练习,我正在构建一个用于
序列
二进制分类
的
网络(
序列
是属于A型还是B型)。该网络由一个具有一个LSTM层
的
RNN组成,并在其之上形成一个输出分类
的
MLP。我将不同长度
的
序列
批量输入到网络
中
,这意味着我需要对
序列
进行填充,使其长度相等,并屏蔽网络
的
输出,使它们与原始
序列
相同长度。 在
PyTorch
中
实现填充/掩蔽
的
正确方法是什么?我读过
浏览 0
提问于2023-05-30
得票数 0
2
回答
如何在Tensorflow 2/keras自定义层中使用基于numpy
的
外部库
函数
?
deep-learning
、
neural-network
、
pytorch
、
tensorflow2.0
、
keras-layer
我正在尝试使用keras实现tensorflow 2
中
的
自定义层(它是从类层派生
的
层)。在
编写
调用
函数
时,我需要从只接受numpy数组
的
外部库调用方法。这是一个相当复杂
的
函数
,当然它不使用tensorflow
函数
。我
的
调用
函数
输入一个张量,将其转换为numpy (通过.numpy()
函数
),从另一个库调用外部方法,然后将numpy数组转换回张量。如果
浏览 2
提问于2020-10-23
得票数 0
回答已采纳
2
回答
计算机视觉变压器: ViT没有解码器吗?
computer-vision
、
transformer
、
attention-mechanism
v=TrdevFK_am4
的
一篇题为“图像值16X16字:用于图像识别的变形金刚”
的
论文那么ViT有一个更简单
的
体系结构?似乎编码器
的
输出是MLP
的
输入,用于分类任务。 此外,为了学习
的
目的,我也被推荐到这个回购https://github.com/lucidra
浏览 0
提问于2023-05-06
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
机器学习利器 PyTorch
使用PyTorch从零开始构建Elman循环神经网络
Github 2.2K星的超全PyTorch资源列表
95%PyTorch库都会中招的bug!特斯拉AI总监都没能幸免
一份超全的PyTorch资源列表
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券