腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
pytorch
模型
在
第一轮
后
返回
NANs
python
、
machine-learning
、
deep-learning
、
pytorch
、
backpropagation
这是我第一次写一个基于
Pytorch
的CNN。我终于让代码运行到了为第一批数据生成输出的地步,但在第二批数据中生成了
nans
。出于调试目的,我极大地简化了
模型
,但它仍然不能正常工作。这里显示的
模型
只是几个具有线性输出的完全连接的层。 我猜问题出在反向传播这一步,但我不清楚问题出在哪里,为什么。以下是
模型
的一个非常简化的版本,它仍然会产生错误: 数据加载器: batch_size = 36# note "rollaxis" to mo
浏览 72
提问于2019-10-19
得票数 4
1
回答
Pytorch
Softmax给出
nans
和负值作为输出
python
、
pytorch
、
softmax
我
在
我的
模型
末尾使用softmax。 然而,经过一些训练
后
,softmax给出了负的probability.In,我也遇到了一些情况下的
nans
概率。我
在
搜索中发现的一个解决方案是使用标准化的softmax…然而,我找不到任何关于这个的
pytorch
实现。请注意,我已经
在
使用torch.nn.utils.clip_grad_norm_(model.parameters(),40),以避免爆炸梯度 我使用的是
pytorch
1.6.0
浏览 180
提问于2020-09-09
得票数 3
回答已采纳
1
回答
修改
后
的
PyTorch
损失函数BCEWithLogitsLoss
返回
NaNs
python
、
pytorch
、
loss-function
、
cross-entropy
我试图从零开始实现一个定制的损失,基于
PyTorch
的 super
浏览 0
提问于2020-06-30
得票数 1
2
回答
在
PyTorch
中加载Torch7训练
模型
(.t7)
python
、
lua
、
pytorch
、
torch
、
pre-trained-model
大多数情况下,我依赖于预先训练好的
模型
。
在
Lua中,我使用torch.load函数来加载一个保存为torch .t7文件的
模型
。我对切换到
PyTorch
( )很好奇,所以我阅读了相关文档。我找不到任何关于加载预训练
模型
的机制的信息。我能找到的唯一相关信息是这个页面: 但是页面中描述的函数torch.load似乎加载了一个用pickle保存的文件。如果有人有更多关于
在
PyTorch
中加载.t7
模型
的信息,请在这里分享。
浏览 4
提问于2017-01-26
得票数 8
回答已采纳
1
回答
CNN与CTC损失
loss-function
、
resnet
、
transfer-learning
、
conv-neural-network
、
ctc
我想使用预先训练的CNN
模型
(ResNet50,VGG等)提取特征,并使用CTC损失函数来使用这些特征。 我想把它构建为一个文本识别
模型
。 有谁知道我该如何做到这一点吗?
浏览 19
提问于2020-04-13
得票数 0
1
回答
修剪
模型
后
删除
Pytorch
中的weight_orig
deep-learning
、
pytorch
、
pruning
在
Pytorch
中修剪
模型
后
,保存的
模型
包含修剪
后
的权重和weight_orig。这会导致修剪
后
的
模型
大小大于未修剪
后
的
模型
。有没有一种方法可以删除weight_orig并减小修剪
后
的
模型
大小?
浏览 9
提问于2020-11-07
得票数 0
3
回答
Keras如何用Adam优化器恢复训练
python
、
tensorflow
、
machine-learning
、
keras
我的
模型
需要运行多个时代才能获得良好的结果,使用v100
在
Google上只需几个小时。 然而,要赶上<e
浏览 0
提问于2019-06-02
得票数 6
1
回答
GRU损失降至0.9,但不会进一步下降,
PyTorch
python
、
deep-learning
、
pytorch
、
lstm
、
recurrent-neural-network
我用来进行GRU实验的代码。 import torchimport torch.nn.functional as F def __init__(self): self.gru = nn.GRU(2, 512, self.layers, bat
浏览 40
提问于2020-10-15
得票数 2
回答已采纳
1
回答
gluUnProject总是
返回
零
android
、
opengl-es
、
coordinates
当我的应用程序运行时,它准确地告诉我屏幕上的坐标,我知道这些坐标存储
在
我的渲染线程中,然后提取屏幕坐标。不幸的是,屏幕坐标似乎没有世界坐标的影响,世界坐标保持
在
零。我还记录了newcoords[]数组的每个部分,它们都
返回
一些内容,即NaN (不是数字),这是问题还是算法中更高的问题?
浏览 0
提问于2011-08-31
得票数 2
4
回答
找不到有效的cuDNN算法来运行卷积
pytorch
我
在
尝试运行前馈torch.nn.Conv2d时收到此消息,得到以下堆栈跟踪:+-----------------------------------------------------------------------------+ 我使用的是Python3.7,
Pytorch
1.5
浏览 1
提问于2020-04-28
得票数 6
1
回答
经过
PyTorch
训练的
模型
可以
在
GPU和TPU之间传输吗?
pytorch
、
gpu
、
tpu
在
使用图形处理器训练
PyTorch
模型
后
,我可以使用保存的权重在TPU上继续训练
模型
吗?
浏览 6
提问于2021-09-25
得票数 0
1
回答
二分类神经网络: Nan损失和NaN预测
python
、
keras
、
deep-learning
这个
模型
试图根据一个包含400个数字的数组来预测两个状态。
在
第一轮
训练中,
模型
从前+- 200个样本的损失开始,然后进入Nan损失。准确率保持
在
50%左右,当我打印测试集的预测时,它只预测NaN。我已经尝试检查数据集中的
NaNs
,但没有。我的
模型
是这样的: model = Sequential() model.add(LSTM(128, input_shape=(400,1), activation='relu', return_sequences
浏览 47
提问于2019-09-24
得票数 0
1
回答
PyTorch
、PyTorchModel
在
sagemaker.
pytorch
中的差异
pytorch
、
amazon-sagemaker
我正在尝试创建一个
模型
,使用火把
在
救世主。我尝试
在
sagemaker.
pytorch
中从sagemaker.
pytorch
导入
PyTorch
中部署使用-sagemaker.
pytorch
模块。但是,我想了解PyTorchModel
在
sagemaker.
pytorch
中的sagemaker.
pytorch
import PyTorchModel是什么。他们都有deploy()。,我们使用sagemaker.
py
浏览 2
提问于2019-08-22
得票数 2
2
回答
如何使用
PyTorch
在
预先训练的
模型
上添加新的层?(给出了Keras示例。)
python
、
keras
、
pytorch
、
vgg-net
、
pre-trained-model
喀拉斯:model = keras.applications.VGG19(include_top=False, weights="imagenet", input_shape=(img_width, img_height, 3))我加载VGG19预训练的
模型
,直到同一层与以前的
模型
,其中加载了Keras。())[:-2])[0] 加载
模型
后
,以下图
浏览 0
提问于2020-11-01
得票数 6
回答已采纳
1
回答
为什么
PyTorch
比滑雪板
模型
更快?
machine-learning
、
scikit-learn
、
random-forest
、
machine-learning-model
、
pytorch
我
在
一个有两个标签的10m大小的数据集上训练了一个RandomForest。用sklearn进行推断需要450 ms。但是,
在
将相同的
模型
转换为
PyTorch
后
,现在需要128 on的CPU推理。如果两者都运行在CPU上,那么为什么蜂鸟的
Pytorch
模型
比sklean
模型
更快呢? 我不明白蜂鸟对我的滑雪板
模型
做了什么来提高速度。
浏览 0
提问于2020-06-23
得票数 1
回答已采纳
1
回答
CNTK C# API支持ConvTranspose吗?
c#
、
convolution
、
cntk
我有一个定制的dnn
模型
,它是我
在
PyTorch
中定义和训练的,我试图将它部署到一个通过ONNX用C#编写的应用程序中。加载
模型
时,会出现以下错误:经过一些测试
后
,我发现只有当我将网络的上采样端(它使用转置卷积)
返回
时才会发生这种情况。Python页面显示一个convolution_transpose函数,但我
在
C# API中找不到。 谢谢!
浏览 0
提问于2018-09-18
得票数 0
回答已采纳
1
回答
是否可以
在
densenet169上执行量化,以及如何执行量化?
machine-learning
、
pytorch
、
artificial-intelligence
、
densenet
、
static-quantization
我一直试图对一个密集的
模型
进行量化,但没有成功。我一直
在
尝试实现
pytorch
后
的训练静态量化。
Pytorch
有其他型号的量化版本,但没有用于密度集的版本。是否可以量化密集的体系结构。我一直
在
寻找如何将量化应用于预先训练的
模型
的教程,但我没有取得任何成功。
浏览 40
提问于2022-11-29
得票数 0
1
回答
UnpicklingError:遇到load persistent id指令,但未指定persistent_load函数
python
、
serialization
、
deep-learning
、
pytorch
、
pickle
在这个文件中,我加载了深度学习
模型
的pickle文件,该
模型
是使用
PyTorch
构建和训练的。
在
api.py中,下面给出的函数是最重要的。
浏览 74
提问于2021-02-24
得票数 4
回答已采纳
1
回答
在
Pytorch
中调用optimizer.step之后,一些网络参数可能成为nan的主要原因是什么?
python
、
pytorch
我正试图理解为什么
在
调用optimizer.step()之后,
Pytorch
神经网络中的一两个参数偶尔会变成nan。
在
调用.backward()之后和调用优化器之前,我已经检查了梯度,它们既不包含
nans
,也不很大。我正在做渐变剪裁,但我不认为这是负责的,因为梯度
在
裁剪
后
看起来仍然很好。我到处都在用单精度浮标。不幸的是,代码太长,无法在这里复制,我无法
在
一个较小的例子中复制这个问题。谢谢!
浏览 0
提问于2021-12-04
得票数 0
回答已采纳
1
回答
回转面变压器中转换型放电筒
模型
的合理加载
python
、
tensorflow
、
machine-learning
、
pytorch
、
huggingface-transformers
我使用以下功能将一个经过预先训练的tf
模型
转换为
pytorch
。)def vectorize_sentence(text): v = v + output[0][0][i].numpy() return vector 然而,
在
加载
模型
浏览 3
提问于2020-08-29
得票数 0
点击加载更多
相关
资讯
在 PyTorch 中使用梯度检查点在GPU 上训练更大的模型
美国太空军的X-37B空天飞机在轨运行434天后返回地球
马克思的SpaceX商业载人飞船在国际空间站停留63天后成功返回地球
DeepSeek在开源平台上线了升级后的DeepSeek-V3模型
闻其声而知雅意,基于Pytorch(mps/cpu/cuda)的人工智能AI本地语音识别库Whisper(Python3.10)
热门
标签
更多标签
云服务器
ICP备案
即时通信 IM
云点播
云直播
活动推荐
运营活动
广告
关闭
领券