PyTorch CNN从不收敛(疑似实现问题)

我很难让这个网络按预期的方式工作。我已经尝试了这个模型的许多次迭代，但仍然无法获得合理的误差(它永远不会拟合，甚至不能使其过度拟合)。作为参考，有12个形状为49、9的输入“图像”(它们实际上是河口9个站点的水面高程)和12个形状为1、9的标签。 net = [] def __init__(self, kernel_size): mid_size = (49*4

浏览 16提问于2019-11-21得票数 0

回答已采纳

1回答

为什么正交权值初始化对PPO如此重要？

我已经实现了PPO来解决Atari环境。有很长一段时间，我不明白为什么我的模型不能像其他开源解决方案那样快速地收敛。最后，它归结为这个单一的权值初始化(在PyTorch)为CNN：为什么正交初始化比PPO的xavier初始化要好得多？

浏览 0提问于2019-12-16得票数 3

回答已采纳

2回答

Pytorch Adam优化器的笨拙行为？重启会更好吗？

、、、

我正试着用Pytorch训练CNN的文本分类器。我像这样使用Adam优化器。optimizer = torch.optim.Adam(CNN_Text.parameters(), lr=args.lr)所以，我实现了学习率衰减， If curr_loss > val_loss: prev_lr = param_group['lr'] param_group我尝

浏览 11提问于2018-12-06得票数 1

1回答

您能将opencv SIFT与tensorflow模型集成吗？

、、、

我正在尝试创建一个CNN，但使用SIFT算法而不是任何池化层。问题是我似乎无法在Tensorflow或PyTorch中找到该算法的任何Python实现。我所见过的唯一的实现是使用opencv。是否可以使用opencv SIFT实现作为Tensorflow CNN模型中的层？如果是这样的话，你将如何创建它？

浏览 9提问于2020-08-08得票数 1

回答已采纳

1回答

Keras到PyTorch

、、

我正在将Keras实现转换为PyTorch实现。在完全转换之后，我的模型收敛得不够快，尽管损失似乎在减少。当我追溯我的脚步时，我注意到我的嵌入层有点奇怪。Keras中的嵌入层中：对于每个批处理，我得到的值比在PyTorch中要“窄”得多，这会影响我的收敛吗？现在，如果我将相同的x传递到PyTorch嵌入层中： torch

浏览 3提问于2022-03-09得票数 1

1回答

什么是正确的Pytorch实现？

、、、

我在“火把”中读到关于RNN的文章: RNN - PyTorch 1.12文档.return torch.zeros(1, self.hidden_size) rnn = RNN(n_letters, n_hidden, n_categories) 为什么实现的函数与方程不同

浏览 0提问于2022-06-30得票数 0

1回答

我正在尝试用PyTorch Fast Dense Feature Extractor实现这篇文章，但我在将他们提供的火炬实现示例转换成PyTorch时遇到了麻烦。到目前为止，我的尝试有一个问题，即当向特征映射添加额外的维度时，卷积权重与特征形状不匹配。这在Torch中是如何管理的(从他们的实现来看，Torch似乎并不关心这一点，但PyTorch关心)。我的代码：https://gist.github.com/system123/c

浏览 36提问于2019-03-13得票数 1

回答已采纳

1回答

DQN在不同的计算机上的行为不同。

、、、、

我有一个或多或少标准的DQN解决Atari“突围”的实现(来自Coursera强化学习课程)，它在不同的计算机上的表现完全不同：我已经查过了：我的笔记本电脑，即聚合，使用旧的CPU (将Tensorflow限

浏览 0提问于2019-05-07得票数 2

2回答

PyTorch中多输出回归问题的RMSE损失

、、、、

我正在训练CNN架构，用PyTorch来解决回归问题，其中我的输出是20个值的张量。我计划用RMSE作为模型的损失函数，并尝试使用PyTorch的nn.MSELoss()，并使用torch.sqrt()作为平方根，但在得到结果后感到困惑，我会尽力解释原因。很明显，对于批处理大小的bs，输出张量的维度将是[bs , 20].I试图实现的，并由我自己实现RMSE函数： def loss_function (predicted_x , target ):如何用nn.MSELoss()<e

浏览 5提问于2020-05-24得票数 6

回答已采纳

1回答

Doest TensorFlow 2支持不同CPU核上的多处理？

、、、

我被困在使用A3C 2实现异步优势Actor-批评者( TensorFlow )。问题定义：用于A3C实现，我必须创建一批工作人员(与CPU核心的数量一样多)和一个主处理器。所有的工人和主人将为他们自己创建一个独特的CNN模块的副本。当每个工人必须优化主人的CNN模块，并将其重量与主人的CNN的权重同步时，问题就出现了。我通过多线程实现了这一点，没有任何问题，但是当multiprocessing出现时，python既不能序列化权重，

浏览 0提问于2020-06-24得票数 3

1回答

如何使用google inception模型对DNA或蛋白质序列数据集进行分类？

、、、

我试着用its序列将蛋白质归入它们的家族。我可以在这个目的上使用深度卷积模型吗，即使它们使用图像的RGB3输入度量？是否有任何特定的方法来转换图像以外的数据集，以便使用这些模型进行分类。我是人工神经网络的新手，非常感谢您的建议。

浏览 4提问于2020-03-08得票数 2

1回答

如何在nn.Module中安全地实现Hadamard (元素级)产品？

、、

我需要在我的层的一些结果上执行一个元素级的产品，但是(强调)我不需要一个参数化的层来实现这一点，我需要将它放在几个参数化层之间。如何在不破坏梯度或导致其他问题的情况下，在模型中实现按元素划分的产品？

浏览 7提问于2022-10-29得票数 0

2回答

基于卷积神经网络的语言翻译

、、、、

是否有(不太复杂)只使用CNN而没有RNN/LSTM?你会在Keras有一个例子吗？

浏览 0提问于2020-02-28得票数 1

2回答

用于实现CNN的Tensorflow (或Keras)与Py火炬与其他ML库

、、、、

我正在研究如何为一个研究问题实现一个卷积神经网络。我听说过像Pytorch和Tensorflow这样的深度学习库，并希望获得一些关于它们适合我的需求的更多信息。但是似乎有更多关于Tensorflow的教程，特别是关于创建CNN的教程。在确定哪种图书馆最适合我的需求时，我应该问自己什么类型的问题？

浏览 0提问于2018-12-19得票数 4

回答已采纳

1回答

带值向量回归模型的pytorch损失函数

、、、

我正在训练CNN架构，用PyTorch来解决回归问题，其中我的输出是25个值的张量。输入/目标张量可以是所有零，也可以是σ值为2的高斯分布。我的问题是如何为模型设计一个损失函数，有效地学习25个值的回归输出。然而，有时网络很难收敛，特别是当有大量的样本都是“零”时，网络就会输出25个小值的向量。我的问题是，还有什么其他的损失我们可以尝试吗？

浏览 0提问于2021-07-13得票数 2

1回答

非平方图像作为YOLOv3的输入

、、、、

我目前使用的网络实现(由ultralytics 1实现的pytorch实现)以正方形图像作为输入。大多数CNNs的实现似乎都使用正方形图像作为网络体系结构的输入。我的问题是:如果我手动将网络架构更改为非平方大小(例如1000x400px)，yolo还能工作吗？为什么艺术中的大多数CNN都是用正方形图像工作的？

浏览 60提问于2019-03-12得票数 1

3回答

字符级别CNN - 1D或2D

、、、、

我想在毕道尔实现一个角色级别的CNN。考虑到输入的维度在技术上都能正常工作，我还看到了这两个版本的实现。所以我想知道哪种方法更好。这两种方法中的一种比另一种有特殊的优势吗？

浏览 0提问于2019-03-26得票数 1

回答已采纳

1回答

在问答中实现注意力池网络的问题

、、

我正在遵循的论文来实现和关注池化网络来构建一个问答系统。在2.1章中，它谈到了CNN层：其中，q_emb是使用word2vec嵌入每个标记(单词)的问题。d是单词嵌入的维度，M是问题的长度。以类似的方式，a_emb是用shape (d, L)嵌入的答案。我的问题是:卷积是如何完成的，怎么可能两次操作的W_1和b_1是相同的？目前，我已经在PyTorch中实现了这个操作： ### Input is a tensor of shape (batch_size,

浏览 0提问于2018-09-27得票数 4

2回答

在神经网络上使用model.eval()每次对非常不同的输入产生相同的输出

、、、、

我有一个简单的网络，用pytorch实现， #编辑:为了提供更多关于我的问题的信息，我试图从零开始创建一个类似于yolo的网络。这是我使用的数据集

浏览 5提问于2021-07-02得票数 2

回答已采纳

2回答

CNN应该概括到数据中任意的位置吗？

、、、

我们的想法是把这看作是一个图像分类问题。当训练数据以相同频率为中心的所有示例(即几百赫兹以内)时，该模型表现得特别好：CNN未能正确分类超出训练数据频率范围的新例子：模型的细节和假设：CNN的模型不应该推广到不属于同一频率范围(即以中间为中心)的新例子应该被识别为正确的类别吗？我是否还需要采取其他步骤，无论是在模型中还是在培训数据中？

浏览 0提问于2023-01-07得票数 1

回答已采纳

点击加载更多