pytorch全连接层_pytorch 全连接层_pytorch 三层全连接网络 - 腾讯云开发者社区

来自PyTorch's official tutorial的示例具有以下ConvNet。我的理解是，输出层使用softmax来估计图像对应的数字。为什么代码没有softmax层或全连接层？ model = nn.Sequential( nn.Conv2d(1, 16, kernel_size=3, stride=2, padding=1), nn.ReLU(), nn.Conv2d(16, 16, kernel_size=3, stride=2, padding=1), nn.ReLU(), nn.Conv2d(16, 10, kernel_s

浏览 93提问于2020-04-11得票数 1

1回答

具有未展平输入的完全连接的图层

、、

(batch_size, 70, 2, 2) -> Linear(2, 2) (batch_size, 140, 2) -> Linear(2, 2) (batch_size, 280) -> Linear(280, 2) 有人能给我解释一下全连接层是如何处理非平面化输入数据的吗？我真的不知道如何思考> 2D矩阵乘法。以上都是等价的吗？(Linear是pytorch中的全连接模块)

浏览 13提问于2019-01-02得票数 0

1回答

连续包字(CBOW)网络体系结构？

、、、

查看word2vec，比如嵌入，我在PyTorch的网站上找到了这练习，这促使读者在PyTorch中实现CBOW网络。我的问题是实现这个CBOW网络的体系结构。以下是我的理解:从多个来源来看，网络似乎应该有一个单独的隐藏层(有权重，没有偏见)，它连接到激活层(大多数消息来源说是softmax)。然后网络将被训练将一个热编码的单词映射到可能的上下文中。最后，将隐层的权值作为嵌入矩阵。我的困惑是:我看到了许多解决方案，比如这是谷歌的第一个，其中有多个隐藏层。在这个例子中，有一个嵌入层，并且有一个由relu连接的两线性层。下面是另一个使用一个线性层的方法。我的问题是：培训CBOW编码的合适

浏览 0提问于2020-12-08得票数 1

2回答

如何使用线性激活函数

、

在Keras中，我可以创建任何具有线性激活函数的网络层，如下所示(例如，采用完全连接的层)： model.add(keras.layers.Dense(outs, input_shape=(160,), activation='linear')) 但我在PyTorch文档中找不到线性激活函数。ReLU不合适，因为我的样本中有负值。如何在PyTorch中创建具有线性激活函数的层？

浏览 3提问于2021-02-20得票数 0

2回答

如何使用动态输入创建用于图像分类的CNN

、

我想在pytorch中创建一个用于二进制图像分类的完全卷积网络，它可以采用动态输入图像大小，但从概念上讲，我不太理解将最终层从完全连接层更改为卷积层的想法。Here和here 都表示，这可以通过使用1x1卷积来实现。假设我有一张16x16x1的图像作为CNN的输入。经过几次卷积后，输出为16x16x32。如果使用完全连接的层，我可以通过创建16*16*32权重并将其提供给单个神经元来产生单值输出。我不明白的是，如何通过应用1x1卷积来获得单值输出。难道你最终不会得到16x16x1的输出吗？

浏览 25提问于2019-03-09得票数 0

回答已采纳

1回答

在pytorch中conv的默认权重初始化器是什么？

、

问题展示了如何在Pytorch中初始化权重。但是，Conv和Dense在Pytorch中的默认权重初始化器是什么？Pytorch使用什么发行版？

浏览 0提问于2018-04-13得票数 15

回答已采纳

2回答

如何在Tensorflow或Pytorch中实现特定于位置的卷积滤波器？

、、、、

我想实现一个卷积层，每个输出位置都有一个不同的卷积滤波器。具体来说，考虑输出为16*16*128 (W *H* C)的情况。我们有16*16个过滤器，而不是3*3*128个过滤器；每个过滤器的大小为3*3*128。这样，参数的数量就不会太多。在中也有类似的想法，但我找不到特定于位置的过滤器的实现。我的问题是，如果我们想要一个特定于位置的卷积滤波器，我该如何在Tensorflow或Pytorch中实现它？我是否需要编写自己的操作，或者有一些聪明的方式来使用所提供的函数？如果我必须写一个OP，有什么技巧可以很容易地实现这个想法吗？如有任何帮助，我们不胜感激！

浏览 0提问于2018-10-03得票数 3

4回答

前馈网络中的稀疏连接-流量还是火炬？

、、、

我想要建立稀疏的前馈网络，在Pytorch和Tensorflow中，也就是说，每个节点只连接到下一层的k个神经元数，其中k严格地小于下一层的节点总数。但是，到目前为止，我看到的所有教程/示例都是关于完全连接的前馈网络的。有没有办法在这些工具中构建这样稀疏的网络？

浏览 0提问于2018-05-10得票数 1

1回答

Pytorch Siamese NN和BERT用于句子匹配

、、、、

我正在尝试使用pytorch构建一个暹罗神经网络，其中我输入BERT单词嵌入，并试图找出两个句子是否相似(想象重复的帖子匹配，产品匹配等)。这是一个模型： class SiameseNetwork(torch.nn.Module): def __init__(self): super(SiameseNetwork, self).__init__() self.brothers = torch.nn.Sequential( torch.nn.Linear(512 * 768, 512), torch.nn.

浏览 12提问于2021-03-18得票数 0

回答已采纳

2回答

是否可以在PyTorch中使用LSTMCells模块实现多层LSTM？

、、

在PyTorch中有一个LSTM模块，除了输入序列、隐藏状态和单元状态之外，它还接受一个num_layers参数，该参数指定我们的LSTM将有多少层。然而，还有另一个模块LSTMCell，它只是将输入大小和隐藏状态的数量作为参数，没有num_layers，因为这是多层LSTM中的单个单元。我的问题是，怎样才能正确地将LSTMCell模块连接在一起，以达到与使用num_layers > 1的多层LSTM相同的效果

浏览 54提问于2018-01-03得票数 4

回答已采纳

1回答

使用Pytorch的*list、.children()和nn.sequential创建的模型会产生不同的输出张量

、、、、

我目前正在尝试在我的模型中使用预先训练好的DenseNet。我遵循这个教程：https://pytorch.org/hub/pytorch_vision_densenet/，它工作得很好，输入为1,3244244，它返回1,1000张量，与预期完全相同。然而，目前我正在使用此代码将预训练的Densenet加载到我的模型中，并将其用作“特征提取”模型。这是init函数中的代码 base_model = torch.hub.load('pytorch/vision:v0.10.0', 'densenet121', pretrained=True) self.ba

浏览 251提问于2021-10-24得票数 0

回答已采纳

1回答

如何在CNN中训练卷积内核？

、、、

在CNN中，卷积运算将核矩阵‘卷积’在输入矩阵上。现在，我知道了完全连接层是如何利用梯度下降和反向传播进行训练的。但是内核矩阵是如何随时间变化的呢？正如前面提到的，有多种初始化内核矩阵的方式。但是，我有兴趣知道它是如何训练的？如果它也使用反向传播，那么是否有任何论文详细描述了培训过程？也提出了类似的问题，但没有得到回答。

浏览 17提问于2018-08-20得票数 6

回答已采纳

2回答

如何在PyTorch中实现时间分布密集层

、

在一些分析时态数据(如音频或视频)的深度学习模型中，我们使用了一个“时间分布密集”层(TDD)。这所创造的是一个完全连接(密集)层，它分别应用于每一个时间步骤。在Keras中，这可以使用来完成，这实际上要稍微一般一些。在PyTorch，已经有几年了。如何在中手动实现的时间分布密集性？

浏览 13提问于2020-04-22得票数 3

回答已采纳

1回答

什么是完全连接层加性偏压？

我将特别使用PyTorch，但我怀疑我的问题适用于深度学习&CNN，因此我选择在这里发布。从这段视频开始，然后： https://www.youtube.com/watch?v=JRlyw6LO5qo&t=1370s George .解释说，PyTorch函数torch.nn.Linear将bias参数设置为False，然后将torch.nn.Linear功能等效(当然不包括GPU支持)到下面的NumPy行： x = np.dot(weights, x) + biases 注意，在torch.nn.Linear中，默认情况下偏差设置为True： https://pytorch

浏览 0提问于2021-06-20得票数 2

回答已采纳

2回答

在Pytorch中创建自定义连接/非完全连接层。

、、、、

如图所示，它是一个具有神经网络的3层，即输入层、隐藏层和输出层。我想设计神经网络(在PyTorch中，只是拱)，其中输入的隐藏层是完全连接的。但是，从隐层到输出层，隐层的前两个神经元应该连接到输出层的第一个神经元，第二个神经元应该连接到输出层的第二个神经元，等等。应该如何设计呢？ from torch import nn layer1 = nn.Linear(input_size, hidden_size) layer2 = ??????

浏览 11提问于2022-06-23得票数 3

1回答

PyTorch LSTM辍学与Keras辍学

、、、

我正在尝试将我的顺序Keras网络移植到PyTorch。但我在LSTM单位遇到麻烦了 LSTM(512, stateful = False, return_sequences = True, dropout = 0.5), LSTM(512, stateful = False, return_sequences = True, dropout = 0.5), 我应该如何用PyTorch来表述这个问题呢？尤其是辍学在PyTorch中的工作方式与在Keras中的工作方式非常不同。

浏览 2提问于2020-06-09得票数 1

2回答

pytorch attention seq2seq教程中的错误？

、

我正在用Pytorch编写序列神经网络的序列。在official Pytorch seq2seq tutorial中，有一个注意力解码器的代码，我不能理解/认为可能包含错误。它通过连接输出和此时的隐藏状态来计算每个时间步的注意力权重，然后乘以一个矩阵，得到一个大小等于输出序列长度的向量。注意，这些注意力权重不依赖于编码器序列(在代码中命名为encoder_outputs )，我认为它应该依赖于编码器序列。此外，the paper cited in the tutorial还列出了三种不同的得分函数，可用于计算注意力权重(本文的3.1节)。这些函数都不是简单地连接和乘以一个矩阵。因此，在

浏览 37提问于2019-05-03得票数 1

1回答

是否有一个PyTorch等价于tf.custom_gradient()？

、、

我是PyTorch的新手，但对TensorFlow有丰富的经验。我想修改图中的一小部分的梯度:仅仅是单层激活函数的导数。使用tf.custom_gradient可以轻松地在Tensorflow中实现这一点，它允许您为任何函数提供定制的梯度。我想在PyTorch中做同样的事情，我知道您可以修改反向()方法，但这需要重写forward()方法中定义的整个网络的导数，而我只是想修改图中一小部分的梯度。在PyTorch中有类似于PyTorch()的东西吗？谢谢!

浏览 3提问于2022-03-03得票数 2

回答已采纳

3回答

ResNet族分类层激活函数

、、

我使用的ResNet18预训练模型，将用于一个简单的二值图像分类任务。但是，包括PyTorch本身在内的所有教程都使用nn.Linear(num_of_features, classes)作为最终的完全连接层。我不明白的是，该模块的激活函数在哪里？另外，如果我想使用sigmoid/softmax，怎么办？谢谢你提前帮忙，我对毕道士有点陌生。

浏览 7提问于2021-02-16得票数 1

回答已采纳

1回答

如何在不破坏反向传播的情况下为pytorch变量赋值？

我有一个pytorch变量，用作模型的可训练输入。在某些情况下，我需要手动重新分配此变量中的所有值。如何才能在不中断与损失函数的连接的情况下做到这一点？假设当前值是[1.2, 3.2, 43.2]，我只是想让它们变成[1,2,3]。编辑在我问这个问题的时候，我还没有意识到PyTorch没有像Tensorflow或Keras那样的静态图形。在PyTorch中，训练循环是手动完成的，您需要调用每个训练步骤中的所有内容。(不存在占位符+静态图的概念，用于稍后提供数据)。因此，我们不能“打破图形”，因为我们将使用新的变量再次执行所有进一步的计算。我担心的是在Keras中发生的问题，而不是

浏览 1提问于2018-12-18得票数 9

回答已采纳

1回答

Pytorch: Numpy数组

、

在使用pytorch时，我可以使用numpy数组吗？我正在将一段代码从tensorflow转换为pytorch，代码在计算过程中使用numpy数组。在计算过程中，我可以将输入保持为numpy数组吗?还是必须将它们转换为torch张量？

浏览 0提问于2021-07-13得票数 0

1回答

sess.run(层)返回什么？

、

我试着四处寻找，但奇怪的是，我找不到类似的东西。假设我有几个完全连接的层： fc_1 = tf.contrib.layers.fully_connected(fc_input, 100) fc_2 = tf.contrib.layers.fully_connected(fc_1, 10) fc_3 = tf.contrib.layers.fully_connected(fc_2, 1) 当我用sess.run(...)运行这些数据时，我会得到一个张量。这个张量是什么？是重量吗？梯度？对于我们给出的所有类型的层，sess.run会返回它吗？

浏览 4提问于2018-04-13得票数 0

回答已采纳

1回答

DCGAN发生器工程中的困惑与重塑

、

我最近一直在研究DCGAN。我试着跟随pytorch.org DCGAN教程的实现，发现它(表面上)缺乏项目&重塑层，这在图表中是存在的： 📷 这让我非常困惑，所以我搜索了其他实现，并找到了tensorflow.org DCGAN教程，这进一步使我感到困惑。ArXiv的原始论文明确指出：值得注意的是，没有使用完全连接或池层。但是tensorflow官方教程正在使用完全连接(密集)层来重塑！我也找到了参考DCGAN实现，但没有帮助，因为我不能理解lua脚本。因此，问题是:从DCGAN文件中正确地实现发电机网络是什么？我应该省略项目和重塑或使用密集层吗？

浏览 0提问于2022-10-02得票数 1

2回答

PyTorch CNN线性层在conv2d后的形状

、、

我试着学习PyTorch，并遇到了一个教程，其中CNN的定义如下， class Net(Module): def __init__(self): super(Net, self).__init__() self.cnn_layers = Sequential( # Defining a 2D convolution layer Conv2d(1, 4, kernel_size=3, stride=1, padding=1), BatchNorm2d(4),

浏览 1提问于2021-01-31得票数 1

回答已采纳

2回答

保分辨率全卷积网络

、

我对ML和Pytorch还不熟悉，我有以下问题：我在Pytorch中寻找一个完全卷积的网络架构，这样输入将是一个RGB映像(HxWxC或480x640x3)，输出将是一个单通道映像(HxW或480x640)。换句话说，我正在寻找一个网络，它将保留输入(HxW)的分辨率，并将释放通道维度。我遇到的所有网络(ResNet，Densenet，.)结束一个完全连接的层(没有任何上采样或反褶积)。这是有问题的，原因有二：我受限于输入大小(HxWxC)的选择。这与我期望得到的输出(单通道图像HxW)无关。我遗漏了什么？为什么会有FC层？为什么在特征提取之后没有上采样，或者一些反褶积

浏览 1提问于2019-12-20得票数 0

回答已采纳

1回答

微调的正确方法--把一个完全连接的层训练成一个单独的步骤

、

我在caffenet中使用微调，它工作得很好，但是我在Keras 关于微调的博客中读到了这篇文章(他们使用经过训练的VGG16模型)： “为了进行微调，所有层都应该从经过适当训练的权重开始:例如，你不应该把一个随机初始化的完全连接的网络放在一个预先训练过的卷积基础上。这是因为随机初始化的权值引发的大梯度更新会破坏卷积基中的学习权重。在我们的情况下，这就是为什么我们首先训练顶级分类器，然后才开始与它并排微调卷积权。” 因此，作为微调的另一步，它们在全连通层(“瓶颈特征”)之前保存最后一层的输出，然后对这些特征进行“小的全连通模型”的训练，然后将新训练的全连通层置于整个网络的顶部，并训练“最后的卷

浏览 0提问于2017-03-20得票数 2

1回答

线性层的PyTorch和Chainer实现-它们是等价的吗？

、、、

我想使用一个线性的，完全连接的层作为我的网络的输入层之一。输入具有形状(batch_size、in_channels、num_samples)。它是建立在塔卡创的论文：，消除婚前部分。在我看来，似乎Chainer和PyTorch有不同的线性层实现--他们真的在执行相同的操作还是我误解了什么？在PyTorch中，线性层的行为遵循文档:根据，输入和输出数据的形状如下：输入：(N，∗，in_features)其中*表示任意数量的附加尺寸输出：(N，∗，out_features)，其中除最后一个维度外，所有维度都与输入的形状相同。现在，让我们尝试在py手电筒中创建一个线性层并执行操作。

浏览 1提问于2019-05-08得票数 1

回答已采纳

1回答

如何利用火把多头注意力进行分类任务？

、、、、

我有一个数据集，其中x形状是(10000,102300)，例如(样本，特征长度，尺寸)和y(10000)，这是我的二进制标签。我想使用多头注意力使用PyTorch。我从PyTorch上看到了文档，但没有解释如何使用它。如何使用我的数据集进行分类使用多头注意力？

浏览 3提问于2022-09-30得票数 0

1回答

使用Pytorch中的预训练模型进行语义分割，然后使用我们自己的数据集仅训练完全连接的图层

、

我正在学习Pytorch，并试图理解这个库是如何进行语义分割的。到目前为止，我所理解的是，我们可以在pytorch中使用预先训练好的模型。我找到了一篇在.eval()模式下使用该模型的文章，但我还没有找到任何关于在我们自己的数据集上使用这种模型进行训练的教程。我有一个非常小的数据集，我需要迁移学习来获得结果。我的目标是只用我自己的数据训练FC层。在Pytorch中如何在不使用OOP或如此多的.py文件使代码复杂化的情况下实现这一点。我很难在github中弄清楚这样的repos，因为当涉及到OOP时，我不是最熟练的人。直到最近，我一直在使用Keras进行深度学习，在那里一切都很简单和直接。我在

浏览 27提问于2019-12-13得票数 0

1回答

如何创建一个1到1的前向层？

、、

我熟悉一个完全连接的层，但是如何在PyTorch中创建一个只有1到1的自定义层呢？也就是说，每个神经元只连接到另外一个神经元。例如:1层神经元: a，b，c 第2层神经元d，e，f 联系：阿-d b-e c-f

浏览 2提问于2021-02-24得票数 0

回答已采纳

1回答

全连通层的尺寸

、

? 我不了解全连接层的面片大小和输入大小。为什么第一个连接层有3个维度的输入？谢谢

浏览 54提问于2020-10-27得票数 1

2回答

由pytorch模型转换而来的coreML模型给出了错误的预测概率

、、、、

我有一个pytorch二进制分类模型，我将其转换为coreML。我分别使用下面的教程/文档https://coremltools.readme.io/docs/pytorch-conversion和https://github.com/onnx/onnx-docker/blob/master/onnx-ecosystem/inference_demos/resnet50_modelzoo_onnxruntime_inference.ipynb通过onnx直接和间接地转换了我的模型。对于从PyTorch转换而来的原始pytorch和onnx模型，softmax函数之前的输出和概率类似。但是通

浏览 75提问于2020-10-25得票数 0

1回答

在PyTorch中为嵌入层分配自定义权重

、、、

PyTorch的nn.Embedding支持只为特定值手动设置嵌入权重吗？我知道我可以像这样设定整个嵌入层的权重- emb_layer = nn.Embedding(num_embeddings, embedding_dim) emb_layer.weights = torch.nn.Parameter(torch.from_numpy(weight_matrix)) 但是，PyTorch是否提供了任何简洁有效的方法来为一个特定的值设置嵌入权值？类似于emb_layer.set_weight(5) = torch.tensor([...])，只为值"5“手动设置嵌入吗？

浏览 10提问于2022-05-13得票数 0

回答已采纳

1回答

匹配PyTorch w/ CNTK (VGG on CIFAR)

、、、、

我试图了解PyTorch是如何工作的，并希望复制CNN关于CIFAR的简单培训。脚本经过168秒的训练(10次)后，达到了0.76的精度，这与我的脚本类似( 153秒后的0.75精度)。然而，我的脚本远远落后于0.71的准确性和354秒。我明白，由于随机权初始化等原因，我会得到精度上的差异。然而，不同框架之间的差异要比框架内的差异大得多，在运行之间随机初始化。我能想到的原因是： MXNet和CNTK被初始化为xavier/glorot制服；不确定如何在PyTorch中做到这一点，因此可能将权重初始化为0。默认情况下，CNTK进行梯度裁剪；不确定PyTorch是否具有等效的也

浏览 7提问于2017-08-17得票数 1

1回答

如何在BertForSequenceClassification之上添加额外的致密层？

、、

我想在分类层(我使用的是PyTorch lightning)之前添加一个额外的层(和dropout)，最好的方法是什么？

浏览 62提问于2021-05-05得票数 0

回答已采纳

1回答

如何在pytorch中将CNN模型转换为宽卷积？

我正在学习CNN，我想用pytorch来改变CNN的宽卷积模型，谁能帮上忙？ self.conv23 = nn.Conv2d(Ci, len(Ks) * Co, (3, Co), padding=1) Traceback (most recent call last): File "E:/workspace/pycharmworkspace/cnn-text-classification-pytorch-update/main.py", line 137, in <module> train.train(train_iter, dev_iter, cn

浏览 8提问于2017-07-04得票数 0

1回答

当修改一个预先训练的模型时，旧的重量是否被重新初始化？

、、、

我在修改一个预先训练好的有效的网络模型。我这样做是为了：创建默认模型，加载imagenet权重. 然后，，更改第一层中的信道数，删除几个层，同时添加几个. from efficientnet_pytorch import EfficientNet from efficientnet_pytorch.utils import Conv2dStaticSamePadding PATH = "../input/efficientnet-pytorch/efficientnet-b0-08094119.pth" model = EfficientNet.from_name('

浏览 2提问于2021-07-27得票数 1

回答已采纳

1回答

如何定义神经元网络？

、、

所以我们想要一个随机的类似大脑的神经元混乱。意思：我们有AxB输入和CxD输出。我们希望K(其中K >= CxD)神经元随机连接。，以便所有K神经元至少连接到至少一个AxB输入、和所有K神经元连接到至少一个CxD输出。类似的东西(这里是AxB=5，K=4，CxD=2)：神经元应该做的操作是加权和+一些减少，如LeakyReLu。因此，人们可以想象，当连接随机控制，使连接被定位在图像补丁相似的CNN层，它可以产生无止境的结果。一个人如何在PyTorch中做这样的事情(一个接一个地处理神经元)？

浏览 2提问于2020-10-24得票数 0

回答已采纳

1回答

从“`pytorch预培训-bert`”迁移到“`pytorch变压器”关于模型()输出的问题

、、、

我很难将代码从pytorch_pretrained_bert迁移到pytorch_transformers。我试着做一个余弦相似练习。我想提取12个隐藏层中第二个到最后一个的文本嵌入值。 import torch from pytorch_pretrained_bert import BertTokenizer, BertModel #from pytorch_transofmers import BertTokenizer, BertModel import pandas as pd import numpy as np model = BertModel.from_pretrained(

浏览 3提问于2020-02-21得票数 0

回答已采纳

6回答

了解最大池化层之后的完全连接层的尺寸

、、

在下面的图表(架构)中，4096个单元的(完全连接的)密集层是如何从维度256x13x13的最后一个最大池层(在右侧)派生出来的？不是4096，不应该是256*13*13=43264吗？

浏览 1提问于2017-03-11得票数 21

2回答

如何在pytorch中从预先训练好的模型创建子模型，而不必重写整个架构？

、、、

因此，我一直致力于Pytorch中的神经样式转换，但我被困在这样一个点上，即我们必须通过有限数量的层来运行输入图像，并将样式损失降至最低。长话短说，我想在Pytorch中找到一种方法来评估架构不同层的输入(我使用的是vgg16)。我已经看到这个问题在keras中得到了非常简单的解决，但我想看看pytorch中是否也有类似的方法。 from keras.applications.vgg16 import VGG16 model = VGG16() model = Model(inputs=model.inputs, outputs=model.layers[1].output)

浏览 29提问于2021-02-05得票数 1

1回答

神经网络层激活的可视化

、

张量流或角的特征可视化很容易，可以在这里找到。或如何在火把里做这件事？我使用PyTorch和预先训练的resnet18模型。我只需要输入图像并为特定的层(例如Layer2.0.卷积2)获得激活。在预训练模型中指定了Layer2.0卷积2。简单地说，如何将一个代码链接到PyTorch？如何获取resnet18 PyTorch中的特定层以及如何获得输入图像的激活。我在tensorflow中尝试过这个，它成功了，但没有PyTorch。

浏览 2提问于2019-11-24得票数 3

回答已采纳

7回答

PyTorch RuntimeError: DataLoader工作者(Pid)15332意外退出

、、

我是PyTorch的初学者，我只是在尝试一些示例。但由于以下错误，我似乎无法运行“super_resolution”程序： RuntimeError: DataLoader worker (pid(s) 15332) exited unexpectedly 我在网上搜索，发现有些人建议将num_workers设置为0。但是，如果我这样做，程序就会告诉我，我的内存用完了(无论是CPU还是GPU)： RuntimeError: [enforce fail at ..\c10\core\CPUAllocator.cpp:72] data. DefaultCPUAllocator: not enoug

浏览 5提问于2020-02-06得票数 18

回答已采纳

2回答

如何使用PyTorch在预先训练的模型上添加新的层？(给出了Keras示例。)

、、、、

我正在与Keras一起工作，并试图分析一些有意义的权重层和一些随机初始化层所建立的模型对精度的影响。喀拉斯：在加载法上加载VGG19预训练的include_top = False参数模型. model = keras.applications.VGG19(include_top=False, weights="imagenet", input_shape=(img_width, img_height, 3)) PyTorch：我加载VGG19预训练的模型，直到同一层与以前的模型，其中加载了Keras。 model = torch.hub.load('pytorch

浏览 0提问于2020-11-01得票数 6

回答已采纳

1回答

前馈网络的接受域

、、

我对人工智能和神经网络非常陌生。我已经在PyTorch中实现了一个前馈神经网络，用于对MNIST数据集进行分类。现在，我想要可视化隐藏神经元(子集)的感受野。但我在理解接受域的概念时遇到了一些问题，当我在谷歌上搜索时，所有的结果都是关于CNNs的。那么，有没有人可以帮助我在PyTorch中如何做到这一点，以及如何解释结果？

浏览 3提问于2019-12-02得票数 0

1回答

如何在PyTorch中获得神经网络的编码器部分？

、、、

我想要应用迁移学习(使用来自UNet或ResNet的预训练编码器的权重初始化我的自定义网络的编码器)。所以问题是:给定Pytorch中的UNet或ResNet实例，如何提取PyTorch中ResNet或UNet的编码器部分？ This blog展示了这样做的一种方法，但它首先要求我拥有UNet或ResNet类，这对我来说并不实用。因为UNet或ResNet的实例是通过net = get_resnet(depth=34)这样的函数获取的，所以我只能获取UNet或ResNet的实例，但不能获取它们的类。

浏览 24提问于2021-07-29得票数 0

1回答

googlent/Resnet50/Resnet101/inception v2和v3中的完全连接层是什么

、、

我正在研究matlab，并尝试使用上面引用的预训练模型作为特征提取器。在Alexnet和vggnet中，完全连接层很清楚是哪个名字叫'fc7‘，但在googlenet/resnet50/resnet101/inception v2 v3中就不清楚了，有人能给我指点一下吗？另外，这些模型中的特征大小是多少，例如在alexnet中是4096？

浏览 34提问于2019-05-22得票数 1

1回答

是否有办法使用Tensorflow (带有Keras)或PyTorch来删除NN中各层之间的1-2 (或更多)特定神经元连接？

、、、、

我正在制作一个GUI，用于创建不同的独特神经网络。我不赞成使用TensorFlow 2.0 (使用Keras )或PyTorch作为后端。但我缺乏关于这些主题的信息，如果有人能回答这些问题，我将非常感激：语言: Python 1)如何利用这些框架去除神经网络中各层间的特定神经元连接? 2)如何为神经网络中神经元的某些设置特定的学习规则? 3)如何设置该层神经元的特定激活函数某些；非常感谢，请不要犹豫回答，任何信息都是有用的。如果有人想为这个项目做出贡献，那就太棒了。

浏览 2提问于2020-01-16得票数 0

回答已采纳

1回答

如何使用元信息丰富卷积神经网络？

、、、、

我非常想了解如何用提供的元信息来丰富CNN。据我所知，CNN“只是”查看图像并将其分类为对象，而不查看可能存在的元参数，如时间、天气条件等。更准确地说，我在后端使用了一个带有tensorflow的keras CNN。我有典型的Conv2D和MaxPooling层，并且在管道的末尾有一个完全连接的模型。它工作得很好，给了我一个很好的准确性。但是，我确实有每个尚未使用的图像(用于拍摄图像的相机的制造商)的额外元信息。将这些元信息合并到模型中的推荐方法是什么？我自己还想不出一个好的解决方案。谢谢你的帮助！

浏览 1提问于2017-12-15得票数 4

2回答

我如何在bert预训练模型中获得最后一个transformer编码器的所有输出，而不仅仅是cls令牌输出？

、、、、

我使用的是pytorch，这是huggingface transformers link的模型 from transformers import BertTokenizerFast, BertForSequenceClassification bert = BertForSequenceClassification.from_pretrained("bert-base-uncased", num_labels=int(data['class'].nuniq

浏览 282提问于2020-12-09得票数 3