将CNN与GRU堆叠在一起以获取图像

腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

1回答

、、、

我正在尝试将CNN 2D与GRU叠加。我成功地获得了一种堆叠CNN的方法，但我有一个错误的GRU。filters = 64, kernel_size = (5,5),padding = 'Same', 313 ndim = K.ndim(x) V

浏览 19提问于2019-06-14得票数 1

1回答

如何在pytorch上实现堆叠的rnn (层数> 1)？

、、

pytorch中的GRU层接受一个名为num_layers的参数，您可以在其中堆叠RNN。然而，还不清楚后续的RNN如何确切地使用前一层的输出。递归层数。例如，设置num_layers=2将意味着将两个GRU堆叠在一起以形成堆叠的GRU，第二个GRU接收第一个GRU的输出并计算最终结果。这是否意味着GRU第一层的最后一个单元的输出将作为输入输入到下一

浏览 6提问于2021-09-23得票数 2

1回答

PyTorch GRU返回中隐藏状态层的顺序

、、、、

batch，num_directions * hidden_size) 对于具有多个层的GRU，我想知道如何获取最后一个层的隐藏状态，是h_n[0]还是h_n[-1]？如果是双向的，如何进行切片以获得GRUs在两个方向上的最后一个隐藏层状态？

浏览 0提问于2019-01-17得票数 8

1回答

用于视频识别的CNN + RNN结构

、、、、

但我很难在我的模型中找到将CNN和LSTM结合起来的正确方法。for param in vgg.parameters(): self.GRU= nn.GRU(4096, hidden_size) embedded = self.embedding我希望预先训练的CNN成为模型的一部分，

浏览 1提问于2020-08-24得票数 1

1回答

Conv1D、Conv2D、Conv3D的区别及其在卷积神经网络中的应用

、、、

我知道我们在图像相关的任务中使用Conv2D，但是我的教授问我，为什么我们不使用Conv1D或Conv3D呢？为什么我们在这里特别使用Conv2D。

浏览 23提问于2022-02-23得票数 0

回答已采纳

3回答

从CNNs到GRUs的语音识别模型转换

、

我正在尝试将简单音频识别实例从TensorFlow转换为使用GRUs而不是CNN。Conv1D层将时间步长从124减少到55。 epochs=EPOCHS,) 问题是，与CNN相比，我的GRU模型精度很低。<em

浏览 0提问于2021-01-07得票数 0

1回答

带有Lambda函数的HSTACK CNN输出

、、、、

我制作了一种使用CNN和LSTM表示的的：images = encoded_imgs[0,:,:,:] // eg: first output of a CNN layer print(imagesima

浏览 1提问于2018-02-16得票数 1

1回答

我很难理解多频道CNN的不同之处:在题为“用于任务诱发的fMRI数据分类的多通道2D卷积神经网络模型”(https://www.hindawi.com/journals/cin/2019/5065214/#sec2.1)图1中，作者使用一个频道来表示输入图像类型。图像是一个二维灰度矩阵。从图上看，图像数=通道数=不同CNN数。这是真的吗？我的印象是，不管有多少频道，我们都有一个CNN，对每种输入分别应用过滤器。但是，这

浏览 0提问于2020-07-19得票数 2

回答已采纳

3回答

在向Facebook发布~之前通过缩略图分页的jQuery解决方案

、、、

我的视图中有一个包含图像URL的数组，例如( [0] => http://i2.cdn.turner.com/cnn/2011/CRIME/06/18/florida.casey.anthony.trial[2] => http://i2.cdn.turner.com/cnn/2011/LIVING/06/16/texas.veterans.lega

浏览 1提问于2011-06-19得票数 1

回答已采纳

1回答

用于图像的多输入CNN

、、

我是图像深度学习领域的新手。我正在使用Keras，但我不知道如何才能构建这个我必须做的网络。尤其是对于第一个。Alexnet架构只需要一个框架作为输入，但我想给出n个框架作为输入。为了给出n帧作为输入，我堆叠了n帧作为通道。当我告诉你我做了什么时，人们会说，“哦，我的天哪，你在做什么？”我不明白为什么。( FlowNet架构不是这样使用的吗？)但我还是不知道我该怎么做。

浏览 5提问于2018-10-27得票数 1

2回答

具有固定宽度和自动高度的SVG文本的叠加实例

、、、、

我希望创造一个文本效果，在其中的文本线自动缩放，以达到一个特定定义的宽度，与自动调整高度。对于SVG文本来说，这是可能的吗？它能通过纯CSS来完成吗？

浏览 10提问于2022-08-16得票数 1

1回答

如何使用OpenCV、NumPy和Python将彩色图像和二进制图像堆叠在一起？

、、

我正在制作一个运动检测程序，它首先从实时视频馈送中获取参考帧，并检测程序启动时所采用的参考帧是否发生了任何变化。refFrame =3维图像，这是程序启动时从网络摄像头提要中获得的彩色帧。(静态图像，即摄像头捕获的第一帧)diffFrame =2维二进制视频提要，它显示当前视频提要与启动程序时拍摄的参考图像帧之间的差异(不同格式的黑白视频源) 我的目标是使用vstack将所有4帧以

浏览 0提问于2021-04-26得票数 2

1回答

基于RNN (LSTM)的手势识别系统

、、、、

问题是，我已经建立了一个类似的系统，但对于静态图像(不包括运动)，它对于翻译字母表很有用，因为在这种情况下，构建CNN是一项直接的任务，因为手不会移动太多，而且数据集结构也是可管理的，因为我正在使用keras，而且可能仍然打算这样做(每个文件夹都包含一组特定符号的图像，文件夹的名称是这个符号的类名: A，B，C，.)此外，考虑到我的数据集将由图像组成，我可能需要一个卷积层，如何将conv层组合成LSTM层(我指的是代码)。例如，我设想我的数据集是这样的名为“Run”的文件夹包含3个文件夹1、2和3，

浏览 0提问于2018-04-25得票数 11

1回答

如何在卷积神经网络中获得/定义滤波器？

、、、

我的想法是这样的:对输入图像(28x28)进行随机图像处理，并获得随机补丁(8x8)。然后使用自动编码器来学习补丁的共同特性(功能=隐藏单位；例如，大约100个)。然后将特征滤波器应用于输入图像并进行卷积。我说的对吗？我很困惑，因为有时文献状态只使用like，例如8，过滤器，但在我的例子中，我有100.g。2层或3层)？有什么想法或资源吗？

浏览 5提问于2014-10-22得票数 7

1回答

深度学习二进制文本分类

、、

我希望为特定的新闻和博客文章建立一个模型，这些文章将时尚与生物学模式结合在一起。我有35个网站，我每天阅读(这是令人筋疲力尽)。假设所有12个都是相关的，我将它们保存到培训dir并重新编译以加强模型。在阅读了用Keras进行深度学习之后，我希望第5章和第6章关于单词嵌入和RNN(简单，LSTM，GRU)将为我指明如何开发这样一个模型。我还在阅读如何实现用于文本分类的CNN，但似乎无法构建一个基本的概念框架，以便从几篇文章开始，并每天添加培训数据以加强模型。这类策略有什么术语吗？

浏览 0提问于2017-06-01得票数 2

1回答