开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

CNN之后的LSTM如何输入和什么尺寸(输入大小)？

LSTM（Long Short-Term Memory）是一种常用的循环神经网络（RNN）模型，用于处理序列数据。在使用LSTM之前，通常需要将序列数据转换为适合模型输入的格式。

对于CNN之后的LSTM，输入的尺寸取决于CNN模型的输出。通常情况下，CNN模型会提取出一系列的特征图（feature maps），每个特征图对应一个特定的特征。这些特征图的尺寸通常是固定的，例如宽度为W，高度为H，通道数为C。

在将特征图输入到LSTM之前，需要将其转换为LSTM可以接受的输入格式。一种常见的做法是将特征图展平为一个向量，即将其三维的形状（W，H，C）转换为二维的形状（W*H，C）。这样得到的向量就可以作为LSTM的输入。

另外，如果序列数据具有时间维度，例如视频或音频数据，还可以将时间作为额外的维度。在这种情况下，可以将特征图的形状扩展为（T，W，H，C），其中T表示时间步数。然后，将每个时间步的特征图展平为向量，得到形状为（T，W*H，C）的输入。

总结起来，CNN之后的LSTM的输入尺寸取决于CNN模型输出的特征图的形状。可以将特征图展平为向量作为LSTM的输入，或者在具有时间维度的序列数据中，将特征图的形状扩展为（T，W，H，C）并展平为向量。

相关搜索:CNN和LSTM的输入形状 CNN的多个输入:图像和参数，如何合并 Dlib特征数组作为CNN和预测的输入 keras LSTM输入和输出形状是如何工作的？Pytorch，如何将CNN的输出输入到RNN的输入中？Tensorflow 2.0 - LSTM状态性和输入大小为什么我的CNN输入大小会导致ValueError？以TFIDF作为输入的LSTM，尺寸错误在keras中给LSTM模型不同大小的输入如何为CNN模型中的输入正确重塑输入数据？

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

一文带你了解 Faster R-CNN

Fast R-CNN 有两个网络：建议窗口网络（RPN）生成建议窗口并使用这些窗口检测物体。与Fast R-CNN 的主要区别在于后者使用选择性搜索来生成建议窗口。当RPN与物体检测网络共享最多计算时，RPN中生成建议窗口的时间成本比选择性搜索小得多。简而言之，RPN对区域框（称为锚点）进行排名，并提出最可能包含物体的框。结构如下。

03

机器学习深度学习笔试面试题目整理（2）

（1）思想　　改变全连接为局部连接，这是由于图片的特殊性造成的（图像的一部分的统计特性与其他部分是一样的），通过局部连接和参数共享大范围的减少参数值。可以通过使用多个filter来提取图片的不同特征（多卷积核）。（2）filter尺寸的选择　　通常尺寸多为奇数（1，3，5，7）

02

计算机视觉中 RNN 应用于目标检测

深度学习在计算机视觉领域取得的巨大的发展，最近几年CNN一直是目前主流模型所采取的架构。最近半年RNN/LSTM应用在识别领域逐渐成为一种潮流，RNN在获取目标的上下文中较CNN有独特的优势。以下我们分析最近有关RNN做目标识别的相关文章。 1、Inside-Outside Net: Detecting Objects in Context with Skip Pooling and Recurrent Neural Networks CVPR2016（论文笔记）本文的主要贡献是用skip pooli

06

最全的DNN概述论文：详解前馈、卷积和循环神经网络技术

本论文技术性地介绍了三种最常见的神经网络：前馈神经网络、卷积神经网络和循环神经网络。且该文详细介绍了每一种网络的基本构建块，其包括了基本架构、传播方式、连接方式、激活函数、反向传播的应用和各种优化算法

04

计算机视觉中 RNN 应用于目标检测

深度学习在计算机视觉领域取得的巨大的发展，最近几年CNN一直是目前主流模型所采取的架构。最近半年RNN/LSTM应用在识别领域逐渐成为一种潮流，RNN在获取目标的上下文中较CNN有独特的优势。以下我们分析最近有关RNN做目标识别的相关文章。 1、Inside-Outside Net: Detecting Objects in Context with Skip Pooling and Recurrent Neural Networks CVPR2016（论文笔记）本文的主要贡献是用skip poolin

05

OCR检测与识别技术

在过去的数年中，腾讯数平精准推荐(Tencent-DPPR)团队一直致力于实时精准推荐、海量大数据分析及挖掘等领域的技术研发与落地。特别是在广告推荐领域，团队自研的基于深度在线点击率预估算法及全流程实时推荐系统，持续多年在该领域取得显著成绩。而在用户意图和广告理解上，借助于广告图片中的文本识别以及物体识别等技术手段，可以更加有效的加深对广告创意、用户偏好等方面的理解，从而更好的服务于广告推荐业务。 OCR（Optical Character Recognition, 光学字符识别）是指对输入图像进行分析识

最全的DNN概述论文：详解前馈、卷积和循环神经网络技术

选自arXiv 机器之心编译本论文技术性地介绍了三种最常见的神经网络：前馈神经网络、卷积神经网络和循环神经网络。且该文详细介绍了每一种网络的基本构建块，其包括了基本架构、传播方式、连接方式、激活函数

06

CNN 在语音识别中的应用

本文介绍了语音识别技术中的端到端模型、基于CTC的序列模型、基于序列学习的注意力机制模型、基于3D卷积神经网络的语音识别系统等。其中，端到端模型可以直接从原始音频数据中学习到针对语音识别的抽象表示，具有较好的可扩展性和鲁棒性；而基于CTC的序列模型则通过连接主义学习的方法，将CTC定义的序列映射问题转化为神经网络中的参数优化问题，进一步提高了语音识别的准确率；基于序列学习的注意力机制模型则借鉴了语言学中的注意力机制，通过对输入序列进行加权处理，进一步提高了模型的识别准确率；基于3D卷积神经网络的语音识别系统则利用3D卷积核对输入序列进行卷积处理，提取出序列中的特征信息，进一步提高了模型的识别准确率。

03

前端设计图转代码，西安交大表示复杂界面也能一步步搞定

使用机器学习技术自动生成图形用户界面（GUI）代码是一个相对较新的研究领域。通常，按照设计编写 GUI 对前端开发者来说是一项耗时又繁琐的工作，因为这使得他们无法投入更多的时间来开发软件的实用功能和逻辑。因此，构建一个将 GUI 原型自动转化为对应编程代码的系统是非常有前景的。

02

论文阅读学习 - CTPN-Detecting Text in Natural Image with Connectionist Text Proposal Network

CTPN(Connectionist Text Proposal Network)，end-to-end 框架：

02

扔掉代码表！用RNN“破解”摩斯电码

作者：Sandeep Bhupatiraju 剧透警告：摩斯电码并不需要破解。它很有用，因为消息可以使用这些代码以最少的设备发送，并且我说它不需要破解，因为代码是众所周知的，点和破折号的组合并不是什么秘密。但是，从理论上讲，它是一种替代密码（substitution cipher）， ‍每个字母（和每个数字）的每个字母都有一些使用点和破折号的表示形式，如下所示。 ‍ 让我们暂停我们的怀疑，并假设我们收到摩尔斯电码的消息，但我们不知道如何阅读它们。假设我们还有一些代码的例子及其相应的单词列表。现在，

05

AI技术讲座精选：NLP 模型到底选 RNN 还是 CNN？

【AI100 导读】本文系统地对比了 CNN 和 RNN 在 NLP 各大任务上的表现，包括：情感分类、关系分类、文本蕴含、答案选择、问题关系匹配、PQA、词性标注等。RNN 在大部分任务上都表现的更好，除了在关键词匹配和识别这类任务不如 CNN。这篇文章有很多不错的结论，值得一读！摘要深度神经网络（DNNs）的出现使得自然语言处理领域（NLP）发生了翻天覆地的变化。卷积神经网络（CNN）和循环神经网络（RNN）是深度神经网路（DNN）的两种主要的架构类型，目前正在大范围的研究当中，用于处理各种各

04

腾讯数平精准推荐 | OCR技术之识别篇

本文介绍了腾讯数平精准推荐团队的OCR识别算法，包括识别算法的演进之路以及4个代表性方法。

如何一夜暴富？深度学习教你预测比特币价格

关键时刻，第一时间送达！ 📷 参与 |王赫编辑 | Donna 近年来，以比特币为代表的加密数字货币一直是社交媒体和搜索引擎上的热门。但是，比特币价格浮动也使各位看官们经历了过山车般的体验。随着本周各大权威机构纷纷表示看好区块链的未来，从1月17日到18日凌晨，比特币成功止住前一日暴跌的颓势，涨幅接近20%（18.46%）。如果我们能够智能化的制定投资策略的话，就能发现这些反复无常的波动背后潜藏着巨大的利润。与传统金融工具相比，加密货币由于缺乏指标数据，预测变得非常困难。本文以当下最火的比特币为例

07

如何一夜暴富？这里有一份比特币价格预测指南

图片来源：Hacker News 翻译 | AI科技大本营（rgznai100）参与 | 王赫编辑 | Donna 近年来，以比特币为代表的加密数字货币一直是社交媒体和搜索引擎上的热门。但是，比特币价格浮动也使各位看官们经历了过山车般的体验。随着本周各大权威机构纷纷表示看好区块链的未来，从1月17日到18日凌晨，比特币成功止住前一日暴跌的颓势，涨幅接近20%（18.46%）。如果我们能够智能化的制定投资策略的话，就能发现这些反复无常的波动背后潜藏着巨大的利润。与传统金融工具相比，加密货币由于

02

如何一夜暴富？这里有一份比特币价格预测指南

图片来源：Hacker News 翻译 | AI科技大本营（rgznai100）参与 | 王赫编辑 | Donna 近年来，以比特币为代表的加密数字货币一直是社交媒体和搜索引擎上的热门。但是，比特币价格浮动也使各位看官们经历了过山车般的体验。随着本周各大权威机构纷纷表示看好区块链的未来，从1月17日到18日凌晨，比特币成功止住前一日暴跌的颓势，涨幅接近20%（18.46%）。如果我们能够智能化的制定投资策略的话，就能发现这些反复无常的波动背后潜藏着巨大的利润。与传统金融工具相比，加密货币由于

07

Tensorflow下Char-RNN项目代码详解

前言 Char-RNN，字符级循环神经网络，出自于Andrej Karpathy写的The Unreasonable Effectiveness of Recurrent Neural Networks。众所周知，RNN非常擅长处理序列问题。序列数据前后有很强的关联性，而RNN通过每个单元权重与偏置的共享以及循环计算（前面处理过的信息会被利用处理后续信息）来体现。Char-RNN模型是从字符的维度上，让机器生成文本，即通过已经观测到的字符出发，预测下一个字符出现的概率，也就是序列数据的推测。现在网上介绍的用

深度学习文本分类实战报告：CNN, RNN & HAN

本文为 AI 研习社编译的技术博客，原标题： Report on Text Classification using CNN, RNN & HAN 翻译 | 小猪咪、莫尔•约瑟夫、M.Y. Li

02

BAT机器学习面试1000题系列（第76~149题）

76、看你是搞视觉的，熟悉哪些CV框架，顺带聊聊CV最近五年的发展史如何？深度学习 DL应用难原英文：adeshpande3.github.io 作者：Adit Deshpande，UCLA

End to End Sequence Labeling via Bidirectional LSTM-CNNs-CRF论文摘要简介神经网络结构训练总结

论文地址：End-to-end Sequence Labeling via Bi-directional LSTM-CNNs-CRF 摘要传统改机的序列标注系统，需要大量的针对特定任务的手工特征和经过预处理的数据。在这篇文章中，作者引入了一种创新的神经网络结果，使用Bi-LSTM、CNN和CRF相结合的网络结果，使模型能够从词和字级别表示中学习和收益。作者指出他们的系统是真正意义上的端到端结果，不需要任何特征工程或者数据预处理工作，因此可以广泛应用于各种序列标注任务。该模型在PennTreebank WS

04

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭