开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

global_max_pool/global_avg_pool和avg_pool_2d/1d/3d有什么区别？

global_max_pool和global_avg_pool是指在深度学习中常用的全局池化操作，用于将输入的特征图进行降维。

区别如下：

global_max_pool：对于输入的特征图，将其每个通道的所有元素取最大值，得到一个通道数不变的特征向量。这种池化操作可以提取出特征图中的最显著特征，适用于需要强调局部最大值的任务，如目标检测。推荐的腾讯云相关产品：腾讯云AI智能图像分析（https://cloud.tencent.com/product/tiia）
global_avg_pool：对于输入的特征图，将其每个通道的所有元素取平均值，得到一个通道数不变的特征向量。这种池化操作可以提取出特征图的整体分布信息，适用于需要考虑整体特征的任务，如图像分类。推荐的腾讯云相关产品：腾讯云AI智能图像分析（https://cloud.tencent.com/product/tiia）
avg_pool_2d/1d/3d：这是一种常见的平均池化操作，对于输入的特征图，在指定的窗口大小内，计算窗口内元素的平均值，并将结果作为输出。avg_pool_2d适用于二维特征图，avg_pool_1d适用于一维特征图，avg_pool_3d适用于三维特征图。这种池化操作可以保留更多的细节信息，适用于需要考虑整体分布和细节的任务，如图像分割、语音识别等。推荐的腾讯云相关产品：腾讯云AI智能图像分析（https://cloud.tencent.com/product/tiia）

以上是对global_max_pool/global_avg_pool和avg_pool_2d/1d/3d的区别和应用场景的简要介绍。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

动态分组卷积-Dynamic Group Convolution for Accelerating Convolutional Neural Networks

github：https://github.com/zhuogege1943/dgc/

01

torch.nn.functional

原文链接：https://pytorch.org/docs/stable/nn.functional.html

01

tensorflow编程: Neural Network

对 features 和 tf.negative(features) 分别 Relu 并 concatenate 在一起。

03

使用一维数据构造简单卷积神经网络

神经网络对于一维数据非常重要，时序数据集、信号处理数据集和一些文本嵌入数据集都是一维数据，会频繁的使用到神经网络。我们在此利用一组一维数据构造卷积层-最大池化层-全连接层的卷积神经网络。希望给大家使用CNN处理一维数据一些帮助。

01

tf.nn

atrous_conv2d_transpose(): atrous_conv2d的转置。

01

TensorFlow API 树 (Python)

Python API Guides (仅记录日常用到的api) TensorFlow API 树 (Python) Tensor转换：　 Ref 生成tensor tf.string_to_number tf.to_double tf.to_float tf.to_bfloat16 tf.to_int32 tf.to_int64 tf.cast tensor形状op tf.shape tf.size tf.rank tf.reshape tf.squeeze tf.expand_di

02

keras.layers

Keras layers API. Aliases: Module tf.compat.v1.keras.layers Classes class AbstractRNNCell: Abstract object representing an RNN cell. class Activation: Applies an activation function to an output. class ActivityRegularization: Layer that applies an update t

01

【综述】神经网络中不同种类的卷积层

在深度学习中，卷积的目的是从输入中提取有用的特征。在图像处理中，卷积滤波器的选择范围非常广，每种类型的滤波器（比如Sobel算子、Canny算子等）都有助于从输入图像中提取不同的方面或者特征，比如水平、垂直、边缘或对角线等特征。

01

从零学Paddle系列-1 Paddle框架CNN相关API详解

前面我们对Paddle做了个大致的介绍，这一次我们来详细学习一下cv相关函数的使用

02

网络结构之 Inception V4

原文： AIUAI - 网络结构之 Inception V4 Inception-v4, Inception-ResNet and the Impact of Residual Connection

02

注意力机制汇总，包括SE、CBAM、ECA等

注意力机制（Attention Mechanism）源于对人类视觉的研究。在认知科学中，由于信息处理的瓶颈，人类会选择性地关注所有信息的一部分，同时忽略其他可见的信息。为了合理利用有限的视觉信息处理资源，人类需要选择视觉区域中的特定部分，然后集中关注它。例如，人们在阅读时，通常只有少量要被读取的词会被关注和处理。综上，注意力机制主要有两个方面：决定需要关注输入的哪部分；分配有限的信息处理资源给重要的部分。

01

越来越卷，教你使用Python实现卷积神经网络（CNN）

https://blog.csdn.net/weixin_44510615/article/details/117409037

03

3D卷积入门 | 多论文笔记 | R2D C3D P3D MCx R(2+1)D

看到这篇论文是因为之前看到一篇Nature上的某一篇医疗影像的论文中用到了这几个算法，R3D，MC3和R2+1D的3D卷积的算法。因为对3D卷积的算法了解比较局限，所以开始补一补这方面的算法。

01

[开发技巧]·AdaptivePooling与Max/AvgPooling相互转换

自适应池化Adaptive Pooling是PyTorch的一种池化层，根据1D，2D，3D以及Max与Avg可分为六种形式。

06

深度学习三人行(第9期)----卷积神经网络实战进阶(附代码)

接下来我们一起学习下关于CNN的代码实现，内存计算和池化层等相关知识，我们多多交流，共同进步。本期主要内容如下：

03

涨点神器！SoftPool：一种新的池化方法，带你起飞！

论文：https://arxiv.org/abs/2101.00440 项目代码链接：

01

涨点Trick | 你还在用MaxPooling和AvgPooling?SoftPool带你起飞(附论文与源码下载）

通常卷积神经网络(CNNs)都会使用池化pool操作来减少Feature Map的尺寸。这个过程对于实现局部空间不变和增加后续卷积的感受野是至关重要的。因此池化pool操作应该尽量减少Feature Map映射中信息的丢失。同时，应该限制计算和内存开销。

02

[深度应用]·使用一维卷积神经网络处理时间序列数据

许多技术文章都关注于二维卷积神经网络（2D CNN）的使用，特别是在图像识别中的应用。而一维卷积神经网络（1D CNNs）只在一定程度上有所涉及，比如在自然语言处理（NLP）中的应用。目前很少有文章能够提供关于如何构造一维卷积神经网络来解决你可能正面临的一些机器学习问题。本文试图补上这样一个短板。

04

【CV中的Attention机制】并行版的CBAM-BAM模块

BAM全程是bottlenect attention module，与CBAM很相似的起名，还是CBAM的团队完成的作品。

02

slim.arg_scope()的使用

slim是一种轻量级的tensorflow库，可以使模型的构建，训练，测试都变得更加简单。在slim库中对很多常用的函数进行了定义，slim.arg_scope()是slim库中经常用到的函数之一。函数的定义如下；

02

【综述】盘点卷积神经网络中的池化操作

一提到池化操作，大部分人第一想到的就是maxpool和avgpool，实际上还有很多种池化操作。

02

【综述】盘点卷积神经网络中的池化操作

一提到池化操作，大部分人第一想到的就是maxpool和avgpool，实际上还有很多种池化操作。

03

注意力机制---Yolov5/Yolov7引入CBAM、GAM、Resnet_CBAM

论文题目：《CBAM: Convolutional Block Attention Module》论文地址： https://arxiv.org/pdf/1807.06521.pdf

01

ACM MM：一种基于情感脑电信号时-频-空特征的3D密集连接网络

本文介绍一篇于计算机领域顶级会议ACM MM 2020发表的论文《SST-EmotionNet: Spatial-Spectral-Temporal based Attention 3D Dense Network for EEG Emotion Recognition》，该研究提出了一种基于注意力机制的3D DenseNet对多媒体刺激产生的情感脑电信号进行分类，该模型在统一的框架下同时提取数据中的空间、频率、时间特征；并且设计了一种3D注意机制来自适应地探索具有判别力的局部模式提升情绪分类效果，在现有的多个数据集上分类表现均为最优。该文提出的模型是一个多变量脑电信号的通用框架，可以被拓展到其余信号分类任务中。

03

深度学习-TF、keras两种padding方式：vaild和same

在使用Keras的时候会遇到这样的代码x = Conv2D(filters, kernel_size=5, strides=2, padding='same')(x)，与pytorch不同，keras和TensorFlow设置卷积层的过程中可以设置padding参数，vaild和same。“valid”代表只进行有效的卷积，对边界数据不处理。“same”代表保留边界处的卷积结果，通常会导致输出shape与输入shape相同。

05

都9102年了还不懂动态图吗？一文带你了解飞桨动态图

导读：飞桨PaddlePaddle致力于让深度学习技术的创新与应用更简单。飞桨核心框架已提供了动态图(DyGraph)相关的API和文档，并且还附有Language model、Sentiment Classification、OCR、ResNet等模型的动态图版本官方实现。飞桨目前兼具了动态图和静态图的优势，同时具备灵活性和高效性。

01

Prometheus入门

Prometheus(普罗米修斯)这款开源监控工具，名字和功能一样酷，本文是一个干货入门，动手来部署一个实验环境。用Prometheus+Grafana来监控MySQL。这里安利一波docker 和 vagrant ，实在是开发的利器，校长用了都说好！

05

探秘计算机视觉中的注意力机制

储泽栋，北京交通大学软件学院学生，曾获ICPC国际大学生程序设计竞赛亚洲区域赛铜牌，全国大学生服务外包大赛二等奖

02

网络结构之 Inception V2

原文：AIUAI - 网络结构之 Inception V2 Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift Rethinking the Inception Architecture for Computer Vision GoogleNet 网络结构的一种变形 - InceptionV2，改动主要有：对比网络结构之 GoogleNet(Incept

02

网络结构之 Inception V3

Factorizing Convolutions with Large Filter Size

03

Kaggle Jigsaw文本分类比赛方案总结

这个比赛是一个文本分类的比赛，这个比赛目标是在给定文本中判断是否为恶意评论即01分类。训练数据还给了其他多列特征，包括一些敏感词特征还有一些其他指标评价的得分特征。测试集没有这些额外的特征只有文本数据。

02

tensorflow学习笔记(十三):conv3d

这是官方给的解释,还不如conv2d解释的详细呢,至少在介绍conv2d的时候还给了公式. 和conv2d对比一下:

03

基于Tensorflow一维卷积用法详解

以下是input_shape=(1,10,1), w = (3,1,1)时，conv1的shape

02

TensorFlow基本操作实现卷积和池化

本文介绍了如何使用卷积神经网络（CNN）进行图像分类。首先介绍了CNN的基本原理和结构，然后阐述了TensorFlow和Keras中实现CNN的代码示例。最后，通过一个具体的例子展示了如何使用卷积层和池化层进行图像分类。

05

VggNet10模型的cifar10深度学习训练

先放些链接，cifar10的数据集的下载地址：http://www.cs.toronto.edu/~kriz/cifar.html

02

用 Python 可以实现侧脸转正脸？我也要试一下！

作者 | 李秋键、出品丨AI科技大本营近几年来GAN图像生成应用越来越广泛，其中主要得益于GAN 在博弈下不断提高建模能力，最终实现以假乱真的图像生成。GAN 由两个神经网络组成，一个生成器和一个判别器组成，其中生成器试图产生欺骗判别器的真实样本，而判别器试图区分真实样本和生成样本。这种对抗博弈下使得生成器和判别器不断提高性能，在达到纳什平衡后生成器可以实现以假乱真的输出。其中GAN 在图像生成应用最为突出，当然在计算机视觉中还有许多其他应用，如图像绘画，图像标注，物体检测和语义分割。在自然语言处理中应

02

tensorflow入门：CNN for MNIST

使用tensorflow构建如上图所示的CNN用于对MNIST数据集进行softmax classification。

02

TensorFlow基本操作实现卷积和池化

之前已经提到过图像卷积的操作和意义，并且用OpenCV中的filter2D函数实现了一些例子。OpenCV中的filter2D函数仅仅是用一个卷积核去卷积单个的图像矩阵，而在TensorFlow中，卷积操作主要用于CNN中的卷积层，所以输入不再仅仅局限与三维或一维的矩阵，卷积核的个数不再是单个，输出的通道数=卷积核的个数，为此TensorFlow提供了tf.nn.conv2d函数实现了一个卷积层的卷积操作。定义如下：

02

tf22: ocr识别——不定长数字串识别

该文章介绍了如何使用深度学习模型完成文本分类任务。首先介绍了如何使用RNN和LSTM完成文本分类，然后介绍了如何使用CNN完成文本分类，最后介绍了如何使用GAN完成文本分类。文章还介绍了如何使用预训练模型和迁移学习完成文本分类任务，并给出了具体的代码示例和实验结果。

MySQL一万字深度总结，基础+进阶(二)，建议收藏。

💖✨MySQL一万字深度总结，基础+进阶(二) [2d47ee05b93f41f888888a8a1bba8b31~tplv-k3u1fbpfcp-zoom-1.image] 👨‍🎓作者：Java学术趴 🏦仓库：Github、Gitee ✏️博客：CSDN、掘金、InfoQ、云+社区 💌公众号：Java学术趴 🚫特别声明：原创不易，未经授权不得转载或抄袭，如需转载可联系小编授权。 🙏版权声明：文章里的部分文字或者图片来自于互联网以及百度百科，如有侵权请尽快联系小编。微信搜索公众号Java学术趴联系小编。 ☠

01

白给的性能不要？cvpr2021-Diverse branch block

本文是继前作ACNet的又一次对网络结构重参数化的探索，我们设计了一个类似Inception的模块，以多分支的结构丰富卷积块的特征空间，各分支结构包括平均池化，多尺度卷积等。最后在推理阶段前，把多分支结构中进行重参数化，融合成一个主分支。这样能在相同的推理速度下，“白嫖”模型性能

04

面朝黄土背朝天，老汉今天不发文章……

从前的机器之心，年会是喝酒、打德州扑克，这次我们要去玩球。那么问题来了：机器之心年会举办了什么球赛？

02

一段Python代码，告诉你机器之心今天的秘密

机器之心今天的情绪，是怎样一段待你解开的 Python 代码：将上图输入以下卷积网络，你想要的都在这~ # -*- coding: utf-8 -*- import tensorflow as tf

网络结构之 GoogleNet(Inception V1)

GoogleNet，即 Inception V1 网络结构，包含 9 个 Inception 结构：

04

逃不过呀！不论是训练还是部署都会让你踩坑的Batch Normalization

BN是2015年论文Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift提出的一种**数据归一化方法**。现在也是大多数神经网络结构的**标配**，我们可能已经**熟悉的不能再熟悉了**。

00

论文阅读：A Closer Look at Spatiotemporal Convolutions for Action Recognition

这篇论文是CVPR2018年的录取论文，主要讨论了时空卷积的几种网络结构，在Action Recognition 的几个标准数据集上也取得了媲美最好方法的效果。作者是FAIR的工作人员，其中包括Du Tran(C3D)作者，Heng Wang(iDT)作者和Yann LecCun等，可谓是大牛云集。论文可以在这里下载。这里大概介绍下论文中的内容，可以看作是原论文的一个翻译。

01

扩展之Tensorflow2.0 | 21 Keras的API详解（下）池化、Normalization层

和卷积层相对应，每一种池化层都有1D,2D,3D三种类型，这里主要介绍2D处理图像的一个操作。1D和3D可以合理的类推。

01

Ubuntu安装和卸载CUDA和CUDNN

最近在学习PaddlePaddle在各个显卡驱动版本的安装和使用，所以同时也学习如何在Ubuntu安装和卸载CUDA和CUDNN，在学习过程中，顺便记录学习过程。在供大家学习的同时，也在加强自己的记忆。本文章以卸载CUDA 8.0 和 CUDNN 7.05 为例，以安装CUDA 10.0 和 CUDNN 7.4.2 为例。

02

使用二维数据构造简单卷积神经网络

使用二维数据构造简单卷积神经网络图像和一些时序数据集都可以用二维数据的形式表现，我们此次使用随机分布的二位数据构造一个简单的CNN—网络卷积-最大池化-全连接参考代码 # Implementing Different Layers # --------------------------------------- # # We will illustrate how to use different types # of layers in TensorFlow # # The layers of i

03

深度学习卷积神经网络——经典网络GoogLeNet(Inception V3)网络的搭建与实现

获得高质量模型最保险的做法就是增加模型的深度（层数）或者是其宽度（层核或者神经元数），

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭