使用共享分类器修改3个网络的训练函数 - 腾讯云开发者社区

又有一周没更新了，不知道进入研究生阶段写博客时间为什么这么上。上周四接到自己第一本书的三审意见需要进行修改。本想着慢慢修改的，结果上周五晚上接到通知北京印刷厂为迎国庆9月开始停业直至10月下旬。没办法必须为新书修改让路，像赶在8月末上式，虽然不知道能不能在8月末把书印出来。这也导致本应该周末整理完Fast R-CNN的笔记有拖了一周。

您找到你想要的搜索结果了吗？

是的

没有找到

[Intensive Reading]目标检测(object detection)系列（三） Fast R-CNN：end-to-end的愉快训练

如何让训练神经网络不无聊？试试迁移学习和多任务学习

训练深度神经网络是一个乏味的过程。更实际的方法，如重新使用训练好的网络解决其他任务，或针对许多任务使用相同的网络。这篇文章中，我们会讨论两个重要的方法：迁移学习和多任务学习。

BBN：长尾视觉识别模型（CVPR 2020）

今天分享一篇发表在CVPR 2020上的论文：BBN: Bilateral-Branch Network with Cumulative Learning for Long-Tailed Visual Recognition (原文链接：[1])。

卷积神经网络CNN

本文学习笔记的部分内容参考zouxy09的博客，谢谢！ http://blog.csdn.net/zouxy09/article/details/8775360 什么是卷积卷积如果改名为“加权平均积”，就会很好理解了。卷积的离散形式就是常用的加权平均，而连续形式则可理解为对连续函数的加权平均。假如我们观测或计算出一组数据，但数据由于受噪音的污染并不光滑，我们希望对其进行人工处理。那么，最简单的方法就是加权平均。实际上加权平均是两个序列在做离散卷积，其中一个序列是权重，另一个序列是原数据。试想若把序列换为函

一文看尽深度学习中的生成对抗网络 | CVHub带你看一看GANs架构发展的8年

生成对抗网络 (Generative Adversarial Networks, GANs) 在过去几年中被广泛地研究，其在图像生成、图像转换和超分辨率等领域取得了显著的进步。到目前为止，已经提出了大量基于GANs的相关工作和综述。本文基于柏林圣三一大学计算机科学与统计学院的王正蔚博士与字节跳动AI实验室联合发表的一篇综述[1]为基础，详细的解读GANs的来龙去脉，同时为大家介绍近期一些相关工作，中间也会穿插一些笔者的见解。最后，本文也将列出一些可探索的未来研究方向，希望能给予读者一些启发。

如何让训练神经网络不无聊？试试迁移学习和多任务学习

卷积神经网络CNN（convolutional）

卷积运算：原图像*卷积核=新图像，经常用来做边缘检测人造核：手动指定权重，改善效果

深度学习、神经网络与卷积神经网络：研究及应用

在如今的网络时代，错综复杂的大数据和网络环境，让传统信息处理理论、人工智能与人工神经网络都面临巨大的挑战。近些年，深度学习逐渐走进人们的视线，通过深度学习解决若干问题的案例越来越多。一些传统的图像处理技术也可以通过深度学习来获得更优异的效果，比如去噪、超分辨率和跟踪算法等。为了跟上时代的步伐，必须对深度学习与神经网络技术有所学习和研究。

fasterrcnn深度学习口罩检测

当我们输入一张图片，首先传达给backbone网络进行特征提取，backbone的选择不是唯一的，可以使用resnet50,101等等，其目的就是为了得到图像的大小较小，但却很深的特征层

PyTorch搭建简单神经网络实现回归和分类

torch_data = torch.from_numpy(np_data)可以将numpy(array)格式转换为torch(tensor)格式；torch_data.numpy()又可以将torch的tensor格式转换为numpy的array格式。注意Torch的Tensor和numpy的array会共享他们的存储空间，修改一个会导致另外的一个也被修改。

Deep Learning综述[上]

Deep-Learning-Papers-Reading-Roadmap: [1] LeCun, Yann, Yoshua Bengio, and Geoffrey Hinton. "Deep learning." (2015) (Three Giants' Survey) Review 机器学习在当下有很多应用：从网络搜索的内容过滤到电商的商品推荐，以及在手持设备相机和智能手机上的应用。机器学习系统用来做图像识别，语音转换，推送符合用户兴趣的内容。这些应用逐渐地开始不仅仅使用机器学习，越来越多的使用

CVPR 2018摘要：第五部分

今天我们向你介绍另一部分，我们将深入了解CVPR 2018（计算机视觉和模式识别）会议的一些论文的细节。我们已经有四个：关于计算机视觉的GAN，关于人类的姿势估计和跟踪，关于合成数据，以及最后关于域适应。特别在第四部分中，我们提出了三篇关于同一主题的论文，这些论文实际具有数字可比性。

农林业遥感图像分类研究[通俗易懂]

遥感图像处理是数字图像处理技术中的一个重要组成部分，长期以来被广泛应用于农林业的遥感测绘，防灾减灾等领域。本文旨在通过深度学习技术从遥感影像中分类出农田和林业地块。手工从遥感图像中分类出农田和林业区域分类虽然准确但是效率低下，并且很多采用传统图像分割技术的方法泛化性能差，不适合场景复杂的遥感图像。经实践证明，使用深度学习技术在各种计算机视觉任务中都取得了良好的效果，因此本文首先使用先进的深度学习框架进行分类实验，例如使用PSPNet,UNet等作为分割网络对遥感图像数据集进行分类与分割训练。这些框架在ImageNet，COCO，VOC等数据集上表现很好，但是由于遥感图像数据集相对于ImageNet，COCO等数据集，不仅检测对象相对较小而且可供学习的数据集样本较少，需要针对这一特点进行优化。本文经过多次实验将高分辨率的图像切割成合适大小分辨率的图像以减小神经网络的输入，同时进行图片的预处理和数据增强来丰富学习样本。同时在真实情况下，农林区域易受到拍摄视角，光照等造成分割对象重叠，因此本文提出一种处理分割对象重叠的处理策略，来优化边界预测不准确的情况，使用该方法后准确率有明显提升。经实验证明，本文所提出的基于深度学习的农林业遥感影像分割在开源遥感图像数据集上的取得了94.08%的准确率，具有较高的研究价值农林业遥感图像数据（图1）对于许多与农林业相关的应用至关重要。例如作物类型和产量监测，防灾减灾以及对粮食安全工作的研究和决策支持。最初，这些数据主要由政府机构使用。如今，蓬勃发展的农林业技术也需要在农场管理，产量预测和林业规划等各种应用领域进行革新。以往农林业地块的高质量遥感图像数据主要是手动在高分辨率图像中分割出来的，即通过土地功能不同引起的颜色，亮度或纹理的差异与周围区域亮度或纹理的差异与周围区域区分开来。尽管农林业遥感图像的手动分类可以非常准确，但是非常耗时耗力。图1.1：农田的遥感图像分割定期更新农林业遥感图像数据的需求日益增加扩大了自动化分割农林业遥感图像的需求。与ImageNet、VOC2007、COCO等目标检测/分类数据集中的大多数图像相比，农林业遥感图像中的对象相对简单。例如，人体的图像数据看起来要复杂得多，因为它包含各种不同纹理和形状的子对象（面部，手部，衣服等）。因此，优化传统的图像分割以及深度学习技术来设计用于农林业遥感图像分割的算法是非常重要的。该模型需要正确地排除不需要进行分割的对象（房屋，工厂，停车场等），区分具有几乎相似的光谱特性的相邻区域和可见度差的边界区域，并且正确地分割出所需的对象。 1.2 选题来源与经费支持本研究课题来源于计算机与信息工程学院随着传感器技术，航空航天技术，图像处理技术快速的发展，利用卫星遥感图像进行深度学习处理广泛应用于生产实际中。由于农林业遥感图像场景复杂，使用传统图像处理分割算法效果差且泛化性能弱，本文使用深度学习方法，在现有的的深度学习模型上训练，优化，最终提出一种一种优化后的深度学习模型，经测试，该模型在收集的农林业遥感图像数据集上可以准确的分割出所需的对象，本文提出的模型主要解决如下几个难点：

最好的Dropout讲解

Dropout (Dropout)(Srivastava et al., 2014) 提供了正则化一大类模型的方法, 计算方便但功能强大。第一种近似下,Dropout可以被认为是集成非常多的大神经网络的实用Bagging方法。Bagging涉及训练多个模型,并在每个测试样本上评估多个模型。当每个模型是一个大型神经网络时,这似乎是不切实际的,因为训练和评估这样的网络需要花费很多运行时间和内存。通常只能集成五至十个神经网络, 如Szegedy et al. (2014a) 用六个赢得 ILSVRC,超过这个数量就会迅速变得难以处理。Dropout提供了一种廉价的Bagging集成近似,能够训练和评估指数级的神经网络。

机器学习与深度学习常见面试题（上）

一年一度的校园招聘已经开始了，为了帮助参加校园招聘、社招的同学更好的准备面试，SIGAI整理出了一些常见的机器学习、深度学习面试题。理解它们，对你通过技术面试非常有帮助，当然，我们不能只限于会做这些题目，最终的目标是真正理解机器学习与深度学习的原理、应用。

深度学习笔记

TensorFlow TensorFlow 不仅是一个实现机器学习算法的接口，也是一种框架，也可用于线性回归、逻辑回归、随机森林等算法； TensorFlow 使用数据流图来规划计算流程，每个运算操作作为一个节点 node，节点之间的连接称为边，边中流动的数据称为张量，故而得名 TensorFlow，预算操作可以有自己的属性，但必须被预先设置，或者能在创建计算图时被推断出来； TensorFlow 有一套为节点分配设备的策略，这是一个简单的贪婪策略，不能确保找到全局最优解，但可以快速找到一个不错的节点运算分

讲解torch 多进程卡死

在使用PyTorch进行多进程训练时，有时会遇到程序卡死的问题。本文将介绍可能导致torch多进程卡死的原因以及如何解决这个问题。

学界 | 在线深度学习：在数据流中实时学习深度神经网络

选自arXiv 机器之心编译参与：Nurhachu Null、刘晓坤在线深度学习的主要困难是模型的容量、复杂度等设置很不灵活，即模型是静态的，而数据流是动态的。本论文提出了一种适应性的网络框架，结合 HBP 算法，使网络结构能随着数据的流入而逐渐扩展、复杂化。这使得模型同时拥有在线学习和深度学习的优点，并在多种在线学习模型和数据集的对比实验中都取得了当前最佳结果。近年来，我们见证了深度学习技术在很多应用中的巨大成功。学习深度神经网络面临着很多挑战，包括但不限于梯度消失、逐渐减少的特征重用、鞍点（以及

PointNet：三维点云分割与分类的深度学习

本文是关于PointNet点云深度学习的翻译与理解，PointNet是一种直接处理点云的新型神经网络，它很好地体现了输入点云的序列不变性。

从AlexNet到残差网络，理解卷积神经网络的不同架构

该文介绍了神经网络模型压缩、加速和量化三个方面的研究进展。其中，压缩技术包括模型剪枝、知识蒸馏等方法，加速技术包括硬件加速、优化算法等方法，量化技术包括量化训练、量化推理等方法。这些技术在不同程度上减小了模型的大小、提高了推理的速度、降低了训练的能耗。

目标检测算法Faster RCNN的损失函数以及如何训练？

从上一期Faster RCNN的算法原理上，我们知道Faster RCNN算法有两部分，一个是用来提取候选框的RPN网络，一个是最后检测目标的分类回归网络。通过学习，我们知道RPN网络在提取候选框的时候有两个任务，一个是判断该anchor产生的候选框是否是目标的二分类任务，另一个是对该候选框进行边框回归的回归任务。而Faster RCNN最后的目标检测网络同样也有两个任务，跟RPN网络类似，一个是判断RPN网络产生的候选框框住的物体是具体哪一类物体的分类任务，另一个是对该候选框进行回归的回归任务。既然两个网络都是多任务网络，那么，我们先看看RPN网络的损失函数是怎么样的？先上RPN网络的总体损失函数，接下来分析，如下（公式可左右滑动）：

告别深度学习炼丹术！谷歌大脑提出“权重无关”神经网络

前不久，我们报道了谷歌给出首个神经网络训练理论的证明。这一研究在训练深度神经网络被戏谑为 “调参炼丹” 的当下，犹如一道希望的强光，射进还被排除在 “科学” 之外的深度学习领域，激动人心。

CVPR2021 Oral | HOTR：不再需要后处理！Kakao Brain提出端到端Human-Object交互检测模型

Human-Object Interaction(HOI)检测是识别图像中“人-物-交互”的任务，涉及到：1）交互作用中的主体（人）和目标（对象）的定位；2）以及交互标签的分类。大多数现有的方法都通过检测人和对象实例，然后单独推断检测到的每一对实例的关系来间接解决这个任务。

AAAI/CVPR论文详解 | 万字长文了解可解释AI工具及技术的最新进展

机器之心分析师网络作者：仵冀颖编辑：H4O 本文聚焦于研究和开发可解释性工具的内容，对AAAI-2022《Tutorial on Explanations in Interactive Machine Learning》提及的三类可解释性工具/方法（局部可解释性、规则可解释性、概念可解释性）进行了解读，重点了解可解释性工具和方法的最新研究进展。 1 背景近年来，学术界、工业界以及政府部门对 AI 伦理的重视程度日益加强，从 AI 伦理监管政策到 AI 伦理技术手段，提升 AI 伦理合规性和打造 AI

Focal Loss for Dense Object Detection(文献阅读)

动机尽管两阶段检测器取得了成功，那么问题就是:一个简单的单阶段能达到类似的精度吗?单阶段应用于目标位置、尺度和纵横比的常规、密集采样。最近在YOLO和SSD等单阶段上的研究显示出了很有前景的结果，与

告别深度学习炼丹术！谷歌大脑提出“权重无关”神经网络

前不久，新智元报道了谷歌给出首个神经网络训练理论的证明。这一研究在训练深度神经网络被戏谑为 “调参炼丹” 的当下，犹如一道希望的强光，射进还被排除在 “科学” 之外的深度学习领域，激动人心。

深度 | 谷歌I/O走进TensorFlow开源模型世界：从图像识别到语义理解

机器之心原创参与：吴攀、QW 一年一度的谷歌开发者大会 Google I/O 在山景城成功举行，在首日的 Keynote 中，谷歌宣布了一系列新的硬件、应用、基础研究等。而作为 AI First 的开发者大会，Google I/O 也自然安排了许多有关机器学习开发的内容，比如《教程 | 如何使用谷歌 Mobile Vision API 开发手机应用》。当然毋庸置疑，TensorFlow 也是本届 I/O 大会的关键核心之一。当地时间 18 日下午，谷歌 TensorFlow 开发者支持 Josh Gor

AI算法分类

线性回归：进行直线或曲线拟合，一般使用“最小二乘法”来求解。最小二乘法将最优问题转化为求函数极值问题。函数极值在数学上我们一般会采用求导数为0的方法。但这种做法并不适合计算机，可能求解不出来，也可能计算量太大。计算机科学界专门有一个学科叫“数值计算”，专门用来提升计算机进行各类计算时的准确性和效率问题。

深度学习目标检测(object detection)系列（三） Fast R-CNN

Integrated Recognition, Localization and Detection using Convolutional Networks

我们提出了一个使用卷积网络进行分类、定位和检测的集成框架。我们认为在一个卷积网络中可以有效地实现多尺度和滑动窗口方法。我们还介绍了一种新的深度学习方法，通过学习预测目标的边界来定位。然后，为了增加检测的置信度，对边界框进行累积而不是抑制。我们证明了使用一个共享网络可以同时学习不同的任务。该集成框架是ImageNet Large scale evisual Recognition Challenge 2013 (ILSVRC2013)定位任务的获胜者，在检测和分类任务上获得了非常有竞争力的结果。在比赛后的工作中，我们为检测任务建立了一个新的技术状态。最后，我们从我们最好的模型中发布了一个名为OverFeat的特性提取器。

学界 | 精准防御对抗性攻击，清华大学提出对抗正则化训练方法DeepDefense

选自arXiv 作者：Ziang Yan等机器之心编译参与：刘晓坤、黄小天本文提出了一个名为 DeepDefense 的训练方案，其核心思想是把基于对抗性扰动的正则化项整合进分类目标函数，从而使模型可以学习直接而精确地防御对抗性攻击。在 MNIST、CIFAR-10 和 ImageNet 上的扩展实验证明了该方法可以显著提高不同深度学习模型对高强度对抗攻击的鲁棒性，同时还不会牺牲准确率。虽然深度神经网络（DNN）在许多挑战性的计算机视觉任务中都取得了当前最优的表现，但在对抗样本（在人类感知上和真实图

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐