首页
学习
活动
专区
工具
TVP
发布

计算机视觉战队

专栏成员
822
文章
799461
阅读量
106
订阅数
一番实验后,有关Batch Size的玄学被打破了
关注并星标 从此不迷路 计算机视觉研究院 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 计算机视觉研究院专栏 作者:Edison_G 有关 batch size 的设置范围,其实不必那么拘谨。 我们知道,batch size 决定了深度学习训练过程中,完成每个 epoch 所需的时间和每次迭代(iteration)之间梯度的平滑程度。batch size 越大,训练速度则越快,内存占用更大,但收敛变慢。 又有一些理论说,GPU 对 2 的幂次的 batch 可以发挥
计算机视觉研究院
2022-07-12
3160
特斯拉AI总监:我复现了LeCun 33年前的神经网络,发现和现在区别不大
欢迎关注“ 计算机视觉研究院 ” 计算机视觉研究院专栏 作者:Edison_G 扫描二维码 关注我们 微信公众号 : 计算机视觉研究院 机器之心报道 编辑:蛋酱 最近,特斯拉 AI 高级总监 Andrej Karpathy 做了一件很有趣的事情,他把 Yann LeCun 等人 1989 年的一篇论文复现了一遍。一是为了好玩,二是为了看看这 33 年间,深度学习领域到底发生了哪些有趣的变化,当年的 LeCun 到底被什么卡了脖子。此外,他还展望了一下 2055 年的人将如何看待今天的深度学习研究。
计算机视觉研究院
2022-03-18
3260
关键词学习——《正则化》
监督机器学习问题无非就是在规则化参数的同时最小化误差。最小化误差是为了让模型拟合训练数据,而规则化参数是防止模型过分拟合训练数据,但训练误差小并不是最终目标,最终目标是希望模型的测试误差小,也就是能准确的预测新的样本。所以需要保证模型“简单”的基础上最小化训练误差,这样得到的参数才具有好的泛化性能(也就是测试误差也小),而模型“简单”就是通过规则函数来实现的。
计算机视觉研究院
2022-01-28
3680
代码实践 | AdderNet(加法网络)迁移到检测网络(代码分享)
记得前段时间“计算机视觉研究院”推送了一篇关于CVPR2020最佳分类的文献(链接:CVPR2020最佳目标检测 | AdderNet(加法网络)含论文及源码链接),其中有同学问可以把这个新的分类框架嫁接到检测网络,会有提升吗?今天就通过实验来告诉大家会有怎样的提升?
计算机视觉研究院
2022-01-28
4670
干货|2021年以后人工智能的几点思考?
我想和大家谈谈我对人工智能的几点思考,包括一些值得商榷的问题。从几千年前的原始社会,人们依靠石器工具来劳动;到农耕时期人们所使用的工具有所升级;到工业革命出现的蒸汽机进一步提升了生产力;电气革命更是极大提升了人类的生产效率;而今信息时代电子计算机的诞生延伸了我们的脑力,拓宽了我们的眼界和思想。马克思说过,“各种经济时代的区别,不在于生产什么,而在于怎样生产,用什么劳动资料生产。劳动资料更能显示一个社会生产时代的具有决定意义的特征。”
计算机视觉研究院
2022-01-26
2790
带有注意力RPN和多关系检测器的小样本目标检测网络(提供源码和数据及下载)
传统的目标检测方法通常需要大量的训练数据,并且准备这样高质量的训练数据是劳动密集型的(工作)。在今天分享中,研究者提出了少量样本的目标检测网络,目的是检测只有几个训练实例的未见过的类别对象。新提出的方法核心是注意力RPN和多关系模块,充分利用少量训练样本和测试集之间的相似度来检测新对象,同时抑制背景中的错误检测。
计算机视觉研究院
2022-01-26
5860
人脸检测识别在各个领域都得到大力展现(附源代码)
在弱光图像中进行人脸检测具有挑战性,因为照片数量有限,而且不可避免地会有噪声,而这些噪声往往在空间上分布不均匀,使得这项任务更加困难。一个自然的解决方案是借用多重曝光的想法,即在具有挑战性的条件下捕捉多个镜头以获得良好曝光的图像。然而,对单一图像进行高质量的多重曝光的实现/近似是很重要的。
计算机视觉研究院
2022-01-25
3120
人脸检测识别助力建党100周年活动安全举办(附源代码)
在弱光图像中进行人脸检测具有挑战性,因为照片数量有限,而且不可避免地会有噪声,而这些噪声往往在空间上分布不均匀,使得这项任务更加困难。一个自然的解决方案是借用多重曝光的想法,即在具有挑战性的条件下捕捉多个镜头以获得良好曝光的图像。然而,对单一图像进行高质量的多重曝光的实现/近似是很重要的。
计算机视觉研究院
2021-07-09
1.2K0
FaceX-Zoo | 使用PyTorch Toolbox进行人脸识别(附源代码)
近年来,基于深度学习的人脸识别已经取得了显著的进展。然而,深度人脸识别的实际模型制作和进一步研究却非常需要相应的公众支持。
计算机视觉研究院
2021-07-09
1.1K0
AI技术 | 弱光下的人脸准确检测识别(附论文下载)
在弱光图像中进行人脸检测具有挑战性,因为照片数量有限,而且不可避免地会有噪声,而这些噪声往往在空间上分布不均匀,使得这项任务更加困难。一个自然的解决方案是借用多重曝光的想法,即在具有挑战性的条件下捕捉多个镜头以获得良好曝光的图像。然而,对单一图像进行高质量的多重曝光的实现/近似是很重要的。
计算机视觉研究院
2021-05-31
1.1K0
YOLOv5的项目实践 | 手势识别项目落地全过程(附源码)
前言 计算机视觉可以学习美式手语,进而帮助听力障碍群体吗?数据科学家David Lee用一个项目给出了答案。
计算机视觉研究院
2020-12-29
5.8K1
详解何恺明团队最新作品:源于Facebook AI的RegNet(附下载链接)
上次我们说到了AnyNet的设计空间,先回顾下:AnyNet设计空间。我们的重点是探索假定标准的固定网络块(例如,剩余瓶颈块)的神经网络结构。在我们的术语中,网络的结构包括一些元素,如块的数量(即网络深度)、块的宽度(即通道的数量)和其他块的参数(如瓶颈比率或组的宽度)。网络的结构决定了计算、参数和内存在整个网络计算图中的分布,是决定其准确性和效率的关键。
计算机视觉研究院
2020-06-06
6610
腾讯开源了 | 微信也在用的Transformer加速推理工具(附源码链接)
自Attention机制提出后,加入attention的Seq2seq模型在各个任务上都有了提升,所以现在的seq2seq模型指的都是结合rnn和attention的模型,具体原理可以参考传送门的文章。之后google又提出了解决sequence to sequence问题的transformer模型,用全attention的结构代替了lstm,在翻译任务上取得了更好的成绩。本文主要介绍《Attention is all you need》这篇文章,自己在最初阅读的时候还是有些不懂,希望可以在自己的解读下让大家更快地理解这个模型。
计算机视觉研究院
2020-05-04
1.3K0
CVPR2020最佳检测 | 带有注意力RPN和多关系检测器的小样本目标检测网络
传统的目标检测方法通常需要大量的训练数据,并且准备这样高质量的训练数据是劳动密集型的(工作)。在本文中,我们提出了少量样本的目标检测网络,目的是检测只有几个训练实例的未见过的类别对象。我们的方法的核心是注意力RPN和多关系模块,充分利用少量训练样本和测试集之间的相似度来检测新对象,同时抑制背景中的错误检测。为了训练我们的网络,我们已经准备了一个新的数据集,它包含1000类具有高质量注释的不同对象。据我们所知,这也是第一个数据集专门设计用于少样本目标检测。一旦我们的网络被训练,我们可以应用对象检测为未见过的类,而无需进一步的训练或微调。我们的方法是通用的,并且具有广泛的应用范围。我们证明了我们的方法在不同的数据集上的定性和定量的有效性。
计算机视觉研究院
2020-04-14
1.5K0
在警察领域高级人脸识别技术的一致性
【导读】来自英国伯恩茅斯大学实验室的研究人员作出的贡献。近年来,人们对具有较高识别能力的人越来越感兴趣。然而,对这些人的识别主要依赖于一次单一的人脸记忆测试的标准性能。目前调查旨在审查30名警察的高级人脸识别技能的一致性,既包括进入同一过程的测试,也包括进入人脸处理不同组成部分的测试之间的一致性。各相关指标的总体绩效指标被发现,以孤立的测试分数确定不同的优秀表现。此外,不同表现的目标现值和目标缺席指数,表明信号检测措施是最有用的绩效指标。最后,观察到优越的记忆和匹配性能之间的分离。因此,超级识别器筛选程序应该包括总结相关测试多次尝试的总体指数,允许个人在不同(有时非常具体)的任务上进行高度排序。
计算机视觉研究院
2019-05-17
8140
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档