首页
学习
活动
专区
工具
TVP
发布

计算机视觉战队

专栏作者
814
文章
728193
阅读量
103
订阅数
强的离谱 , Transformer 杀疯了!
前段时间 Transformer已席卷计算机视觉领域,并获得大量好评,如『基于Swin-Transformer』、『美团提出具有「位置编码」的Transformer,性能优于ViT和DeiT』、『Lifting Transformer』、『TimeSformer』等等。 Transformer为什么这么有实力? 因为它在分类、检测等任务上展现了极其强劲的性能。而且骨干网络上的发展也推动了下游任务的发展,Swin Transformer 更是成了屠榜般的存在,在工业界具有广阔的应用前景。所以引起了人工智
计算机视觉研究院
2022-09-27
3310
图神经网络的表达能力,究竟有多强大?
前几年神经网络很火,相信大家对神经网络都有一定的了解。而图神经网络是直接在图上进行计算,整个计算的过程,沿着图的结构进行,这样处理的好处是能够很好的保留图的结构信息。而能够对结构信息进行学习,正是图神经网络的能力所在。 下面我们就来看看图神经网络为什么强大? 图神经网络的应用场景自然非常多样。笔者在这里选择一部分应用场景为大家做简要的介绍,更多的还是期待我们共同发现和探索。 1. 计算机视觉 在计算机视觉的应用有根据提供的语义生成图像,如下图所示(引用)。输入是一张语义图,GNN通过对“man behin
计算机视觉研究院
2022-09-13
2950
OpenMMLAB系列框架解读(基于PyTorch)
什么是OpenMMLab呢? 为了帮助更多的同学在复现上少走弯路,并且实现可以在一个相同的环境下比较不同的settings,香港中文大学-商汤科技联合实验室(MMLab)推出了OpenMMLab计划。是一个用于多个重要研究领域的开源的代码库,力求在代码的质量和整体比别的代码库更具优势,其目标就是做到"Open-Source, Unified, Reproducible"。 OpenMMLab在国内人工智能算法开源领域遥遥领先,受到了学术界和工业界的广泛好评,在多个国际学术竞赛上被冠军团队采用,并通过完善工业
计算机视觉研究院
2022-09-06
4010
Github累积1.6万颗星 , OpenMMLab到底有多强?
什么是OpenMMLab呢? 为了帮助更多的同学在复现上少走弯路,并且实现可以在一个相同的环境下比较不同的settings,香港中文大学-商汤科技联合实验室(MMLab)推出了OpenMMLab计划。是一个用于多个重要研究领域的开源的代码库,力求在代码的质量和整体比别的代码库更具优势,其目标就是做到"Open-Source, Unified, Reproducible"。 OpenMMLab在国内人工智能算法开源领域遥遥领先,受到了学术界和工业界的广泛好评,在多个国际学术竞赛上被冠军团队采用,并通过完善工业
计算机视觉研究院
2022-07-20
5750
370多页免费书籍,三位学者带你专攻深度学习基础(免费下载地址)
关注并星标 从此不迷路 计算机视觉研究院 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 计算机视觉研究院专栏 作者:Edison_G 期待即将到来的章节。 转自《机器之心》 深度学习这一领域,对于初学者而言,编程已然令人生畏,而更加令人难以接受的是,深度学习里的数学知识更难。 对于这种困惑,已经有人提前替你想到了,这不今天就为大家推荐一本新书,书中介绍了深度学习中的数学工程。书的名字为《 The Mathematical Engineering of Deep L
计算机视觉研究院
2022-07-04
4690
目标检测算法终结篇:YOLOV1-V5
YOLO 是一种快速紧凑的开源对象检测模型,与其它网络相比,同等尺寸下性能更强,并且具有很不错的稳定性,是第一个可以预测对象的类别和边界框的端对端神经网络。YOLO 家族一直有着旺盛的生命力,从YOLO V1一直到”V5“,凭借着不断的创新和完善,一直被计算机视觉工程师作为对象检测的首选框架之一。 YOLO v5 模型的头部与之前的 YOLO V3 和 V4 版本相同。 它比 YOLOv4 小 88%(27 MB vs 244 MB) 它比 YOLOv4 快 180%(140 FPS vs 50 FPS)
计算机视觉研究院
2022-06-29
3690
旷视首席科学家、知名AI学者孙剑博士去世
关注并星标 从此不迷路 计算机视觉研究院 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 计算机视觉研究院专栏 作者:Edison_G 如此优秀的学者逝世,实为 CV 领域一大痛事。想想当年还被他问及残差网络原理及发展,可惜没有和AI领域界的优秀学者一起共事,祝一路走好! 转自《机器之心》 孙剑博士是人工智能领域的优秀学者。 孙剑博士本硕博期间均就读于西安交通大学,2003年在西安交通大学获得博士学位,加入微软亚洲研究院,任至首席研究员。2015-2016年在微软美国
计算机视觉研究院
2022-06-16
1990
速度起飞!精选10篇入门CV必读经典的baseline论文
大家好,我叫Aaron! 之前给大家整理过很多干货,今天再精选10篇CV图像分类任务的经典论文称为“baseline 论文”——基石论文。快速准确吃透baseline论文,是学习CV其他细分任务论文的基石。 精选整理10篇论文的篇目如下: NIPS-2012,Alexnet:深度学习CV领域划时代论文,具有里程碑意义 《ImageNet Classification with Deep Convolutional Neural Networks》 ICLR-2015,VGG net:开启3*3卷积堆叠时代
计算机视觉研究院
2022-06-14
7260
YoloR:又一个YOLO系列新框架!速度远远高于Yolov4(代码已开源)
计算机视觉研究院专栏 作者:Edison_G 目标检测现在的框架越来越多,我们“计算机视觉研究院”最近也分享了众多的目标检测框架!今天我们继续分享一个最新的检测框架——YOLOR。 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 论文:https://arxiv.org/pdf/2105.04206.pdf 开源代码:https:// github.com/WongKinYiu/yolor 1 前言 人们通过视觉、听觉、触觉以及过去的经验“理解”世界。人类经验可以通
计算机视觉研究院
2022-05-18
3420
目标检测与分割领域的经典算法解读
计算机视觉是人工智能的关键领域之一,是一门研究如何使机器“看”的科学。图像目标检测又是计算机视觉的关键任务,主要对图像或视频中的物体进行识别和定位,是AI后续应用的基础。 因此,检测性能的好坏直接影响到后续目标 追踪、动作识别的性能。传统图像目标检测的滑窗法虽然简单易于理解,但随目标大小而变化的窗口对图像进行从左 至右、从上至下的全局搜索导致效率低下。 为了在滑动窗口检测器的基础上提高搜索速度,选择性搜索方法(selective search method)孕育而出,基于这一想法采用子区域合并的方式进行
计算机视觉研究院
2022-05-12
2480
985计算机视觉研究生找不到工作?
前段时间知乎上“985计算机视觉研究生找不到工作怎么办?”问题,引发了将近80万+人的围观。 到底是什么原因导致找不到工作呢?首先我们来看看他的履历: 他目前是985高校研究生,方向是计算机视觉。成绩中等,无论文,无比赛经历,有项目经历。编程基础还可以,自认为在教研室算好的了,python用得比较熟,C++也会一点,PyTorch, TensorFlow,Keras等框架也用的还可以。 当初选择该方向时,深度学习正处于大热阶段,什么无人驾驶,人脸识别听起来就很高大上。然而,到了找工作的时候,发现就业形式和
计算机视觉研究院
2022-04-27
7090
强的离谱,Transformer 杀疯了!
前段时间 Transformer 已席卷计算机视觉领域,并获得大量好评,如『基于Swin-Transformer』、『美团提出具有「位置编码」的Transformer,性能优于ViT和DeiT』、『Lifting Transformer』、『TimeSformer』等等 Transformer为什么这么有实力? 因为它在分类、检测等任务上展现了极其强劲的性能。而且骨干网络上的发展也推动了下游任务的发展,Swin Transformer 更是成了屠榜般的存在,在工业界具有广阔的应用前景。所以引起了人工智能研
计算机视觉研究院
2022-03-30
3460
知乎热议:985计算机视觉研究生找不到工作?
前段时间知乎上“985计算机视觉研究生找不到工作怎么办?”问题,引发了将近80万+人的围观。 到底是什么原因导致找不到工作呢?首先我们来看看他的履历: 他目前是985高校研究生,方向是计算机视觉。成绩中等,无论文,无比赛经历,有项目经历。编程基础还可以,自认为在教研室算好的了,python用得比较熟,C++也会一点,PyTorch, TensorFlow,Keras等框架也用的还可以。 当初选择该方向时,深度学习正处于大热阶段,什么无人驾驶,人脸识别听起来就很高大上。然而,到了找工作的时候,发现就业形式和
计算机视觉研究院
2022-03-10
3620
ICCV-目标检测:用图特征金字塔提升精度(附论文下载)
开源代码:https://arxiv.org/pdf/2108.00580.pdf
计算机视觉研究院
2022-01-28
2460
华为诺亚方舟实验室品:加法神经网络在目标检测中的实验研究
加法神经网络 (AdderNets) 在仅使用加法运算的图像分类方面表现出令人印象深刻的性能,这比使用乘法构建的传统卷积神经网络更节能。
计算机视觉研究院
2022-01-28
5380
又一个YOLO系列新框架!速度远远高于Yolov4(代码已开源)
开源代码:https:// github.com/WongKinYiu/yolor
计算机视觉研究院
2022-01-27
3320
ICCV2021目标检测:用图特征金字塔提升精度(附论文下载)
开源代码:https://arxiv.org/pdf/2108.00580.pdf
计算机视觉研究院
2022-01-26
3120
多目标检测:基于YoloV4优化的多目标检测
为了解决目标检测任务中小目标检测精度低、误检、漏检率高等问题,有研究者提出了一种基于YOLOv4卷积神经网络的多目标检测方法。 多目标检测作为目标检测领域的一个重要研究方向,一直受到研究人员的广泛关注。目前,在智能交通、智能辅助驾驶和视频监控等领域已经产生了深入的研究。
计算机视觉研究院
2022-01-26
9190
Apple团队:轻量级、通用且移动友好的网络框架(附论文下载)
论文地址:https://arxiv.org/pdf/2110.02178.pdf
计算机视觉研究院
2022-01-26
4010
图特征金字塔应用在目标检测,最终精度大幅度提升
开源代码:https://arxiv.org/pdf/2108.00580.pdf
计算机视觉研究院
2022-01-26
2920
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档