数据派THU-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

数据派THU

专栏成员

2149

文章

2149744

阅读量

191

订阅数

CVPR 2023 | 谷歌、MIT提出统一框架MAGE：表征学习超MAE，无监督图像生成超越 Latent Diffusion

图像识别框架论文模型重构

来源：机器之心本文约1400字，建议阅读5分钟在一篇 CVPR 2023 论文中，来自 MIT 和谷歌的研究人员提出了一种全新的框架MAGE，同时在图像识别和生成两大任务上实现了 SOTA。识别和生成是人工智能领域中的两大核心任务，如果能将二者合并到一个统一的系统中，这两个任务应该能实现互补。事实上，在自然语言处理中，像 BERT [1] 这样的模型不仅能够生成高质量的文本，还能够提取文本中的特征。然而，在计算机视觉领域，目前的图像生成模型和识别模型大多是分开进行训练，没有充分利用这两个任务的协同作用。

2023-03-29

4110

ECCV 2022 | MixSKD: 用于图像识别的Mixup自蒸馏方法

编程算法图像识别

来源：PaperWeekly 本文约1800字，建议阅读5分钟本篇文章介绍一下我们于 ECCV-2022 发表的一篇模型自蒸馏文章。传统的知识蒸馏（Knowledge Distillation，KD）需要一个预训练的教师模型来训练一个学生模型，这种模式的缺点是需要设计并训练额外的教师网络，并且两阶段的训练过程提升了流水线开销。自网络知识蒸馏（Self-Knowledge Distillation，Self-KD），顾名思义，则是不依赖额外的教师网络进行指导，利用网络自身的知识来指导自身的学习，从而实现自

2023-02-23

4850

NeurIPS'22｜Hinton团队开源：用一个统一的接口处理四大视觉任务

图像识别 NLP 服务图像处理

来源：极市平台本文约1800字，建议阅读5分钟本文提出了一种将四个看似不同的视觉任务（目标检测，实例分割，关键点检测，图像描述）统一在单个像素到序列界面中的方法。论文链接：https://arxiv.org/pdf/2206.07669v2.pdf 源码链接：https://github.com/google-research/pix2seq 简介训练能够执行无数个任务的单个神经网络模型是迈向通用人工智能的重要一步。在NLP领域，许多NLP相关任务都可以统一在大型语言模型下进行。主要原因是这些任务

2023-02-23

2790

目标检测YOLO系列算法的进化史

图像识别神经网络深度学习人工智能机器学习

来源：DeepHub IMBA 本文约3400字，建议阅读6分钟本文为你简单总结YOLO的发展历史。本文中将简单总结YOLO的发展历史，YOLO是计算机视觉领域中著名的模型之一，与其他的分类方法，例如R-CNN不同，R-CNN将检测结果分为两部分求解：物体类别（分类问题），物体位置即bounding box（回归问题）不同，YOLO将任务统一为一个回归问题。也就是相对于R-CNN系列的"看两眼"(候选框提取与分类)，YOLO只需要 You Only Look Once。目标检测我们人类只需要看一眼

2022-10-11

1.1K0

海事监控视频舰船目标检测研究现状与展望

来源：专知本文为论文介绍，建议阅读5分钟本文为促进舰船目标检测技术的应用提供了新的思路。舰船目标检测是海域监控、港口流量统计、舰船身份识别以及行为分析与取证等智能海事应用的基石。随着我国海洋强国建设的推进，智慧航运和智慧海洋工程迅速发展，对通过海事监控视频开展有效的舰船目标检测识别以确保航运和海洋工程安全的需求日益紧迫。本文针对基于海事监控视频的舰船目标检测任务，回顾了舰船目标检测数据集及性能评价指标、基于传统机器学习和基于卷积神经网络的深度学习的目标检测方法等方面的国内外研究现状，分析了海洋环境中舰船

2022-09-19

5040

YOLO算法最全综述：从YOLOv1到YOLOv5

图像识别 https 网络安全神经网络深度学习

来源：知乎初识CV 深度学习爱好者https://zhuanlan.zhihu.com/p/136382095本文共8000字，建议阅读15分钟本文为大家介绍了YOLO算法的最全综述。 YOLO官网： https://github.com/pjreddie/darknet YOLO v.s Faster R-CNN 1.统一网络:YOLO没有显示求取region proposal的过程。Faster R-CNN中尽管RPN与fast rcnn共享卷积层，但是在模型训练过程中，需要反复训练RPN网络和f

2022-06-20

6290

图像预训练模型的起源解说和使用示例

pytorch 迁移学习图像识别机器学习深度学习

来源：Deephub Imba本文约3500字，建议阅读14分钟本文文章简要介绍了研究人员在图像识别算法和图像数据方面的演变，并总结了现在的一些热门话题。三十多年来，许多研究人员在图像识别算法和图像数据方面积累了丰富的知识。如果你对图像训练感兴趣但不知道从哪里开始，这篇文章会是一个很好的开始。这篇文章简要介绍了过去的演变，并总结了现在的一些热门话题。 ImageNet 预训练模型迁移学习（热门话题）使用预训练模型识别未知图像 PyTorch ImageNet 的起源在 2000 年代初期，大多数

2022-05-05

5410

何恺明组新论文：只用ViT做主干也可以做好目标检测

来源：机器之心本文约3100字，建议阅读5分钟arXiv上上传了一篇新论文，证明了将普通的、非分层的视觉 Transformer 作为主干网络进行目标检测的可行性。做目标检测就一定需要 FPN 吗？昨天，来自 Facebook AI Research 的 Yanghao Li、何恺明等研究者在 arXiv 上上传了一篇新论文，证明了将普通的、非分层的视觉 Transformer 作为主干网络进行目标检测的可行性。他们希望这项研究能够引起大家对普通主干检测器的关注。研究概览论文链接： https:/

2022-04-14

3360

【CVPR2022】基于鲁棒区域特征生成的零样本目标检测

来源：专知本文为论文，建议阅读5分钟首次实现了同时针对可见目标类和不可见目标类的统一目标检测模型。黄培亮,韩军伟,程德,张鼎文. Robust Region Feature Synthesizer for Zero-Shot Object Detection, CVPR 2022. 零样本目标检旨在提升模型对训练阶段不可见目标类的检测能力。传统的零样本学习模型在该任务环境下难以为未见目标生成具有足够类内多样性的区域特征，亦或是牺牲掉部分未见目标与图像背景的可区分性。在本研究中，我们充分考虑到物体检测任务

2022-03-29

7900

AI伪装目标检测：让变色龙现出原形！

来源：极市平台本文共3400字，建议阅读5分钟鉴于显著性目标和伪装目标研究的相似性，本文作者将显著性目标与伪装目标合在一起进行研究，文章重点是特征提取网络与特征融合技术，主要介绍了三种方法EGNet，PFANet和SINet。在自然界中许多生物都具有“伪装”的本领，变色龙能够根据周遭的环境来调整自身颜色以达到其“伪装”的目的；狮子将身体“伪装”在草丛之中而伺机等待猎物的靠近；蝴蝶躺在与自身颜色相近的树干上一动不动以躲过天敌的伤害。生物学家将这类伪装方式称为背景匹配，即动物为避免被识别，会尝试改变其自身颜

2022-03-04

3850

与时代共振，AI助力工业缺陷检测

[ 摘要 ]由于深度学习强大的特征提取能力，代替了人工目检和传统的机器视觉，成为了工业缺陷检测的新利器。然而，基于深度学习的语义分割技术在工业缺陷检测领域的应用仍具有挑战性。本文先对比自然场景下的语义分割，概述了工业缺陷检测背景下语义分割技术的特点；接着，对于工业缺陷检测的常见难点，对常见的解决方案进行介绍。最后，作者提出了关于工业缺陷检测实际应用中一些问题的思考。

2021-10-19

9870

独家 | COVID-19：利用Opencv, Keras/Tensorflow和深度学习进行口罩检测

图像识别深度学习 keras opencv 人脸识别

本文为大家介绍了如何使用Opencv，Keras/Tensorflow构建一个口罩检测模型，以及如何将该模型应用到图片和视频中。

2020-06-04

1.8K0

独家 | AutoFlip：智能化视频剪裁的开源框架（附链接）

https 网络安全 github 图像识别

为电视和显示器拍摄制作的视频常常使用横向16：9或者4：3比例。然而越来越多的用户开始在移动设备上制作和观看视频，传统的画面比例并不能完美兼容。为此需要对视频画面进行剪裁，传统的做法涉及到静态剪裁，例如，选定好可视区域，然后把区域外的内容全部剪掉。不幸的是，由于构图种类和相机运动模式繁多，这种静态剪裁经常产出无法让人满意的结果。而其他特殊的做法，常常要求拍摄者手动确定每个画面的目标，并追踪他们在每帧间的转变，然后相应的剪裁掉多余的画面。这个过程是非常耗时、乏味且容易出错的。

2020-03-26

1.5K0

独家｜深度学习训练和推理之间有什么差异？

语音识别神经网络深度学习人工智能图像识别

就像在学校上课一样，神经网络在“训练”阶段得到的教育跟大多数人一样——学会去做一份工作。

2019-08-12

3.5K0

收藏 | AI领域必看的45篇论文（附下载地址）

https 网络安全编程算法图像识别神经网络

而AI领域的发展会是IT中最快的。我们所看到的那些黑客技，其后面无不堆积了大量的论文。而且都是最新、最前沿的论文。

2019-07-22

1K0

医学+数据科学，必将大有可为 | 清华生物医学影像研究中心赵锡海

编程算法图像识别大数据

在数据时代，相比于传统的统计学分析方法，使用数据科学领域的算法模型或图像识别等技术将能辅助医学专家提高医学研究效率和精准度。作为从始至终支持数据院在医疗健康大数据方向研究工作的医学专家，清华大学生物医学影像研究中心研究员赵锡海早就认识到数据科学对于医学研究的重要性，也一直在践行和推动“医工结合”的创新性合作。

2018-07-30

8050

清华大学张长水教授：机器学习和图像识别（附视频、PPT下载）

机器学习图像识别自动化

本篇干货整理自清华大学自动化系教授张长水于2018年4月27日在清华大学数据科学研究院第二届“大数据在清华”高峰论坛主论坛所做的题为《机器学习和图像识别》的演讲。

2018-07-30

2.2K0

大数据赋能司法新发展政产学研嘉宾共聚清华

大数据人工智能图像识别存储

2018年3月23日，以“智汇司法、相得益彰”为主题的清华RONG系列论坛之司法大数据专场在清华大学举办，邀请了国家信息化、法院信息化、司法及大数据领域一线的专家学者出席，就司法信息化建设的方向、大数据如何赋能司法新发展、司法将如何为大数据保驾护航等问题进讨，共话智慧司法体系建设之路。此次论坛由数据科学研究院主办，清华大学法学院、社会科学学院、北京国双科技有限公司协办，清数大数据产业联盟承办。论坛现场大数据助力司法起航——“以知识为中心”建设智慧法院近年来，以大数据为基础的人工智能科技越来越成熟地应

2018-06-07

6590

没有更多了

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态