首页
学习
活动
专区
工具
TVP
发布

机器学习算法与Python学习

专栏作者
1142
文章
1306785
阅读量
186
订阅数
CVPR 2022正式公布最佳论文奖!李飞飞获Thomas S. Huang 纪念奖
点击 机器学习算法与Python学习 ,选择加星标 精彩内容不迷路 机器之心报道 刚刚,CVPR 2022 正式公布了最佳论文、最佳学生论文等奖项。来自 ETH Zurich、华盛顿大学、佐治亚理工学院、捷克理工大学多个机构的研究者共同获得了最佳论文奖,来自阿里巴巴和同济大学的研究者获得了最佳学生论文奖。此外,斯坦福大学教授李飞飞获得了本次大会的 Thomas S. Huang (黄煦涛)纪念奖。 2022 年,‍‍CVPR 大会的投稿量达到 8161 份,相比 2021 年度的 7093 份提交增长
昱良
2022-06-27
1.8K0
万字深度好文!VL最强总结!
点击 机器学习算法与Python学习 ,选择加星标 精彩内容不迷路 本文转自AI科技评论 本文对视觉-语言(VL)智能按时间顺序进行了全面调研,并将这一领域的发展总结为三个阶段: 第一个阶段是2014-2018年,其间,专门的模型被设计用于不同的任务。第二个时代是2019-2021年,在此期间,通过使用有着高质量标签的VL数据集进行预训练,神经网络模型能够学习视觉和语言的联合表征。最后,随着2021年CLIP的出现,第三个时代开始了,此时研究人员寻求在更大的弱标签数据集上预训练VL模型,并通过VL预
昱良
2022-04-02
7550
一文梳理视觉Transformer:与CNN相比,ViT赢在哪儿?
点击 机器学习算法与Python学习 ,选择加星标 精彩内容不迷路 机器之心报道 Transformer 近年来已成为视觉领域的新晋霸主,这个来自 NLP 领域的模型架构在 CV 领域有哪些具体应用?。 Transformer 作为一种基于注意力的编码器 - 解码器架构,不仅彻底改变了自然语言处理(NLP)领域,还在计算机视觉(CV)领域做出了一些开创性的工作。与卷积神经网络(CNN)相比,视觉 Transformer(ViT)依靠出色的建模能力,在 ImageNet、COCO 和 ADE20k 等多个
昱良
2022-03-25
1.1K0
CVPR 2022放榜!2067篇论文被接收:提前传播真会被拒
点击 机器学习算法与Python学习 ,选择加星标 精彩内容不迷路 机器之心报道 放榜了! 在短短几分钟,朋友圈已经被 CVPR 2022 论文接收结果公布的消息刷屏。 作为人工智能领域的顶级会议,CVPR 每年都会吸引大量研究机构和高校参会,投稿量在去年 11 月临近 deadline 时迅速超过了一万——上届 CVPR 2021 的有效投稿数还「仅有」7500 篇。创新高的投稿数引发了审稿压力,截止 1 月 25 日,共有 6427 位审稿人给出了 25801 个评审意见,包括 2104 位紧急审
昱良
2022-03-04
2780
时隔两年,CV大神何恺明最新一作:视觉预训练新范式MAE!大道至简!
论文「Masked Autoencoders Are Scalable Vision Learners」证明了 masked autoencoders(MAE) 是一种可扩展的计算机视觉自监督学习方法。
昱良
2021-11-19
6380
【Transformer】新型ViTGAN性能比肩基于CNN的GAN
卷积神经网络(CNN)在卷积(权重共享和局部连接)和池化(平移等变)方面的强大能力,让其已经成为了现今计算机视觉领域的主导技术。但最近,Transformer 架构已经开始在图像和视频识别任务上与 CNN 比肩。其中尤其值得一提的是视觉 Transformer(ViT)。这种技术会将图像作为 token 序列(类似于自然语言中的词)来解读。Dosovitskiy et al. 的研究表明,ViT 在 ImageNet 基准上能以更低的计算成本取得相当的分类准确度。不同于 CNN 中的局部连接性,ViT 依赖于在全局背景中考虑的表征,其中每个 patch 都必须与同一图像的所有 patch 都关联处理。
昱良
2021-07-27
3450
刷新纪录,揭秘漫画脸背后的AI技术
昨晚做了一个梦,梦里的我变成漫画里的人物,正在为参与选秀苦练舞蹈,期待着万众瞩目登上舞台的一天。
昱良
2021-02-08
7770
ImageNet一作、李飞飞高徒邓嘉获最佳论文奖,ECCV 2020奖项全公布
昨日,计算机视觉顶会 ECCV 2020 公布了最佳论文等奖项,ImageNet 论文一作邓嘉获最佳论文奖。
昱良
2020-08-28
3970
让二次元妹子动起来,用一张图生成动态虚拟主播
我使用的方法结合了之前两项研究。一是 Pumarola et al. 2018 年的 GANimation 论文《GANimation: Anatomically-aware Facial Animation from a Single Image》,我将其用于修改面部的特征(具体来说是闭上眼睛和嘴)。二是 Zhou et al. 2016 年根据外观流实现目标旋转的论文《View Synthesis by Appearance Flow》,我将其用于实现人脸的旋转。
昱良
2019-12-03
2K0
用Matplotlib制作动画
动画是呈现各种现象的有趣方式。在描述像过去几年的股票价格、过去十年的气候变化、季节性和趋势等时间序列数据时,与静态图相比,动画更能说明问题。因为,从动画中,我们可以看到特定参数是如何随时间而变化的。
昱良
2019-11-24
2.2K0
【AI实战】10 行代码带你搞定目标检测
计算机视觉是人工智能的一个重要领域,是关于计算机和软件系统的科学,可以对图像和场景进行识别、理解。计算机视觉还包括图像识别、目标检测、图像生成、图像超分辨率重建等多个领域。由于存在大量的实际需求,目标检测可能是计算机视觉中最有意义的领域。
昱良
2019-09-02
8290
吴恩达 deeplearning.ai 上新了,只需 Python 和高中数学基础
吴恩达的deeplearning.ai上新了!新的AI课程叫做TensorFlow in Practice,面向那些希望学习使用TensorFlow编写AI程序的人。
昱良
2019-08-09
6670
你的电脑是如何识别色图的?
在视频监控系统中,计算机甚至能把你能从一大堆东西里给认出来,连你穿啥颜色衣服都能看的一清二楚。
昱良
2019-07-23
1.7K0
寒冬!100万$图灵奖颁给熬过寒冬的深度学习三巨头
据官方公告介绍,因三位巨头(Hinton、Bengio、LeCun)在深度神经网络概念和工程上的突破,使得 DNN 成为计算的一个重要构成,从而成为 2018 年图灵奖得主。
昱良
2019-07-04
5270
太值得收藏了!秒懂各种深度CNN操作
卷积神经网络(Convolutional Neural Network,CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。它包括卷积层(alternating convolutional layer)和池层(pooling layer)。
昱良
2019-07-04
9050
用Python搞出自己的云词图 | 【带你装起来】
由词汇组成类似云的彩色图形。“词云”就是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。
昱良
2019-07-04
1.1K0
详解计算机视觉五大技术:图像分类、对象检测、目标跟踪、语义分割和实例分割
目前,计算机视觉是深度学习领域最热门的研究领域之一。计算机视觉实际上是一个跨领域的交叉学科,包括计算机科学(图形、算法、理论、系统、体系结构),数学(信息检索、机器学习),工程学(机器人、语音、自然语言处理、图像处理),物理学(光学 ),生物学(神经科学)和心理学(认知科学)等等。许多科学家认为,计算机视觉为人工智能的发展开拓了道路。
昱良
2019-07-04
1.3K0
写给想要填报CS/AI志愿的考生们
国内CS/AI方向又有很多新的变化,最明显的是各大高校纷纷设立人工智能学院,开始招收人工智能专业本科生。最近又要开始新的一轮填报志愿,我又来蹭个热点,花了些时间整理出这篇短文,聊聊人工智能是什么、学什么、怎么学、以及去哪儿学的问题。
昱良
2019-07-04
5780
一份基于Pytorch的视频分类教程
这是一个在UCF101上使用3D RNN/CNN+RNN 进行视频分类的教程,基于Pytorch实现。
昱良
2019-06-02
2.7K0
2018年AI合成最好的5张图,每张图里都藏着最新技术秘密
2017年,Google偷偷上线了一个小app,上传你的大头照,测测你长得跟历史上哪个著名油画里的人物最像。
昱良
2019-01-03
7460
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档