腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

贾志刚-OpenCV学堂

三本书《Java数字图像处理-编程技巧与应用实践》、《OpenCV Android开发实战》、《OpenCV4应用开发-入门、进阶与工程化实践》作者。OpenCV实验大师平台软件作者

专栏作者

859

文章

1417833

阅读量

422

订阅数

tochvision轻松支持十种图像分类模型迁移学习

c++pytorch 机器学习神经网络人工智能

点击上方蓝字关注我们微信公众号：OpenCV学堂关注获取更多计算机视觉与深度学习知识 torchvision分类介绍 Torchvision高版本支持各种SOTA的图像分类模型，同时还支持不同数据集分类模型的预训练模型的切换。使用起来十分方便快捷，Pytroch中支持两种迁移学习方式，分别是： - Finetune模式基于预训练模型，全链路调优参数- 冻结特征层模式这种方式只修改输出层的参数，CNN部分的参数冻结上述两种迁移方式，分别适合大量数据跟少量数据，前一种方式计算跟训练时间会比第二种方

2022-10-09

4810

知乎热议：985计算机视觉研究生找不到工作？

编程算法神经网络深度学习人工智能知识图谱

AI算法工程师走下神坛了？这几年来，圈子内越来越卷的话题持续不下，再加上大厂程序员“被毕业”、“再就业”的新闻层出不穷，贩卖给人们的焦虑也越来越多： 2016年——深度学习的春天是不是要来了?

2022-09-27

6390

先马后看！YOLO论文讲解：V1-V7

神经网络深度学习人工智能图像识别云直播

YOLO V7出来的时候，有朋友跟我吐槽：V5还没闹明白呢，又来个V7，太卷了。我找来了深耕目标检测的朋友张老师，从V1到V7，给各位做一次YOLO的系统分享。张老师在辅助驾驶领域深耕多年，主要研究计算机视觉在工业目标检测、图像分割、人脸检测和识别等领域的落地。是一位既有深厚理论知识储备，又有丰富工业落地经验积累的高级算法工程师。相信各位能从张老师的分享中，既学习到YOLO系列的理论架构，又了解到YOLO在实际工业中的应用。因为分享的内容比较多，所以分两天进行，分别在9月21日和9月22日晚20:

2022-09-23

7440

TPAMI 2022 | 不同数据模态的人类动作识别综述，涵盖500篇文章精华

机器学习神经网络人工智能学习方法深度学习

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号机器之心授权本文对最近被 TPAMI 接收的一篇综述文章 Human Action Recognition from Various Data Modalities: A Review（基于不同数据模态的人类动作识别综述）进行解读。原综述文章地址：https:arxiv.org/pdf/2012.11866.pdf 1 概述人类动作识别（Human Action Recognition, HAR）旨在理解人类的行为，并为每个行为分配一个标签。多

2022-09-19

1.3K0

二十多篇顶会？！顶会论文大佬聊多模态

云直播神经网络深度学习人工智能

在各种科幻大片里，我们似乎可以照见科技发展的趋势与目标。比如，与真人无二的Ai机器人；会让人产生，为科研，掉再多头发都值得的错觉（不是）。人工智能的发展其实是一个不断模拟人类，逐渐向人类智能逼近的过程。在现实世界中，数据天然以“多模态”的形式存在，人类通过综合运用视觉、听觉、触觉、嗅觉等多种感官，来接触和理解大千世界。因此，要探索实现通用人工智能（AGI）的路径，人工智能（AI）从单模态走向多模态必然是大势所趋。当我们把目光从未来拉向当前，“多模态”的落地应用场景也非常广泛—— 借助多模态技术

2022-09-14

5450

推荐一个论文写作神器

机器学习神经网络深度学习人工智能

朋友们，开学啦，你的论文开始写了嘛~ 论文通俗来说是本科和硕士的升学助力，也是学术界的硬通货，更是未来工作的加分项和敲门砖。论文的写作对很多学生来说，是一种挑战。有些学生不知该如何对论文做选题，更多的学生则是对毕业论文写作到底有什么要求不清楚，不知从何下手，常常为毕业论文发愁。我跟几位CVPR、ECCV等顶会审稿人聊了聊，总结输出如下文，希望对大家有启发。扫码0.1元领取《顶会审稿人论文写作干货》论文写作的分为四个顺序：阅读论文→确定创新点→Coding／实验→论文写作。 01 阅读论文发表论

2022-09-09

3880

ECCV 2022 | 清华&Meta提出HorNet，用递归门控卷积进行高阶空间相互作用

机器学习神经网络深度学习人工智能编程算法

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号机器之心授权来自清华大学和 Meta AI 的研究者证明了视觉 Transformer 的关键，即输入自适应、长程和高阶空间交互，也可以通过基于卷积的框架有效实现。视觉 Transformer 的最新进展表明，在基于点积自注意力的新空间建模机制驱动的各种任务中取得了巨大成功。在本文中，来自清华大学和 Meta AI 的研究者证明了视觉 Transformer 背后的关键成分，即输入自适应、长程和高阶空间交互，也可以通过基于卷积的框架有效实现。作者提

2022-09-09

4980

Vision Transformers看到的东西是和卷积神经网络一样的吗？

机器学习神经网络深度学习人工智能

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号 AI公园授权 ---- 作者：Mengliu Zhao 编译：ronghuaiyang 导读这是对论文《Do Vision Transformers See Like Convolutional Neural Networks》的一篇解读。 Vision Transformer (ViT)自发布以来获得了巨大的人气，并显示出了比基于CNN的模型(如ResNet)更大的潜力。但是为什么Vision Transformer比CNN的模型更好呢？最近发

2022-09-08

8780

Yann LeCun：大模型方向错了，智力无法接近人类

深度学习神经网络人工智能 NLP 服务

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号机器之心授权你训练大模型用的是语言，还想获得 AGI？那肯定是永远也不行的。「语言只承载了所有人类知识的一小部分；大部分人类知识、所有动物知识都是非语言的；因此，大语言模型是无法接近人类水平智能的，」这是图灵奖得主 Yann LeCun 对于人工智能前景的最新思考。昨天，他与纽约大学博士后 Jacob Browning 合著的新文章发表在《NOEMA》上，引发了人们的讨论。在文章中，作者讨论了当前流行的大规模语言模型，认为其存在明显的极限。

2022-08-29

3690

简单粗暴，5行代码，快速实现图像分割

机器学习神经网络深度学习人工智能 https

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号量子位授权图像分割，作为计算机视觉的基础，是图像理解的重要组成部分，也是图像处理的难点之一。那么，如何优雅且体面的图像分割？ 5行代码、分分钟实现的库——PixelLib，了解一下。当然，如此好用的项目，开源是必须的。为什么要用到图像分割？虽然计算机视觉研究工作者，会经常接触图像分割的问题，但是我们还是需要对其做下“赘述”(方便初学者)。我们都知道每个图像都是有一组像素值组成。简单来说，图像分割就是在像素级上，对图像进行分类的任务。图像

2022-08-29

6500

多模态图像合成与编辑这么火，马普所、南洋理工等出了份详细综述

机器学习神经网络深度学习人工智能图像处理

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号机器之心授权本篇综述通过对现有的多模态图像合成与编辑方法的归纳总结，对该领域目前的挑战和未来方向进行了探讨和分析。近期 OpenAI 发布的 DALLE-2 和谷歌发布的 Imagen 等实现了令人惊叹的文字到图像的生成效果，引发了广泛关注并且衍生出了很多有趣的应用。而文字到图像的生成属于多模态图像合成与编辑领域的一个典型任务。近日，来自马普所和南洋理工等机构的研究人员对多模态图像合成与编辑这一大领域的研究现状和未来发展做了详细的调查和分析。

2022-08-29

3760

秋招算法岗卷上天？大厂技术岗缩减70%！

编程算法神经网络深度学习人工智能语音识别

---- 点击上方↑↑↑“OpenCV学堂”关注我来源：公众号新智元授权【导读】2023年秋招已经陆续展开，AI就业形势再次引发了网友热议。有人说，2023年秋招技术岗哀鸿遍野。那么，真实情况如何？年年秋招年年难，又是一年秋招季。随着各大厂纷纷发布了2023届的秋季校园招聘信息，毕业生都开始忙活起来了。互联网大裁员的当下，不得不说，今年是真难啊。算法岗太卷？对于计算机专业的毕业生而言，算法岗基本上就是「高薪」的代名词。然而，由于这几年AI方向异常火爆，算法岗似乎也已经承载不下了。

2022-08-29

6180

毕业月薪3万起！算法工程师九成硕博学历，腾讯成AI人才收割机

编程算法神经网络深度学习人工智能自动驾驶

---- 点击上方↑↑↑“OpenCV学堂”关注我来源：公众号新智元授权【导读】毕业时，你的月薪多少？《人工智能顶尖人才数据图鉴2022》显示，AI算法工程师应届生底薪超3万，且九成是硕博学历。刚毕业月薪3万啥体验？昨日，职场社交平台脉脉发布了《人工智能顶尖人才数据图鉴2022》。报告显示，人工智能行业，算法工程师应届生毕业起薪3.2万，近九成算法工程师为硕博学历。而人工智能人才大多来自985高校，清华第1，北大第3。算法工程师月薪3万起，九成硕博学历此外，脉脉就人工智能的人才

2022-08-29

4310

人脑90%都是自监督学习，AI大模型离模拟大脑还有多远？

NLP 服务编程算法神经网络深度学习人工智能

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号新智元授权【导读】人的大脑和自监督学习模型的相似度有多高？我们都知道，人类的大脑90%都是自监督学习的，生物会不断对下一步发生的事情做出预测。自监督学习，就是不需要外部干预也能做出决策。只有少数情况我们会接受外部反馈，比如老师说：「你搞错了」。而现在有学者发现，大型语言模型的自监督学习机制，像极了我们的大脑。知名科普媒体Quanta Magazine近日报道，越来越多的研究发现，自监督学习模型，尤其是大型语言模型的自学方式，与我们的大脑的

2022-08-29

3030

15年软件架构师经验总结：在ML领域，初学者踩过的5个坑

机器学习深度学习人工智能线性回归

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号机器之心授权如果你要构建你的第一个模型，请注意并避免这些问题。数据科学和机器学习正变得越来越流行，这个领域的人数每天都在增长。这意味着有很多数据科学家在构建他们的第一个机器学习模型时没有丰富的经验，而这也是错误可能会发生的地方。近日，软件架构师、数据科学家、Kaggle 大师 Agnis Liukis 撰写了一篇文章，他在文中谈了谈在机器学习中最常见的一些初学者错误的解决方案，以确保初学者了解并避免它们。 Agnis Liukis 拥有超过 1

2022-08-29

3050

大火的多模态，落地了吗？

编程算法机器学习神经网络深度学习人工智能

01 多模态机器学习多模态机器学习，英文全称 MultiModal Machine Learning (MMML)，旨在通过机器学习的方法实现处理和理解多源模态信息的能力。每一种信息的来源或者形式，都可以称为一种模态。例如，人有触觉，听觉，视觉，嗅觉；信息有语音、视频、文字等媒介；多种多样的传感器，如雷达、红外、加速度计等。以上的每一种都可以称为一种模态。模态也可以有非常广泛的定义，比如我们可以把两种不同的语言当做是两种模态，甚至在两种不同情况下采集到的数据集，亦可认为是两种模态。 02 爆火的多

2022-08-29

6730

图像大面积缺失，也能逼真修复，新模型CM-GAN兼顾全局结构和纹理细节

机器学习神经网络深度学习人工智能 tcp/ip

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号机器之心授权来自罗彻斯特大学和 Adobe Research 的研究者提出了一种新的生成网络 CM-GAN，很好地合成了整体结构和局部细节，在定量和定性评估方面都显著优于现有 SOTA 方法，如 CoModGAN 和 LaMa。图像修复是指对图像缺失区域进行补全，是计算机视觉的基本任务之一。该方向有许多实际应用，例如物体移除、图像重定向、图像合成等。早期的修复方法基于图像块合成或颜色扩散来填充图像缺失部分。为了完成更复杂的图像结构，研究人员开始转

2022-08-29

5030

解锁CNN和Transformer正确结合方法，字节跳动提出有效的下一代视觉Transformer

神经网络机器学习深度学习人工智能 opencv

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号机器之心授权来自字节跳动的研究者提出了一种能在现实工业场景中有效部署的下一代视觉 Transformer，即 Next-ViT。Next-ViT 能像 CNN 一样快速推断，并有 ViT 一样强大的性能。由于复杂的注意力机制和模型设计，大多数现有的视觉 Transformer（ViT）在现实的工业部署场景中不能像卷积神经网络（CNN）那样高效地执行。这就带来了一个问题：视觉神经网络能否像 CNN 一样快速推断并像 ViT 一样强大？近期一些工作试

2022-07-26

6911

解决CNN固有缺陷， CCNN凭借单一架构，实现多项SOTA

深度学习机器学习人工智能云联网神经网络

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号机器之心授权本文提出了迈向通用 CNN 架构：CCNN，可以用于任意分辨率、长度和维度的数据。在 VGG、U-Net、TCN 网络中... CNN 虽然功能强大，但必须针对特定问题、数据类型、长度和分辨率进行定制，才能发挥其作用。我们不禁会问，可以设计出一个在所有这些网络中都运行良好的单一 CNN 吗？本文中，来自阿姆斯特丹自由大学、阿姆斯特丹大学、斯坦福大学的研究者提出了 CCNN，单个 CNN 就能够在多个数据集（例如 LRA）上实现 SOT

2022-07-26

6640

如何实现超大尺寸图像快速识别

图像识别神经网络深度学习人工智能编程算法

一般情况下，遥感目标检测中，遥感图像的图片尺寸都会很大，且图像中元素极为复杂，近期开赛的亚马逊云科技【AI For Good - 2022 遥感光学影像目标检测挑战赛】也不例外，动辄超过10000 x 10000的卫星遥感图像让许多选手感到头疼。同时遥感影像中目标尺寸差别大、小而密集、角度各异也导致常见的CV框架难以实现快速精准的目标识别。所以，如何实现遥感图像等超大尺寸图像快速识别？目前比较成熟的卫星图像识别算法并不少，但大多依托于强大的计算资源，为了用有限的计算资源实现大尺寸图像识别，我们找到了一个

2022-07-14

7970

点击加载更多

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态