腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

贾志刚-OpenCV学堂

三本书《Java数字图像处理-编程技巧与应用实践》、《OpenCV Android开发实战》、《OpenCV4应用开发-入门、进阶与工程化实践》作者。OpenCV实验大师平台软件作者

专栏作者

859

文章

1421338

阅读量

422

订阅数

本人开发 | 零代码从模型训练到部署软件平台发布啦！

深度学习图像处理 opencv 编程算法

大家好，过去的十多年时间，本人一直从事图像处理跟视觉相关的开发与技术培训工作。在此过程中深深感受到OpenCV教学领域缺乏一款好的教学工具软件，它可以帮助高职院校老师减轻备课压力、提高工作效率、提升教学效果，特别是对各种图像处理、分析、测量等机器视觉常见算子熟练掌握与使用，更加高效有针对性的培养机器视觉人才。因此本人从2021年底开始策划启动，前后花了一年多的时间开发完成了一款机器视觉教学平台软件，借助它，高职院校再也不用担心开设OpenCV视觉课程没有硬件、没有软件、没有案例、无法检查学生掌握程度等现实问题。

2023-01-04

6960

3D版DALL-E来了！谷歌发布文本3D生成模型DreamFusion，重点是zero-shot

图像处理 tcp/ip

---- 点击上方↑↑↑“OpenCV学堂”关注我来源：公众号新智元授权【导读】给一个文本提示就能生成3D模型！自从文本引导的图像生成模型火了以后，画家群体迅速扩张，不会用画笔的人也能发挥想象力进行艺术创作。但目前的模型，如DALL-E 2, Imagen等仍然停留在二维创作（即图片），无法生成360度无死角的3D模型。想要直接训练一个text-to-3D的模型非常困难，因为DALL-E 2等模型的训练需要吞噬数十亿个图像-文本对，但三维合成并不存在如此大规模的标注数据，也没有一个高效的模型

2022-10-10

7370

AI终于能生成流畅3D动作片了，不同动作过渡衔接不出bug，准确识别文本指令丨开源

图像处理 babel.js

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号量子位授权让3D动画小人做一套丝滑的动作，需要手动渲染多久？现在交给AI，输入几句话就能搞定（不同颜色代表不同动作）：看向地面并抓住高尔夫球杆，挥动球杆，小跑一段，蹲下。此前，AI控制的3D人体模型基本只能“每次做一个动作”或“每次完成一条指令”，难以连续完成指令。现在，无需剪辑或编辑，只需按顺序输入几条命令，3D人物就能自动完成每一套动作，全程丝滑无bug。这只新AI的名字叫TEACH，来自马普所和古斯塔夫·艾菲尔大学。网友们脑

2022-10-09

1.1K0

李飞飞新作登PNAS！AI与人类互动23万次，智能水平提高112%

学习方法图像处理强化学习

---- 点击上方↑↑↑“OpenCV学堂”关注我来源：公众号新智元授权【导读】与人类互动23万次后，AI的视觉识别能力提高了112%。人类从与他人的互动中学习，而目前的人工智能却常常只能在与社会隔离的环境中学习。所以当我们把一个智能体放到真实世界中时，它会不可避免地在遇到大量新的数据，无法应对不断变化的新需求。如何将智能体从只有一堆书的房间里「解放」出来，让它在广阔的社会情境中学习，是一个新的挑战。最近，斯坦福大学计算机系的 Ranjay Krishna、Donsuk Lee、李飞飞、Mi

2022-10-09

2860

CV下一个风口在哪里？听听顶会审稿人怎么说

ide 监督学习 linux http 图像处理

“想要发一篇论文，怎么就那么难？” 无论几岁的计算机视觉党，面对这样的灵魂拷问，很有可能都要陷入沉思。 0-1岁的科研人要考虑的是，谁来告诉我，哪个研究方向比较好，比较热门，比较不卷，比较好发论文。 2岁以上的科研人已然入坑，一时半会也爬不出来，所以想着，求大神指导，怎么“抢idea”、怎么占坑、怎么快速发论文…… 大多数CV研究生的最终目的地无非两个，工程上的或者学术上的。要么进大厂当算法工程师；要么成为Lab算法研究员。而要到达理想目的地的前提条件是，有一份拿得出手的成绩——发论文的数量和质量无

2022-10-09

3880

帮林志颖修脸的3D重建，用两块A100加二维CNN就可以实现！

图像处理深度学习 https 网络安全编程算法

---- 点击上方↑↑↑“OpenCV学堂”关注我来源：公众号新智元授权【导读】不用三维构图的三维重建，速度能到每帧73ms。三维重建（3D Reconstruction）技术一直是计算机图形学和计算机视觉领域的一个重点研究领域。简单说，三维重建就是基于二维图像，恢复三维场景结构。据说，林志颖出车祸后，他的面部重建方案就用到了三维重建。三维重建的不同技术路线，有望融合其实，三维重建技术已在游戏、电影、测绘、定位、导航、自动驾驶、VR/AR、工业制造以及消费品领域等方面得到了广泛的应用。

2022-09-27

5480

无人机盖房子登Nature封面！半小时盖2米，未来可上火星

https 图像处理网络安全机器人

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号量子位授权好家伙，无人机现在都能组团盖房子了！在路径规划算法的加持下，它们的协作方式是这样的：上图中蓝色轨迹表示在建造，红色轨迹表示离开建造区域去补充材料。真正搭载了3D打印装置之后，就可以像这样一层一层地盖上去了：在快速定型绝缘泡沫材料的实验中，无人机打印2.05米高、共72层的圆筒型建筑原型只需29分钟，验证了此方法建造大型建筑的能力。而在类水泥材料的薄壁建筑实验，则证明此方法的打印误差不超过5毫米。相关研究来自伦敦帝国理工学

2022-09-23

2190

Pytorch加入开源生态，成CV开发者标配！

深度学习图像处理

点击上方蓝字关注我们微信公众号：OpenCV学堂关注获取更多计算机视觉与深度学习知识引言：学习图象分类、目标检测、实例分割、语义分割从理论到实践就看这套课程足够了。这套课程是我通过六个月精心打磨与准备，而且得到大家深度认同的系统化学习Pytorch框架CV相关的视频课程，它都有哪些内容，往下看即可。 01 课程有什么特色深度学习是涵盖很多领域与方向，为了避免大家学习的太泛没有重点，课程主要针对CV方向组织知识点与章节，去伪留真，注重实战，注重代码实现。从零开始学习深度学习在计算机视觉/机器视觉领域

2022-09-19

6370

没有3D卷积的3D重建方法，A100上重建一帧仅需70ms

对象存储图像处理 https github 网络安全

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号机器之心授权来自 Niantic 和 UCL 等机构的研究者使用精心设计和训练的 2D 网络，实现了高质量的深度估计和 3D 重建。从姿态图像重建 3D 室内场景通常分为两个阶段：图像深度估计，然后是深度合并（depth merging）和表面重建（surface reconstruction）。最近，多项研究提出了一系列直接在最终 3D 体积特征空间中执行重建的方法。虽然这些方法已经获得出令人印象深刻的重建结果，但它们依赖于昂贵的 3D 卷积层，

2022-09-14

5020

导师放养，怎样才能自救？

http 微信图像处理编程算法

“导师放养，怎样才能自救？” 无论几岁的计算机视觉党，面对这样的灵魂拷问，很有可能都要陷入沉思。 0-1岁的科研人考虑的是，谁来告诉我，哪个研究方向比较好，比较热门，比较不卷，比较好发论文。 2岁以上的科研人已然入坑，一时半会也爬不出来，所以想着，求大神指导，怎么“抢idea”、怎么占坑、怎么快速发论文…… 大多数CV研究生的最终目的地无非两个，工程上的或者学术上的。要么进大厂当算法工程师；要么成为Lab算法研究员。而要到达理想目的地的前提条件是，有一份拿得出手的成绩——发论文的数量和质量无疑是最好的背

2022-09-07

3850

OpenCV4.X CUDA编译与加速全解析

opencv 人脸识别深度学习打包图像处理

OpenCV4.x + CUDA概述 OpenCV4.x中关于CUDA加速的内容主要有两个部分，第一部分是之前OpenCV支持的图像处理与对象检测传统算法的CUDA加速；第二部分是OpenCV4.2版本之后开始支持的针对深度学习卷积神经网络模型的CUDA加速。这些内容都在OpenCV的扩展模块中，想要获取这OpenCV CUDA的支持，必须首先编译OpenCV CUDA相关的模块，这里主要是开展模块以CUDA开头的那些。此外编译的电脑或者PC必须有N卡（英伟达GPU卡），并且按照好了正确版本的驱动与cuDN

2022-09-07

1K0

月薪3w6日均写7行代码被开除/ 我国探日成果向全球共享/ 巴菲特首次减持比亚迪…今日更多新鲜事在此

编程算法深度学习图像处理

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号量子位授权又到周三，不少人心中的「小周末」！你有没考虑下班后放松放松？劳逸结合，别忘关注这些「科技圈都在看」的新鲜事！今日大新闻月薪3.6万算法工程师，日均写7行代码被开除；视觉算法工程师，月薪3.6万，平均一天写7行多代码，被公司解除劳动关系。近日，这样一则事件在网上引发诸多关注。其信息源头来自中国裁判文书网，根据其中内容，李某在2020年11月2日入职中科尚易健康科技（北京）有限公司（后简称中科尚易公司），其岗位为机器视觉算法工程

2022-09-01

1970

草图人像变3D模特，360° 无死角还原姿势，一张就行，多“草”都可｜SIGGRAPH 2022

图像处理 https 网络安全

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号量子位授权一张随便勾画的草图，居然也可以分分钟自动变成逼真的3D模型？！ ‍ ‍ 360° 无死角不说，转换期间真的不需要任何其它角度姿势的输入。这就是获得了SIGGRAPH 2022荣誉奖的一个最新3D姿态估计模型： Sketch2Pose。除了草图，像这样的小猴子，四肢严重不按比例生长，Sketch2Pose也可以办到： ‍‍ ‍‍ ‍这是如何做到的？只要4步，草图人变3D人将草图上的人物/形象变成3D模型，此前的研究中都还未专

2022-08-29

4570

多模态图像合成与编辑这么火，马普所、南洋理工等出了份详细综述

机器学习神经网络深度学习人工智能图像处理

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号机器之心授权本篇综述通过对现有的多模态图像合成与编辑方法的归纳总结，对该领域目前的挑战和未来方向进行了探讨和分析。近期 OpenAI 发布的 DALLE-2 和谷歌发布的 Imagen 等实现了令人惊叹的文字到图像的生成效果，引发了广泛关注并且衍生出了很多有趣的应用。而文字到图像的生成属于多模态图像合成与编辑领域的一个典型任务。近日，来自马普所和南洋理工等机构的研究人员对多模态图像合成与编辑这一大领域的研究现状和未来发展做了详细的调查和分析。

2022-08-29

3760

有福利送书 | 3D对象检测检测概述

图像处理自动驾驶无人驾驶机器学习神经网络

点击上方蓝字关注我们微信公众号：OpenCV学堂关注获取更多计算机视觉与深度学习知识将3D对象检测方法分为三类：单目图像，点云以及基于融合的方法。基于单目图像的方法。尽管2D对象的检测已解决，并已在多个数据集中得到成功应用。但KITTI数据集对对象检测，提出了挑战的特定设置。而这些设置，对于大多数驾驶环境都是常见的，包括小的、被遮挡的或被截断的物体，以及高度饱和的区域或阴影。此外，图像平面上的2D检测，还不足以提供可靠的驱动系统。此类应用需要更精确的3D空间定位和尺寸估算。本节将重点介

2022-08-29

6790

AlphaFold预测了几乎所有已知蛋白质！涵盖100万物种2.14亿结构，数据集开放免费用

图像处理 https 网络安全开源搜索引擎

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号量子位授权全世界几乎所有已知蛋白质结构，都被AlphaFold预测出来了！在预测出人类98.2%蛋白质一年后，DeepMind的重磅成果再次引爆学术界。包括植物、细菌、真菌在内的100万个物种、2.14亿个蛋白质结构，现在都增加到了数据集中。其中80%结构的可信度达到了足以支撑研究实验的水平，更有35%达到了高置信度。而且这些数据全部免费开放！ DeepMind表示，以后查找蛋白质结构，会像使用搜索引擎一样简单。创始人哈撒比斯发推激动地说

2022-08-29

2980

从1小时到3.5分钟，Meta新算法一部手机搞定3D人脸数据采集，可用于VR的那种

图像处理 https html 网络安全

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号量子位授权搞定这样的人脸3D建模需要几步？在数据采集的阶段，答案是：一部手机 + 3.5分钟。没错，仅凭这3.5分钟的数据，就足以生成高保真、可驱动的真实3D人脸头像。这项研究来自Meta Reality Labs——就是扎克伯格元宇宙计划里的那个核心部门。论文已经被SIGGRAPH 2022接收。作者提到，这一方法适用于VR应用。也就是说，在VR的世界里，以后你可能就不必顶着一张卡通脸登场了。而是可以方便地与胖友们“真身”相见。

2022-07-06

5610

在成人影片里做17种姿势识别？大佬在线求助：训练集不够用！

---- 点击上方↑↑↑“OpenCV学堂”关注我来源：公众号新智元授权【导读】有大佬最近在成人影片中做姿态识别的任务，发帖表示训练集不够用。立刻得到热心网友响应：我赞助140TB数据！兄弟们又来学技术啦！今天讲的是人体动作识别（Human Action Recognition），也就是通过模型识别出图片、视频中的人体动作姿势。最近Reddit的一个网友突发奇想，如果把模型用在成人内容领域，那一定可以大大增加色情视频的鉴别和搜索的准确度。据作者称，他建立的深度学习模型以图像RGB、骨架（S

2022-07-06

5760

教程推荐 | Pytorch框架CV开发-从入门到实战

深度学习图像处理

点击上方蓝字关注我们微信公众号：OpenCV学堂关注获取更多计算机视觉与深度学习知识引言：学习图象分类、目标检测、实例分割、语义分割从理论到实践就看这套课程足够了。这套课程是我通过六个月精心打磨与准备，而且得到大家深度认同的系统化学习Pytorch框架CV相关的视频课程，它都有哪些内容，往下看即可。 01 课程有什么特色深度学习是涵盖很多领域与方向，为了避免大家学习的太泛没有重点，课程主要针对CV方向组织知识点与章节，去伪留真，注重实战，注重代码实现。从零开始学习深度学习在计算机视觉/机器视觉领域

2022-06-17

9070

Gartner权威报告：鹅厂计算机视觉，世界第二

图像处理神经网络深度学习人工智能人脸识别

---- 点击上方↑↑↑“OpenCV学堂”关注我来源：公众号新智元授权【导读】腾讯的计算机视觉能力首次进入全球Top2的评分排名！ Gartner最新发布的2022年度《Magic Quadrant for Cloud AI Developer Services》是业内权威的云计算评估报告之一，评估对象包括亚马逊、微软、谷歌等全球云厂商。在核心产品能力评估中，腾讯的计算机视觉凭借出色的产品服务能力，获得了全球Top2的评分排名，创造了国内AI公司在该领域的最高评分排名，领先优势明显。同时，

2022-06-17

3100

点击加载更多

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态