首页
学习
活动
专区
工具
TVP
发布

贾志刚-OpenCV学堂

三本书《Java数字图像处理-编程技巧与应用实践》、《OpenCV Android开发实战》、《OpenCV4应用开发-入门、进阶与工程化实践》作者。OpenCV实验大师平台 软件作者
专栏作者
859
文章
1421338
阅读量
422
订阅数
本人开发 | 零代码从模型训练到部署软件平台发布啦!
大家好,过去的十多年时间,本人一直从事图像处理跟视觉相关的开发与技术培训工作。在此过程中深深感受到OpenCV教学领域缺乏一款好的教学工具软件,它可以帮助高职院校老师减轻备课压力、提高工作效率、提升教学效果,特别是对各种图像处理、分析、测量等机器视觉常见算子熟练掌握与使用,更加高效有针对性的培养机器视觉人才。因此本人从2021年底开始策划启动,前后花了一年多的时间开发完成了一款机器视觉教学平台软件,借助它,高职院校再也不用担心开设OpenCV视觉课程没有硬件、没有软件、没有案例、无法检查学生掌握程度等现实问题。
OpenCV学堂
2023-01-04
6960
3D版DALL-E来了!谷歌发布文本3D生成模型DreamFusion,重点是zero-shot
---- 点击上方↑↑↑“OpenCV学堂”关注我来源:公众号 新智元 授权 【导读】给一个文本提示就能生成3D模型! 自从文本引导的图像生成模型火了以后,画家群体迅速扩张,不会用画笔的人也能发挥想象力进行艺术创作。 但目前的模型,如DALL-E 2, Imagen等仍然停留在二维创作(即图片),无法生成360度无死角的3D模型。 想要直接训练一个text-to-3D的模型非常困难,因为DALL-E 2等模型的训练需要吞噬数十亿个图像-文本对,但三维合成并不存在如此大规模的标注数据,也没有一个高效的模型
OpenCV学堂
2022-10-10
7370
AI终于能生成流畅3D动作片了,不同动作过渡衔接不出bug,准确识别文本指令丨开源
点击上方↑↑↑“OpenCV学堂”关注我来源:公众号 量子位 授权 让3D动画小人做一套丝滑的动作,需要手动渲染多久? 现在交给AI,输入几句话就能搞定(不同颜色代表不同动作): 看向地面并抓住高尔夫球杆,挥动球杆,小跑一段,蹲下。 此前,AI控制的3D人体模型基本只能“每次做一个动作”或“每次完成一条指令”,难以连续完成指令。 现在,无需剪辑或编辑,只需按顺序输入几条命令,3D人物就能自动完成每一套动作,全程丝滑无bug。 这只新AI的名字叫TEACH,来自马普所和古斯塔夫·艾菲尔大学。 网友们脑
OpenCV学堂
2022-10-09
1.1K0
李飞飞新作登PNAS!AI与人类互动23万次,智能水平提高112%
---- 点击上方↑↑↑“OpenCV学堂”关注我来源:公众号 新智元 授权 【导读】与人类互动23万次后,AI的视觉识别能力提高了112%。 人类从与他人的互动中学习,而目前的人工智能却常常只能在与社会隔离的环境中学习。所以当我们把一个智能体放到真实世界中时,它会不可避免地在遇到大量新的数据,无法应对不断变化的新需求。 如何将智能体从只有一堆书的房间里「解放」出来,让它在广阔的社会情境中学习,是一个新的挑战。 最近,斯坦福大学计算机系的 Ranjay Krishna、Donsuk Lee、李飞飞、Mi
OpenCV学堂
2022-10-09
2860
CV下一个风口在哪里?听听顶会审稿人怎么说
“想要发一篇论文,怎么就那么难?” 无论几岁的计算机视觉党,面对这样的灵魂拷问,很有可能都要陷入沉思。 0-1岁的科研人要考虑的是, 谁来告诉我,哪个研究方向比较好,比较热门,比较不卷,比较好发论文。 2岁以上的科研人已然入坑,一时半会也爬不出来, 所以想着,求大神指导,怎么“抢idea”、怎么占坑、怎么快速发论文…… 大多数CV研究生的最终目的地无非两个,工程上的或者学术上的。要么进大厂当算法工程师;要么成为Lab算法研究员。 而要到达理想目的地的前提条件是,有一份拿得出手的成绩——发论文的数量和质量无
OpenCV学堂
2022-10-09
3880
帮林志颖修脸的3D重建,用两块A100加二维CNN就可以实现!
---- 点击上方↑↑↑“OpenCV学堂”关注我来源:公众号 新智元 授权 【导读】不用三维构图的三维重建,速度能到每帧73ms。 三维重建(3D Reconstruction)技术一直是计算机图形学和计算机视觉领域的一个重点研究领域。 简单说,三维重建就是基于二维图像,恢复三维场景结构。 据说,林志颖出车祸后,他的面部重建方案就用到了三维重建。 三维重建的不同技术路线,有望融合 其实,三维重建技术已在游戏、电影、测绘、定位、导航、自动驾驶、VR/AR、工业制造以及消费品领域等方面得到了广泛的应用。
OpenCV学堂
2022-09-27
5480
无人机盖房子登Nature封面!半小时盖2米,未来可上火星
点击上方↑↑↑“OpenCV学堂”关注我来源:公众号 量子位 授权 好家伙,无人机现在都能组团盖房子了! 在路径规划算法的加持下,它们的协作方式是这样的: 上图中蓝色轨迹表示在建造,红色轨迹表示离开建造区域去补充材料。 真正搭载了3D打印装置之后,就可以像这样一层一层地盖上去了: 在快速定型绝缘泡沫材料的实验中,无人机打印2.05米高、共72层的圆筒型建筑原型只需29分钟,验证了此方法建造大型建筑的能力。 而在类水泥材料的薄壁建筑实验,则证明此方法的打印误差不超过5毫米。 相关研究来自伦敦帝国理工学
OpenCV学堂
2022-09-23
2190
Pytorch加入开源生态,成CV开发者标配!
点击上方蓝字关注我们 微信公众号:OpenCV学堂 关注获取更多计算机视觉与深度学习知识 引言: 学习图象分类、目标检测、实例分割、语义分割从理论到实践就看这套课程足够了。这套课程是我通过六个月精心打磨与准备,而且得到大家深度认同的系统化学习Pytorch框架CV相关的视频课程,它都有哪些内容,往下看即可。 01 课程有什么特色 深度学习是涵盖很多领域与方向,为了避免大家学习的太泛没有重点,课程主要针对CV方向组织知识点与章节,去伪留真,注重实战,注重代码实现。从零开始学习深度学习在计算机视觉/机器视觉领域
OpenCV学堂
2022-09-19
6370
没有3D卷积的3D重建方法,A100上重建一帧仅需70ms
点击上方↑↑↑“OpenCV学堂”关注我来源:公众号 机器之心 授权 来自 Niantic 和 UCL 等机构的研究者使用精心设计和训练的 2D 网络,实现了高质量的深度估计和 3D 重建。 从姿态图像重建 3D 室内场景通常分为两个阶段:图像深度估计,然后是深度合并(depth merging)和表面重建(surface reconstruction)。最近,多项研究提出了一系列直接在最终 3D 体积特征空间中执行重建的方法。虽然这些方法已经获得出令人印象深刻的重建结果,但它们依赖于昂贵的 3D 卷积层,
OpenCV学堂
2022-09-14
5020
导师放养,怎样才能自救?
“导师放养,怎样才能自救?” 无论几岁的计算机视觉党,面对这样的灵魂拷问,很有可能都要陷入沉思。 0-1岁的科研人考虑的是,谁来告诉我,哪个研究方向比较好,比较热门,比较不卷,比较好发论文。 2岁以上的科研人已然入坑,一时半会也爬不出来,所以想着,求大神指导,怎么“抢idea”、怎么占坑、怎么快速发论文…… 大多数CV研究生的最终目的地无非两个,工程上的或者学术上的。要么进大厂当算法工程师;要么成为Lab算法研究员。 而要到达理想目的地的前提条件是,有一份拿得出手的成绩——发论文的数量和质量无疑是最好的背
OpenCV学堂
2022-09-07
3850
OpenCV4.X CUDA编译与加速全解析
OpenCV4.x + CUDA概述 OpenCV4.x中关于CUDA加速的内容主要有两个部分,第一部分是之前OpenCV支持的图像处理与对象检测传统算法的CUDA加速;第二部分是OpenCV4.2版本之后开始支持的针对深度学习卷积神经网络模型的CUDA加速。这些内容都在OpenCV的扩展模块中,想要获取这OpenCV CUDA的支持,必须首先编译OpenCV CUDA相关的模块,这里主要是开展模块以CUDA开头的那些。此外编译的电脑或者PC必须有N卡(英伟达GPU卡),并且按照好了正确版本的驱动与cuDN
OpenCV学堂
2022-09-07
1K0
月薪3w6日均写7行代码被开除/ 我国探日成果向全球共享/ 巴菲特首次减持比亚迪…今日更多新鲜事在此
点击上方↑↑↑“OpenCV学堂”关注我来源:公众号 量子位 授权 又到周三,不少人心中的「小周末」! 你有没考虑下班后放松放松? 劳逸结合,别忘关注这些「科技圈都在看」的新鲜事! 今日大新闻 月薪3.6万算法工程师,日均写7行代码被开除; 视觉算法工程师,月薪3.6万,平均一天写7行多代码,被公司解除劳动关系。 近日,这样一则事件在网上引发诸多关注。 其信息源头来自中国裁判文书网,根据其中内容,李某在2020年11月2日入职中科尚易健康科技(北京)有限公司(后简称中科尚易公司),其岗位为机器视觉算法工程
OpenCV学堂
2022-09-01
1970
草图人像变3D模特,360° 无死角还原姿势,一张就行,多“草”都可|SIGGRAPH 2022
点击上方↑↑↑“OpenCV学堂”关注我来源:公众号 量子位 授权 一张随便勾画的草图,居然也可以分分钟自动变成逼真的3D模型?! ‍ ‍ 360° 无死角不说,转换期间真的不需要任何其它角度姿势的输入。 这就是获得了SIGGRAPH 2022荣誉奖的一个最新3D姿态估计模型: Sketch2Pose。 除了草图,像这样的小猴子,四肢严重不按比例生长,Sketch2Pose也可以办到: ‍‍ ‍‍ ‍这是如何做到的? 只要4步,草图人变3D人 将草图上的人物/形象变成3D模型,此前的研究中都还未专
OpenCV学堂
2022-08-29
4570
多模态图像合成与编辑这么火,马普所、南洋理工等出了份详细综述
点击上方↑↑↑“OpenCV学堂”关注我来源:公众号 机器之心 授权 本篇综述通过对现有的多模态图像合成与编辑方法的归纳总结,对该领域目前的挑战和未来方向进行了探讨和分析。 近期 OpenAI 发布的 DALLE-2 和谷歌发布的 Imagen 等实现了令人惊叹的文字到图像的生成效果,引发了广泛关注并且衍生出了很多有趣的应用。而文字到图像的生成属于多模态图像合成与编辑领域的一个典型任务。 近日,来自马普所和南洋理工等机构的研究人员对多模态图像合成与编辑这一大领域的研究现状和未来发展做了详细的调查和分析。
OpenCV学堂
2022-08-29
3760
有福利送书 | 3D对象检测检测概述
点击上方蓝字关注我们 微信公众号:OpenCV学堂 关注获取更多计算机视觉与深度学习知识 将3D对象检测方法分为三类:单目图像,点云以及基于融合的方法。基于单目图像的方法。       尽管2D对象的检测已解决,并已在多个数据集中得到成功应用。但KITTI数据集对对象检测,提出了挑战的特定设置。而这些设置,对于大多数驾驶环境都是常见的,包括小的、被遮挡的或被截断的物体,以及高度饱和的区域或阴影。此外,图像平面上的2D检测,还不足以提供可靠的驱动系统。此类应用需要更精确的3D空间定位和尺寸估算。本节将重点介
OpenCV学堂
2022-08-29
6790
AlphaFold预测了几乎所有已知蛋白质!涵盖100万物种2.14亿结构,数据集开放免费用
点击上方↑↑↑“OpenCV学堂”关注我来源:公众号 量子位 授权 全世界几乎所有已知蛋白质结构,都被AlphaFold预测出来了! 在预测出人类98.2%蛋白质一年后,DeepMind的重磅成果再次引爆学术界。 包括植物、细菌、真菌在内的100万个物种、2.14亿个蛋白质结构,现在都增加到了数据集中。 其中80%结构的可信度达到了足以支撑研究实验的水平,更有35%达到了高置信度。 而且这些数据全部免费开放! DeepMind表示,以后查找蛋白质结构,会像使用搜索引擎一样简单。 创始人哈撒比斯发推激动地说
OpenCV学堂
2022-08-29
2980
从1小时到3.5分钟,Meta新算法一部手机搞定3D人脸数据采集,可用于VR的那种
点击上方↑↑↑“OpenCV学堂”关注我来源:公众号 量子位 授权 搞定这样的人脸3D建模需要几步? 在数据采集的阶段,答案是:一部手机 + 3.5分钟。 没错,仅凭这3.5分钟的数据,就足以生成高保真、可驱动的真实3D人脸头像。 这项研究来自Meta Reality Labs——就是扎克伯格元宇宙计划里的那个核心部门。论文已经被SIGGRAPH 2022接收。 作者提到,这一方法适用于VR应用。 也就是说,在VR的世界里,以后你可能就不必顶着一张卡通脸登场了。 而是可以方便地与胖友们“真身”相见。
OpenCV学堂
2022-07-06
5610
在成人影片里做17种姿势识别?大佬在线求助:训练集不够用!
---- 点击上方↑↑↑“OpenCV学堂”关注我来源:公众号 新智元 授权 【导读】有大佬最近在成人影片中做姿态识别的任务,发帖表示训练集不够用。立刻得到热心网友响应:我赞助140TB数据! 兄弟们又来学技术啦! 今天讲的是人体动作识别(Human Action Recognition),也就是通过模型识别出图片、视频中的人体动作姿势。 最近Reddit的一个网友突发奇想,如果把模型用在成人内容领域,那一定可以大大增加色情视频的鉴别和搜索的准确度。 据作者称,他建立的深度学习模型以图像RGB、骨架(S
OpenCV学堂
2022-07-06
5760
教程推荐 | Pytorch框架CV开发-从入门到实战
点击上方蓝字关注我们 微信公众号:OpenCV学堂 关注获取更多计算机视觉与深度学习知识 引言: 学习图象分类、目标检测、实例分割、语义分割从理论到实践就看这套课程足够了。这套课程是我通过六个月精心打磨与准备,而且得到大家深度认同的系统化学习Pytorch框架CV相关的视频课程,它都有哪些内容,往下看即可。 01 课程有什么特色 深度学习是涵盖很多领域与方向,为了避免大家学习的太泛没有重点,课程主要针对CV方向组织知识点与章节,去伪留真,注重实战,注重代码实现。从零开始学习深度学习在计算机视觉/机器视觉领域
OpenCV学堂
2022-06-17
9070
Gartner权威报告:鹅厂计算机视觉,世界第二
---- 点击上方↑↑↑“OpenCV学堂”关注我来源:公众号 新智元  授权 【导读】腾讯的计算机视觉能力首次进入全球Top2的评分排名! Gartner最新发布的2022年度《Magic Quadrant for Cloud AI Developer Services》是业内权威的云计算评估报告之一,评估对象包括亚马逊、微软、谷歌等全球云厂商。 在核心产品能力评估中,腾讯的计算机视觉凭借出色的产品服务能力,获得了全球Top2的评分排名,创造了国内AI公司在该领域的最高评分排名,领先优势明显。 同时,
OpenCV学堂
2022-06-17
3100
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档