腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

贾志刚-OpenCV学堂

三本书《Java数字图像处理-编程技巧与应用实践》、《OpenCV Android开发实战》、《OpenCV4应用开发-入门、进阶与工程化实践》作者。OpenCV实验大师平台软件作者

专栏作者

861

文章

1424466

阅读量

422

订阅数

谷歌AI生成视频两连发：720p高清+长镜头，网友：对短视频行业冲击太大

短视频 https 网络安全 NLP 服务 html

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号量子位授权内容生成AI进入视频时代！ Meta发布「用嘴做视频」仅一周，谷歌CEO劈柴哥接连派出两名选手上场竞争。第一位Imagen Video与Meta的Make-A-Video相比突出一个高清，能生成1280*768分辨率、每秒24帧的视频片段。另一位选手Phenaki，则能根据200个词左右的提示语生成2分钟以上的长镜头，讲述一个完整的故事。网友看过后表示，这一切进展实在太快了。也有网友认为，这种技术一旦成熟，会冲击短视频行业

2022-10-09

7440

这个深度学习库能执行10多种图像文本任务，有20多个数据集，还统一接口｜已开源

tcp/ip https 网络安全开源深度学习

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号量子位授权支持10余种图像文本任务，囊括20多种数据集，还提供SOTA模型性能和可复现预训练及微调实验配置。没错，这是一个视觉语言深度学习框架就可以拥有的。这个库的庐山真面目是：Salesforce亚洲研究院推出的LAVIS。并且，它还统一了接口，降低开发成本和入门门槛。最重要的是：已开源！ LAVIS全⽅位⽀持视觉语⾔任务、数据集、模型。如果还不能看不出它的优势，那话不多说，直接看LAVIS与现有多模态库的对比图。相较之下，现存的视

2022-10-09

4740

三分之一的作者都没实质性贡献，论文挂名现象该停了

https 网络安全

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号机器之心授权「假作者」比抄袭者更可耻。一篇学术论文通常由多位作者共同完成，但是这些作者的贡献显然是不一样的，有些甚至只是「挂名作者」。一种常见的现象是论文主要作者所在团队的负责人或资助者会出现在作者名单里，即使他们对研究本身几乎没有思路贡献。这显然是学术界存在的一种问题。由康奈尔大学动物医学副教授 Nicola Di Girolamo 领导的团队做了一项新的调查研究，发现「挂名作者」的现象似乎很常见。该研究调查了超过 600000 名论文作者，其

2022-10-09

5730

LeCun：概率论无法实现真正AI，我们要退回原点重新开始

无人驾驶自动驾驶深度学习 https 强化学习

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号量子位授权马库斯又开炮了，直指LeCun最新一篇采访。「LeCun所说的一切，我之前几乎逐字逐句都说过。」「大部分内容就在2018年一篇论文中，而LeCun当时还嘲笑，大部分内容是错误的」。同样在Twitter上，马库斯也发布数十条相关主题推文，还是针对LeCun的这篇内容，引发不少业内人关注。目前，相关媒体ZDNet已注意到马库斯的声音，并在原报道中刊出相关争议—— 但目前LeCun尚未回应。所以，这究竟是怎样一篇采访？LeCun又说

2022-09-29

2580

帮林志颖修脸的3D重建，用两块A100加二维CNN就可以实现！

图像处理深度学习 https 网络安全编程算法

---- 点击上方↑↑↑“OpenCV学堂”关注我来源：公众号新智元授权【导读】不用三维构图的三维重建，速度能到每帧73ms。三维重建（3D Reconstruction）技术一直是计算机图形学和计算机视觉领域的一个重点研究领域。简单说，三维重建就是基于二维图像，恢复三维场景结构。据说，林志颖出车祸后，他的面部重建方案就用到了三维重建。三维重建的不同技术路线，有望融合其实，三维重建技术已在游戏、电影、测绘、定位、导航、自动驾驶、VR/AR、工业制造以及消费品领域等方面得到了广泛的应用。

2022-09-27

5490

无人机盖房子登Nature封面！半小时盖2米，未来可上火星

https 图像处理网络安全机器人

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号量子位授权好家伙，无人机现在都能组团盖房子了！在路径规划算法的加持下，它们的协作方式是这样的：上图中蓝色轨迹表示在建造，红色轨迹表示离开建造区域去补充材料。真正搭载了3D打印装置之后，就可以像这样一层一层地盖上去了：在快速定型绝缘泡沫材料的实验中，无人机打印2.05米高、共72层的圆筒型建筑原型只需29分钟，验证了此方法建造大型建筑的能力。而在类水泥材料的薄壁建筑实验，则证明此方法的打印误差不超过5毫米。相关研究来自伦敦帝国理工学

2022-09-23

2210

做40年程序员是一种什么体验？他给出了13条建议

https 网络安全

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号量子位授权干了40年程序员，是一种什么体验？一位从1984年就开始当程序员的老哥出来“现身说法”了。他总结了自己从业近40年的经验，汇集成13条建议，希望能给想长期做程序员的新手们提供一些帮助。文章一发布，就在reddit、推特上引发讨论，许多程序员也纷纷跟帖附议，有网友就表示：不能同意更多！赶紧来看看，他都分享了哪些干货吧。来自近40年码农的经验分享这位老哥叫Noah Gibbs，曾供职于英伟达、AppFolio Inc、DAQRI

2022-09-19

3980

PyTorch和Meta「分家」！以后归Linux基金会管了

html pytorch https linux 网络安全

---- 点击上方↑↑↑“OpenCV学堂”关注我来源：公众号新智元授权【导读】PyTorch要和Meta分开了？成立新的基金会，成为Linux基金会的一部分。一觉醒来，PyTorch「换家」了？ Meta宣布，其AI研究框架PyTorch有了一个新家，将转移到一个独立的PyTorch基金会。该基金会将成为非营利性的Linux基金会的一部分，是一个以协作开发开源软件为核心任务的技术联盟。据Meta的工程副总裁Aparna Ramani说，明年的重点，将是实现从Meta到基金会的无缝过渡。

2022-09-19

5490

「女孩基因突变最快48秒睡着」上热搜，像她这样的我国还有70万人，网友：给我也整一个

https 网络安全

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号量子位授权一个基因突变，让23岁女孩获得随时都能睡着的“能力”：从关灯到睡着平均只用2.8分钟，最短一次只用48秒。到医院检查发现，她HLA-DQB1的等位基因上显示突变阳性。这条消息冲上热搜之后，网友纷纷表示太羡慕了。但实际上这并不全是好事，犯困不分场合的特点在生活中会带来诸多不便。热搜中的姜姜从初中开始一上课就睡觉，自己都控制不住上课睡、下课睡，甚至有时站着也会睡过去。 23岁时，她被确诊为发作性睡病（Narcolepsy）。原

2022-09-19

3200

8月AI论文GitHub十强榜出炉！语言-图像模型连斩Top2

网络安全 https github git 开源

---- 点击上方↑↑↑“OpenCV学堂”关注我来源：公众号新智元授权【新智元导读】GitHub上榜项目靠谱，拿来就能用！看完一篇AI论文，要是发现代码没公开，心就得凉半截，瞬间对实验结果都要开始怀疑。最近有网友收集了八月份发表的10642篇AI论文，发现其中90.9%的论文都没有公开代码。在公开的一千份代码中，根据其在GitHub上收获Stars数量做了一个排行榜，排名前二的论文都是语言-图像模型相关的研究。文末还有在推特上排行前十的AI研究列表，部分只有论文，没有代码。 1.

2022-09-19

7740

没有3D卷积的3D重建方法，A100上重建一帧仅需70ms

对象存储图像处理 https github 网络安全

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号机器之心授权来自 Niantic 和 UCL 等机构的研究者使用精心设计和训练的 2D 网络，实现了高质量的深度估计和 3D 重建。从姿态图像重建 3D 室内场景通常分为两个阶段：图像深度估计，然后是深度合并（depth merging）和表面重建（surface reconstruction）。最近，多项研究提出了一系列直接在最终 3D 体积特征空间中执行重建的方法。虽然这些方法已经获得出令人印象深刻的重建结果，但它们依赖于昂贵的 3D 卷积层，

2022-09-14

5030

这个模型，竟成为网友的AI果照生成器

https 网络安全

---- 点击上方↑↑↑“OpenCV学堂”关注我来源：公众号新智元授权【新智元导读】大火模型变魔怔... 最近大火的图像生成模型Stable Diffusion被网友们玩坏了... 而且还是走上了分岔路——搞黄色。上图，一睹为快：「疯狂动物城」的兔朱迪狐尼克皮克斯电影风格的果体女孩性感沙滩女郎果体野蛮人战斗古典美人开放之旅周一，Stability AI向公众开放了模型Stable Diffusion的代码权重。用户可以只需几秒钟就可以生成512 × 512像素

2022-09-07

4K0

突发！英伟达、AMD恐断供高端GPU，中国AI计算或需另起炉灶

硬件开发 https 网络安全神经网络深度学习

---- 点击上方↑↑↑“OpenCV学堂”关注我来源：公众号新智元授权【导读】近日，AMD和英伟达接到消息，美国政府要求其对中国区断供高端GPU。 8月31日晚，集微网突然发布消息称，AMD和英伟达中国区已相继接到总部通知，要对中国区客户断供用于人工智能和数据中心的顶级计算芯片。 AMD方面：暂停对中国区所有MI100和MI200发货；统计中国区Ml100已发货量；统计中国区MI200已发货客户清单和发货明细。英伟达方面：暂停对中国区所有客户所有代理商的A100和H100的发货，其它GP

2022-09-02

5670

加上Web UI，文本-图像模型Stable Diffusion变身绘图工具，生成艺术大片

https github 机器学习网络安全 git

‍ 点击上方↑↑↑“OpenCV学堂”关注我来源：公众号机器之心授权对于艺术家和插‍图画家来说，这类绘图工具虽然省时省力，但如何保持自己的创作风格是一个大问题。前段时间，来自慕尼黑大学和 Runway 的研究者，与Eleuther AI、LAION 等团队合作，共同开发了一种文本转图像模型 Stable Diffusion。这项研究入选CVPR 2022 Oral。 Stable Diffusion 可以在消费级 GPU 上的 10 GB VRAM 下运行，并在几秒钟内生成 512x512 像素的

2022-09-01

1.2K0

只喝一次酒，足以永久性改变大脑｜PNAS

https 网络安全

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号量子位授权原来人生第一次喝酒后，大脑就发生了永久性改变？没错，以前大家往往只关注长期饮酒的危害，但发表于PNAS（美国科学院院报）的一篇最新论文告诉大家：仅仅喝一次酒，就足以改变大脑神经元的形态，并增加未来酒精成瘾的风险。更重要的是，这个变化将是不可逆的。值得一提的是，虽然本次实验还仅仅建立在小鼠和果蝇身上，但研究人员认为这一结论对人类也同样适用。是不是感觉常识被颠覆？赶紧来看看科学家们是怎么得出这一结论的。大脑的变化有哪些？在该

2022-08-31

1270

谷歌用新AI超越自己：让Imagen能够指定生成对象，风格还能随意转换

https 网络安全 github git 开源

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号量子位授权给Imagen加上“指哪打哪”的能力，会变得有多强？只需上传3-5张指定物体的照片，再用文字描述想要生成的背景、动作或表情，就能让指定物体“闪现”到你想要的场景中，动作表情也都栩栩如生。不止是动物，其他物体像墨镜、书包、花瓶，也都能做出几乎以假乱真的成品：属于是发朋友圈也不会被别人看出破绽的那种。（手动狗头）这个神奇的文字-图像生成模型名叫DreamBooth，是谷歌的最新研究成果，基于Imagen的基础上进行了调整，一经发布就

2022-08-29

6910

Hinton坐阵！斯坦福CS25 Transformer专题讲座更新：多位AI大佬齐聚

https 网络安全神经网络深度学习

---- 点击上方↑↑↑“OpenCV学堂”关注我来源：公众号新智元授权【导读】斯坦福大牛Christopher Manning开设的Transformer联合讲座课程更新啦！这期请来的是Hinton大神。图灵奖得主、深度学习教父Geoffrey Hinton在斯坦福线上开课啦？本课程是斯坦福大学计算机科学家Christopher Manning教授开设的CS25: Transformers United联合讲座课程。课程邀请了学术界和产业界关于Transformer架构的知名学者和工程师主讲

2022-08-29

2420

简单粗暴，5行代码，快速实现图像分割

机器学习神经网络深度学习人工智能 https

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号量子位授权图像分割，作为计算机视觉的基础，是图像理解的重要组成部分，也是图像处理的难点之一。那么，如何优雅且体面的图像分割？ 5行代码、分分钟实现的库——PixelLib，了解一下。当然，如此好用的项目，开源是必须的。为什么要用到图像分割？虽然计算机视觉研究工作者，会经常接触图像分割的问题，但是我们还是需要对其做下“赘述”(方便初学者)。我们都知道每个图像都是有一组像素值组成。简单来说，图像分割就是在像素级上，对图像进行分类的任务。图像

2022-08-29

6590

南洋理工提出全场景图生成PSG任务，像素级定位物体，还得预测56种关系

https 网络安全数据结构

---- 点击上方↑↑↑“OpenCV学堂”关注我来源：公众号新智元授权【导读】本文提出基于全景分割的全场景图生成（panoptic scene graph generation，即PSG）任务。相比于传统基于检测框的场景图生成，PSG任务要求全面地输出图像中的所有关系（包括物体与物体间关系，物体与背景间关系，背景与背景间关系），并用准确的分割块来定位物体。PSG任务旨在推动计算机视觉模型对场景最全面的理解和感知，用全面的识别结果更好地支撑场景描述、视觉推理等下游任务。同时PSG数据集提供的关系标注

2022-08-29

6090

草图人像变3D模特，360° 无死角还原姿势，一张就行，多“草”都可｜SIGGRAPH 2022

图像处理 https 网络安全

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号量子位授权一张随便勾画的草图，居然也可以分分钟自动变成逼真的3D模型？！ ‍ ‍ 360° 无死角不说，转换期间真的不需要任何其它角度姿势的输入。这就是获得了SIGGRAPH 2022荣誉奖的一个最新3D姿态估计模型： Sketch2Pose。除了草图，像这样的小猴子，四肢严重不按比例生长，Sketch2Pose也可以办到： ‍‍ ‍‍ ‍这是如何做到的？只要4步，草图人变3D人将草图上的人物/形象变成3D模型，此前的研究中都还未专

2022-08-29

4600

点击加载更多

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态