首页
学习
活动
专区
工具
TVP
发布

贾志刚-OpenCV学堂

三本书《Java数字图像处理-编程技巧与应用实践》、《OpenCV Android开发实战》、《OpenCV4应用开发-入门、进阶与工程化实践》作者。OpenCV实验大师平台 软件作者
专栏作者
860
文章
1423361
阅读量
422
订阅数
谷歌AI生成视频两连发:720p高清+长镜头,网友:对短视频行业冲击太大
点击上方↑↑↑“OpenCV学堂”关注我来源:公众号 量子位 授权 内容生成AI进入视频时代! Meta发布「用嘴做视频」仅一周,谷歌CEO劈柴哥接连派出两名选手上场竞争。 第一位Imagen Video与Meta的Make-A-Video相比突出一个高清,能生成1280*768分辨率、每秒24帧的视频片段。 另一位选手Phenaki,则能根据200个词左右的提示语生成2分钟以上的长镜头,讲述一个完整的故事。 网友看过后表示,这一切进展实在太快了。 也有网友认为,这种技术一旦成熟,会冲击短视频行业
OpenCV学堂
2022-10-09
7440
整理了20场kaggle比赛baseline
我整理了20场+kaggle比赛baseline,包括CV/NLP/多模态/机器学习等方向。 01 CV方向比赛 CV方向选出了10场比赛,涵盖图像分类、图像分割、目标检测、视频分类等CV经典任务,覆盖农业、医疗、体育等应用领域。 扫码加我微信,回复“比赛” 领取baseline代码 02 NLP方向比赛 NLP方向选出了6场比赛,涵盖文本分类、AES等NLP任务,覆盖医疗、教育等应用领域。 扫码加我微信,回复“比赛” 领取baseline代码 03 多模态方向比赛 多模态方向有2场比赛,
OpenCV学堂
2022-09-19
3960
Yann LeCun:大模型方向错了,智力无法接近人类
点击上方↑↑↑“OpenCV学堂”关注我来源:公众号 机器之心 授权 你训练大模型用的是语言,还想获得 AGI?那肯定是永远也不行的。 「语言只承载了所有人类知识的一小部分;大部分人类知识、所有动物知识都是非语言的;因此,大语言模型是无法接近人类水平智能的,」这是图灵奖得主 Yann LeCun 对于人工智能前景的最新思考。 昨天,他与纽约大学博士后 Jacob Browning 合著的新文章发表在《NOEMA》上,引发了人们的讨论。 在文章中,作者讨论了当前流行的大规模语言模型,认为其存在明显的极限。
OpenCV学堂
2022-08-29
3700
人脑90%都是自监督学习,AI大模型离模拟大脑还有多远?
点击上方↑↑↑“OpenCV学堂”关注我来源:公众号 新智元 授权 【导读】人的大脑和自监督学习模型的相似度有多高? 我们都知道,人类的大脑90%都是自监督学习的,生物会不断对下一步发生的事情做出预测。 自监督学习,就是不需要外部干预也能做出决策。 只有少数情况我们会接受外部反馈,比如老师说:「你搞错了」。 而现在有学者发现,大型语言模型的自监督学习机制,像极了我们的大脑。 知名科普媒体Quanta Magazine近日报道,越来越多的研究发现,自监督学习模型,尤其是大型语言模型的自学方式,与我们的大脑的
OpenCV学堂
2022-08-29
3040
Jeff Dean大规模多任务学习SOTA遭吐槽,复现一遍要6万美元!
---- 点击上方↑↑↑“OpenCV学堂”关注我来源:公众号 新智元 授权 【导读】谷歌大神Jeff Dean最近亲自操刀发新作,提出了一个大规模多任务学习框架µ2Net,基本把各大数据集多任务学习的SOTA刷了个遍,但这次为何网友有点不买账了?很简单,差钱。 2021年10月,Jeff Dean亲自撰文介绍了一个全新的机器学习架构——Pathways。 目的很简单,就是让一个AI能够跨越数以万计的的任务,理解不同类型的数据,并同时以极高的效率实现: 在大半年之后的2022年3月,Jeff Dean终
OpenCV学堂
2022-07-26
3980
牛啊!这才是真能3天复现出论文的方法!
Node2vec是2016年斯坦福教授 Jure Leskovec、Aditya Grover提出的论文,Node2vec是图神经网络著名的模型之一。学图神经网络必读的论文,论文原文可扫码添加小享领取。 为什么要学图神经网络 提高就业竞争力 图神经网络应用领域广泛:电子商务、金融风控、推荐系统 许多实际应用场景中的数据是从非欧式空间生成的,如何将深度学习方法应用在图数据。 Node2vec是GNN图游走类算法中非常重要的一种,也是图神经网络算法工程师面试必备的知识点。 发论文 在近年的各大顶级学术会议
OpenCV学堂
2022-06-08
5450
叫板DALL·E 2,预训练大模型做编码器,谷歌把文字转图像模型卷上天
点击上方↑↑↑“OpenCV学堂”关注我来源:公众号 机器之心  授权 OpenAI:DALL・E 2 就是最好的。谷歌:看下我们 Imagen 生成的柴犬? 多模态学习近来受到重视,特别是文本 - 图像合成和图像 - 文本对比学习两个方向。一些模型因在创意图像生成、编辑方面的应用引起了公众的广泛关注,例如 OpenAI 的文本转图像模型 DALL・E、英伟达的 GauGAN。现在,来自谷歌的研究者也在这一方向做出了探索,提出了一种文本到图像的扩散模型 Imagen。 Imagen 结合了 Transfor
OpenCV学堂
2022-05-25
5270
强到离谱,Transformer为何能闯入CV界秒杀CNN?
Transformer 近年来已成为视觉领域的新晋霸主,这个来自 NLP 领域的模型架构为何能闯入CV界秒杀CNN? 自提出之日起,Transformer模型已经在CV、NLP以及其他更多领域中「大展拳脚」,实力冲击CNN。 Transformer为什么这么有实力?因为它在分类、检测等任务上展现了极其强劲的性能。而且骨干网络上的发展也推动了下游任务的发展,Swin Transformer更是成了屠榜般的存在,在工业界具有广阔的应用前景。所以引起了人工智能研究生的强烈兴趣。 但要想啃透CV Transfor
OpenCV学堂
2022-04-21
3480
2022年软件工程师报告出炉!年薪最高竟是网安,机器学习比不过NLP
---- 点击上方↑↑↑“OpenCV学堂”关注我来源:公众号 新智元 授权 【导读】同为码农,凭啥NLP年薪就比机器学习高2000美元? 2022年哪个编程语言最受雇主公司喜欢? 软件工程师薪酬在不同地区和不同岗位有什么区别? 最近,一份新鲜出炉的「2022年软件工程师现状」就可以回答这些问题。 其中涵盖了美国著名程序员招聘网站Hired对近37万次雇主和求职者互动的分析,以及2000多名软件工程师的调查采访。 平均年薪只涨了0.8% 总体而言,美国仍然是软件工程师薪资最高的国家,其次是英国和加拿
OpenCV学堂
2022-04-18
5820
Kaggle大神们都在用什么语言、框架、模型?这里有一份详细统计
点击上方↑↑↑“OpenCV学堂”关注我来源:公众号 机器之心 授权 对于ML学习者和从业者来说,参加竞赛是一个很好的锻炼机会,还能赚取一些零花钱。那么,你知道哪个平台比赛最多,成绩比较好的那些团队都在使用什么架构、什么模型吗?在这篇文章中,一位名叫Eniola Olaleye的数据科学爱好者介绍了他们的统计结果。 统计网站:https://mlcontests.com/ 作者得出了几个重要结论: 1、在所有竞赛中,Kaggle上的竞赛数量仍然占据1/3,而且奖金数量占270万美元总奖金池的一半; 2
OpenCV学堂
2022-03-31
5960
训练CV模型新思路来了:用NLP大火的Prompt替代微调,性能全面提升
点击上方↑↑↑“OpenCV学堂”关注我来源:公众号 量子位 授权 Prompt tuning,作为NLP领域中的一个“新宠”,甚至曾被学者誉为NLP预训练新范式。 那么,它能否借鉴到CV领域并产生同样的成绩呢? 现在,来自康奈尔大学和Meta AI等机构,通过Prompt来调整基于Transformer的视觉模型,结果发现: 完全可以! 比起全面微调,Prompt性能提升显著。无论模型的规模和训练数据怎么变,24种情况中有20种都完全胜出。 与此同时,它还能大幅降低每项任务所需的存储成本。 只使用不到
OpenCV学堂
2022-03-28
6390
Transformer深至1000层还能稳定训练,微软实习生一作,LSTM之父转发
点击上方↑↑↑“OpenCV学堂”关注我来源:公众号 量子位 授权 近几年,随着业内“大力出奇迹”的趋势,Transformer的模型参数量也是水涨船高。 不过,当参数从数百万增加至数十亿,甚至数万亿,性能实现相应提升时,Transformer的深度也受到了训练不稳定的限制。 至少,还没有优化方法能在Transformer扩展至上千层的同时,还保证其稳定性。 但现在,微软研究院一篇论文出手,直接将Transformer提升到了1000层: 所采用的方法,甚至只需要修改几行代码就能完成。 LSTM之父, 获
OpenCV学堂
2022-03-04
2840
17篇注意力机制PyTorch实现,包含MLP、Re-Parameter系列热门论文
注意力(Attention)机制最早在计算机视觉中应用,后来又在 NLP 领域发扬光大,该机制将有限的注意力集中在重点信息上,从而节省资源,快速获得最有效的信息。
OpenCV学堂
2021-08-05
9580
华为北大等联手打造的Transformer竟在CV领域超过了CNN:多项底层视觉任务达到SOTA
但其实,这个在各种自然语言处理任务中「混迹」,强大的无监督预训练模型,现在已经在「计算机视觉」的道路上越走越远了。
OpenCV学堂
2020-12-08
5990
BERT轻量化:最优参数子集Bort,大小仅为BERT-large16%
近期,亚马逊 Alexa 团队发布了一项研究成果:研究人员对BERT模型进行参数选择,获得了BERT的最优参数子集——Bort。
OpenCV学堂
2020-12-08
5630
PyTorch官方教程大更新:增加标签索引,更加新手友好
如果你是PyTorch 24K纯萌新,PyTorch官方一如既往地向你推荐他们最受欢迎的教程之一:60分钟入门PyTorch(Start 60-min blitz)。
OpenCV学堂
2020-05-26
1K0
原来Transformer就是一种图神经网络,这个概念你清楚吗?
有的工程师会问这个问题:图深度学习听起来不错,但是有没有商业上的成功案例?它是否已经在实际应用中使用过了?
OpenCV学堂
2020-03-10
6370
数据太少怎么办?试试自监督学习,CV训练新利器,fast.ai新教程,LeCun点评
在多数情况下,训练神经网络都应该从一个预训练(pre-trained)模型开始,然后再对它进行微调。
OpenCV学堂
2020-02-21
4590
使用DeepWalk从图中提取特征
以下文章来源于磐创AI,作者VK 来源:公众号 磐创AI 授权转 概述 从表格或图像数据中提取特征的方法已经众所周知了,但是图(数据结构的图)数据呢? 学习如何使用DeepWalk从图中提取特征 我们
OpenCV学堂
2019-12-09
1.1K0
7Papers | 李飞飞新论文;深度学习代码搜索综述;Adobe用GAN生成动画
论文 1:SummAE: Zero-Shot Abstractive Text Summarization using Length-Agnostic Auto-Encoders
OpenCV学堂
2019-10-25
4240
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档