腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
机器之心
专栏成员
举报
9145
文章
6878821
阅读量
281
订阅数
订阅专栏
申请加入专栏
全部文章(999+)
人工智能(999+)
模型(999+)
深度学习(999+)
神经网络(999+)
机器学习(999+)
https(999+)
数据(999+)
其他(999+)
网络安全(999+)
编程算法(963)
论文(709)
开源(633)
NLP 服务(538)
性能(419)
机器人(417)
系统(352)
视频(326)
强化学习(321)
图像处理(307)
工作(304)
算法(300)
python(281)
github(259)
测试(233)
自动驾驶(228)
游戏(224)
设计(222)
网络(219)
gpt(218)
框架(210)
优化(207)
安全(202)
科技(194)
架构(190)
硬件开发(187)
chatgpt(181)
pytorch(177)
tensorflow(174)
产品(154)
监督学习(149)
工具(142)
git(140)
函数(140)
基础(138)
图像识别(133)
开发(129)
卷积神经网络(128)
开发者(126)
芯片(126)
企业(124)
数学(122)
腾讯云测试服务(120)
行业(117)
无人驾驶(116)
openai(116)
语音识别(111)
api(110)
搜索(108)
汽车(107)
分布式(96)
数据库(92)
服务(90)
内存(90)
数据分析(88)
渲染(85)
linux(84)
http(84)
大数据(82)
ide(78)
tcp/ip(78)
声纹识别(76)
网站(75)
效率(75)
存储(72)
自动化(70)
云计算(70)
学习方法(68)
编码(68)
html(66)
研发(65)
sql(64)
keras(64)
人脸识别(63)
数据结构(63)
语音(61)
迁移学习(60)
苹果(60)
计算机(59)
腾讯(57)
隐私计算(56)
手机(55)
机器翻译(54)
缓存(51)
gpu(51)
meta(51)
计算机科学(51)
无监督学习(49)
token(49)
文件存储(48)
对象(48)
LLM(48)
nat(47)
编程(47)
华为(47)
音频(47)
推荐系统(45)
解决方案(44)
工程师(43)
搜索引擎(42)
知识图谱(42)
css(41)
软件(41)
部署(40)
百度(38)
压缩(38)
java(37)
打包(37)
连接(37)
医疗(36)
windows(36)
量化(36)
javascript(35)
公众号(35)
计算机视觉(35)
硬件(35)
数据挖掘(34)
微信(34)
c++(33)
腾讯云开发者社区(33)
迁移(33)
翻译(33)
ios(32)
黑客(31)
创业(31)
arm(30)
批量计算(29)
联邦学习(29)
iphone(28)
numpy(28)
go(27)
云直播(27)
变量(27)
事件(25)
决策树(24)
数据处理(24)
教育(24)
实践(24)
程序(23)
区块链(22)
短视频(22)
nlp(22)
动画(22)
服务器(22)
物联网(21)
fpga(21)
com(21)
编程语言(21)
统计(21)
原理(21)
apache(19)
prompt(19)
插件(19)
语音合成(18)
kernel(18)
5g(18)
互联网(18)
可视化(18)
隐私(18)
程序员(17)
内核(17)
文字识别(16)
markdown(16)
aigc(16)
管理(16)
接口(16)
摄像头(16)
mac os(15)
嵌入式(15)
金融(15)
acl(15)
gan(15)
集合(15)
量子计算(15)
排序(15)
图表(15)
重构(15)
android(14)
opencv(14)
数据可视化(14)
cpu(14)
表格(14)
通信(14)
博客(13)
漏洞(13)
.net(12)
高性能计算(12)
电商(12)
数据安全(12)
爬虫(12)
架构设计(12)
app(12)
编译(12)
地图(12)
数据中心(12)
bash(11)
matlab(11)
访问管理(11)
gui(11)
agent(11)
facebook(11)
脚本(11)
原型(11)
r 语言(10)
node.js(10)
ajax(10)
容器(10)
运维(10)
面向对象编程(10)
线性回归(10)
flash(10)
code(10)
工作流(10)
技巧(10)
教程(10)
面试(10)
配置(10)
数据科学(10)
单片机(9)
容器镜像服务(9)
模式识别(9)
系统架构(9)
lstm(9)
video(9)
操作系统(9)
代理(9)
阿里巴巴(9)
高性能(9)
模块化(9)
索引(9)
协议(9)
异常(9)
元宇宙(9)
php(8)
spring(8)
正则表达式(8)
小程序(8)
腾讯云(8)
acm(8)
bug(8)
scaling(8)
编译器(8)
布局(8)
反射(8)
集群(8)
开源框架(8)
浏览器(8)
入门(8)
软件工程(8)
树莓派(8)
特效(8)
erp(7)
scikit-learn(7)
processing(7)
虚拟化(7)
jupyter notebook(7)
智能创作(7)
adobe(7)
bit(7)
image(7)
ocr(7)
vr(7)
供应链(7)
同步(7)
终端(7)
LoRa(7)
Midjourney(7)
swift(6)
c 语言(6)
json(6)
bash 指令(6)
单元测试(6)
智能客服机器人(6)
graph(6)
patch(6)
pdf(6)
客户端(6)
路由(6)
密码学(6)
日志(6)
移动端(6)
语法(6)
oracle(5)
中文分词(5)
SSL 证书(5)
人脸核身(5)
内容理解(5)
视频处理(5)
express(5)
serverless(5)
devops(5)
spark(5)
ssh(5)
unity(5)
安全漏洞(5)
视频分析(5)
cuda(5)
google(5)
max(5)
models(5)
office(5)
ps(5)
text(5)
递归(5)
后端(5)
计算机图形学(5)
进程(5)
逆向工程(5)
软件开发(5)
图形学(5)
音视频(5)
字符串(5)
脑机接口(5)
比特币(4)
xcode(4)
scala(4)
ubuntu(4)
全站加速网络(4)
DevOps 解决方案(4)
智慧物流(4)
二叉树(4)
rpc(4)
特征工程(4)
sdk(4)
rust(4)
模型测试(4)
视频理解(4)
智慧交通(4)
智能制造(4)
cto(4)
debug(4)
macbook(4)
self(4)
youtube(4)
笔记(4)
二维码(4)
加密(4)
兼容性(4)
流量(4)
拖拽(4)
解释器(4)
费用中心(3)
云服务器(3)
数据万象(3)
数字货币(3)
ruby(3)
access(3)
unix(3)
nginx(3)
apt-get(3)
mapreduce(3)
日志服务(3)
TDSQL MySQL 版(3)
NAT 网关(3)
腾讯云小微(3)
kubernetes(3)
shell(3)
dns(3)
asp(3)
cdn(3)
微服务(3)
canvas(3)
机器学习平台(3)
性能测试(3)
腾讯广告算法大赛(3)
云游戏(3)
流计算 Oceanus(3)
alpha(3)
amd(3)
cs(3)
detection(3)
epoch(3)
excel(3)
glm(3)
instance(3)
intel(3)
interpreter(3)
it(3)
jupyter(3)
keynote(3)
layer(3)
map(3)
mask(3)
mobile(3)
nvidia(3)
object(3)
overflow(3)
pipeline(3)
reddit(3)
robotics(3)
ssm(3)
uber(3)
登录(3)
二进制(3)
跨域(3)
敏捷(3)
排序算法(3)
前端(3)
全栈(3)
调试(3)
异步(3)
云服务(3)
智慧城市(3)
对象存储(2)
perl(2)
c#(2)
lua(2)
react(2)
jquery ui(2)
xml(2)
jquery(2)
qt(2)
云数据库 Redis(2)
django(2)
windows server(2)
黑石物理服务器(2)
命令行工具(2)
检测工具(2)
短信(2)
双螺旋(2)
生物基因(2)
智能交通(2)
出行(2)
智能硬件(2)
svg(2)
互联网金融(2)
html5(2)
hadoop(2)
jvm(2)
yum(2)
selenium(2)
聚类算法(2)
angel(2)
腾讯会议(2)
dart(2)
raft(2)
内容识别(2)
智能推荐平台(2)
手势识别(2)
智能音乐(2)
adapter(2)
bi(2)
block(2)
class(2)
dataset(2)
dsl(2)
e2e(2)
el(2)
embedding(2)
eval(2)
free(2)
gaussian(2)
gif(2)
ipa(2)
kaggle(2)
key(2)
knn(2)
latex(2)
local(2)
mesh(2)
midi(2)
min(2)
module(2)
na(2)
nas(2)
network(2)
next(2)
null(2)
pascal(2)
point(2)
powerpoint(2)
ram(2)
rpa(2)
salesforce(2)
set(2)
similarity(2)
size(2)
stack(2)
state(2)
system(2)
ui(2)
vi(2)
wifi(2)
word(2)
word2vec(2)
yolo(2)
zero(2)
百度飞桨(2)
编辑器(2)
边缘计算(2)
并发(2)
产品经理(2)
动态规划(2)
公有云(2)
黑客马拉松(2)
后台(2)
继承(2)
开源软件(2)
命令行(2)
设计模式(2)
视频编码(2)
数组(2)
图数据库(2)
推荐算法(2)
线程(2)
虚拟机(2)
虚拟现实(2)
用户体验(2)
游戏开发(2)
游戏引擎(2)
远程办公(2)
增强现实(2)
最佳实践(2)
自然语言处理(2)
深度学习框架(2)
向量数据库(2)
云+校园(1)
云点播(1)
云镜(主机安全)(1)
官方文档(1)
认证考试(1)
objective-c(1)
cocoa(1)
actionscript(1)
bootstrap(1)
regex(1)
vue.js(1)
typescript(1)
ecmascript(1)
opengl(1)
汇编语言(1)
composer(1)
云数据库 SQL Server(1)
postgresql(1)
flask(1)
vba(1)
jar(1)
maven(1)
全文检索(1)
云数据迁移(1)
实时音视频(1)
音视频点播加速(1)
智能鉴黄(1)
es 2(1)
专有云(1)
金融风控(1)
智慧零售(1)
工业物联(1)
electron(1)
云联网(1)
babel.js(1)
压力测试(1)
wordpress(1)
hive(1)
sql server(1)
spring boot(1)
npm(1)
seo(1)
kotlin(1)
敏捷开发(1)
socket编程(1)
uml(1)
lamp(1)
ntp(1)
anaconda(1)
sas(1)
haskell(1)
nest(1)
智能外呼机器人(1)
信息流(1)
mqtt(1)
flutter(1)
对话机器人(1)
ddos 攻击(1)
内容安全(1)
云开发(1)
分类算法(1)
接口测试(1)
测试策略(1)
etcd(1)
flink(1)
ghost(1)
媒体处理(1)
智能编辑(1)
数据脱敏(1)
验证码(1)
视频内容安全(1)
应用安全开发(1)
Elasticsearch Service(1)
数据集成(1)
图像标签(1)
图像分析(1)
测试服务(1)
数据湖(1)
自由视角(1)
设计云(1)
腾讯天籁 inside(1)
智慧停车(1)
基础教育(1)
智能家居(1)
小程序·云开发(1)
代码托管(1)
action(1)
ada(1)
alexa(1)
amp(1)
animation(1)
apollo(1)
apple(1)
assertion(1)
atomic(1)
automation(1)
aws(1)
backbone(1)
background(1)
bat(1)
cad(1)
cell(1)
chat(1)
classification(1)
composition(1)
config(1)
connect(1)
container(1)
controller(1)
cookies(1)
copy(1)
cut(1)
data(1)
database(1)
db(1)
diff(1)
difference(1)
direct3d(1)
distance(1)
distribution(1)
drawing(1)
element(1)
email(1)
embed(1)
encoding(1)
entity(1)
equation(1)
error(1)
extract(1)
factory(1)
feed(1)
figure(1)
final(1)
focus(1)
formula(1)
frame(1)
fs(1)
gin(1)
global(1)
gps(1)
gradient(1)
gzip(1)
hierarchy(1)
history(1)
hugo(1)
identifier(1)
ipad(1)
jpeg(1)
julia(1)
label(1)
lambda(1)
list(1)
lm(1)
logic(1)
ls(1)
mac(1)
match(1)
matching(1)
math(1)
matplotlib(1)
matrix(1)
mean(1)
media(1)
medium(1)
memory(1)
microsoft(1)
mips(1)
mnist(1)
modeling(1)
mvp(1)
nft(1)
nio(1)
oceanbase(1)
ode(1)
offline(1)
offset(1)
optimization(1)
output(1)
owl(1)
photo(1)
photoshop(1)
physics(1)
pixel(1)
position(1)
prediction(1)
presto(1)
project(1)
publish(1)
pyramid(1)
random(1)
reduce(1)
reference(1)
relation(1)
rest(1)
rgb(1)
rss(1)
scale(1)
sensors(1)
sh(1)
shift(1)
signature(1)
sketch(1)
slice(1)
slide(1)
smoothing(1)
space(1)
split(1)
src(1)
ssl(1)
store(1)
sum(1)
summary(1)
svm(1)
t4(1)
target(1)
time(1)
tm(1)
torch(1)
tree(1)
twitter(1)
var(1)
verification(1)
vim(1)
web(1)
web3(1)
webp(1)
wix(1)
worker(1)
workspace(1)
z3(1)
zip(1)
备份(1)
遍历(1)
表单(1)
播客(1)
产品设计(1)
队列(1)
多线程(1)
工具类(1)
规范化(1)
混合云(1)
架构师(1)
监控(1)
交换机(1)
局域网(1)
开发工具(1)
开发环境(1)
快捷键(1)
路由器(1)
乱码(1)
求职(1)
权限(1)
上传图片(1)
生命周期(1)
数据采集(1)
数据存储(1)
数据管理(1)
系统设计(1)
小游戏(1)
性能优化(1)
远程工作(1)
云平台(1)
指针(1)
重定向(1)
主机(1)
城市交通(1)
时序预测(1)
梯度下降算法(1)
量子算法(1)
混合现实(1)
深度强化学习(1)
图像分割(1)
3D建模(1)
腾讯混元大模型(1)
幻兽帕鲁(1)
搜索文章
搜索
搜索
关闭
CVPR 2023 | 谷歌、MIT提出统一框架MAGE:表征学习超MAE,无监督图像生成超越 Latent Diffusion
图像识别
框架
论文
模型
重构
机器之心专栏 机器之心编辑部 在一篇 CVPR 2023 论文中,来自 MIT 和谷歌的研究人员提出了一种全新的框架MAGE,同时在图像识别和生成两大任务上实现了 SOTA。 识别和生成是人工智能领域中的两大核心任务,如果能将二者合并到一个统一的系统中,这两个任务应该能实现互补。事实上,在自然语言处理中,像 BERT [1] 这样的模型不仅能够生成高质量的文本,还能够提取文本中的特征。 然而,在计算机视觉领域,目前的图像生成模型和识别模型大多是分开进行训练,没有充分利用这两个任务的协同作用。这主要是由于图
机器之心
2023-03-29
397
0
「十亿像素」引领视觉智能技术变革,2022 GigaVision挑战赛圆满落幕
人工智能
神经网络
深度学习
图像识别
渲染
机器之心原创 作者:蛋酱 在十亿像素级数据平台的支撑下,GigaVision 系列赛事秉承「以赛促研、以赛促用」的理念,将持续推动更多前沿性、原创性视觉智能技术的突破。 2012 年,深度学习在 ImageNet 图像挑战赛中取得了巨大的突破,被广泛认为是第三次人工智能革命的标志性事件。以此为开端,十多年间,从人脸识别、跟踪到动作识别,围绕各类视觉智能任务的技术都取得了显著的进展,人工智能理论与技术的大变革时代终于到来。 2017 年,国务院发布《新一代人工智能发展规划》,描绘了中国人工智能未来发展的宏伟
机器之心
2023-02-28
634
0
谷歌复用30年前经典算法,CV引入强化学习,网友:视觉RLHF要来了?
编程算法
强化学习
图像处理
图像识别
机器之心报道 机器之心编辑部 模型预测和预期使用之间存在错位,不利于 CV 模型的部署,来自谷歌等机构的研究者用强化学习技术的奖励函数,从而改善了计算机视觉任务。 ChatGPT 的火爆有目共睹,而对于支撑其成功背后的技术,监督式的指令微调以及基于人类反馈的强化学习至关重要。这些技术也在逐渐扩展到其他 AI 领域,包括计算机视觉(CV)。 我们知道,在处理计算机视觉中的复杂输出时,成功的主要标准不在于模型对训练目标的优化程度,而在于预测能力与任务的吻合程度,即模型在预期用途上的表现效果。 为了追求这种一致性
机器之心
2023-02-27
650
0
首个目标检测扩散模型,比Faster R-CNN、DETR好,从随机框中直接检测
图像识别
机器学习
神经网络
深度学习
人工智能
扩散模型( Diffusion Model )作为深度生成模型中的新 SOTA,已然在图像生成任务中超越了原 SOTA:例如 GAN,并且在诸多应用领域都有出色的表现,如计算机视觉,NLP、分子图建模、时间序列建模等。
机器之心
2022-12-16
723
0
7 Papers & Radios | Stable Diffusion采样速度翻倍;MIT解决神经网络百年难题
https
网络安全
编程算法
图像识别
神经网络
论文 1:Closed-form Continuous-time Neural Networks
机器之心
2022-12-16
441
0
用CNN做基础模型,可变形卷积InternImage实现检测分割新纪录!
图像处理
机器学习
深度学习
人工智能
图像识别
近年来大规模视觉 Transformer 的蓬勃发展推动了计算机视觉领域的性能边界。视觉 Transformer 模型通过扩大模型参数量和训练数据从而击败了卷积神经网络。来自上海人工智能实验室、清华、南大、商汤和港中文的研究人员总结了卷积神经网络和视觉 Transformer 之间的差距。从算子层面看,传统的 CNNs 算子缺乏长距离依赖和自适应空间聚合能力;从结构层面看,传统 CNNs 结构缺乏先进组件。
机器之心
2022-12-16
649
0
NeurIPS 2022 | 四分钟内就能训练目标检测器,商汤基模型团队是怎么做到的?
编程算法
图像识别
神经网络
机器学习
深度学习
本文提出了一种大批量训练算法 AGVM (Adaptive Gradient Variance Modulator),不仅可以适配于目标检测任务,同时也可以适配各类分割任务。AGVM 可以把目标检测的训练批量大小扩大到 1536,帮助研究人员四分钟训练 Faster R-CNN,3.5 小时把 COCO 刷到 62.2 mAP,均打破了目标检测训练速度的世界纪录。
机器之心
2022-12-16
412
0
基于PyTorch、易上手,细粒度图像识别深度学习工具库Hawkeye开源
https
网络安全
图像识别
网站
细粒度图像识别 [1] 是视觉感知学习的重要研究课题,在智能新经济和工业互联网等方面具有巨大应用价值,且在诸多现实场景已有广泛应用…… 鉴于当前领域内尚缺乏该方面的深度学习开源工具库,南京理工大学魏秀参教授团队用时近一年时间,开发、打磨、完成了 Hawkeye——细粒度图像识别深度学习开源工具库,供相关领域研究人员和工程师参考使用。本文是对 Hawkeye 的详细介绍。
机器之心
2022-12-15
720
0
深度学习能否达到人类推理水平?三位图灵奖得主激辩海德堡论坛
深度学习
人工智能
神经网络
图像识别
html
85 岁的图灵奖得主 Raj Reddy 参加了最近举行的第九届海德堡获奖者论坛。他发出由衷感叹:「我在人工智能领域工作了近 60 年,没想到这种技术会在有生之年实用化。」
机器之心
2022-12-15
213
0
YOLO内卷时期该如何选模型?
网络安全
https
图像识别
github
git
机器之心转载 来源:知乎 作者:知乎用户@迪迦奥特曼 YOLO 新版本那么多,到底选哪个? 前不久看到了美团微信公众号上的宣传,更新发布了新版 YOLOv6,还放出了 arxiv 论文,更新了之前的 N/T/S 小模型,也放出了 M 和 L 版本的大模型,论文实验表格多达十几个,看的出来是很用心的做了,YOLO官方也认可了这个起名。 之前本人写了一个 YOLO 合集的文章(迪迦奥特曼:从百度飞桨 YOLOSeries 库看各个 YOLO 模型:https://zhuanlan.zhihu.com/p/550
机器之心
2022-10-08
867
0
固定参数的模型有多大潜力?港中文、上海AI Lab等提出高效视频理解框架EVL
图像识别
迁移学习
机器之心专栏 机器之心编辑部 来自香港中文大学、上海人工智能实验室等机构的研究者提出了高效的视频理解迁移学习框架 EVL,通过固定骨干基础模型的权重,节省了训练计算量和内存消耗。 视觉基础模型近两年取得了瞩目发展。从一方面而言,基于大规模互联网数据的预训练已经给模型预置了大量的语义概念,从而具有良好的泛化性能;但另一方面,为充分利用大规模数据集带来的模型尺寸增长,使得相关模型在迁移到下游任务时面临着低效率问题,尤其是对于需要处理多帧的视频理解模型。 论文链接:https://arxiv.org/abs/2
机器之心
2022-10-08
355
0
计算机视觉、自然语言理解、强化学习多个方向,MSRA智能多媒体组招聘实习生
强化学习
图像识别
自动化
NLP 服务
本期我们将为大家介绍MSRA智能多媒体组招聘实习生的相关信息。 作为专业的全球人工智能信息服务平台,机器之心不仅可以提供前沿的科研动态,还能帮你找到合适的工作或进修机会。 本期的招募信息来自MSRA智能多媒体组,欢迎对计算机视觉、自然语言理解、强化学习等方向感兴趣的同学踊跃申请。 组别介绍 我们属于微软亚洲研究院的智能多媒体(Intelligent Multimedia, IM)组。智能多媒体组致力于将机器学习与图像视频分析的过程相结合,设计新一代智能图像视频分析系统。研究方向包括屏幕分析,深度学习,人的行
机器之心
2022-08-25
466
0
集成多种YOLO改进点,面向小白科研的YOLO检测代码库YOLOAir
神经网络
深度学习
人工智能
图像识别
编程算法
机器之心专栏 机器之心编辑部 YOLOAir 算法代码库是一个基于 PyTorch 的 YOLO 系列目标检测开源工具箱。使用统一模型代码框架、统一应用方式、统一调参,该库包含大量的改进模块,可使用不同网络模块来快速构建不同网络的检测模型。基于 YOLOv5 代码框架,并同步适配 YOLOv5(v6.0/v6.1 更新) 部署生态。用户在使用这个项目之前, 可以先了解 YOLOv5 库。 该项目包含大量的改进方式,并能降低改进难度,改进点包含 Backbone、Neck、Head、注意力机制、IoU 损失
机器之心
2022-08-25
875
0
YOLOv7上线:无需预训练,5-160 FPS内超越所有目标检测器
图像识别
机器之心报道 编辑:小舟、泽南 在 5-160 FPS 范围内速度和精度超过所有已知目标检测器。 在 YOLOv6 推出后不到两个星期,提出 YOLOv4 的团队就发布了更新一代的版本。 本周三,YOLOv7 的论文被提交到了预印版论文平台 arXiv 上,其三位作者 Chien-Yao Wang、Alexey Bochkovskiy 和 Hong-Yuan Mark Liao 是 YOLOv4 的原班人马。 论文链接:https://arxiv.org/abs/2207.02696 GitHub 链接:
机器之心
2022-07-12
10.3K
0
同济、阿里的CVPR 2022最佳学生论文奖研究了什么?这是一作的解读
图像处理
图像识别
机器之心发布 作者:陈涵晟(同济大学研究生、阿里达摩院研究型实习生) 距离 CVPR 2022 各大奖项公布没多久,来自同济大学研究生、阿里达摩院研究型实习生陈涵晟为我们解读最佳学生论文奖。 本文解读我们获得 CVPR 2022 最佳学生论文奖的工作《EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monocular Object Pose Estimation》。论文研究的问题是基于单张图像估计物体在 3D 空
机器之心
2022-07-01
879
0
图神经网络作CV骨干模型,来听听华为诺亚是怎么做的
云直播
图像处理
神经网络
图像识别
数据结构
在计算机视觉领域,骨干网络一直是特征提取的重要部件。从 AlexNet 到 ResNet,卷积网络 CNN 在很长一段时间内一直是视觉任务的标配。近年来,基于注意力机制的 Transformer 和以全连接层为主的 MLP 网络也开始在计算机视觉领域崭露头角。与现有主流 CNN 模型相比,基于 Transformer 或 MLP 的模型在视觉任务上也显示出了良好的性能。 直到现在,关于谁是更好的视觉骨干网络还是一个仍在探索和颇具争议的课题。传统的卷积网络将图像视作一个矩阵或网格,通过滑动窗口对邻域像素点或
机器之心
2022-06-27
791
0
图神经网络也能用作CV骨干模型,华为诺亚ViG架构媲美CNN、Transformer
图像处理
图像识别
神经网络
机器学习
深度学习
机器之心专栏 机器之心编辑部 华为诺亚实验室的研究员发现图神经网络(GNN)也能做视觉骨干网络。将图像表示为图结构,通过简洁高效的适配,提出一种新型视觉网络架构 ViG,表现优于传统的卷积网络和 Transformer。在 ImageNet 图像识别任务,ViG 在相似计算量情况下 Top-1 正确率达 82.1%,高于 ResNet 和 Swin Transformer。 论文链接:https://arxiv.org/abs/2206.00272 PyTorch 代码:https://github.com
机器之心
2022-06-27
620
0
YOLO界再起波澜!mAP 51.4,149FPS,目标检测,一个就够了
神经网络
人工智能
图像识别
https
网络安全
机器之心发布 作者:百度飞桨团队 百度飞桨团队发布了 PP-YOLOE,与其他 YOLO 系列算法相比,其具有更强的性能、更丰富灵活的配置方案以及更全硬件支持三大优势。 此前,机器之心报道过的 PaddleDetection 项目再次升级,发布了全新进化版 YOLO 模型——PP-YOLOE,并再次以极佳的性能表现刷新业界性能榜单指标,在目标检测领域引起了广泛关注。 论文地址:https://arxiv.org/abs/2203.16250 项目地址:https://github.com/PaddleP
机器之心
2022-05-17
919
0
CVPR 2022 | 结合短期动态、长期一致性,视频伪装物体检测框架,大幅超越SOTA
访问管理
数据分析
图像识别
机器学习
神经网络
机器之心专栏 作者:程雪莲、熊欢、范登平、钟怡然等 本文提出了一个用于视频伪装物体分割的方法 SLT-Net,并构建了第一个大规模 VCOD 数据集,MoCA- Mask,该研究入选CVPR 2022。 视频伪装物体检测(Video Camouflaged Object Detection,VCOD)是找出视频中在外观上与背景展现出极高相似性的物体的任务。尽管拥有广泛的应用场景(例如:监控与安防 [25]、自动驾驶 [33, 5]、医学图像分割 [12, 43]、蝗虫检测 [18] 与机器人 [29]),伪
机器之心
2022-05-05
842
0
有人一周内清理了PASCAL数据集中的17120张图像,将mAP提高了13%
数据分析
图像识别
选自hasty.ai 作者:Vladimir Lyashenko 机器之心编译 编辑:陈萍 干净的数据对于你的 AI 模型的表现有多重要? 有研究称,他们使用一种技术在一周内清理了 PASCAL VOC 2012 数据集中的 17120 张图像,并发现 PASCAL 中 6.5% 的图像有不同的错误(缺失标签、类标签错误等)。他们在创纪录的时间内修复了这些错误,并将模型的性能提高了 13% 的 mAP。 通常情况下,模型性能较差可能是由于训练数据质量不高引起的。即使在 2022 年,由于数据是公司最重要的资
机器之心
2022-04-28
532
0
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档