GiantPandaCV-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

GiantPandaCV

专栏成员

722

文章

992179

阅读量

100

订阅数

用于ARM Cortex-M系列的芯片的神经网络推理库CMSIS-NN详解

企业机器学习神经网络深度学习人工智能

论文题目：《CMSIS-NN: Effificient Neural Network Kernels for Arm Cortex-M CPUs》, 2018年

2022-09-28

2.5K0

时间序列预测paper、应用汇总

编程算法深度学习机器学习神经网络人工智能

Optiver是全球顶尖的量化交易公司。10个月前，Optiver在Kaggle上面办的一场预测股票市场波动率的比赛。

2022-09-28

2910

Instance-Conditioned GAN

机器学习神经网络深度学习人工智能 https

作者：Arantxa Casanova, Marlene Careil, Jakob Verbeek, Michal Drozdzal, Adriana Romero Soriano

2022-09-28

8910

YOLOv7-Pose尝鲜，基于YOLOv7的关键点模型测评

https 神经网络深度学习人工智能图像识别

目前人体姿态估计总体分为Top-down和Bottom-up两种，与目标检测不同，无论是基于热力图或是基于检测器处理的关键点检测算法，都较为依赖计算资源，推理耗时略长，今年出现了以YOLO为基线的关键点检测器。玩过目标检测的童鞋都知道YOLO以及各种变种目前算是工业落地较多的一类检测器，其简单的设计思想，长期活跃的社区生态，使其始终占据着较高的话题度。

2022-09-28

2.9K0

CVPR2022：计算机视觉中长尾数据平衡对比学习

学习方法机器学习神经网络深度学习人工智能

现实中的数据通常存在长尾分布，其中一些类别占据数据集的大部分，而大多数稀有样本包含的数量有限，使用交叉熵的分类模型难以很好的分类尾部数据。在这篇论文中，作者专注不平衡数据的表示学习。通过作者的理论分析，发现对于长尾数据，它无法形成理想的几何结构（在下文中解释该结构）。为了纠正 SCL（Supervised Contrastive Learning，有监督对比学习）的优化行为并进一步提高长尾视觉识别的性能，作者提出了一种新的BCL（Balanced Contrastive Learning，平衡对比学习）损失。

2022-09-28

2.3K0

YOLOV1 - V4 第二次阅读

神经网络深度学习人工智能图像识别

V2：基于论文发布时间段其他学者的一些学术成果和作者自己的思考和实验进行yolo的改进

2022-09-28

2330

MLSys 15-884: Course Introduction

编程算法机器学习深度学习神经网络人工智能

本来是在找一些有趣的关于mlsys的paper，突然发现，相比我刚刚读Ph.D.那会，这个domain变得越来越火了，包括MLSys2022，OSDI2022好多这方面的paper，目测9月开WLK前，我都有大把的时间来搞这些东西，所以，这次肯定是能够把坑填完的。同时也发现爱丁堡的麦络老师也写了一本不错的关于mlsys的书籍：

2022-05-27

8230

2022年新版YOLO解读(PP-YOLOE)

神经网络深度学习人工智能

【GiantPandaCV导语】这是2022年第一个关于YOLO的改版，该版本由百度提出，称之为YOLOE，是目前各项指标sota的工业目检测器，性能sota且部署相对友好。

2022-04-06

3.7K0

Tokens-to-token ViT: 对token做编码的纯transformer ViT，T2T算引入了CNN了吗？

css 机器学习神经网络深度学习人工智能

T2T-ViT是纯transformer的形式，先对原始数据做了token编码后，再堆叠Deep-narrow网络结构的transformer模块，实际上T2T也引入了CNN。

2022-04-06

6470

Kaggle Tensorflow StarFish挑战赛金牌分享

机器学习神经网络深度学习人工智能

在去年，陆陆续续和队友@willer共同参加了一些计算机视觉竞赛（图像检测、分类竞赛），取得了一些不错的成绩。在年底，偶然得知Kaggle上有一个热度很高的还行检测的比赛，于是简单参考了一下。今天榜单揭晓，非常幸运，在比赛切换到了私榜后，分数大幅度提升，从初赛Public Leaderboard的1100多名直接上分到了Top10，很幸运的荣获了人生中的第一个Kaggle Gold。

2022-04-06

6740

ViTAE：引入归纳偏置，浅层用CNN，深层用self-attention

机器学习神经网络深度学习人工智能 css

引入归纳偏置，即局部性和尺度不变性，浅层用CNN编码token，深层用多头注意力机制做transformer的模块堆叠，是一次CNN和transformer结合探索，也是一个对送进多头注意力机制的token编码的探索，送进更信息更加聚合的token，来降低模型大小，提高分类任务的效果。

2022-02-11

1.2K0

CvT: 如何将卷积的优势融入Transformer

机器学习神经网络深度学习人工智能 https

与之前BoTNet不同，CvT虽然题目中有卷积的字样，但是实际总体来说依然是以Transformer Block为主的，在Token的处理方面引入了卷积，从而为模型带来的局部性。最终CvT最高拿下了87.7%的Top1准确率。

2022-01-27

8220

BoTNet:Bottleneck Transformers for Visual Recognition

机器学习神经网络深度学习人工智能 https

基于Transformer的骨干网络，同时使用卷积与自注意力机制来保持全局性和局部性。模型在ResNet最后三个BottleNeck中使用了MHSA替换3x3卷积。属于早期的结合CNN+Transformer的工作。简单来讲Non-Local+Self Attention+BottleNeck = BoTNet

2021-12-29

6520

CNN、Transformer、MLP架构的经验性分析

机器学习神经网络深度学习人工智能

ViT的兴起挑战了CNN的地位，随之而来的是MLP系列方法。三种架构各有特点，为了公平地比较几种架构，本文提出了统一化的框架SPACH来对比，得到了具有一定insight的结论。论文来自微软的A Battle of Network Structures: An Empirical Study of CNN, Transformer, and MLP

2021-12-27

8860

【分类技巧】Fixing the train-test resolution discrepancy

腾讯云测试服务神经网络深度学习人工智能 https

【GiantPandaCV导语】调研分类方法的时候师姐推荐的一篇paper，其核心是训练的时候使用小分辨率，测试的时候使用大分辨率（训练分辨率的1.15倍），能够有效提升验证精度。

2021-11-12

4530

PPLcnet和YOLO的碰撞，真的能在cpu上快到起飞？

神经网络深度学习人工智能图像识别编程算法

【GiantPandaCV导语】这是一篇论证博客，前几天，baidu发布了PPLcnet，这是一款专门为cpu设计的网络，在看完论文后，果断进行了PPLcnet-yolo的复现，一来是想验证下这个网络在cpu上的性能，二来如果验证效果work，这套实验可以合并到自己的仓库。

2021-10-20

1K0

追求极致：Repvgg重参数化对YOLO工业落地的实验和思考

神经网络深度学习人工智能图像识别腾讯云测试服务

【GiantPandaCV导语】之前做了一次shufflenetv2与yolov5的组合，目的是为了适配arm系列芯片，让yolov5在端侧设备上也能达到实时。但在gpu或者npu方面也一直在尝试着实验，对此类实验的目的很明确，要求也不高，主要还是希望yolov5在保持原有精度的同时能够提速。这一次的实验主要借鉴repvgg重参化的思想，将原有的3×3conv替换成Repvgg Block，为原有的YOLO模型涨点。本文版权属于GiantPandaCV，未经允许请勿转载

2021-10-08

1.4K0

Deepfake视频中时空不一致学习

编程算法机器学习神经网络深度学习人工智能

针对Deepfake Video检测任务上的时空不一致问题，提出了三种模块对时间信息、空间信息、时间差异进行建模，能够灵活地即插即用到2D CNN中。

2021-10-08

8110

NCNN+Int8+yolov5部署和量化

神经网络深度学习人工智能图像识别 github

【GiantPandaCV引言】还记得我在两个月前写的文章吗，关于yolov4-tiny+ncnn+int8量化的详细教程：NCNN+INT8+YOLOV4量化模型和实时推理

2021-09-14

3.4K0

ShuffleNetV2-Yolov5 更轻更快易于部署的yolov5

神经网络深度学习人工智能图像识别 node.js

【GiantPandaCV导语】毕设的一部分，前段时间，在yolov5上进行一系列的消融实验，让他更轻（Flops更小，内存占用更低，参数更少），更快（加入shuffle channel，yolov5 head进行通道裁剪，在320的input_size至少能在树莓派4B上一秒推理10帧），更易部署（摘除Focus层和四次slice操作，让模型量化精度下降在可接受范围内）。版权属于GiantPandaCV，未经允许请勿转载

2021-09-14

2.4K1

点击加载更多

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态