BBuf

LV0
发表了文章

2022年新版YOLO解读(PP-YOLOE)

【GiantPandaCV导语】 这是2022年第一个关于YOLO的改版,该版本由百度提出,称之为YOLOE,是目前各项指标sota的工业目检测器,性能sota...

BBuf
发表了文章

F8Net:只有8比特乘法的神经网络量化

【GaintPandaCV导语】F8Net用定点化量化方法对DNN进行量化,在模型推理只有8-bit的乘法,没有16-bit/32-bit的乘法,采用非学习的方...

BBuf
发表了文章

【论文解读】基于MLIR生成矩阵乘法的高性能GPU代码,性能持平cuBLAS

本文是对 https://arxiv.org/abs/2108.13191 这篇论文进行解读,学习一下如何基于MLIR编译器基础设施生成高效的GPU代码。本文的...

BBuf
发表了文章

浅谈NVIDIA H100白皮书

【GiantPandaCV导语】忙完手头工作,就赶紧来过了一遍 H100 白皮书。下面我就以框架开发和炼丹师的角度谈谈 H100 的一些新特性,如有说错的地方还...

BBuf
发表了文章

Compact-Transformer:缓解数据不足带来的问题

【GiantPandaCV导语】本文致力于解决ViT在小型数据集上性能不够好的问题,这个问题非常实际,现实情况下如果确实没有大量数据集,同时也没有合适的预训练模...

BBuf
发表了文章

【从零开始学深度学习编译器】二十,MLIR的Pattern Rewrite机制

这篇文章对MLIR的Pattern Rewrite机制进行翻译和总结。这几篇文档分别是https://mlir.llvm.org/docs/PatternRew...

BBuf
发表了文章

【从零开始学深度学习编译器】十九,MLIR的Pass机制实践

这个系列的前面几篇文章对MLIR的组件有了一些粗浅的认识,这篇文章不继续讲MLIR的架构。而是从实践的角度带读者来看一下,MLIR帮助我做了什么,这里仍然以On...

BBuf
发表了文章

Detectors for the 2020s 目标检测算法最新进展

近几年目标检测的落地越发成熟,新的sota网络同样层出不穷,不断刷新着coco的记录。本文盘点截止2019-2021年,在coco test-dev上霸榜,且知...

BBuf
发表了文章

视觉模型端侧部署新范式|二值神经网络的落地实践

二值神经网络 (BNN)指的是weight和activation都用1-bit来表示的模型架构,相比FP32的浮点神经网络,它可以实现约32倍的内存减少,并且在...

BBuf
发表了文章

MLIR:摩尔定律终结的编译器基础结构 论文解读

【GiantPandaCV导语】本文是对MLIR的论文解读以及实践,这里的实践指的是把MLIR的要点在OneFlow Dialect中进行了对应,并解释了每个要...

BBuf
发表了文章

Tokens-to-token ViT: 对token做编码的纯transformer ViT,T2T算引入了CNN了吗?

T2T-ViT是纯transformer的形式,先对原始数据做了token编码后,再堆叠Deep-narrow网络结构的transformer模块,实际上T2T...

BBuf
发表了文章

Kaggle Tensorflow StarFish挑战赛金牌分享

在去年,陆陆续续和队友@willer共同参加了一些计算机视觉竞赛(图像检测、分类竞赛),取得了一些不错的成绩。在年底,偶然得知Kaggle上有一个热度很高的还行...

BBuf
发表了文章

检测器backbone和neck哪个更重要,达摩院新作有不一样的答案

【GaintPanda导语】这是关于GiraffeDet的论文详读,该论文提出以S2D Chain为组合模块,构建light backbone,再以Queen ...

BBuf
发表了文章

ViTAE:引入归纳偏置,浅层用CNN,深层用self-attention

引入归纳偏置,即局部性和尺度不变性,浅层用CNN编码token,深层用多头注意力机制做transformer的模块堆叠,是一次CNN和transformer结合...

BBuf
发表了文章

IJCAI21 对比自蒸馏实现超分模型的加速

Towards Compact Single Image Super-Resolution via Contrastive Self-distillation ...

BBuf
发表了文章

FFCV:让数据加载不再是训练模型的瓶颈

前段时间逛GitHub看到FFCV这个库,该库主要是优化数据加载过程来提升整体训练速度。其中也放出了一些benchmark,看上去比其他优化库如DALI,PyT...

BBuf
发表了文章

工程部署(三): 低算力平台模型性能的优化

此文讨论如何在低端的移动设备上提高模型性能,文章针对模型(不改变模型原有op情况下,不需要重新训练)和后处理两部分的优化开展讲解,若有不当之处,望批评指出!

BBuf
发表了文章

一文读懂 Pytorch 中的 Tensor View 机制

用户在使用 Pytorch 的过程中,必然会接触到 view 这个概念,可能会有用户对它背后的实现原理感兴趣。

BBuf
发表了文章

一个Tensor在深度学习框架中的执行过程简单梳理

相信看到这篇文章的人都对深度学习框架是有所了解和熟悉的,也多多少少会使用Python写一些神经网络相关的代码。例如我们可以在PyTorch写出下面的代码:

BBuf
发表了文章

2021 BDCI 华为零售商品识别竞赛一等奖方案分享

【GiantPandaCV导语】上学期快结束的时候参加了华为和CCF组织的零售商品识别的比赛,队伍名称为GiantPandaCV队,比赛大约持续了两个月,期间从...

BBuf

个人简介

个人成就

扫码关注云+社区

领取腾讯云代金券