GiantPandaCV-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

GiantPandaCV

专栏成员

722

文章

990714

阅读量

100

订阅数

《YOLOv5全面解析教程》十三，downloads.py 详细解析

python github git 开源

是一个工具类，代码比较简单，函数也比较少，主要难点还是在于一些包可能大家不是很熟悉，下面一起来学习下。

2023-01-01

1.1K0

自制深度学习推理框架-前言-第一课

github git 开源

很高兴GiantPandaCV和傅莘莘同学达成合作，将连载由他原创制作的自制深度学习推理框架课程系列，这篇是本系列的开篇。第一课对应的视频和课件放在下方了。github链接：https://github.com/zjhellofss/KuiperInfer

2022-12-29

7400

【BBuf的CUDA笔记】二，解析 OneFlow BatchNorm 相关算子实现

https 网络安全神经网络 github git

在ResNet中（https://github.com/pytorch/vision/blob/main/torchvision/models/resnet.py），关于BatchNorm的调用一共有两种模式，第一种是ReLU接在BN之后：

2022-12-29

9490

【BBuf 的CUDA笔记】一，解析OneFlow Element-Wise 算子实现

kernel 深度学习 https 网络安全 github

由于CUDA水平太菜，所以一直没写过这方面的笔记。现在日常的工作中已经不能离开写CUDA代码，所以准备学习ZZK随缘做一做CUDA的笔记记录一下学习到的知识和技巧。这篇文章记录的是阅读OneFlow的Element-Wise系列CUDA算子实现方案学习到的技巧，希望可以帮助到一起入门CUDA的小伙伴们。Elemet-Wise算子指的是针对输入Tensor进行逐元素操作，比如ReLU就是针对输入Tensor的每个值进行判断是否大于0，大于0的话输出就是输入否则就是0。用CUDA来表达最简单的写法就是：

2022-12-29

1.3K0

TVM 学习指南（个人版）

https 网络安全 github git 开源

最近粗略的看完了天奇大佬的MLC课程（顺便修了一些语法和拼写错误，也算是做了微弱的贡献hh），对TVM的近期发展有了一些新的认识。之前天奇大佬在《新一代深度学习编译技术变革和展望》一文中（链接：https://zhuanlan.zhihu.com/p/446935289）讲解了TVM Unify也即统一多层抽象的概念。这里的统一多层抽象具体包括AutoTensorization用来解决硬件指令声明和张量程序对接，TVM FFI（PackedFunc）机制使得我们可以灵活地引入任意的算子库和运行库函数并且在各个编译模块和自定义模块里面相互调用。TensorIR负责张量级别程序和硬件张量指令的整合。Relax (Relax Next) 引入relay的进一步迭代，直接引入first class symbolic shape的支持（摘抄自《新一代深度学习编译技术变革和展望》一文）。然后这些抽象可以相互交互和联合优化来构造深度学习模型对应的最终部署形式。我个人感觉TVM Unify类似于MLIR的Dialect，但是这几个抽象的直接交互能力相比于MLIR的逐级lower我感觉是更直观方便的，毕竟是Python First（这个只是我最近看MLC课程的一个感觉）。对这部分内容感兴趣的读者请查看天奇大佬的TVM Unify介绍原文以及MLC课程。

2022-09-28

3.4K0

【社区实践】为 TVM 新增 OneFlow 前端

https 网络安全 github git 开源

去年在Summer Code的时候我刚好开始入门 TVM（虽然现在仍然也还是入门阶段，没做过什么有意义的工作），并且恰好来到OneFlow 工作就想着给 TVM 添加一个 OneFlow 前端。但可惜在 Summer Code 发起了这个项目后因为系统选人的 BUG 导致没有选到合适的候选人。后来我私下联系了申请这个项目的第二位候选人胡伽魁同学问他是否愿意来 OneFlow 实习并花1-2个月完成这件事，他同意了并在实习期间做了一个初版出来。感谢胡伽魁同学的贡献。

2022-05-27

4980

如何更快地训练Vision Transformer

https 网络安全 github git 开源

近期MetaAI发布了一篇博客，关于如何显著提升Vision Transformer的训练效率。

2022-05-27

9970

【TVM 三代优化巡礼】在X86上将普通的矩阵乘法算子提速90倍

缓存智能推荐平台 https 网络安全 github

本文主要梳理一下在21年接触到优化gemm的知识，做一个学习总结。行文的顺序大概为：

2022-05-27

1K0

Detectors for the 2020s 目标检测算法最新进展

https 网络安全 github 编程算法 git

近几年目标检测的落地越发成熟，新的sota网络同样层出不穷，不断刷新着coco的记录。本文盘点截止2019-2021年，在coco test-dev上霸榜，且知名度较广的目标检测网络（未完全开源不加入讨论）。

2022-04-06

1.2K0

深度学习框架如何优雅的做算子对齐任务？

https 网络安全 github git 开源

之前回答过「如何为PyTorch做贡献的知乎问题」，原贴见：https://www.zhihu.com/question/502301777/answer/2248950419 。回答提到了去年在OneFlow开发一些算子时，基于算子AutoTest框架找到了一些PyTorch算子的bug，并给PyTorch做出了反馈或修复。但这个回答没有介绍这个AutoTest框架长什么样子，以及它背后的原理。因此，这篇文章就用来介绍OneFlow的算子AutoTest框架看一下OneFlow深度学习框架在算子开发过程中是如何优雅的做算子对齐任务的（由@大缺弦开发，后经我和其它同事进行扩展和丰富功能形成今天的形态）。这个AutoTest框架也可以很轻易移植到其它深度学习训练框架使用，代码实现在https://github.com/Oneflow-Inc/oneflow/blob/v0.6.0/python/oneflow/test_utils/automated_test_util/torch_flow_dual_object.py。

2022-02-11

9760

神经网络加上注意力机制，精度反而下降，为什么会这样呢？

github https git 开源网络安全

因为之前写过Attention+YOLOv3的文章，做过相关实验，所以被问过很多问题，举几个典型的问题：

2021-12-27

2.5K0

【从零开始学深度学习编译器】十七，MLIR ODS要点总结下篇

c++编程算法 https 网络安全 github

这一节在【从零开始学深度学习编译器】十六，MLIR ODS要点总结上篇的基础上补充完整了ODS的要点。约束和属性的定义都是MLIR中相当重要的元素，至于类型的定义个人认为了解即可，等到我们需要自定义类型的时候再仔细研究。最后MLIR的语法比较晦涩，初学者可以借助mlir-tblgen来辅助debug。

2021-12-13

1.6K0

MosaicML Composer 炼丹技巧14条

https 网络安全批量计算 NLP 服务 github

Github 链接：https://github.com/mosaicml/composer

2021-12-09

6810

如何参与PyTorch社区开源贡献？

pytorch https github 网络安全 git

作为深度学习框架OneFlow的一个全职开发者（声明我是菜鸡），基本上每天都会和PyTorch打交道，所以自问自答一下这个问题，希望对想为开源项目做贡献的小伙伴们提供一些思路也希望这个问题能获得更多回复。

2021-12-02

9120

强化学习读后感

编程算法 https 网络安全 github git

此学习笔记基础来源于zhoubolei RL(https://github.com/zhoubolei/introRL)，以基本概念，基本定理，问题建模，代码实现，新论文的阅读为逻辑展开写的。学习强化学习的过程，会相对漫长。比如：一个假想的学习过程，可能会包含sutton的 complete draft；一些RL基础课程，David Silver，伯克利RL或周博磊等；经典算法的复现；核心研究部门的学术文章(openAI，DeepMind，...)；靠谱博士写的博文；会遇见公式符号，上下标，算法实现细节，问题优化，具体问题建模等问题。这里，只是个开始，代码框架可参考PARL。不太懂wx格式，建议wx对latex支持更友好，不要搞什么其他幺蛾子语法。

2021-10-08

7540

用Welford算法实现LN的方差更新

https 网络安全 github git 开源

前段时间debug LayerNorm的时候，看见Pytorch LayerNorm计算方差的方式与我们并不一样。它使用了一种在线更新算法，速度更快，数值稳定性更好，这篇笔记就当一篇总结。

2021-09-14

1.5K0

以OneFlow为例梳理深度学习框架的那些插值方法

编程算法 kernel https 网络安全 github

这篇文章基于自己为OneFlow框架开发interpolate这个Op总结而来，OneFlow的interpolate Op 和 Pytorch的功能一致，都是用来实现插值上采样或者下采样的。在实现这个Op的时候还给Pytorch修复了一个bug并合并到了主仓库，见：https://github.com/pytorch/pytorch/commit/6ab3a210983b7eee417e7cd92a8ad2677065e470。因此OneFlow框架中的interpolate算子和Pytorch中的interpolate算子的功能是完全等价的。这篇文章就以OneFlow中这个算子的实现为例来盘点一下深度学习框架中的那些插值算法。

2021-09-14

1.4K0

可以让深度学习编译器来指导算子优化吗

单片机 https 网络安全 github git

之前在阅读Ansor论文的时候（https://zhuanlan.zhihu.com/p/390783734）我就在想这样一个问题，既然Ansor是在人为指定的推导规则下启发式的生成高性能的Scheduler模板。那么这个算子生成的Scheduler模板是否可以反过来指导我们写程序呢？嗯，然后我就开启了这个实验，但最近因为工作的事情delay得厉害，终于在这个周末抽出时间来更新这个实验结果并且记录了这篇文章。由于笔者只对GEMM的优化熟悉，这里就以优化X86的GEMM为例子来探索。希望这篇文章能为你带来启发，文章所有的实验代码都放到了https://github.com/BBuf/tvm_learn ，感兴趣的可以点个star一起学习（学习TVM的4个月里，这个工程已经收到了快100star了，我很感激）。

2021-09-14

8750

NCNN+Int8+yolov5部署和量化

神经网络深度学习人工智能图像识别 github

【GiantPandaCV引言】还记得我在两个月前写的文章吗，关于yolov4-tiny+ncnn+int8量化的详细教程：NCNN+INT8+YOLOV4量化模型和实时推理

2021-09-14

3.4K0

LightSeq: Transformer高性能加速库

https 网络安全 github apache git

Transformer，Bert模型在NLP领域取得巨大成功，得到广泛应用。而Transformer系列模型大小通常很大，在应用层提供相应服务是一个巨大的挑战。

2021-08-19

1.2K0

点击加载更多

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态