首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

NVDLA中Winograd卷积的设计

在探究NVDLA中的Winograd卷积设计之前,必须先明确NVDLA中的的直接卷积的计算方式。...Nvidia的相关文档中十分详细的NVDLA计算直接卷积的流程(NVDLA Unit),其将卷积计算分成了五级(下述描述中,以数值精度为Int16为例) Atomic Operation (原子操作,完成...计算顺序还一定程度确定了NVDLA的Buffer设计和数据路径设计。...NVDLA中的Winograd卷积 建立在直接卷积的硬件架构上,NVDLA针对Winograd卷积进行了一系列的修改。...NVDLA是一个相对专用的加速器,从相关文档中也可以看出,NVDLA专门针对计算中的各种特性/数据排列进行了硬件上的处理。而现有的很多加速器,为了兼顾不同网络的计算效率,往往更为灵活。

1.3K10
您找到你想要的搜索结果了吗?
是的
没有找到

全球首个软硬件推理平台 :NVDLA编译器正式开源

NVDLA 编译器的性能和效率 编译器是 NVDLA 软件栈的关键组件。它能生成优化的执行图,将预训练的神经网络模型层中定义的任务,映射到 NVDLA 中的各个执行单元。...NVDLA 核心硬件有六个专门的硬件单元,可以实现同时调度,或者在流水线配置中实现调度。 ? NVDLA 架构图 此外,它还具有小型和大型硬件配置文件。...cd firesim-nvdla ..../build-setup.sh fast 使用 NVDLA 运行单节点模拟之后,按照 NVDLA 教程中的步骤可以立即启动 YOLOv3。...SiFive 使用 NVDLA 进行深度学习推理 据悉,SiFive 在一年前首次在自己的平台上开始使用 NVDLA,而经过了性能优化的开源 NVDLA 编译器,能够创建特定领域的优化 SoC 设计,为

1K20

提问黄仁勋:5年内GPU定会赢过TPU,中国计算机产业已居世界一流

今天英伟达的官方博客则着重介绍了NVIDIA深度学习加速器(NVDLA)这一免费开源架构。...NVIDIA深度学习加速器(NVDLA)是一个免费开源架构,可以促进深度学习加速器设计方法的标准化。通过其模块化架构,NVDLA具备可拓展性、高度可配置性,可简化集成和便携度。...作为英伟达Open NVDLA许可证下的开源项目,所有的软件、硬件、文档都可在GitHub上找到。...详细介绍地址:http://nvdla.org/primer.html 开源地址:https://github.com/nvdla 不少人评论称,黄教主又有了新的信仰——开源。...NVIDIA®深度学习加速器(NVDLA)项目推动了一种标准化的开放架构,以解决推理的计算需求。 NVDLA架构既可扩展又高度可配置,模块化的设计保持了灵活性并简化集成。

1K50
领券