升级背景
DPU(Deep-learning Processor Unit,深度学习专用处理器)是深鉴科技为解决深度学习类应用重计算负载需求专门优化和设计的计算加速平台,支持图像和视频的分类 (Classification)、分割 (Segmentation)、检测 (Detection)、跟踪 (Tracking),以及语音识别 (Speech Recognition) 等各种AI场景类应用需求。DPU有一套专门针对DNN (深度神经网络) 算法设计的优化指令集,可灵活高效地支持各种神经网络算法。
DNNDK (Deep Neural NetworkDevelopment Kit) 是深鉴科技面向AI异构计算平台DPU自主研发的原创深度学习开发SDK,涵盖了深度神经网络Inference阶段的模型压缩(包括剪枝和定点化)、编译优化和高效运行时支持等各种功能需求,为DPU平台深度学习应用开发和部署提供高效全栈式解决方案,DNNDK具有以下特色:
- 国内首款公开发布的深度学习SDK、引领人工智能技术研发趋势
- 业界领先的原创深度学习全栈式解决方案
- 自动化神经网络模型压缩、编译和运行时完整优化工具链支持
- 基于标准C/C++高级语言的轻量级编程APIs
- 简单易用、开发门槛低
DeePhi深度学习平台
DNNDK全球试用地区分布
DNNDK中国试用区域分布
更新内容
DNNDK本次版本升级的主要内容如下:
1. 改进了工具的易用性,实现对主流神经网络的一键式压缩和编译,避免了之前版本需要用户冗余的手动参与操作,极大地提高了用户的研发效率;
2. 在SDK的完备性方面,我们引入了新的运行时管理工具DExplorer和可视化性能分析工具DSight,可帮助用户便捷地管理DPU Runtime的运行模式,直观地查看应用运行在DPU的性能Profile结果;
3. 对DNNDK进行了诸多的优化和改进,实现了更优的网络层融合策略、更有效的内存复用算法、更低开销的DPU运行时调度策略等;
4. 修复用户在使用DNNDK过程中发现的一系列bug;
5. 版本升级过程中我们尽最大可能保持了版本向前兼容,用户基于老版SDK开发的项目可以无缝地切换到新版本下。
DSight性能分析工具
领取专属 10元无门槛券
私享最新 技术干货