随着大数据的发展,计算机芯片算力的提升,人工智能近两年迎来了新一轮的爆发。而人工智能实现超级算力的核心就是AI芯片。AI芯片也被称为人工智能加速器,即专门用于处理人工智能应用中的大量计算任务的模块。
2020年我国人工智能芯片市场规模约为184亿元。未来5G商用的普及将继续催生人工智能芯片的应用需求,中国人工智能芯片行业将快速发展,预计2023年市场规模将突破千亿元。
那么,如何借助AI芯片来实现特定的任务,将是所有AI芯片产业人员必备的技能。
为此,贪心学院重磅推出《高性能神经网络与AI芯片应用研修课程》,为想进入AI芯片行业的同学们提供一个可以大幅提升自身就业竞争力的选择。
本课程会讲解AI芯片相关知识、高性能网络设计、通用芯片及专用芯片计算加速方法等专业技能,并结合优秀编译器的架构和实现细节的讲解,为学生构建高性能AI算法的软硬件视角,能够解决应用落地时神经网络的优化和部署相关问题。
01
内容亮点
02
你将收获
感兴趣的请添加咨询顾问
03
项目介绍
▌项目1项目名称:模型轻量化项目内容描述:mobilenet、shufflenet、squeezenet等,模型量化、剪枝和蒸馏技术,网络的计算量和内存分析的工具,主干网络的轻量化,检测网络的轻量化,分割网络的轻量化,不同框架提供的加速方案。项目使用的数据集:COCO,ADE20k,ImageNet项目使用的算法:模型量化,模型剪枝和模型蒸馏项目使用的工具:python,c/c++,pytorch,tensorflow,distiller,ncnn项目预期结果:学员掌握轻量化网络设计准则,模型轻量化技术,能够上手操作一 个网络部署前的优化。项目对应第几周的课程:1~4周
▌项目2项目名称:神经网络编译器项目内容描述:tvm,ncnn,mnn,tnn 各自的特点,对于神经网络的优化方案,tvm的具体设备的优化方案,算子融合,路径优化,内存优化,ncnn的网络的表示数据结构,ncnn的一些优化计算的思路,量化方法,mnn中的数据结构,模型转换和量化方法,tnn和ncnn的区别,系统架构,量化方法。项目使用的算法:离线量化,在线感知量化项目使用的工具:python,c/c++,tvm,ncnn,tnn,mnn项目预期结果:学员对于神经网络编译器有全面的了解,对于主流神经网络编译器能够实践使用,完成模型到芯片所需要格式的转换。项目对应第几周的课程:5~8周
▌项目3项目名称:通用芯片加速技术项目内容描述:cpu,arm对应的指令集级别的加速,编译器中具体的优化策略,simd,avx,sse,openblas,neon和cpu中对于卷积的运算加速方案,cpu上的具体实例,arm上的具体实例,环境配置,神经网络的例子,加速方案的组合和实际效果。项目使用的算法:simd,avs,sse,blas,winograd项目使用的工具:nnpack,qnnpack,lowpgemm,tvm,ncnn项目预期结果:学员深入掌握cpu,arm等芯片的神经网络加速技术,并且通过一个例子来看具体的加速效果 。项目对应第几周的课程:9~12周
▌项目4项目名称:专用芯片加速技术项目内容描述:gpu和k210 npu及各自神经网络编译器中的加速优化技术,gpu上的cuda加速的方法,cublas,opencl,vulkan的开发例子,nncase上编译一个网络,k210开发板环境配置及人脸检测模型的部署项目使用的算法:人脸检测项目使用的工具(编程语言、工具、技术等):Python,C/C++,opencl,vulkan,nncase项目预期结果:学员可以掌握gpu及npu上神经网络的编译加速,并且通过一个具体的例子来完成人脸检测模型在k210芯片上的部署 。项目对应第几周的课程:13~16周
感兴趣的请添加咨询顾问
04
详细内容介绍
第一周:轻量化网络结构设计
本节课将讲解网络参数量、浮点运算数等模型评价指标、工具,以及分类网络, 检测网络,分割网络的轻量化设计。
课程提纲:
第二周:知识蒸馏优化、低秩分解优化
本节课将讲解神经网络知识蒸馏优化、神经网络计算低秩分解加速计算方法。
课程提纲:
第三周:网络剪枝
本节课将讲解网络稀疏性原理,网络剪枝原则及剪枝的常见方法。
课程提纲:
第四周:网络量化
本节课将讲解网络的低比特化,以及在AI芯片中的计算,实现网络量化的离线和在线感知的量化方法。课程提纲:
第五周:神经网络编译器简介
本节课将讲解tvm、ncnn、tnn、mnn的简要对比,tvm relay和网络转换,网络的编译优化和推理加速。
课程提纲:
第六周:ncnn
本节课将讲解ncnn的系统架构图,数据结构,支持的框架,网络的表示,网络优化,量化,以及各平台的优化策略。
课程提纲:
第七周:tnn本节课将讲解tnn的系统架构图,数据结构,支持的框架,网络的表示,网络优化,量化,以及各平台的优化策略。课程提纲:
第八周:mnn
本节课将讲解mnn的系统架构图,数据结构,支持的框架,网络的表示,网络优化,量化,以及各平台的优化策略。
课程提纲:
第九周:cpu中的指令集优化
本节课将讲解cpu中的指令集优化,simd、avx、sse方法,及tvm中对于cpu上神经网络加速的位置。
课程提纲:
第十周:arm中的神经网络加速
本节课将讲解arm中的neon优化,及ncnn,tnn和mnn的实现,并结合实际例子来看具体的加速效果。课程提纲:
第十一周:卷积计算的优化算法本节课将讲解卷积计算的优化算法,包括winograd等。
第十二周:神经网络加速库本节课将讲解openblas库的优化,nnpack/qnnpack的优化,及lowpgemm。课程提纲:
第十三周:gpu上神经网络的运行和加速
本节课将讲解gpu与cpu计算加速的区别,英伟达gpu的原生cuda加速方法,及推理侧tensorrt的使用。
课程提纲:
第十四周:gpu加速通用加速库
本节课将讲解通用加速库cublas,vulkan,opencl的使用。
课程提纲:
第十五周:dsp,fpga,npu专用加速计算
本节课将讲解dsp,fpga,npu的专用加速计算。
课程提纲:
第十六周:npu使用本节课将以嘉楠科技的k210为例,实现一个人脸检测案例。课程提纲:
感兴趣的请添加咨询顾问
05
授课方式
06
适合人群
大学生
在职人士
入学基础要求
07
课程研发及导师团队
王欢
肇观科技算法总监华中科技大学模式识别与人工智能硕士原拼多多、同盾科技等公司算法工程师,AI算法领域从业15+年
蓝振忠课程研发顾问ALBERT模型的第一作者
西湖大学特聘研究员和博士生导师Google AI实验室科学家美国卡耐基梅隆大学博士先后在NIPS, CVPR, ICCV, IJCAI等会议发表30篇以上论文,1000+引用次数
Jerry Yuan课程研发顾问美国微软(总部)推荐系统部负责人美国亚马逊(总部)资深工程师
美国新泽西理工大学博士
14年人工智能, 数字图像处理和推荐系统领域研究和项目经验先后在AI相关国际会议上发表20篇以上论文
李文哲贪心科技CEO美国南加州大学博士
曾任独角兽金科集团首席数据科学家、美国亚马逊和高盛的高级工程师金融行业开创知识图谱做大数据反欺诈的第一人先后在AAAI、KDD、AISTATS、CHI等国际会议上发表过15篇以上论文
感兴趣的请添加咨询顾问
08
历届学员去向
本文分享自 机器学习算法与Python学习 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!