首页
学习
活动
专区
工具
TVP
发布

人人都是极客

专栏作者
495
文章
826956
阅读量
175
订阅数
深度学习中的3个秘密:集成,知识蒸馏和自蒸馏
训练好的模型,用自己蒸馏一下,就能提高性能,是不是很神奇,这里面的原理到底是什么呢,这要从模型集成开始说起。
刘盼
2024-04-15
1830
图形驱动技术栈概览
1 说明背景1.1 近来想法1.2 几个概念2 全局视角2.1 应用场景(了解)2.2 大概原理(了解)2.3 技术图景(了解)3 用户空间3.1 OpenGL 和 libGL(了解)3.2 libXCB 和 XServer(了解)3.3 libGL 和 Mesa(了解)4 用户和内核4.1 软件构图(了解)4.2 驱动视角(待掌握)4.3 源码视角(了解)5 内核和固件5.1 工作流程(掌握)5.2 交互途径(掌握)5.3 寄存器组设计(掌握)5.4 通信协议设计(掌握)6 固件和硬件6.1 固件软件设计(掌握)6.2 软件硬件接口(了解)6.3 体系结构简介(了解)6.4 图形流水线(了解)7 参考资料
刘盼
2023-01-05
1.9K0
入门篇-GPU知识概览
做了一段时间的 GPU 固件和驱动开发,加上平时学习的一些零散的知识,最近打算整理,将这些做成一页文章。 主线任务:梳理 GPU 的知识大纲 =====> 对标 GPU入门工程师 支线任务:了解 GPU 硬件工作机理 支线任务:掌握 GPU 固件工作机理 =====> 对标 GPU固件工程师 支线任务:了解 GPU 驱动 和 GPU 固件的交互接口 支线任务:掌握 GPU 驱动工作机理 =====> 对标 GPU驱动工程师 支线任务:了解 GPU 驱动 和 LIBDRM 的交互接口
刘盼
2023-01-05
1.6K0
一个打通软硬件的极好资源
大家好,我是 Peter!今天宣布一个好消息。 很荣幸和大佬们一起合写了本书《计算机系统开发与优化实战》,最近就要上市了。本书首先介绍通用处理器的架构,以及汇编和编译的技术;然后讲解 Linux 内存管理、 Linux 进程管理,以及 GDB、 trace、 eBPF、 SystemTap 等 Linux 系统开发工具;接着通过视频编解码主流技术和 NVIDIA 计算平台 CUDA 等讨论人工智能技术在音视频领域与自然语言处理领域的应用;最后讲解标准计算平台 OpenCL 的原理、开源硬件 soDLA、
刘盼
2022-08-26
6333
一文读懂深度学习:从神经元到BERT
一个神经网络结构通常包含输入层、隐藏层、输出层。输入层是我们的 features (特征),输出层是我们的预测 (prediction)。神经网络的目的是拟合一个函数 f*:features -> prediction。在训练期间,通过减小 prediction 和实际 label 的差异的这种方式,来更改网络参数,使当前的网络能逼近于理想的函数 f*。
刘盼
2019-05-28
9780
嵌入式AI —— 6. 为糖葫芦加糖,浅谈深度学习中的数据增广
又和大家见面了,上次本程序猿介绍了CMSIS-NN,一晃过去了两个月。。。。闲话不多说,开始正题,小编这次带来的是,进行深度学习部署时的一段比较有用的小插曲:浅谈深度学习中的数据增广。
刘盼
2019-05-22
6070
物联网产业链全景图!
2018年产业分布内容中出现了一些新的子类别,这也反映了物联网领域的新趋势。包括:语音平台、海洋车辆、垂直农业和边缘计算。同时,也体现出物联网生态系统的各个部分并没有以相同的速度发展,物联网涵盖了几个行业而不是一个行业。
刘盼
2019-05-17
2.6K0
推荐系统技术连载(1)
在这个系列文章中,我将分享掌握推荐系统的经验,以及围绕推荐系统从低级模型到高级模型的实现。
刘盼
2019-05-15
6300
解密AI芯片的加速原理
网上对AI芯片的剖析实在太少,这里对一些论文和大佬的研究做一个总结,希望对读者有所帮助。
刘盼
2019-05-14
7800
i.MX RT助您跨界AI ——5. 从穿糖葫芦到织深度神经网络
CMSIS-NN作为在i.MX RT上运行深度神经网络的关键幕后英雄,在上期中终于闪亮登场,并且在i.MX RT强大算力的支持下,分类10样物体只是小试牛刀——每秒能识别多达50次!
刘盼
2019-05-13
5910
谷歌携手恩智浦发布发布:端到端开源机器学习平台
今天凌晨,谷歌一年一度的TensorFlow开发者大会在加州举行。明明应该是一场软件盛会,却被生生开出了硬件发布会的味道。
刘盼
2019-05-08
4960
六张图看懂人工智能知识体系
关于人工智能的前世今生、内涵意义,下图可以说是相当清楚全面了。人工智能是未来一大热点,如果你也看好这一趋势,不妨把下面六张图收藏起来慢慢看。
刘盼
2019-05-08
8690
AI 芯片和传统芯片的区别
比如,自动驾驶需要识别道路行人红绿灯等状况,但是如果是当前的CPU去算,那么估计车翻到河里了还没发现前方是河,这是速度慢,时间就是生命。如果用GPU,的确速度要快得多,但是,功耗大,汽车的电池估计无法长时间支撑正常使用,而且,老黄家的GPU巨贵,经常单块上万,普通消费者也用不起,还经常缺货。另外,GPU因为不是专门针对AI算法开发的ASIC,所以,说到底,速度还没到极限,还有提升空间。而类似智能驾驶这样的领域,必须快!在手机终端,可以自行人脸识别、语音识别等AI应用,这个必须功耗低,所以GPU OUT!
刘盼
2018-12-19
1.5K0
Peter教你谈情说AI | 01导读
机器学习已经慢慢演变成了根据已知模型 + 框架运用的开发,用不了多久机器学习就会变成像多媒体,图形开发等一样,只要根据已知的 api 开发相应的 AI app 就行了,但是不了解机器学习的根本原理很难优化模型计算,也就很难发挥出 AI 专有场景的性能。
刘盼
2018-10-24
3980
面向嵌入式 AI 芯片上视觉任务的神经网络设计
随着这几年神经网络和硬件(GPU)的迅猛发展,深度学习在包括互联网,金融,驾驶,安防等很多行业都得到了广泛的应用。然而在实际部署的时候,许多场景例如无人驾驶,安防等对设备在功耗,成本,散热性等方面都有额外的限制,导致了无法大规模应用深度学习解决方案。
刘盼
2018-10-24
1.1K0
解密AI芯片的加速原理
网上对AI芯片的剖析实在太少,这里对一些论文和大佬的研究做一个总结,希望对读者有所帮助。
刘盼
2018-09-25
4.1K0
解读AI芯片麒麟980如何让手机更智能
8月31日,华为发布了新一代顶级人工智能手机芯片——麒麟980,成为全球首款采用7nm制程工艺的手机芯片。麒麟980能做到人脸识别、物体识别、物体检测、图像分割、智能翻译等,实现AI识别质的飞跃。
刘盼
2018-09-25
1.3K0
【视频教学】如何加速深度学习架构
有些人会觉得现在市场上有很多深度学习引擎的框架,比如tensorflow, pytorch, caffe等,为什么还需要加速呢,很简单,虽然深度学习的技术发展火热,也有很多大牛,但是深度学习框架在技术上目前并没有收敛。这种事就像大数据分析hadoop一样,之前并没有成熟框架来处理分布式数据,经过很多年沉淀,现在hadoop已经成工业标准,后来内存的计算用spark。深度学习框架也是一样,由于深度学习算法还没有完全成熟以及与传统硬件计算力的不同(对新的芯片计算能力有需求),所以深度学习框架并没有得到真正的收敛。下面我们看一下袁进辉老师对深度学习架构的优化有什么办法。
刘盼
2018-07-26
8960
如何加速深度学习?GPU、FPGA还是专用芯片
计算机发展到今天,已经大大改变了我们的生活,我们已经进入了智能化的时代。但要是想实现影视作品中那样充分互动的人工智能与人机互动系统,就不得不提到深度学习。
刘盼
2018-07-26
5470
极简入门 | 无人驾驶汽车系统基本框架梳理
作者简介:申泽邦(Adam Shan),兰州大学在读硕士研究生,主攻无人驾驶,深度学习;兰大未来计算研究院无人车团队骨干,在改自己的无人车,参加过很多无人车Hackathon,喜欢极限编程。
刘盼
2018-07-26
1.8K0
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档