人人都是极客-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

人人都是极客

专栏成员

495

文章

902574

阅读量

178

订阅数

深度学习中的3个秘密：集成，知识蒸馏和自蒸馏

测试模型数据神经网络深度学习

训练好的模型，用自己蒸馏一下，就能提高性能，是不是很神奇，这里面的原理到底是什么呢，这要从模型集成开始说起。

2024-04-15

4510

图形驱动技术栈概览

opengl api 深度学习编程算法

1 说明背景1.1 近来想法1.2 几个概念2 全局视角2.1 应用场景(了解)2.2 大概原理(了解)2.3 技术图景(了解)3 用户空间3.1 OpenGL 和 libGL(了解)3.2 libXCB 和 XServer(了解)3.3 libGL 和 Mesa(了解)4 用户和内核4.1 软件构图(了解)4.2 驱动视角(待掌握)4.3 源码视角(了解)5 内核和固件5.1 工作流程(掌握)5.2 交互途径(掌握)5.3 寄存器组设计(掌握)5.4 通信协议设计(掌握)6 固件和硬件6.1 固件软件设计(掌握)6.2 软件硬件接口(了解)6.3 体系结构简介(了解)6.4 图形流水线(了解)7 参考资料

2023-01-05

2.2K0

入门篇-GPU知识概览

深度学习编程算法 https arm 网络安全

做了一段时间的 GPU 固件和驱动开发，加上平时学习的一些零散的知识，最近打算整理，将这些做成一页文章。主线任务：梳理 GPU 的知识大纲 =====> 对标 GPU入门工程师支线任务：了解 GPU 硬件工作机理支线任务：掌握 GPU 固件工作机理 =====> 对标 GPU固件工程师支线任务：了解 GPU 驱动和 GPU 固件的交互接口支线任务：掌握 GPU 驱动工作机理 =====> 对标 GPU驱动工程师支线任务：了解 GPU 驱动和 LIBDRM 的交互接口

2023-01-05

1.9K0

一个打通软硬件的极好资源

linux 神经网络深度学习人工智能

大家好，我是 Peter！今天宣布一个好消息。很荣幸和大佬们一起合写了本书《计算机系统开发与优化实战》，最近就要上市了。本书首先介绍通用处理器的架构，以及汇编和编译的技术；然后讲解 Linux 内存管理、 Linux 进程管理，以及 GDB、 trace、 eBPF、 SystemTap 等 Linux 系统开发工具；接着通过视频编解码主流技术和 NVIDIA 计算平台 CUDA 等讨论人工智能技术在音视频领域与自然语言处理领域的应用；最后讲解标准计算平台 OpenCL 的原理、开源硬件 soDLA、

2022-08-26

6753

一文读懂深度学习：从神经元到BERT

机器学习深度学习人工智能神经网络

一个神经网络结构通常包含输入层、隐藏层、输出层。输入层是我们的 features (特征)，输出层是我们的预测 (prediction)。神经网络的目的是拟合一个函数 f*：features -> prediction。在训练期间，通过减小 prediction 和实际 label 的差异的这种方式，来更改网络参数，使当前的网络能逼近于理想的函数 f*。

2019-05-28

1K0

嵌入式AI —— 6. 为糖葫芦加糖，浅谈深度学习中的数据增广

神经网络深度学习机器学习人工智能

又和大家见面了，上次本程序猿介绍了CMSIS-NN，一晃过去了两个月。。。。闲话不多说，开始正题，小编这次带来的是，进行深度学习部署时的一段比较有用的小插曲：浅谈深度学习中的数据增广。

2019-05-22

6590

物联网产业链全景图！

物联网工业物联神经网络深度学习人工智能

2018年产业分布内容中出现了一些新的子类别，这也反映了物联网领域的新趋势。包括：语音平台、海洋车辆、垂直农业和边缘计算。同时，也体现出物联网生态系统的各个部分并没有以相同的速度发展，物联网涵盖了几个行业而不是一个行业。

2019-05-17

2.7K0

推荐系统技术连载（1）

推荐系统编程算法神经网络深度学习人工智能

在这个系列文章中，我将分享掌握推荐系统的经验，以及围绕推荐系统从低级模型到高级模型的实现。

2019-05-15

6540

解密AI芯片的加速原理

硬件开发文件存储存储深度学习

网上对AI芯片的剖析实在太少，这里对一些论文和大佬的研究做一个总结，希望对读者有所帮助。

2019-05-14

8080

i.MX RT助您跨界AI ——5. 从穿糖葫芦到织深度神经网络

神经网络深度学习机器学习人工智能

CMSIS-NN作为在i.MX RT上运行深度神经网络的关键幕后英雄，在上期中终于闪亮登场，并且在i.MX RT强大算力的支持下，分类10样物体只是小试牛刀——每秒能识别多达50次！

2019-05-13

6310

谷歌携手恩智浦发布发布：端到端开源机器学习平台

tensorflow linux pytorch 机器学习深度学习

今天凌晨，谷歌一年一度的TensorFlow开发者大会在加州举行。明明应该是一场软件盛会，却被生生开出了硬件发布会的味道。

2019-05-08

5200

六张图看懂人工智能知识体系

神经网络深度学习人工智能

关于人工智能的前世今生、内涵意义，下图可以说是相当清楚全面了。人工智能是未来一大热点，如果你也看好这一趋势，不妨把下面六张图收藏起来慢慢看。

2019-05-08

9150

AI 芯片和传统芯片的区别

比如，自动驾驶需要识别道路行人红绿灯等状况，但是如果是当前的CPU去算，那么估计车翻到河里了还没发现前方是河，这是速度慢，时间就是生命。如果用GPU，的确速度要快得多，但是，功耗大，汽车的电池估计无法长时间支撑正常使用，而且，老黄家的GPU巨贵，经常单块上万，普通消费者也用不起，还经常缺货。另外，GPU因为不是专门针对AI算法开发的ASIC，所以，说到底，速度还没到极限，还有提升空间。而类似智能驾驶这样的领域，必须快！在手机终端，可以自行人脸识别、语音识别等AI应用，这个必须功耗低，所以GPU OUT！

2018-12-19

1.5K0

Peter教你谈情说AI | 01导读

机器学习 api 深度学习编程算法监督学习

机器学习已经慢慢演变成了根据已知模型 + 框架运用的开发，用不了多久机器学习就会变成像多媒体，图形开发等一样，只要根据已知的 api 开发相应的 AI app 就行了，但是不了解机器学习的根本原理很难优化模型计算，也就很难发挥出 AI 专有场景的性能。

2018-10-24

4130

面向嵌入式 AI 芯片上视觉任务的神经网络设计

嵌入式神经网络深度学习无人驾驶编程算法

随着这几年神经网络和硬件（GPU）的迅猛发展，深度学习在包括互联网，金融，驾驶，安防等很多行业都得到了广泛的应用。然而在实际部署的时候，许多场景例如无人驾驶，安防等对设备在功耗，成本，散热性等方面都有额外的限制，导致了无法大规模应用深度学习解决方案。

2018-10-24

1.2K0

解密AI芯片的加速原理

自动驾驶物联网无人驾驶存储深度学习

网上对AI芯片的剖析实在太少，这里对一些论文和大佬的研究做一个总结，希望对读者有所帮助。

2018-09-25

4.2K0

解读AI芯片麒麟980如何让手机更智能

人脸识别深度学习嵌入式图像识别游戏

8月31日，华为发布了新一代顶级人工智能手机芯片——麒麟980，成为全球首款采用7nm制程工艺的手机芯片。麒麟980能做到人脸识别、物体识别、物体检测、图像分割、智能翻译等，实现AI识别质的飞跃。

2018-09-25

1.4K0

【视频教学】如何加速深度学习架构

深度学习 tensorflow pytorch

有些人会觉得现在市场上有很多深度学习引擎的框架，比如tensorflow, pytorch, caffe等，为什么还需要加速呢，很简单，虽然深度学习的技术发展火热，也有很多大牛，但是深度学习框架在技术上目前并没有收敛。这种事就像大数据分析hadoop一样，之前并没有成熟框架来处理分布式数据，经过很多年沉淀，现在hadoop已经成工业标准，后来内存的计算用spark。深度学习框架也是一样，由于深度学习算法还没有完全成熟以及与传统硬件计算力的不同（对新的芯片计算能力有需求），所以深度学习框架并没有得到真正的收敛。下面我们看一下袁进辉老师对深度学习架构的优化有什么办法。

2018-07-26

9170

如何加速深度学习？GPU、FPGA还是专用芯片

深度学习 fpga 人工智能神经网络

计算机发展到今天，已经大大改变了我们的生活，我们已经进入了智能化的时代。但要是想实现影视作品中那样充分互动的人工智能与人机互动系统，就不得不提到深度学习。

2018-07-26

5680

极简入门 | 无人驾驶汽车系统基本框架梳理

无人驾驶深度学习

作者简介：申泽邦（Adam Shan），兰州大学在读硕士研究生，主攻无人驾驶，深度学习；兰大未来计算研究院无人车团队骨干，在改自己的无人车，参加过很多无人车Hackathon，喜欢极限编程。

2018-07-26

1.9K0

点击加载更多

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态