首页
学习
活动
专区
工具
TVP
发布

GPUS开发者

专注NVIDIA Jetson产品开发。
专栏作者
1072
文章
1701261
阅读量
206
订阅数
CUDA优化冷知识23|如何执行配置优化以及对性能调优的影响
这一系列文章面向CUDA开发者来解读《CUDA C Best Practices Guide》 (CUDA C最佳实践指南) CUDA优化冷知识22|测量Occupancy的三种方式 我们今天主要进行<CUDA Best Practices Guide>的章节10的剩余内容https://docs.nvidia.com/cuda/cuda-c-best-practices-guide/index.html#occupancy, 也就是接上一篇的occupancy后面,继续说说寄存器的延迟掩盖,blocks
GPUS Lady
2022-08-31
8760
CUDA优化冷知识22|测量Occupancy的三种方式
这一系列文章面向CUDA开发者来解读《CUDA C Best Practices Guide》 (CUDA C最佳实践指南) CUDA优化冷知识21|occupancy越高越好么? CUDA优化冷知识20|不改变代码本身如何提升性能? 一般的来说, occupancy往往有个折中点, 过高了或者过低了性能都不好. (就如同你干得过少, 或者干得过累都不好一样). 好了, 我们有了occupancy的概念, 知道了无需一味的去追逐occupancy, 就已经是一个很大的胜利了. 我们下面将具体看一下, 如
GPUS Lady
2022-08-29
4350
Jetson NANO机器人利用预训练模型探索人机交互
俗话说“模仿是最真诚的恭维”。好吧,在波兰开发人员 Tomasz Tomanek 的机器人项目中,模仿是他的机器人 Mariola 的目标。  Tomanek 开发了一个时髦的小机器人,它使用预训练的机器学习模型来实现人机交互。该机器人的主控制器是Jetson Nano 2GB。  PoseNet 模型的使用使 Mariola能够识别人的姿势和动作,然后使用这些模型使机器人模仿或复制这些人类动作。正如 Tomanek 所说,“使用 Jetson Nano 可以非常简单直接地实现这一目标。”  如您所见,Ma
GPUS Lady
2022-07-12
6320
对计算能力9.0+GPU卡特性的探索
我们今天的主要内容将不谈论H100(作为一个卡)本身具有的特性,像是功耗,频率范围,SP数量, 访存带宽这些"商品指标",而是想更多集中于这一代卡(计算能力9.0+)的可能的通用特性。这样今天的讨论可能对本系列的卡(包括还未出的家用版)都有用,而不至于变成针对一款谁都买不起的空中楼阁的讨论。 对具体卡的指标感兴趣的人可以自行看到时候的广告。 在Hopper白皮书里,有这样一个图: 这一带的卡的SM里面,依然是4个Schedulers吗?或者说,这一代卡的SM,拥有什么样的变化?这个whitepaper没
GPUS Lady
2022-04-02
3260
給盲人一双眼睛:用Jetson NANO做一个盲人导航器
一个老外开发者做了一个开源项目:Deepway。这个项目是用Jetson NANO开发套件給盲人做一个导航器。他不是通过声音来給盲人指示,而是别出心裁地通过触觉給盲人传递路况信息。
GPUS Lady
2021-04-14
1K0
CUDA优化冷知识20|不改变代码本身如何提升性能?
这一系列文章面向CUDA开发者来解读《CUDA C Best Practices Guide》 (CUDA C最佳实践指南)
GPUS Lady
2021-03-12
3890
CUDA优化的冷知识19|constant和寄存器
https://docs.nvidia.com/cuda/cuda-c-best-practices-guide/index.html 来阅读原文。
GPUS Lady
2021-02-05
5500
CUDA优化的冷知识14|local memory你可能不知道的好处
https://docs.nvidia.com/cuda/cuda-c-best-practices-guide/index.html 来阅读原文。
GPUS Lady
2021-02-05
1.2K0
CUDA优化的冷知识13 |从Global memory到Shared memory
上一篇里我们说到目前我们能买到的新卡(例如RTX3070), 已经支持直接从global memory读取到shared memory了. 这是一个极好的特性. 是从友商AMD那里学来的特性。
GPUS Lady
2021-01-20
1.3K0
多么孤独的灵魂,才能用Jetson NANO做个象棋机器人
本文来自一位Jetson开发者供稿。文章里,他从项目发起,到项目中遇到的挑战和瓶颈的点点滴滴,都非常详细。这个项目Lady我也一直关注着,当他第一时间把运行的DEMO看的时候,我也是由衷地感到高兴,迫不及待让他写下来分享给大家!
GPUS Lady
2020-07-01
2.7K1
NVIDIA论坛常见Jetson问题汇总(2)
(网址:https://docs.nvidia.com/jetson/archives/l4t-archived/l4t-3231/index.html#page/Tegra%2520Linux%2520Driver%2520Package%2520Development%2520Guide%2Fjetson_eeprom_layout.html ),
GPUS Lady
2020-06-01
2.6K0
用Jetson NANO做个机器狗?
注意是“准备”阶段....Wilk表示:This Project is heavily work in progress and may change every day. It is NOT a working or even finished Project you might want to use.(也就是说,很有可能这个项目可能做着做着就失败了....)
GPUS Lady
2019-07-16
2.2K0
看Jetson NANO如何变成“蜘蛛侠”
自从NVIDIA发布了开源智能小车JetBot项目后,各路创客开始脑洞大开,比如这个:
GPUS Lady
2019-05-14
1.4K0
DAY32:阅读local Memory
我们正带领大家开始阅读英文的《CUDA C Programming Guide》,今天是第32天,我们正在讲解性能,希望在接下来的68天里,您可以学习到原汁原味的CUDA,同时能养成英文阅读的习惯。 本文共计489字,阅读时间20分钟 Two-Dimensional Arrays A common global memory access pattern is when each thread of index (tx,ty) uses the following address to access
GPUS Lady
2018-06-25
5540
DAY28:阅读如何计算Occupancy
我们正带领大家开始阅读英文的《CUDA C Programming Guide》,今天是第28天,我们正在讲解性能,希望在接下来的72天里,您可以学习到原汁原味的CUDA,同时能养成英文阅读的习惯。 本文共计232字,阅读时间15分钟 注意:最近涉及到的基础概念很多,所以我们备注的内容也非常详细,希望各位学员认真阅读 5.2.3.1. Occupancy Calculator Several API functions exist to assist programmers in choosing
GPUS Lady
2018-06-25
1.4K0
DAY19:阅读纹理内存之Texture Gather
3.2.11.1.5. Cubemap Textures A cubemap texture is a special type of two-dimensional layered texture that has six layers representing the faces of a cube: · The width of a layer is equal to its height. · The cubemap is addressed using three texture coord
GPUS Lady
2018-06-22
3.1K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档