首页
学习
活动
专区
工具
TVP
发布

GPUS开发者

专注NVIDIA Jetson产品开发。
专栏作者
1076
文章
1709566
阅读量
206
订阅数
​为什么在Jetson Orin上使用DLA是必要的?
NVIDIA的DLA硬件是专门用于深度学习操作的固定功能加速器引擎。它旨在对卷积神经网络进行全硬件加速,支持各种层,如卷积、反卷积、全连接、激活、池化、批量归一化等。NVIDIA的Jetson Orin SoC最多支持2个第二代DLA(第二代DLA在功耗效率方面表现最佳),而Xavier SoC最多支持2个第一代DLA。
GPUS Lady
2023-09-07
5150
利用TensorRT的视觉辅助设备为盲人和视力受损者提供帮助
嘿!你知道吗,盲人和视力受损者经常会遇到一些挑战,这些挑战使他们难以独立生活和参与社会。但是,由于机器学习的奇妙之处,我们现在有一些非常酷的辅助技术,可以帮助他们。例如,这位小哥,开发了一种设备,利用图像字幕和文本转语音技术,为那些最需要帮助的人提供帮助。
GPUS Lady
2023-05-30
3640
更新太快,CUDA 12.0工具包正式发布啦
一下子,CUDA 12.0就出来啦!NVIDIA表示:此版本是多年来的第一个主要版本,它侧重于新的编程模型和通过新硬件功能加速 CUDA 应用程序。
GPUS Lady
2023-01-04
2.2K0
CUDA优化冷知识24|函数和指令使用的选择和优化
这一系列文章面向CUDA开发者来解读《CUDA C Best Practices Guide》 (CUDA C最佳实践指南)。
GPUS Lady
2023-01-04
8380
NVIDIA Jetson 上可以兼容多个CUDA版本了?
国庆节期间,NVIDIA在其开发者Blog上发布了一篇文章: 也就是说:开发者从CUDA11.8开始,可以在Jetson上像PC上那样的安装新版本的CUDA开发包了! 这确实是一件好事情,为什么这么说呢? 原本Jetson上有两种系统,一种是NV打包好的Jetpack,普通开发者们已经很熟悉了。另外一种是用的NV的BSP包,第三方厂商自己制作的系统(在NV的一堆组件, 包括内核源代码的基础上)自己构建的。 但是无论这两种情况,里面都自带有一个固定版本的CUDA开发包/运行时/驱动,例如11.x或者10.
GPUS Lady
2022-10-11
1.3K0
NVIDIA Tesla P4亲测:货真价实的高科技与狠活儿(1)
本文受作者授权,转载自《GPU 篇一:当年王谢堂前燕,飞入寻常百姓家》 (https://post.smzdm.com/p/aoowz2qn/) ---- 2016年9月13日,GTC China大会上,NVIDIA发布了Tesla P4 GPU。这是一块采用Pascal架构、2560个CUDA核心、8GB GDDR5显存、显存带宽192.0GB/S半高Data Center系列GPU。这款GPU为了深度学习推理而生,搭载了当时最先进特性的同时只有50/75W的功耗。当初售价高达一万多的P4 GPU,如今
GPUS Lady
2022-10-08
6.5K0
CUDA Toolkit 11.8 新功能揭晓
NVIDIA 发布了最新的 CUDA Toolkit 软件版本 11.8。此版本的重点是通过新的硬件功能增强编程模型和 CUDA 应用程序加速。 NVIDIA Hopper 和 Ada Lovelace 中特定于架构的新功能最初是通过库和框架增强功能公开的。NVIDIA Hopper 架构的完整编程模型增强功能将从 CUDA Toolkit 12 系列开始发布。 CUDA 11.8 有几个重要的特性。这篇文章提供了关键功能的概述。 支持NVIDIA Hopper 和 NVIDIA Ada 架构 CUDA 应
GPUS Lady
2022-10-08
1.7K0
AI如何协助牙科医生解决难以发现的牙齿问题
医疗保健正处于数字革命之中。患者已经熟悉电子记录保存以及数字 CT 和 MRI 扫描;有些人使用计算机视觉和人工智能 (AI) 来诊断肺癌和其他癌症。 尽管人工智能已经准备好给我们的生活带来新的、更直接的印象,但在日常牙科中,大多数人可能会第一次体验到计算机惊人的能力——它能够比人类更精确地查看和解释常规牙齿 X 射线报告。 西好莱坞初创公司Pearl为牙科图像提供人工智能以协助诊断。今年3月获得了 FDA 的批准,是首批获得牙科 AI 批准的公司之一。 该批准为其在美国各地的诊所使用铺平了道路。 “这确实
GPUS Lady
2022-09-20
3910
NVIDIA AI技术如何燃爆“美国达人秀”半决赛现场
在本周美国达人秀(目前是美国第二受欢迎的黄金时段电视节目)的半决赛中,有超过 600 万双眼睛注视着实时 AI 化身技术。 (美国达人秀评委们) 当三位歌手 — Daniel Emmet、Patrick Dailey 和 John Riesen走上舞台,所有观众都在期待,接下来将是一场如何振奋人心的表演 三位歌手开始唱起著名歌剧作品“Nessun Dorma”时候,身后的大屏幕上,三位歌手立刻变脸成为三位评委,从身形姿态及表情,几乎达到以假乱真的地步,毫无违和感。 让评委们大呼精彩,称为“该系列迄今
GPUS Lady
2022-09-20
7820
GTC2022精彩讲座预告|医学/医药/保健
我们整理了GTC2022精彩讲座预告,欢迎大家报名参加 01 用于生成化学和蛋白质的人工智能药物发现 [A41196] 大型语言模型显示出学习生化空间表示的希望。NVIDIA 将展示一个大型语言模型框架,用于构建、训练和部署基于转换器的大型蛋白质和生物分子神经架构,扩展之前在小分子生成化学模型方面所做的工作。 时间:Thursday, Sep 221:00 AM - 1:25 AM CST 02 脑外科新领域 [A41130] 我们将讨论高级计算和数字孪生世界在改变外科专科,特别是神经外科方面的作用
GPUS Lady
2022-09-08
2550
GTC2022精彩讲座预告|智能视频分析及智能制造
我们整理了GTC2022精彩讲座预告,欢迎大家报名参加 01 通过智能空间获取基础设施的价值 [A41168] 智能空间的出现对包括人工智能、视频分析和边缘计算在内的下一代技术的需求产生了冲击波。智能空间背后的理念是确保社区和工人的安全,同时提高运营效率,释放现有基础设施的财务优势。这不再是未来的概念——借助强大的 AI 加速视频分析平台和端到端解决方案,智能空间就在今天。听听那些接受将物联网数据转化为有价值的解决方案的领导者。我们将分享在机场、城市、道路、体育场馆和运营技术中植入智能空间的示例。 时间
GPUS Lady
2022-09-07
3660
CUDA优化冷知识23|如何执行配置优化以及对性能调优的影响
这一系列文章面向CUDA开发者来解读《CUDA C Best Practices Guide》 (CUDA C最佳实践指南) CUDA优化冷知识22|测量Occupancy的三种方式 我们今天主要进行<CUDA Best Practices Guide>的章节10的剩余内容https://docs.nvidia.com/cuda/cuda-c-best-practices-guide/index.html#occupancy, 也就是接上一篇的occupancy后面,继续说说寄存器的延迟掩盖,blocks
GPUS Lady
2022-08-31
8910
CUDA优化冷知识22|测量Occupancy的三种方式
这一系列文章面向CUDA开发者来解读《CUDA C Best Practices Guide》 (CUDA C最佳实践指南) CUDA优化冷知识21|occupancy越高越好么? CUDA优化冷知识20|不改变代码本身如何提升性能? 一般的来说, occupancy往往有个折中点, 过高了或者过低了性能都不好. (就如同你干得过少, 或者干得过累都不好一样). 好了, 我们有了occupancy的概念, 知道了无需一味的去追逐occupancy, 就已经是一个很大的胜利了. 我们下面将具体看一下, 如
GPUS Lady
2022-08-29
4540
Seoul Robotics使用由 NVIDIA Jetson AGX Orin让非自动驾驶汽车自己停车
想象一下,驾驶一辆没有自动驾驶功能的汽车到商场、机场或停车场,然后使用应用程序让汽车自动停车。 软件公司 Seoul Robotics 正在使用 NVIDIA 技术来实现这一目标——将非自动驾驶汽车转变为自动驾驶汽车。 该公司总部位于韩国,最初的重点是改善停车等第一英里和最后一英里的物流。它的 5 级控制塔是一个由传感器和计算机组成的网状网络,放置在设施周围的基础设施上,例如建筑物或灯杆——而不是单独的汽车——以捕捉环境的畅通无阻的视图。 该系统使汽车能够通过将车辆引导至一切事物或所谓的 V2X 通信系统来
GPUS Lady
2022-08-26
3800
NVIDIA JetPack 5 生产版本发布
NVIDIA发布 JetPack 5系列第一个生产版本JetPack 5.0.2。该版本包括带有 Linux Kernel 5.10 的 Jetson Linux 35.1 BSP,为这些系统运行基于 Ubuntu 20.04 的系统。有很多新功能! NVIDIA官方介绍说:JetPack 5.0.2 生产版本取代了仅用于开发目的的 JetPack 5.0/5.0.1 开发者预览版。JetPack 5.0.2 是 Jetson AGX Orin 的第一个生产版本。JetPack 5.0.2 包括 带有 Li
GPUS Lady
2022-08-26
1.2K0
“云+边缘”的 IoT 解决方案,新手如何从零开始入行?
随着各行各业数字化转型的不断升级,以及物联网技术的迅速发展,实现以场景为中心的边缘到到云的解决方案,以应对行业特定的业务挑战已经成为越来越多行业企业的技术选择。 作为一个支持以不同方式集成应用程序,以满足托管、本地扩展、基于容器的现代化以及无服务等各种不同开发需要的云平台,Azure 上提供了十分完备的物联网解决方案,可以帮助我们实现从边缘到云的连接、分析和自动化。结合边缘设备,即可完成不同行业领域的“云+边缘”解决方案,从而推动数字化转型,满足我们实际的业务需要。 比如,有开发者利用NVIDIA边缘计算设
GPUS Lady
2022-08-26
6010
如何在 Fleet Command 上使用远程管理
生产边缘人工智能的一个关键考虑因素是管理员如何在部署后管理应用程序和系统的日常维护,有时称为第二天操作。远程管理是一项关键功能,使您能够轻松管理数十个甚至数千个远程站点。 远程管理对于边缘人工智能至关重要 将边缘人工智能概念验证( POC )大规模引入生产环境的过程要求您能够在分布式位置完全访问边缘系统和应用程序。 如果没有完整、无痛的访问,快速进行和扩展的能力会受到远程边缘站点手动故障排除所需时间的限制。由于安装和扩展新技术总是会出现不可预测的问题,因此该过程可能非常耗时和昂贵。 传统 VPN 连接缺乏安
GPUS Lady
2022-07-26
1.5K0
“暑”你当学霸|2022 CUDA线上训练营Day 2学员笔记分享
7月5日,2022 CUDA on Arm Platform线上训练营开始第二天的课程。 课程大纲: 1.     CUDA编程模型---CUDA存储单元的使用与错误检测(2.1+2.2实验课) Ÿ  设备初始化 Ÿ  GPU的存储单元 Ÿ  GPU存储单元的分配与释放 Ÿ  数据的传输 Ÿ  数据与线程之间的对应关系 Ÿ  CUDA应用程序运行时的错误检测 Ÿ  CUDA中的事件 Ÿ  利用事件进行计时 Ÿ  实验课内容:编写MatrixMul程序,体验线程和数据的对应关系 Ÿ  留课后作业 2. 
GPUS Lady
2022-07-06
5410
“暑”你当学霸|2022 CUDA线上训练营Day 1学员笔记分享
7月4日,2022 CUDA on Arm Platform线上训练营开始第一天的课程。 第一天的课程,NVIDIA开发者社区何琨老师重点讲解:  基于Arm的Jetson开发环境介绍,Arm Linux系统简介(1.1理论课+实验课) 介绍实验平台,介绍Linux编译的基本技巧,介绍基本的开发环境。实验课:Makefile 编写规范。 GPU架构及异构计算(1.2) Ÿ  介绍GPU架构以及异构计算的基本原理 Ÿ  介绍GPU硬件平台 Ÿ  介绍基于Arm的嵌入式平台GPU架构和编程模型之间的关系,介绍
GPUS Lady
2022-07-06
5310
【NVIDIA AGX Orin开发教程3】安装开发环境
【NVIDIA Jetson AGX Orin教程2】配置操作系统 【NVIDIA Jetson AGX Orin教程1】开发套件硬件介绍 上一篇文章已经为Orion开发套件配置好Ubuntu 20.04 L4T(Linux for Tegra)桌面级操作系统,但是如下列所需要的开发资源并未安装: - CUDA工具包(toolkits); -CUDNN神经网络加速库: -TensorRT推理加速引擎; -OpenCV计算机视觉库; -VPI视觉开发界面; -DeepStream智能分析工具; 过去的AG
GPUS Lady
2022-06-29
2K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档