首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

充分利用NVIDIA Nsight开发工具发挥Jetson Orin的最大潜力

Orin 架构以行业领先的性能为下一代边缘 AI 系统提供动力,该系统由 12 个 ARM Cortex A78 内核和 2 MB 三级缓存, NVIDIA Ampere 架构 GPU 提供 16 个流式多处理器或每个 SM 128 个 CUDA 内核的 SM,Orin 还具有用于工作负载的专用加速器,用于视频缩放、图像处理,还有光流加速器即OFA、2 个 JPEG 解码器、2 个深度学习加速器单元或支持张量 RT 的 DLA,用于深度学习操作,还有可编程视频加速器(PVA)和视频编解码引擎。Orin 使用高带宽 LPDDR5 内存,并具有一组丰富的 IO 连接选项,包括 22 个 PCI Express 通道、4 个千兆以太网连接器和 16 个 CSI 通道。凭借所有这些强大的功能,Jetson Orin 完全有能力应对边缘 AI 场景。

04

vivo AI 计算平台的K8s填坑指南

在 2018 年底,vivo AI 研究院为了解决统一的高性能训练环境、大规模的分布式训练、计算资源的高效利用调度等痛点,着手建设 AI 计算平台。白驹过隙,将近两年时间过去了,平台的建设和落地取得了很大的进展,成为了 vivo AI 领域的核心基础平台。平台现在已经有超过 500 多个用户,来自人工智能、影像、互联网等多个部门。平台的容器集群有 1000 多台服务器,拥有 50000 多 CPU 核,1000 多张 GPU 卡,GPU 算力将近 100 PFLOPS。每天运行 1000 多个的算法训练任务,部署了 100 多个的模型推理服务和 AI 应用。这些训练任务和应用都是以容器的方式运行。平台从当初服务深度学习训练为主,到现在演进成包含 VTraining、VServing、VContainer 三大模块,对外提供模型训练、模型推理和容器化的能力。

01
领券