首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

#pytorch

PyTorch是一个基于Torch的 开源机器学习库,用于自然语言处理等应用程序。

CUDA Python的「黄金三角」:PyTorch+RAPIDS+CuPy如何重构科学计算

GPUS Lady

当我们在讨论这个主题时——大家可以看到CUDA Python生态中层层叠叠的各个组件:从顶层的框架与SDK,一直延伸到需要直接操作硬件的CUDA内核开发层。实际...

1400

【教程】PyTorch多机多卡分布式训练的参数说明 | 附通用启动脚本

小锋学长生活大爆炸

🔹 2. --nproc_per_node(Processes Per Node)

5300

Python迁移学习:用Torchvision、Pytorch进行交通标志图像分类|附代码数据

拓端

本研究旨在探索如何应用迁移学习技术对交通标志图像进行分类。通过构建适用于Torchvision的图像数据集,并利用预训练模型进行微调,我们实现了对原始像素的交通...

8010

vLLM源码学习

aaronwjzhao

谦合益邦云 | AI框架工程师 (已认证)

vLLM从v0.6.0开始,为了解决功能碎片化、模块之间耦合严重、技术债等问题,并行开发了v1。v1不仅解决了上述问题,还提升了推理性能,让CPU调度开销更小。...

9610

Nvidia Nemotron核心技术揭秘

aaronwjzhao

谦合益邦云 | AI框架工程师 (已认证)

NVIDIA 正式发布了 Llama Nemotron 模型家族,这是一组专为推理与智能体任务优化的模型。它们基于开源的 Meta Llama 模型,结合深度蒸...

14711

使用 C# 入门深度学习:Pytorch 基础

痴者工良

本文内容介绍 Pytorcn 的基础 API,主要是数组的创建方式和运算方式,由于相关内容跟 Numpy 比较相似,并且 Numpy 类型可以转 torch.T...

8410

一文搞懂归一化(PyTorch)

福大大架构师每日一题

归一化技术通过调整输入数据的尺度,使数据分布范围趋于一致,从而提升模型的训练效率和泛化性能。常见的归一化方法包括批量归一化(BN)、层归一化(LN)、实例归一化...

14420

【深入解析Inception网络:从V1到V3的理论演进与对比,包含pytorch实现Inception模块的代码】

机器学习司猫白

在深度学习领域,卷积神经网络(CNN)通过堆叠卷积层提取图像特征,但传统架构存在两个核心问题:

20610

如何用更少的内存训练你的PyTorch模型?深度学习GPU内存优化策略总结

CoovallyAIHub

在训练大规模深度学习模型时,GPU 内存往往成为关键瓶颈,尤其是面对大型语言模型(LLM)和视觉 Transformer 等现代架构时。由于大多数研究者和开发者...

21610

DeepSeek R1专家并行

aaronwjzhao

谦合益邦云 | AI框架工程师 (已认证)

混合专家相当于Transformer结构中的FFN,R1每一层网络有1个共享专家(shared expert)、256个路由专家(routed expert),...

44621

全球首个AI CUDA工程师来了!将PyTorch原生实现提速10-100倍

机器之心

我们的大脑只用了 20 瓦的能量就能完成复杂思考,而现代 AI 系统却需要成排的高功率 GPU 和惊人的电力消耗。这种差距如何缩小?

9910

RTX4060+ubuntu22.04.3+cuda12.4.1+Miniconda3+pytorch2.6 安装验证

tankaro

这里特别说明一下,pytorch的cudnn与C语言版本的cudnn版本没有关系,pytorch使用自己的cudnn库。(从实际操作中得出相关结论)

11712

DeepSeek与PyTorch携手:开启工业缺陷检测新时代(4/18)

正在走向自律

摘要:本文介绍了如何结合DeepSeek和PyTorch实现工业缺陷检测的全流程,重点聚焦于小样本数据增强、异常检测模型微调以及产线级部署与边缘计算优化。在小样...

1.3K10

图机器学习调研洞察:PyG与DGL

Splendid

图神经网络(Graph Neural Networks,GNN)是人工智能领域最火热的课题之一,近年来,越来越多的研究机构和企业投入大量精力研究图神经网络,推出...

10310

解密卷积神经网络

VyrnSynx

,尤其在计算机视觉领域表现突出。其核心设计灵感来源于生物视觉系统的层次化信息处理机制。

12910

解密卷积神经网络

VyrnSynx

,尤其在计算机视觉领域表现突出。其核心设计灵感来源于生物视觉系统的层次化信息处理机制。

12910

【PyTorch入门】使用PyTorch构建一个简单的图像分类模型

机器学习司猫白

18610

【PyTorch入门】 PyTorch不同优化器的比较

机器学习司猫白

在 PyTorch 中,torch.optim 提供了多种优化器用于神经网络训练。每种优化器背后有不同的更新规则和机制,旨在适应不同的训练需求。以下是五种常见优...

21910

【PyTorch入门】 常用统计函数【二】

机器学习司猫白

torch.prod()用于计算张量 a 中所有元素的乘积。返回一个张量,表示输入张量所有元素的累积乘积。如果输入是一个多维张量,则默认计算所有元素的乘积。

12110
领券