首页
学习
活动
专区
圈层
工具
发布

#pytorch

PyTorch是一个基于Torch的 开源机器学习库,用于自然语言处理等应用程序。

Flink与AI的完美融合:深入解析Flink ML库及TensorFlow/PyTorch联动

用户6320865

随着数字化转型的深入,数据已成为企业最核心的资产之一。而如何高效、实时地处理海量数据,并从中挖掘出智能洞察,成为技术领域的关键挑战。在这一背景下,Apache ...

6710

深度学习框架对比研究:TensorFlow与PyTorch的综合分析

一点人工一点智能

导读:深度学习作为人工智能的核心技术之一,已经在多个领域取得了突破性进展。TensorFlow和PyTorch作为当前最主流的深度学习框架,各自具有独特的设计理...

23610

PyTorch 分布式训练底层原理与 DDP 实战指南

deephub

深度学习模型参数量和训练数据集的爆炸式增长,以 Llama 3.1 为例:4050 亿参数、15.6 万亿 token 的训练量,如果仅靠单 GPU可能需要数百...

18910

从 0 搭建 LLM 不再难!这个 PyTorch 项目帮你吃透大模型底层逻辑

fangpin

如果你曾想深入理解大语言模型(LLM)的 “五脏六腑”,却被框架封装的黑盒接口、复杂的源码结构劝退;如果你希望亲手实现 Transformer 的每一个组件,而...

15600

144_推理时延优化:Profiling与瓶颈分析 - 使用PyTorch Profiler诊断推理延迟,优化矩阵运算的独特瓶颈

安全风信子

在2025年的大模型时代,推理时延优化已经成为部署LLM服务的关键挑战之一。随着模型规模的不断扩大(从数亿参数到数千亿甚至万亿参数),即使在最先进的硬件上,推理...

16410

66_框架选择:PyTorch vs TensorFlow

安全风信子

在2025年的大语言模型(LLM)开发领域,框架选择已成为项目成功的关键决定因素。随着模型规模的不断扩大和应用场景的日益复杂,选择一个既适合研究探索又能支持高效...

26210

130_知识蒸馏技术:温度参数与损失函数设计 - 教师-学生模型的优化策略与PyTorch实现

安全风信子

随着大型语言模型(LLM)的规模不断增长,部署这些模型面临着巨大的计算和资源挑战。以DeepSeek-R1为例,其671B参数的规模即使经过INT4量化后,仍需...

14410

从零实现3D Gaussian Splatting:完整渲染流程的PyTorch代码详解

deephub

3D Gaussian Splatting(3DGS)现在几乎成了3D视觉领域的标配技术。NVIDIA把它整合进COSMOS,Meta的新款AR眼镜可以直接在设...

29710

Transformer自回归关键技术:掩码注意力原理与PyTorch完整实现

deephub

掩码注意力(Causal Attention)是生成式模型的核心技术,它传统自注意力机制有根本的不同,掩码注意力限制模型只能关注当前位置之前的tokens,确保...

17710

Neural ODE原理与PyTorch实现:深度学习模型的自适应深度调节

deephub

对于神经网络来说,我们已经习惯了层状网络的思维:数据进来,经过第一层,然后第二层,第三层,最后输出结果。这个过程很像流水线,每一步都是离散的。

34710

近端策略优化算法PPO的核心概念和PyTorch实现详解

deephub

近端策略优化(Proximal Policy Optimization, PPO)作为强化学习领域的重要算法,在众多实际应用中展现出卓越的性能。本文将详细介绍P...

45320

即插即用涨点系列 (六):AAAI 2025,PConv & SD Loss 详解!融合风车卷积与动态损失的涨点新范式。

AITricks

论文原文 (Paper):https://arxiv.org/pdf/2412.16986 官方代码 (Code):https://github.com/JN-...

18110

23_Transformer架构详解:从原理到PyTorch实现

安全风信子

Transformer架构自2017年Google发表的论文《Attention Is All You Need》中提出以来,彻底改变了深度学习特别是自然语言处...

1.4K10

如何解决Python pip的版本匹配错误:ERROR: Could not find a version that satisfies the require

猫头虎

如何解决Python pip的版本匹配错误:ERROR: Could not find a version that satisfies the require...

2.7K10

PyTorch分布式训练与混合精度技术详解

用户11764306

单GPU训练结果:总耗时69.03秒,训练1个epoch耗时13.08秒,测试准确率27%。

14310

PyTorch编译缓存加速模型推理技术解析

用户11764306

某机构现已缓存torch.compile编译产物,以缩短使用PyTorch框架模型的启动时间。

10410

【DGL系列】编译dgl源码时指定多个sm架构

小锋学长生活大爆炸

DGL 的 cmake/modules/CUDA.cmake 里写死了一个选择逻辑:

8800

【教程】DataLoader中各个参数的解释

小锋学长生活大爆炸

数据来源对象,告诉 DataLoader 去哪里拿样本。pytorch提供的torch.utils.data.Dataset类是一个抽象基类,供用户继承,编写自...

16810
领券