runtimeerror: element 0 of tensors does not require grad and does not have a - 腾讯云开发者社区

您找到你想要的搜索结果了吗？

是的

没有找到

torch.Tensor

[源码分析] Facebook如何训练超大模型--- (5)

我们在前文介绍过，微软 ZeRO 可以对一个万亿参数模型可以使用 8 路模型并行、64 路管道并行和 8 路数据并行在 4,096 个 NVIDIA A100 GPU 上进行扩展。而FSDP（Fully Sharded Data Parallel）是Facebook 深度借鉴微软ZeRO之后提出的PyTorch DDP升级版本，可以认为是对标微软 ZeRO，其本质是 parameter sharding。Parameter sharding 就是把模型参数等切分到各个GPU之上。我们会以 Google，微软和 Facebook 的论文，博客以及代码来进行学习分析。

PyTorch 4.0版本迁移指南

欢迎阅读PyTorch 0.4.0的迁移指南。在此版本中，我们引入了许多振奋人心的新功能和重要的bug修复，旨在为用户提供更好，更清晰的接口。在这个指南中，我们将介绍从以前版本迁移现有代码时最重要的变化：

Automatic differentiation package - torch.autograd

torch.autograd提供实现任意标量值函数的自动微分的类和函数。它只需要对现有代码进行最小的更改—您只需要声明张量s，对于该张量，应该使用requires_grad=True关键字计算梯度。

[源码解析] PyTorch 分布式(12) ----- DistributedDataParallel 之前向传播

前文已经对Reducer如何构建和几个重要场景做了介绍，本文就来分析 Reducer 如何实现前向传播。

RuntimeError: Trying to backward through the graph a second time...

RuntimeError: Trying to backward through the graph a second time, but the buffers have already been freed. Specify retain_graph=True when calling backward the first time.

[源码解析] Pytorch 如何实现后向传播 (1)---- 调用引擎

本系列将通过大概十篇左右文章来分析 PyTorch 的自动微分功能如何实现。本文是后向传播的第一篇，介绍调用流程：如何从 Python 代码进入到 C++ autograd 引擎。

Deep Learning with PyTorch > A Gentle Introduction to torch.autograd

torch.autograd is PyTorch’s automatic differentiation engine that powers neural network training. In this section, you will get a conceptual understanding of how autograd helps a neural network train.

[源码解析] PyTorch 流水线并行实现 (2)--如何划分模型

上一篇文章我们介绍了 PyTorch 流水线并行的基本知识，本文我们介绍其自动平衡机制和模型分割。

PyTorch 的这些更新，你都知道吗？

翻译 | 林椿眄出品 | AI 科技大本营（公众号ID：rgznai100）一些你可能不知道的优质公众号！这次版本的主要更新一些性能的优化，包括权衡内存计算，提供 Windows 支持，24个基础分布，变量及数据类型，零维张量，张量变量合并，支持 CuDNN 7.1，加快分布式计算等，并修复部分重要 bug等。 ▌目录主要变化张量/变量合并零维张量数据类型版本迁移指南新特性张量高级的索引功能快速傅里叶变换神经网络权衡内存计算瓶颈—用于识别代码热点的工具 torch中的分布 2

Typical Loss and its gradient

常用的norm有L1-norm，L2-norm即L1，L2范数。那么问题来了，什么是范数？

PyTorch 重磅更新，不只是支持 Windows

这次版本的主要更新一些性能的优化，包括权衡内存计算，提供 Windows 支持，24个基础分布，变量及数据类型，零维张量，张量变量合并，支持 CuDNN 7.1，加快分布式计算等，并修复部分重要 bug等。

tf.GradientTape

Record operations for automatic differentiation.

PyTorch入门笔记-拼接cat函数

合并是指将多个张量在某个维度上合并成一个张量。张量的合并可以使用拼接（Concatenate）和堆叠（Stack）操作实现，其中拼接操作不会产生新的维度，仅在现有维度上合并，而堆叠会创建新的维度。选择使用拼接还是堆叠操作来合并张量，取决于具体的场景是否需要创建新维度。

PyTorch入门笔记-堆叠stack函数

torch.cat(tensors, dim = 0) 函数拼接操作是在现有维度上合并数据，并不会创建新的维度。如果在合并数据时，希望创建一个新的维度，则需要使用 torch.stack 操作。

[源码解析] PyTorch 分布式(11) ----- DistributedDataParallel 之构建Reducer和Join操作

因为前文已经围绕Reducer相关的各种成员变量做了相关分析，所以本文开始做动态逻辑分析，目的是：把前面几篇文章串联起来，为后面分析前向传播和反向传播设定基础。

[源码解析] PyTorch 分布式(9) ----- DistributedDataParallel 之初始化

前文我们对DDP的一些支撑模块已经做了介绍，这为本文做了必要的铺垫，本文就开始介绍Python世界代码和C++世界的初始化部分。下文介绍C++世界的核心代码。

[源码解析] PyTorch 分布式(2) ----- DataParallel(上)

DataParallel 从流程上来看，是通过将整个小批次（minibatch）数据加载到主线程上，然后将子小批次（ub-minibatches）数据分散到整个GPU网络中来工作。

pytorch .detach() .detach_() 和 .data用于切断反向传播的实现

这篇文章主要介绍了pytorch .detach() .detach_() 和 .data用于切断反向传播的实现。

torch、(三) Random sampling

Sets the seed for generating random numbers to a non-deterministic random number. Returns a 64 bit number used to seed the RNG.

YOLOv8优化策略：Adam该换了！斯坦福最新Sophia优化器，比Adam快2倍 | 2023.5月斯坦福最新成果

斯坦福2023.5月发表的最新研究成果，他们提出了「一种叫Sophia的优化器，相比Adam，它在LLM上能够快2倍，可以大幅降低训练成本」。

torch、(一) Tensor

The torch package contains data structures for multi-dimensional tensors and mathematical operations over these are defined. Additionally, it provides many utilities for efficient serializing of Tensors and arbitrary types, and other useful utilities.It has a CUDA counterpart, that enables you to run your tensor computations on an NVIDIA GPU with compute capability >= 3.0.

第9节：libtorch开发深度学习算法中的autograde

文章目录 CmakeLists.txt C++ CmakeLists.txt cmake_minimum_required (VERSION 3.8) project(SOLDIER) set(Torch_DIR "/libtorch/share/cmake/Torch") set(PYTHON_EXECUTABLE "/usr/bin/python3") find_package(Torch REQUIRED) find_package(OpenCV REQUIRED) set(CMAKE_CXX

【深度学习】翻译：60分钟入门PyTorch（二）——Autograd自动求导

原文翻译自：Deep Learning with PyTorch: A 60 Minute Blitz

[源码解析] PyTorch 分布式(13) ----- DistributedDataParallel 之反向传播

上文我们已经对Reduer的前向传播进行了分析，本文就接着来看看如何进行反向传播。

[源码解析] 深度学习流水线并行 GPipe(3) ----重计算

GPipe是一个基于 Lingvo （Lingvo 是 Google 基于 TensorFlow 二次开发的重点针对序列模型的框架）开发的，支持超大规模模型的神经网络训练并行库，本文介绍其重计算功能，同时可以和其他实现一起印证。

3个Tricks帮你提升你Debug Pytorch的效率

每一个深度学习项目都是不同的。不管你有多少经验，你总会遇到新的挑战和意想不到的行为。你在项目中运用的技巧和思维方式将决定你多快发现并解决这些阻碍成功的障碍。

3个Tricks帮你提升你Debug Pytorch的效率

PyTorch 源码解读之 torch.autograd

来源 | https://zhuanlan.zhihu.com/p/321449610

【他山之石】适合PyTorch小白的官网教程：Learning PyTorch With Examples

PyTorch(总)---PyTorch遇到令人迷人的BUG与记录

BUG1 在使用NLLLoss()激活函数时，NLLLoss用来做n类分类的，一般最后一层网络为LogSoftmax，如果其他的则需要使用CrossEntropyLoss。其使用格式为：loss(m(

PyTorch 源码解读之 torch.autograd：梯度计算详解

原文链接：https://zhuanlan.zhihu.com/p/321449610

PyTorch 的 10 条内部用法

欢迎阅读这份有关 PyTorch 原理的简明指南[1]。无论您是初学者还是有一定经验，了解这些原则都可以让您的旅程更加顺利。让我们开始吧！

深度学习框架中的「张量」不好用？也许我们需要重新定义Tensor了

尽管张量在深度学习的世界中无处不在，但它是有破绽的。它催生出了一些坏习惯，比如公开专用维度、基于绝对位置进行广播，以及在文档中保存类型信息。这篇文章介绍了一种具有命名维度的替代方法 named tensor，并对其进行了概念验证。这一改变消除了对索引、维度参数、einsum 式解压缩以及基于文档的编码的需求。这篇文章附带的原型 PyTorch 库可以作为 namedtensor 使用。

PyTorch 60分钟入门系列之自动求导

在PyTorch中所有神经网络的核心是autograd软件包。我们先来简单介绍一下这个，然后再构建第一个神经网络。 autograd包为Tensors上的所有操作提供了自动求导。它是一个运行过程中定义的框架（define-by-run），这意味着反向传播是由代码的运行方式来定义的，并且每一次迭代都可能不同。

[源码解析] PyTorch 流水线并行实现 (6)--并行计算

前几篇文章我们介绍了 PyTorch 流水线并行的基本知识，自动平衡机制和切分数据，本文我们结合论文内容来看看如何实现流水线。

[源码分析] Facebook如何训练超大模型 --- (2)

我们在前文介绍过，微软 ZeRO 可以对一个万亿参数模型可以使用 8 路模型并行、64 路管道并行和 8 路数据并行在 4,096 个 NVIDIA A100 GPU 上进行扩展。

pytorch基础知识-运算（上）

而在tensor的乘法运算中，*又分为element_wise（元素相乘）和 martix_matmul（矩阵形式相乘）两种。而按矩阵形式相乘有三种表达形式：

tf.compat.v1.Session

A class for running TensorFlow operations.

Pytorch Autograd 基础（三）

本篇介绍如何关闭和打开Autograd。关闭和打开Autograd的最简单的方法是更改tensor的requires_grad 属性。 import torch a = torch.ones(2, 3, requires_grad=True) print(a) b1 = 2 * a # b1 由 a 计算得来，继承了 a 当前额 requires_grad属性 print(b1) a.requires_grad = False # 关闭 Autograd，不再追踪计算历史 b2 = 2 * a

Pytorch: autograd与逻辑回归的实现

torch.autograd.backward ( tensors, grad_tensors=None,retain_graph=None,create_graph=False)

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐