Pytorch如何增加批量大小_pytorch SGD的默认批量大小是多少？_PyTorch:如何批量推理(并行推理) - 腾讯云开发者社区

、、、

在pytorch中，backward()函数累积渐变，我们必须通过调用optimizer.zero_grad()在每个小批量中重置它。在这种情况下，当实际动量SGD使用过去一些小批次的指数平均值更新权重时，动量SGD如何工作。作为Pytorch的初学者，我很困惑。不需要使用过去的渐变来执行更新吗？

浏览 0提问于2018-12-31得票数 1

1回答

在内存方面，tensor2tensor和pytorch有什么区别吗？

、、

我正在尝试用pytorch和tensor2tensor训练seq2seq模型(转换器)。使用tensor2tensor时，批处理大小可能类似于1024，而pytorch模型显示CUDA out memory错误，批处理大小为8。在tensor2tensor中有没有什么技术可以最大限度地利用内存。如果有人知道这一点，请告诉我。提前谢谢。

浏览 11提问于2020-05-05得票数 1

2回答

我不理解在pytorch中训练分类器的代码

我不明白labels.size(0)这句话。我是Pytorch的新手，对数据结构感到非常困惑。 correct = 0 total = 0 with torch.no_grad(): for data in testloader: images, labels = data outputs = net(images) _, predicted = torch.max(outputs.data, 1) total += labels.size(0) correct += (predicted == labels).sum().it

浏览 0提问于2019-04-08得票数 0

1回答

Keras Upsampling2d对PyTorch上采样

、、、、

我正在尝试将Keras模型转换为PyTorch。现在，它涉及来自keras的keras。当我在pytorch中使用torch.nn.UpsamplingNearest2d时，由于UpSampling2D在keras中的默认值是nearest，因此得到了不同的不一致结果。例子如下： Keras行为 In [3]: t1 = tf.random_normal([32, 8, 8, 512]) # as we have channels last in keras In [4]: u_s = tf.keras.layers.UpS

浏览 17提问于2022-03-23得票数 1

回答已采纳

1回答

神经网络中图像的默认输入尺寸？

、、

在阅读一本PyTorch书籍时，我偶然发现了这样一段代码，其中作者更改了轴的顺序。 img_t.permute(1，2，0) (将轴的顺序从C×H×W更改为H×W×C) 在神经网络中，H x W x C是输入图像的默认输入尺寸吗？

浏览 48提问于2021-09-17得票数 0

回答已采纳

1回答

使用不同长度的批次进行PyTorch训练？

是否有可能在一个时期内使用长度不等的批次来训练模型？我是pytorch的新手。

浏览 69提问于2021-02-10得票数 0

回答已采纳

1回答

tensorflow中的Convtranspose2D

、、、、

我必须在tensorflow中使用ConvTranspose2d来处理我的GAN生成器的输入噪声(16,100)，而没有密集的层。有什么建议吗？我看到这在pytorch中是可能的，但在tensorflow中是不可能的。背景信息：

浏览 0提问于2020-07-21得票数 1

2回答

将256x256 (不是299x299)的图像大小输入到初始v3模型(PyTorch)中，是否可以正常工作？

、、、、

我正在Pytorch上测试预训练的inception v3模型。我给它提供了256x256的图像大小，并将它的大小调整到了299x299。在这两种情况下，图像都被正确分类。谁能解释一下为什么PyTorch预训练模型可以接受不是299x299的图像？

浏览 16提问于2019-08-09得票数 4

回答已采纳

3回答

增加批处理规范化会降低性能。

、、、

我正在使用PyTorch实现一个基于骨架的动作识别的分类网络。该模型由三个卷积层和两个完全连通的层组成。在NTU+D数据集中，这个基本模型给了我大约70%的精度.我想了解更多关于批处理规范化的知识，所以我为所有层添加了一个批处理规范化，除了最后一个层。令我惊讶的是，评估的准确率下降到60%，而不是增加，但训练的准确率却从80%提高到90%。有人能说我做错了什么吗？还是增加批量归一化不一定要提高准确度？批归一化模型 class BaseModelV0p2(nn.Module): def __init__(self, num_person, num_joint, num_c

浏览 1提问于2019-08-12得票数 4

回答已采纳

1回答

Azure服务总线性能问题MassTransit

、、、

所以我一直在尝试MassTransit和Azure Service Bus Premium，这是我的一个消费者的示例。假设一个发布者的初始负载大约是每秒1000条消息。然而，每当我尝试配置一个消费者时，它似乎通常平均每个循环大约有20-40条消息。 cfg.ReceiveEndpoint("ReceivePoint", e =>{ e.PrefetchCount = 500; e.MaxConcurrentCalls = 20; e.Batch<IBlahContract>(b => { b.MessageLimi

浏览 16提问于2020-03-30得票数 0

2回答

在pytorch中的模型上调用forward()是否需要在gpu内存中加载模型和数据之后需要额外的gpu内存？

、

我可以在gpu内存中加载模型和数据样本，但是当我用示例对模型进行前向调用时，它会出现CUDA out of memory错误。我确信模型和数据已经加载，因为我的代码结构如下(伪代码)： model = Model() sample = load_sample() sleep(5) # to check memory usage with nvidia-smi print('before forward') model(sample) print('after forward') “在前进之前”被打印，而“后向前”没有。我假设在构建模型的过程中为向前传递分配了

浏览 3提问于2019-12-10得票数 0

回答已采纳

1回答

如何理解SageMaker图像分类示例日志中的速度数

、

我正在研究加州理工学院图像分类笔记本的SageMaker示例：。我按照笔记本中的步骤操作，但将资源部分改为使用具有8个V100图形处理器的ml.p3.16xlarge，如下所示： "ResourceConfig": { "InstanceCount": 1, "InstanceType": "ml.p3.16xlarge", "VolumeSizeInGB": 50 } 当我在训练后查看日志文件时，我发现速度只有895 images/s，这与使用单个GPU (p3.2xlarge)非常相似。

浏览 0提问于2018-10-03得票数 0

2回答

PyTorch -无法将batchnorm1d与线性一起使用

、

在一维张量上使用PyTorch的BatchNorm1D会给出错误： RuntimeError: running_mean应包含%1个不是2304的元素有什么建议可能是错误的吗？我的代码： self.net_common = nn.Sequential ( nn.Linear(64*64, 48*48), nn.BatchNorm1d(48*48), nn.Tanh(), nn.Dropout(p=0.25), nn.Linear(48*48, 32*32), nn.BatchNorm1d(32*32), nn.Tanh(), )

浏览 116提问于2019-06-01得票数 3

2回答

增加ElasticSearch中的队列容量

弹性版本7.8 在对数千条记录运行此代码时，我遇到了一个错误： var bulkIndexResponse = await _client.BulkAsync(i => i .Index(indexName) .IndexMany(bases)); if (!bulkIndexResponse.IsValid) { throw bulkIndexResponse.OriginalException;

浏览 102提问于2020-10-04得票数 0

回答已采纳

1回答

弹性APM HTTP错误(503)：队列已满

、

基巴纳的回应是 { "statusCode": 500, "error": "Internal Server Error", "message": "An internal server error occurred" } APM服务器返回503 -内部服务器错误，很难确定根本原因。ES队列是否已满或内存不足或群集设置不正确？根据ES文档：完整队列通常意味着代理收集的数据比APM服务器所能处理的还要多。当APM没有按照您的Elasticsearch集群的大小正确配置时，或者由于您的Elasticsearch集

浏览 0提问于2019-02-11得票数 7

1回答

使用深度学习进行图像分类的最佳批次大小

我有一个广泛的问题，但仍然应该是相关的。假设我正在使用CNN进行2类图像分类。32-64的批次大小应足以用于培训目的。然而，如果我有大约13个类的数据，32批大小对于一个好的模型来说肯定是不够的，因为每批可能会得到每个类的2-3个图像。是否有通用或近似公式来确定用于训练的批次大小？或者应该使用网格搜索或贝叶斯方法等技术将其确定为超参数？塞迪

浏览 30提问于2020-02-10得票数 2

1回答

tensorflow是否可以单独优化每个元素的损失，而不是优化整个平均损失？

、、

tensorflow如何单独优化批次的元素损失，而不是优化批次损失？在对每个批次的损失进行优化时，常用的方法是对所有批次的元素损失进行求和或取其平均值作为批次损失，然后对该批次损失进行优化。在我的例子中，我想单独优化每个元素的损失，而不是将它们一起减少为批量损失。例如，在以下代码中。 losses = tf.nn.nce_loss(<my batch inputs here>) loss = tf.reduce_mean(losses) optim = tf.nn.GradientDesentOptimizor(learning_rate = 0.01).minimize(l

浏览 17提问于2019-04-19得票数 0

2回答

为什么香草变压器有固定长度的输入？

、

我知道，在变压器的数学基础上，没有限制输入的长度。但我仍然不明白为什么我们要在框架(PyTorch)中修复它。由于这个问题，已经创建了Transformer。请你向我解释一下这个问题藏在哪里好吗？

浏览 0提问于2020-03-08得票数 8

回答已采纳

1回答

具有多个文本字段的elasticsearch的性能较差

我的环境： Ubuntu 16.4，CPU 16核，16 GB内存，SSD硬盘。 200个文本字段。我有一个节点。我们使用4个线程与批量API和部分更新。我们看到GC的持续时间是~150ms，正常吗？我们能否提高索引率(当前为~2000秒)？因为我们在CPU和磁盘上看不到任何瓶颈。

浏览 0提问于2019-04-15得票数 0

1回答

java应用程序到elasticsearch的并发输出

、、

我正在研究是否可以使用传输客户端和批量上传apis同时将多个线程输出到elasticsearch。具体地说，我希望有多个传输客户端或批量上传api实例在它们自己的线程上运行，并处理到elasticsearch的输入。我想这样做的具体原因是，我可以创建一个负载平衡算法来有效地处理大量的json消息。我已经用谷歌搜索了一段时间，找不到任何关于这类事情的文档，也找不到任何其他人提出类似问题的人。另外，我是elasticsearch的新手。有没有人对此有任何见解，他们可以分享的一些文献，或者是一个好的起点？谢谢。

浏览 15提问于2016-08-25得票数 1

回答已采纳

1回答

PyTorch BatchNorm1D、2D、3D和TensorFlow/Keras BatchNormalization

、、

我想在TensorFlow中像在PyTorch中一样使用BatchNorm1D。我注意到TF中的BatchNormalization()默认使用axis=-1。与在PyTorch中一样，哪个轴是BatchNorm1D, BatchNorm2D, BatchNorm3D的正确轴？

浏览 7提问于2020-11-01得票数 0

2回答

增加Kafka消费者单次轮询的消息阅读量

Kafka使用者有一个配置max.poll.records，它控制在一次调用poll()及其时返回的最大记录数。我将其设置为一个非常高的数字，这样我就可以在一次投票中获得所有消息。然而，尽管该主题有更多的消息，但该调查在一次调用中仅返回数千条消息(约6000条)。如何进一步增加单个消费者读取的消息数？

浏览 0提问于2018-08-09得票数 31

回答已采纳

3回答

如何在PyTorch中更改图片大小

、

我试图使用 CNN 使用FER2013数据集对PyTorch模型进行情感识别，我有以下错误： Traceback (most recent call last): File "VGG.py", line 112, in <module> transfer.keras_to_pytorch(keras_network, pytorch_network) File "/home/eorg/NeuralNetworks/user/Project/model/nntransfer.py", line 121, in keras_to_pyto

浏览 1提问于2017-11-08得票数 9

1回答

在深度强化学习中，我是计算每个迷你批次的一个损失，还是计算每个迷你批次的一个损失？

、、、、

神经网络和Pytorch的新手。我在每个迷你批次中有300个回放记忆。我见过人们计算300个回放记忆的损失，但这对我来说并不是真的有意义。300个回放记忆来自非常不同的游戏状态，为什么将预测和目标之间的300个差异合并到一个值中是有意义的？当模型反向传播时，梯度是否被分成300个分支，每个分支对应于迷你批次中的一个条目？例如，仍然使用小型批处理，每个批处理中有300个重放内存。我的策略网络输出10个动作的概率分布，或者300 x 10张量，我的目标概率分布具有相同的形状。我想找出我的预测和目标之间的交叉熵损失。我想知道我是应该在300个大小为10的张量的预测目标对之间找到300个交叉熵损失

浏览 8提问于2020-05-18得票数 1

1回答

如何在PyTorch中使用Glove嵌入层处理可变长度的句子？

、、、、

我正在使用PyTorch中的RNN构建一个文本分类器。我使用的嵌入是GLOVE。但是，我将可变长度索引引用提供给模型。这将导致可变长度嵌入，我认为这不会起作用。我如何解决这个问题，并使嵌入输出的所有句子的长度相同？ def forward(self, sentence): embeds = self.embedding(sentence) hidden = self.__init__hidden(size) output, hidden = self.rnn(embeds, hidden) out = self.hidden2o

浏览 12提问于2021-04-21得票数 3

11回答

CUDA错误:调用``cublasCreate( CUBLAS_STATUS_ALLOC_FAILED )`时出现句柄

、、

当我在colab中运行我的pytorch深度学习模型时，我得到以下错误 /usr/local/lib/python3.6/dist-packages/torch/nn/functional.py in linear(input, weight, bias) 1370 ret = torch.addmm(bias, input, weight.t()) 1371 else: -> 1372 output = input.matmul(weight.t()) 1373 if bias is not None: 1

浏览 0提问于2020-04-28得票数 22

2回答

pytorch中图像增强后的图像数量

、

我有100张图片，我使用Pytorch函数RandomHorizontalFlip和RandomVerticalFlip以1的概率应用了水平和垂直增强。在此之后，我的图像总数将是300个或更多吗？

浏览 124提问于2021-02-11得票数 1

2回答

PyTorch DataLoader如何与PyTorch数据集交互以转换批处理？

、、

我正在为与NLP相关的任务创建一个自定义数据集。在PyTorch中自定义数据广播tutorial，我们可以看到__getitem__()方法在返回样本之前为转换留出空间： def __getitem__(self, idx): if torch.is_tensor(idx): idx = idx.tolist() img_name = os.path.join(self.root_dir, self.landmarks_frame.iloc[idx, 0])

浏览 46提问于2021-02-25得票数 6

回答已采纳

1回答

pytorch:索引超出了大于批大小的索引范围

、、

我正在尝试使用Pytorch预测MNIST中的一些图像，我无法从0到60,000之间选择任何索引。首先，我添加了"drop_last=True“，因为我注意到最后一个未完成的批处理没有被丢弃，我认为这可以解决问题，但它没有。如果我的批处理大小是256，那么我可以选择预测的最大索引是255。我该如何解决这个问题？下面是我获取图片的方法： images = MNIST('mnist_data',transform=T, download=True, train=True) image_loader = torch.utils.data.DataLoader(images,b

浏览 19提问于2019-11-27得票数 0

2回答

为什么Google Colab TPU和我的电脑一样慢？

、、、、

因为我有一个很大的数据集，而且我的PC没有多少电力，所以我认为在Google Colab上使用TPU是一个好主意。下面是我的TPU配置： try: tpu = tf.distribute.cluster_resolver.TPUClusterResolver() print('Running on TPU ', tpu.master()) except ValueError: tpu = None if tpu: tf.config.experimental_connect_to_cluster(tpu) tf.tpu.experi

浏览 90提问于2020-12-15得票数 1

1回答

Pytorch神经网络如何将数据集加载到GPU中

、、

在将数据集加载到GPU进行训练时，Pytorch NN将加载整个数据集还是只加载批处理？我有一个33 T4的数据集，很适合我的普通内存(64 T4)，但我只有16 T4的GPU内存(T4)。只要Pytorch一次只将一批加载到GPU中，那么它应该工作得很好，不会出现任何内存问题？

浏览 133提问于2021-04-10得票数 0

回答已采纳

1回答

使用图形处理器时，pytorch中的loss.backward()停止响应

、

我在一个基于WSL的环境中使用pytorch。当我在图形处理器(RTX3090)上训练深度学习模型(如下所示)时，它在loss.backward()停止响应。 pytorch停止后，GPU占用率为0%，nvidia-smi停止响应。 def train_loop(model, optimizer, scheduler, loader, device): losses, lrs = [], [] model.train() optimizer.zero_grad() for i, d in enumerate(loader): print(f"{i

浏览 183提问于2021-10-30得票数 0

1回答

SDG批量>1？

、、

我正在学习IBM的“使用PyTorch的深度NNs”课程，并且我遇到了一些实验室示例，其中SDG用于优化器，而DataLoader中的批处理大小大于1。如果我正确理解，SGD将执行梯度下降，每一步只有一个训练例子，所以这个情况下，SGD将如何与每一批训练示例交互？例如，如果批处理大小= 20，SGD优化器会在每批中执行20个GD步骤吗？如果是这样的话，那么这是否意味着无论我为DataLoader设置了多大的批大小，SGD优化器都只会在一个时代执行GD步骤(训练示例的#)吗？ Layers = [2, 50, 3] model = Net(Layers) learning_rate = 0.

浏览 6提问于2022-05-01得票数 0

1回答

具有图像尺寸的预测时间的Faster-RCNN Pytorch问题

、、

根据本教程：，我正在使用PyTorch优化更快的RCNN 结果相当不错，但只有在向模型提供单个张量的情况下，才能进行预测。例如： # This works well >>> img, _ = dataset_test[3] >>> img.shape torch.Size([3, 1200, 1600]) >>> model.eval() >>> with torch.no_grad(): .. preds = model([img.to(device)]) 但是当我一次输入多个张量时，我会得到这个错误： >

浏览 21提问于2019-08-12得票数 0

回答已采纳

1回答

未使用Dist-Keras更新的权重

、、、、

正如所解释的，当我运行示例笔记本时，我的权重在训练后永远不会更新： model.layers[0].get_weights() trained_model.layers[0].get_weights() 两者都给了我相同的权重(就好像模型根本没有经过训练一样)： [array([[-0.39513412, 0.26937097, -0.36478603, 0.30427128, -0.13985097, -0.22316453, 0.13130313, -0.08426034], [ 0.41418487, -0.46847233, 0.58078319, -0.63027477, -0.45

浏览 18提问于2017-06-23得票数 0

2回答

使用KMeans对大量文本文件进行聚类

、、

我有一个预解压缩的文本文件的文件夹(来自图像、pdf、文档等的数据)。总共有222mb或27,600个文档。该文件夹被编译成一个字典： data = {'file_name':'document text',...} 然后我将字典矢量化。 X = vectorizer.fit_transform(documents.values()) X = X.toarray() 将“X”导出到文本文件会显示它的大小约为7 7gb！我尝试使用PCA将矢量化数据转换为2D数组 pca = PCA(n_components=2) two_dim = pca.fit_trans

浏览 2提问于2019-03-06得票数 0

1回答

如何加快弹性搜索的重索引操作？

我们是否可以通过将副本设置为零并增加刷新间隔来加快elasticsearch (v5.3)的重新索引操作，还是已经在内部进行了处理？

浏览 2提问于2018-02-02得票数 2

回答已采纳

1回答

Cassandra在繁重的插入工作负载下重置连接

我有一个包含8个节点的cassandra集群，cassandra 1.0.8。我正在尝试使用batch_mutate()在循环中执行大量的小插入操作。在一段时间(大约200K插入)后，服务器重置连接，但出现以下异常： org.apache.thrift.transport.TTransportException: java.net.SocketException: Connection reset at org.apache.thrift.transport.TIOStreamTransport.write(TIOStreamTransport.java:147) at org.apache

浏览 4提问于2012-07-12得票数 4

回答已采纳

2回答

变压器模型如何计算自我注意力？

、、、、

在变压器模型中，存在自我注意，这是使用softmax对Query (Q)和Key (K)向量进行计算的：我正在尝试理解矩阵乘法： Q = batch_size x seq_length x embed_size K = batch_size x seq_length x embed_size QK^T = batch_size x seq_length x seq_length Softmax QK^T = Softmax (batch_size x seq_length x seq_length) 由于每个批次元素都有seq_length x seq_length值，如何计算soft

浏览 9提问于2020-05-13得票数 1

2回答

如何使用Py火炬将增强图像添加到原始数据集中？

、

据我所知，RandomHorizontalFlip等代替了图像，而不是向数据集添加新图像。如何通过使用PyTorch向数据集添加增强图像来增加数据集的大小？我已经浏览了发布的链接&还没有找到解决方案。我想通过添加翻转/旋转图像来增加数据大小，但是文章解决了图像的就地处理问题。谢谢。

浏览 3提问于2019-03-03得票数 3

回答已采纳

3回答

随着批量大小的变化，学习率应该如何变化？

、

当我增加/减少SGD中使用的小批量的批量大小时，我应该改变学习率吗？如果是这样，那么是如何实现的呢？作为参考，我正在与某人讨论，有人说，当批量增加时，学习率应该在一定程度上降低。我的理解是，当我增加批量大小时，计算的平均梯度将不那么嘈杂，因此我要么保持相同的学习率，要么增加学习率。此外，如果我使用自适应学习率优化器，如Adam或RMSProp，那么我想我可以保持学习率不变。如果我错了，请纠正我，并在这方面给出任何见解。

浏览 2提问于2018-10-29得票数 59

回答已采纳

2回答

为什么我会因为凯拉斯的损失而得到南？

、、、

我正在关注这篇文章。首先，我尝试使用本文中的数据，即。脚本产生与文章相同的结果。然后，我尝试从Yahoo下载另一个数据集。THe数据集更大(本文示例数据集中有2805行而不是1000+行)。然而，在使用LSTM方法后，我将得到作为nan的损失。为什么？如何解决这个问题？

浏览 1提问于2019-04-16得票数 0

回答已采纳

1回答

ReadTimeoutError(HTTPConnectionPool(host='localhost'，超时错误: ElasticSearch port=9200)：读取超时。(阅读timeout=60)

、、

我有一个运行在服务器上的ElasticSearch实例。当我试图使用多处理索引一个庞大的语料库时，我会得到很多超时错误。EasticSearch似乎只能处理少数几个请求。我遵循了ElasticSearch网站中建议的配置。对于如何提高多处理设置的索引性能，有什么建议吗？我要向其中添加文档的索引有一个碎片。

浏览 5提问于2020-10-08得票数 1

回答已采纳

1回答

PyTorch软最大输出总和不是1

、

交叉过帐我开始在目标Dirichlet分布和我的模型的输出Dirichlet分布之间收到负的KL分歧。有人在网上提出，这可能表明狄利克雷分布的参数之和不是1。我认为这是荒谬的，因为模型的输出是通过 output = F.softmax(self.weights(x), dim=1) 但是仔细研究之后，我发现torch.all(torch.sum(output, dim=1) == 1.)返回的是False！查看有问题的行，我发现它是tensor([0.0085, 0.9052, 0.0863], grad_fn=<SelectBackward>)。但是torch.sum(outp

浏览 51提问于2019-10-30得票数 2

回答已采纳

3回答

如何制作小尺寸的android应用？

、、

我在为我的学校做一个小小的项目... 我做了一个简单的计算器app...with进行简单的数学运算…当apk文件被创建和安装时，它消耗了超过700kb的手机内存空间。而在android市场(Play store)，只有一些类似的应用程序，大小较小，占用的内存空间不到500。我在eclipse中创建应用程序... 谁能帮我解决这个问题吗?他们是如何制作简单的小尺寸的应用程序的？？

浏览 1提问于2013-01-08得票数 6

17回答

如何避免PyTorch中的“数据自动化系统内存不足”

、、、、

我认为对于内存较低的PyTorch用户来说，这是一个非常常见的消息： RuntimeError: CUDA out of memory. Tried to allocate MiB (GPU ; GiB total capacity; GiB already allocated; MiB free; cached) 我试图通过将每个层加载到GPU并将其加载回图像来处理图像： for m in self.children(): m.cuda() x = m(x) m.cpu() torch.cuda.empty_cache() 但它似乎不太有效。我想知道

浏览 16提问于2019-12-01得票数 106

回答已采纳

1回答

ONNX和TensorRT模型中的参数和FLOPS的数量

、、、

将模型从PyTorch转换为ONNX或TensorRT格式时，参数和FLOPS (每秒浮点操作数)的数量是否会发生变化？

浏览 19提问于2021-11-24得票数 0

1回答

前馈神经网络的超参数整定和过拟合-小批处理和交叉验证

、、、

我正在考虑为使用PyTorch实现的前馈神经网络实现一种超参数整定方法。我最初的模糊神经网络被命名为net，它使用一种带有epochs的小批量学习方法来实现： #Parameters batch_size = 50 #larger batch size leads to over fitting num_epochs = 1000 learning_rate = 0.01 #was .01-AKA step size - The amount that the weights are updated during training batch_no = len(x_train) // bat

浏览 2提问于2020-03-25得票数 0

回答已采纳

1回答

在Python中，如何一行导入库中的所有模块？

、、、、

下面的代码可以工作： import torch import pytorch_lightning as torchl import pytorch_forecasting as torchf from pytorch_forecasting.data.examples import get_stallion_data x = torchf.data.examples.get_stallion_data() print(x) 但是，如果我删除第四行，我会得到一个错误： AttributeError: module 'pytorch_forecasting.data' ha

浏览 74提问于2021-06-16得票数 0

1回答

来自拥抱脸的pytorch_transformers是否被维护？

、

Huggingface有两个库Pytorch_transformers 1.2.0和transformers 4.和其他库？有一些论文使用来自pytorch_transformers的代码，我试图在pytorch_transformers？上实现一些基于生产的解决方案。"pytorch_transformers“库是否由huggingface维护？

浏览 9提问于2021-01-27得票数 1