batch_sampler - 腾讯云开发者社区

文章/答案/技术大牛

发布

2回答

关于不同尺寸的小型批次的培训

、、、

我试着用PyTorch来训练一个深入的学习模型，学习的图像已经到了特定的维度。我想用迷你批次来训练我的模型，但是小批次的大小并不能很好地划分每个桶中的示例数。具体来说，如果N是存储桶中图像的数量，而B是批处理大小，那么对于这个存储桶，如果B将N划分为N，则希望得到N // B批，而N // B + 1批处理则不然。最后一批可能有少于B的示例。索引0，9对应于桶0

浏览 2提问于2018-06-03得票数 1

回答已采纳

1回答

我如何才能从一个数据集中获得一批样本，并给出一组idxs？

、、、

我有一个torch.utils.data.Dataset对象，我希望有一个DataLoader或类似的对象，它接受idxs列表并返回带有相应idxs的一批示例。list_idxs = [10, 109, 7, 12]batch = loader.getbatch(list_idxs)[sample10, sample109, sample7, sample12]

浏览 1提问于2021-09-09得票数 1

回答已采纳

1回答

PyTorch:第一次划时代后的自定义批量取样器排气

、、

我使用一个带有自定义batch_sampler的batch_sampler来确保每个批处理是类平衡的。如何防止迭代器在第一个时代耗尽自己？= CustomDataset() dataset=my_dataset, batch_sampler

浏览 9提问于2022-04-27得票数 2

回答已采纳

1回答

__getitem_的idx是如何在PyTorch的DataLoader中工作的？

、、

目前，我正在尝试使用PyTorch的DataLoader来处理数据以输入到我的深度学习模型中，但也面临一些困难。def __getitem__(self, idx): return x然而，

浏览 2提问于2019-11-13得票数 14

回答已采纳

1回答

我正在训练LSTM，以便将时间序列数据分类为2个类(0和1)，.I在驱动器上有巨大的数据集，其中0级和1级数据位于不同的文件夹中，我试图通过创建数据集类并将DataLoader封装在其周围来训练LSTM批量使用。我必须做预处理，比如整形。这是我的代码。class LoadingDataset(Dataset): self.data_root1=data_root1#Has the path for class1 data self.data_root2=data_r

浏览 0提问于2019-08-25得票数 1

2回答

打印torch.data.dataset对象的值

、

我将我的pandas数据帧X_train转换为z张量，但输出是fields=[('user_id',user_id)]z=torchtext.data.Dataset(X_train.user_id,fields)print(z)426018我应该如何打

浏览 42提问于2020-05-28得票数 1

回答已采纳

1回答

如何在Dataloader中使用Batchsampler

、

batch_idx): batch_samplerself.wiki_df.loc[batch_idx] dataset=dataset, batch_sampler

浏览 1提问于2020-04-27得票数 4

回答已采纳

1回答

"AssertionError:找不到需要填充的字段；我们很惊讶您收到此错误，请在github上打开一个问题“错误发生

、

}, "validation_metric": "+f1" "data_loader": { "batch_sampler

浏览 0提问于2021-02-21得票数 0

1回答

从多个不同大小的数据集中加载PyTorch数据

、

我有多个数据集，每个数据集中有不同数量的图像(以及不同的图像维数)。在训练循环中，我希望从所有数据集中随机加载一批图像，但使每一批只包含来自单个数据集的图像。例如，我有数据集A，B，C，D，每个数据集都有图像01.jpg，02.jpg，…n.jpg (其中n取决于数据集)，假设批大小为3。例如，在第一批加载的批中，我可以得到图像B/02.jpg、B/06.jpg、B/12.jpg、下一批D/01.jpg、D/05.jpg、D/12.jpg等。对每个数据集使用不同的DataLoader，例如dataloaderA、dataloaderB等，然后在每个训练循环

浏览 0提问于2018-08-14得票数 1

1回答

火炬闪电limit_val_batches与val_check_interval行为

我正在设置limit_val_batches=10和val_check_interval=1000，以便每1000个培训步骤对10个验证批进行验证。是否保证每次调用验证时，培训师都会使用相同的10批？

浏览 5提问于2021-08-04得票数 1

回答已采纳

1回答

数据洗牌对火炬结果重现性的影响

、、

类具有以下构造函数： batch_sampler=None

浏览 1提问于2020-05-20得票数 1

回答已采纳

1回答

AllenNLP中可分解注意力模型的微调问题

、

do_layer_norm": false, } }, "data_loader": { }, "batch_sam

浏览 131提问于2021-03-29得票数 0

回答已采纳

1回答

如何在PyTorch中根据标签量调整批次数据

我已经制作了n-gram/doc-id用于文档分类， def create_dataset(tok_docs, vocab, n): document_ids = [] for n_gram in [doc[0][i:i+n] for i in range(len(doc[0]) - 1)]: document_ids.append(i) d

浏览 25提问于2020-07-16得票数 0

回答已采纳

1回答

PyTorch:我能按长度分组批次吗？

、、

我正在从事一个ASR项目，在那里我使用来自HuggingFace (wav2vec2)的模型。我现在的目标是将培训过程转移到PyTorch，所以我尝试重新创建HuggingFace的Trainer()类提供的所有内容。在我的例子中，输入是表示.wav文件的原始波形的一维数组。因此，在进行训练之前，我需要确保类似大小的数组能够成批在一起。我是否需要创建一个定制的Dataloader类并对其进行修改，以便每次它给我尽可能接近的批处理大小？我有一个想

浏览 2提问于2021-08-14得票数 0

回答已采纳

2回答

一种简单的方法来加载特定的样本，使用Py电筒数据中心

、、、

显然，解决这一问题的一种可能方法是定义一个自定义sampler或从抽象torch.utils.data.Sampler继承的batch_sampler。但这似乎在顶部检索了几个特定的样本。

浏览 1提问于2019-02-19得票数 6

回答已采纳

1回答

使用不同长度的批次进行PyTorch训练？

是否有可能在一个时期内使用长度不等的批次来训练模型？我是pytorch的新手。

浏览 69提问于2021-02-10得票数 0

回答已采纳

2回答

如何使用PyTorch DataLoader创建批处理，使给定批处理中的每个示例对属性具有相同的值？

、、、、

假设我有一个list，datalist，它包含几个示例(对于我的用例来说是torch_geometric.data.Data类型的)。每个示例都有一个属性num_nodes。import torchimport networkx as nx # for creating random data# the python list containing t

浏览 11提问于2022-01-26得票数 1

回答已采纳

2回答

如何构造每个类返回相同数量图像的批处理

、、、

我正在工作一个image retrieval项目，为了使模型更公平，我想构建返回的批处理： ImageFolderLoader class ，我已经创建了数据集，我想在我的中添加上面的功能，我在下面添加了它的代码.。 '.jpg', '.JPG', '.jpeg', '.J

浏览 2提问于2021-05-14得票数 1

回答已采纳

1回答

从打印中禁用模型训练器输出

'collate_fn': <function collate_tensor at 0x000002BE21221700>} {'batch_size': 1, 'sampler': None, 'batch_sampler

浏览 2提问于2022-02-08得票数 0

回答已采纳

1回答

在CNN训练中跳过反向传播，以便在Caffe中更快地训练

、、

{ max_trials: 1 batch_sampler { min_scalemin_jaccard_overlap: 0.10000000149 max_sample: 1 } } max_

浏览 16提问于2018-08-30得票数 0

点击加载更多

关于不同尺寸的小型批次的培训

我如何才能从一个数据集中获得一批样本，并给出一组idxs？

PyTorch:第一次划时代后的自定义批量取样器排气

__getitem_的idx是如何在PyTorch的DataLoader中工作的？

按批量加载庞大的数据集，以训练火把。

打印torch.data.dataset对象的值

如何在Dataloader中使用Batchsampler

"AssertionError:找不到需要填充的字段；我们很惊讶您收到此错误，请在github上打开一个问题“错误发生

从多个不同大小的数据集中加载PyTorch数据

火炬闪电limit_val_batches与val_check_interval行为

数据洗牌对火炬结果重现性的影响

AllenNLP中可分解注意力模型的微调问题

如何在PyTorch中根据标签量调整批次数据

PyTorch:我能按长度分组批次吗？

一种简单的方法来加载特定的样本，使用Py电筒数据中心

使用不同长度的批次进行PyTorch训练？

如何使用PyTorch DataLoader创建批处理，使给定批处理中的每个示例对属性具有相同的值？

如何构造每个类返回相同数量图像的批处理

从打印中禁用模型训练器输出

在CNN训练中跳过反向传播，以便在Caffe中更快地训练

相关资讯

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐