我正在训练LSTM,以便将时间序列数据分类为2个类(0和1),.I在驱动器上有巨大的数据集,其中0级和1级数据位于不同的文件夹中,我试图通过创建数据集类并将DataLoader封装在其周围来训练LSTM批量使用。我必须做预处理,比如整形。这是我的代码。class LoadingDataset(Dataset): self.data_root1=data_root1#Has the path for class1 data
self.data_root2=data_r
我已经制作了n-gram/doc-id用于文档分类, def create_dataset(tok_docs, vocab, n): document_ids = [] for n_gram in [doc[0][i:i+n] for i in range(len(doc[0]) - 1)]: document_ids.append(i)
d
假设我有一个list,datalist,它包含几个示例(对于我的用例来说是torch_geometric.data.Data类型的)。每个示例都有一个属性num_nodes。import torchimport networkx as nx # for creating random data# the python list containing t