所有其他数据集都应该进行子类化。 所有子类应该override__len__和__getitem__,前者提供了数据集的大小,后者支持整数索引,范围从0到len(self)。...):
# sequence是一个列表,e.g. [[1,2,3], [a,b], [4,h]]
# return 一个数据大小列表,[3, 5, 7], 明显看的出来包含数据多少,第一个代表第一个数据的大小...,第二个代表第一个+第二数据的大小,最后代表所有的数据大学;
......shuffle (bool, optional) - 是否打乱数据集(一般打乱较好)。
sampler (Sampler, optional) - 定义从数据集中提取样本的策略。...=False, num_samples=None)
样本随机排列,如果没有Replacement,将会从打乱的数据采样,否则,。。