在模型的训练过程中,我已经使用了shuffle my dataset,如文档示例: (但无法将其全部混洗,因为它会占用太多内存),我还将我的数据集分成多个小碎片,每个碎片大小相等。然而,我有理由认为这种“近似”的混洗是不够的,我还认为馈送已经混洗的数据将提高训练速度。所以现在我的问题是:在我将我的数据集分成Tfrecords分片后,是否有可能高效
在pandas中按行或按列混洗数据帧的简单而有效的方法是什么?即如何编写一个函数shuffle(df, n, axis=0),该函数接受一个数据帧、多个随机n和一个轴(axis=0是行,axis=1是列),并返回已经被随机n次的数据帧的副本。编辑:关键是在不破坏数据帧的行/列标签的情况下执行此操作。如果你只是混洗df.index,就会丢失所有的信息。我希望生成的<