我正在尝试对dataframe中的列进行随机排列,但我需要这种排列对于两个dataframe是相同的。
现在我就有了这个
X_train = X_train.sample(frac=1, axis=1)
X_test = X_test.sample(frac=1, axis=1)
这会创建两个不同的排列,但我需要对X_train
和X_test
使用相同的列排列,例如unison shuffle。
谢谢!
发布于 2019-06-03 07:47:49
sample()方法接受一个为随机数生成器设置种子的random_state
。这应该在两种情况下产生相同的“随机数”。
fixed_seed = 111
X_train = X_train.sample(frac=1, axis=1, random_state =fixed_seed )
X_test = X_test.sample(frac=1, axis=1, random_state =fixed_seed )
https://stackoverflow.com/questions/56419710
复制相似问题