#created dataframes for training, validation, and testing #Dataframe is simply partitioned as you would splitting by dataset
training_dataframe, validation_dataframe, testing_dataframe
提出了一种很好的方法来处理具有多个分类值的数据帧。但是,我不确定这种情况是否正确(在泡菜中),是否会再次对刚传入的数据应用相同的标签。到目前为止,我直接使用熊猫,并通过.cat.codes获得了类别值的标签。但现在,我需要将标签编码集成到管道中,以处理新传入的数据。LabelEncoder()
for col in df.select_dtypes([], ['objec