我必须从一个文件中创建一个dataframe,该文件包含一些重复的列,并且它们的值按如下方式拆分:如您所见,例如,c1被分成3个部分,c2被分成2个部分
df.sum(index=1) or df.max(index=1)
但是不知道如何指定我想要对特定列执行此操作。另一种可能是创建仅包含重复列的数据帧
我有几个数据帧,我只想合并成一个大的数据帧来构建分类器。 This is the base dataframe, user_df_copy 在此数据帧中,有一个id列,它指示客户端id。我还有其他的dataframes like this one,它们有与user_id列相关的列。因此,我们的目标是将这些小数据帧合并到user_df_copy中,添加像subject_id这样的列,并且仅</