我有一个用于机器学习的训练集和测试集,但是训练集包含的数据行太多,而测试集包含的数据太少。我计算出我需要将245行从训练集中移动到测试集中,以产生更好的拆分。我该怎么做呢?我在训练集中总共有5116行。行,并将它们移动到test_df 我在这里找到了这两个解决方案 Pandasdataframe - move rows from one <em
我正在尝试按来源划分帐单行的音量。账单行数据量报告为一个值,但我知道55%的数据量来自源A,45%来自源B。我如何在Pandas数据帧中创建新行,以将行拆分为两行,每个源一行?我可以计算每个源的新体积值,并将其放入新列,但我不确定如何将这些值输入到新行中。
源A应为计数的55%,源B应为计数的45%。from panda