我有一个非常大的csv文件,其中包含millions of rows和我need.like的行号列表。rownumberList = [1,2,5,6,8,9,20,22]df = pd.read_csv('myfile.csv',skiprows = skiplist)
#skiplist would conta
我有一个包含17个特征、10K观测值的数据集,其中一列包含标签(从1到4,整数)。因此,数据集是10,000 X 18 (17个特征加上一个标签)。我想要做的是创建一个数组列表,其中每个数组都是从每个标签块创建的。例如,前10行可能被标记为1,1,1,2,2,3,1,1,1,3。我最初试图通过标签聚合来使用Pandas,但这不起作用,因为这样我在列表中将只有四个数组。关于如