我正在尝试将文件列表合并到一个数据帧中,以便将其写回单个csv。每次我使用pd.concat合并文件时,所有内容都会在合并后的输出文件中完全重新排序(包括列和行)。output as csvrebuild.to_csv('combined.csv',index=False)
单独的文件具有按“时间”、“名称”、“数量”的顺序排列的列
是否有一种方法(在Linux中)将合并的200 to磁盘空间合并到一个文件夹中,该文件夹可以在网络中的所有机器之间使用NFS共享?按照这个路线,所有的机器都可以读/写到同一个文件夹,这样,I/O就可以均匀地分布在它们之间。如果一个人需要一个大型的文件系统来存储100多个TB数据,这是个好主意吗?(注意:数据将被分割成许多较小的文件,每个文件大小为500 be )。
是否有现成的解决方案(更好的,开