首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Python工具开发实践-csv文件分割

今天工作中需要处理一个700多W行的csv文件,要求将csv文件按照100W行进行分割,以便可以用excel打开,找了几个脚本,处理小文件都差不多,但是当我尝试处理这个大文件时,代码效率就凸显出来了,有的程序半个小时都处理不完...() 定义csv分割行数 linesPerFile = 1000000 初始化文件编号为1 filecount = 1 以0为起点,文件行数为终点,分片大小为间隔,循环遍历文件,每次遍历行数即为分片大小...,而不是每行遍历一次 for i in range(0, len(csv_file), linesPerFile): 打开目标文件准备写入,不存在则创建 with open(file_name[:-4]...+ '_' + str(filecount) + '.csv', 'w+') as f: 判断是否为第一个文件,不是的话需要先写入标题行 if filecount > 1: f.write(csv_file...[0]) 批量写入i至i+分片大小的多行数据 f.writelines(csv_file[i:i+linesPerFile]) 完成一个文件写入之后,文件编号增加1 filecount += 1 至此,

1.2K40

Python小工具:CSV文件分割神器2.0

工作中需要处理一个700多W行的csv文件,要求将csv文件按照100W行进行分割,以便可以用excel打开,找了几个脚本,处理小文件都差不多,但是当我尝试处理这个大文件时,代码效率就凸显出来了,有的程序半个小时都处理不完...= f.readlines() 定义csv分割行数 linesPerFile = 1000000 初始化文件编号为1 filecount = 1 以0为起点,文件行数为终点,分片大小为间隔,循环遍历文件...,每次遍历行数即为分片大小,而不是每行遍历一次 for i in range(0, len(csv_file), linesPerFile): 打开目标文件准备写入,不存在则创建 with open...1: f.write(csv_file[0]) 批量写入i至i+分片大小的多行数据 f.writelines(csv_file[i:i+linesPerFile]) 完成一个文件写入之后,文件编号增加...回复 csv2 获取CSV文件分割神器2.0版本

3.7K30
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    CSV文件太大打不开进行分割、和打开乱码问题

    解决办法:首先处理打不开的问题,我们可以把大的csv分割成若干小文件,使用文件分割器,按10000行一个文件分割分割器在F:\新建文件夹\csv文件分割器\split.exe(这是我的放的位置),...贴上CSV文件分割器的下载地址:https://www.jb51.net/softs/606744.html 稍等一段时间就行。...我还试过另一个分割器,但是不行。...分割完之后,用excel打开发现是乱码,这是因为编码格式不同,可以在excel中转换编码格式,在数据栏—>自文件—>找到我们要打开的csv—>下一步之后有个编码格式选择,**我们要选择UTF-8的格式,...然后后面分隔符我们用逗号,并且把Tab的钩子去掉 这样就可以看到我们想看的csv文件了 如果csv文件用记事本打开可以正常显示,但用excel打开乱码,可以将csv文件的编码改成ANSI

    5.7K30

    CSV文件编辑器——Modern CSV for mac

    在编辑 CSV 文档时,大多数人都在寻找一种高度专业的工具来帮助他们做他们想做或实际需要做的任何事情。现代 CSV 正是这种类型的工具。它提供了大量的选项和功能,同时快速且易于使用。...考虑到这一点,当涉及到 CSV 文档时,这个小程序可以做正确的事情。 点击安装》Modern CSV for mac 快速编辑 多单元格编辑 复制行、列和单元格。 移动行、列和单元格。...Modern CSV Mac功能特点 轻松编辑CSV文件 为什么移动列、复制行或拆分单元格会很困难?使用现代 CSV,这很容易。 使用大多数命令,您可以一次对多个行、列或单元格进行操作。...快速查看大型 CSV 文件 Modern CSV 不仅是一个强大的 CSV 编辑器,还是一个强大的 CSV 查看器。它带有只读模式,可以快速加载大文件,并且占用的内存很小,只是文件大小的一小部分。...您可以自定义的 CSV 编辑器 我们将 Modern CSV 设计为一个易于使用的应用程序。要更轻松地查看 CSV 文件,您可以设置主题(浅色或深色)、更改单元格大小或每隔一行或一列添加阴影。

    4.8K30

    csv模块-python

    CSV模块式python的内置模块,用于读写CSV文件. testqq.csv文件内容: 序号姓名年龄1啊啊102宝宝153尺寸174等等195恩恩206方法21 序号 姓名 年龄 1 啊啊 10 2...宝宝 15 3 尺寸 17 4 等等 19 5 恩恩 20 6 方法 21 序号 姓名 年龄 1 啊啊 10 2 宝宝 15 3 尺寸 17 4 等等 19 5 恩恩 20 6 方法 21 一、从CSV...文件读取内容 使用CSV模块的reader函数读CSV文件代码: import  csv f =  open('testqq.csv','rb')reader  = csv.reader(f)for...文件写入内容 使用writer函数向csv文件写入内容 import  csv f =  open('testqq.csv','wb')writer  = csv.writer(f)writer.writerow...(['序号','姓名','年龄'])data =  ['aa','bb','cc']writer.writerow(data) 程序运行结果testqq.csv文件已经写入了aa bb cc内容。

    1.3K20

    CSV文件存储

    它比 Excel 文件更加简洁, XLS 文本是电子表格,它包含了文本、数值、公式和格式等内容,而 CSV 中不包含这些内容,就是特定字符分割的纯文本,结构简单清晰。...写入 这里先看一个最简单的例子: import csv with open('data.csv', 'w')as csvfile: writer = csv.writer(csvfile...import csv with open('data.csv', 'w', newline='')as csvfile: writer = csv.writer(csvfile)...另外,如果接触过 pandas 等库的话,可以调用 DataFrame 对象的 to_csv() 方法来将数据写入 CSV 文件中。 读取 我们同样可以使用 csv 库来读取 CSV 文件。...另外,如果接触过 pandas 的话,可以利用 read_csv() 方法将数据从 CSV 中读取出来,例如: import pandas as pd df = pd.read_csv('data.csv

    5.2K20

    python 实现读取csv数据,分类求和 再写进 csv

    这两天在测试过程中,遇到这样的问题: 数据量很大,一份csv文件的数据与另外一个文件的数据进行对比,但是csv中的文件数据量很大,并且进行统计 ,如果手动单个去对比,会很花时间,吃力不讨好,还容易出错。...直接上脚本 : import pandas as pd import csv df=pd.read_csv('D:\test\orderBook.csv') df_sum = df.groupby('AskPrice...')['AskQuantity'].sum() df_sum.to_csv('D:\test\orderBook2.csv') 然后运行得到: ?...补充知识:python处理csv文件(场景分类) 最近做一个关于场景分类的比赛,总共有20类,不到2万张图片,首先要做的就是把20类图片分到每个文件夹下。...数据,分类求和 再写进 csv就是小编分享给大家的全部内容了,希望能给大家一个参考。

    2.8K50
    领券