学习
实践
活动
专区
工具
TVP
写文章

python 实现读取csv数据,分类求和 再写进 csv

这两天在测试过程中,遇到这样的问题: 数据量很大,一份csv文件的数据与另外一个文件的数据进行对比,但是csv中的文件数据量很大,并且进行统计 ,如果手动单个去对比,会很花时间,吃力不讨好,还容易出错。 比如说,这样的数据 ? 需要对AskPrice值相同对应的AskQuantity 统计出来。 直接上脚本 : import pandas as pd import csv df=pd.read_csv('D:\test\orderBook.csv') df_sum = df.groupby('AskPrice 这对于大数据量的处理特别方便。 补充知识:python处理csv文件(场景分类) 最近做一个关于场景分类的比赛,总共有20类,不到2万张图片,首先要做的就是把20类图片分到每个文件夹下。 数据,分类求和 再写进 csv就是小编分享给大家的全部内容了,希望能给大家一个参考。

92750
  • 广告
    关闭

    【玩转 GPU】有奖征文

    精美礼品等你拿!

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    【爬虫】(五)数据存储之CSV

    一个完整的(大)数据处理可以分为这几个阶段: 数据收集 数据存储 数据建模 数据分析 数据变现。 Holi的项目进度,已经从入门到处理了。 第一步的数据收集基本已经完成。 现在是第二步的数据存储。 讲道理,不懂点前端知识还真不好下手。 看到一堆标签也是很烦的,还好这些东西就想剥洋葱一样,一层一层剥开。 CSV( Comma-Separated Values,逗号分隔值)是存储表格数据的常用文件格式。 Microsoft Excel 和很多应用都支持 CSV 格式,因为它很简洁。 Python 的 csv 库可以非常简单地修改 CSV 文件,甚至从零开始创建一个 CSV 文件: import csv csvFile = open(".. /files/test.csv", 'w+') try: writer = csv.writer(csvFile) writer.writerow(('number', 'number plus 2

    24210

    python 数据分析基础 day5-读写csv文件基础python读写csv文件通过pandas模块读写csv文件通过csv模块读写csv文件

    基础python读写csv文件 读写单个CSV 以下为通过基础python读取CSV文件的代码,请注意,若字段中的值包含有","且该值没有被引号括起来,则无法通过以下的简单代码获取准确的数据。 代码如下: import os import glob inputPath="读取csv文件的路径" outputFile="写入数据csv文件名" firstFile=True for file in “写入数据csv文件名” df=pd.read_csv(inputFile) df.to_csv(outputFile) 请注意,若字段中的值包含有","且该值没有被引号括起来,则无法通过以下的简单代码获取准确的数据 读取多个csv文件并写入至一个csv文件 import os import glob import pandas as pd i nputPath="读取csv文件的路径" outputFile="写入数据的 (outputFile) 通过csv模块读写csv文件 读写单个CSV文件 代码如下: import csv inputFile="要读取的文件名" outputFile=“写入数据csv文件名” with

    1.2K60

    Python使用csv模块读写csv文件

    纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据csv可以存储各种各样的数据,不过,通常来说,比较适合存储有相同字段或表头的一批数据,这些数据可以展示成表格。 可以使用excel开启csv文件,打开后看到的数据以excel表格的方式进行展示。 现在我们就开始使用csv数据写入csv文件,然后将数据csv中读取出来使用。 ? : 1.我们先将需要保存的数据解析好,保存成固定的数据类型(保存成列表,元组,字典都可以,根据具体场景来选择) 2.我们将保存数据csv文件的代码封装成一个函数,方便重用。 二、从csv文件中读取数据 input_file_name = 'csv_file.csv' def read_csv(input_file_name): """ 读取csv文件数据 这样,将数据写入csv和从csv中读取数据就完成了,使用过程是非常简单的。

    51030

    php 处理大数据导出csv文件

    最近公司要用到客户导入导出,导入由于是要给客户用户,需要下载报表,所以导入采用phpexecl来处理表格,说实话,小量数据还可以接受,数据一上千,上万,机器配置性能不好,直接挂的节奏,特别涉及到多表数据查询 第一,不要在循环中使用sql,不要一条条导数据,要想办法最后拼装成一条sql执行插入,你想下,你要导入1万条数据,你执行1万条sql和1条sql的区别是很大的。 今天主要说的是导出,如果你要导出大量数据,业务逻辑复杂的话,建议csv导出,缺点是没有样式,不能设置行高。等设置,好处,快,快,快。 使用php内置函数fputcsv()函数 //处理csv $fileName = "拼团订单明细"; $header = [ '拼团主单号 * @param array $data 数据 * @param array $headers csv标题+数据 * @param array $specHeaders

    73910

    机器学习Python实践》——数据导入(CSV

    一、CSV 逗号分隔值(逗号分隔值,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。 所以,如果单纯的只是存储文本格式的数据,可以直接选择使用CSV文件,读写方便,易于实现,数据可以表格化展示,这就是优点! 当CSV文件被读入后,可以利用这些数据生成一个Numpy数组,用来训练算法模型。 from csv import readerimport numpy as npfilename='pima_data.csv' #这个文件中所有数据都是数字,并且数据中不包含文件头。 delimiter=',')print(data.shape) (3)采用Pandas导入CSV文件 - 机器学习项目中常用来做数据清洗与数据准备工作。

    72620

    Python数据持久化-csv、excel篇

    最广泛的应用是在程序之间转移表格数据,而这些程序本身是不兼容的格式上进行操作的。因为大量程序都支持CSV变体,至少是作为一个可选择的输入/输出格式。 例如,一个用户可以需要交换信息,从一个私有格式存储数据数据库程序,得到一个数据格式完全不同的电子表格。 最有可能的情况是,该数据库程序被导出数据为“CSV”,然后被导出的CSV文件可以被电子表格程序导入。 “CSV”并不是一种单一的、定义明确的格式。 用csv.reader(file)产生一个reader用来读文件,reader是一个可迭代对象,数据类型为csv.reader 用csv.writer(file)产生一个writer用来写文件,reader 是一个可迭代对象,数据类型为csv.writer Python操作Excel 1.利用xlrd模块读取Excel 运行代码的py文件所在的文件夹需要有某公司贸易数据.xlsx这个文件, 此文件下载链接

    64931

    Android 读取csv格式数据文件

    前言 什么是csv文件呢?百度百科上说 CSV是逗号分隔值文件格式,也有说是电子表格的,既然是电子表格,那么就可以用Excel打开,那为什么要在Android中来读取这个.csv格式的文件呢? 因为现在主流数据格式是采用的JSON,但是另一种就是.csv格式的数据,这种数据通常由数据库直接提供,进行读取。下面来看看简单的使用吧 正文 首先还是先来创建一个项目,名为ReadCSV ? 然后打开刚才解压后的文件夹,把iso3166.csv复制到这个新建的文件夹下。 ? 可以看到这个时候你的编译器已经可以正常打开.csv格式文件了,然后这个文件中的第一行到第四行都删掉,因为都是没有用的数据, ? 实际上是并没有出现,但是你会发现第一行的数据没了,天杀的AS居然偷我数据

    1.3K30

    爬虫数据的json转为csv文件

    需求:我们之前通过接口爬虫 爬取一些数据, 这些数据都是Json格式的,为了方便我们的甲方使用 所以需要把这些数据转为csv 方便他们使用(例如在表单里面搜索,超链接跳转等等) 直接上代码吧: 在转换之前 我们需要对爬取的源数据进行一次过滤 用到我们的node的fs独写文件模块工具 const fs = require("fs"); const data = require(". csv的准备了 下面是我们转json转csv的代码: 代码有点多,下面的方法是直接从别人封装好的拿过来的 <! clickDownload(csvJson, downName, title, key);         });     };     //csv下载文件名,用户拼接     //csv下载      CSV) return;           this.SaveAs(fileName, CSV);         },         SaveAs: function (fileName, csvData

    24620

    CSV文件

    CSV文件:Comma-Separated Values,中文叫,逗号分隔值或者字符分割值,其文件以纯文本的形式存储表格数据。该文件是一个字符序列,可以由任意数目的记录组成,记录间以某种换行符分割。 在爬虫中,可以把数据写入CSV文件,示例如下:import csv #需要导入库with open('data.csv','w') as fp: writer = csv.writer(fp)#先传入文件句柄 如果想修改列与列之间的分隔符,传入delimiter参数:import csv #需要导入库with open('data.csv','w') as fp: writer = csv.writer 也可以先写标题,在写数据:注意:数据是一个列表,并且用writerows()方法? 一般情况下,爬虫的数据以字典居多:import csvwith open('data.csv','w') as fp: fieldnames = ['id','name','age'] #先定义字典里的

    83820

    关注

    腾讯云开发者公众号
    10元无门槛代金券
    洞察腾讯核心技术
    剖析业界实践案例
    腾讯云开发者公众号二维码

    相关产品

    • 腾讯云图数据可视化

      腾讯云图数据可视化

      腾讯云图 (TCV)是一站式数据可视化展示平台,旨在帮助用户快速通过可视化图表展示海量数据,10 分钟零门槛打造出专业大屏数据展示。精心预设多种行业模板,极致展示数据魅力。采用拖拽式自由布局,无需编码,全图形化编辑,快速可视化制作……

    相关资讯

    热门标签

    活动推荐

    扫码关注腾讯云开发者

    领取腾讯云代金券