Python读取CSV和Excel

当下 ║ 2019.1.1

人生苦短,我们都要用Python,不定期更新Python相关知识点

知识点

CSV

逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。通常,所有记录都有完全相同的字段序列.

特点

读取出的数据一般为字符类型,如果是数字需要人为转换为数字

以行为单位读取数据

列之间以半角逗号或制表符为分隔,一般为半角逗号

一般为每行开头不空格,第一行是属性列,数据列之间以间隔符为间隔无空格,行之间无空行。

1普通方法读取:

with open("fileName.csv") as file:

for line in file:

print line

2用CSV标准库读取:

import csv

csv_reader = csv.reader(open("fileName.csv"))

for row in csv_reader:

print row

3用pandas读取:

import pandas as pd

data = pd.read_csv("fileName.csv")

print data

data = pd.read_table("fileName.csv",sep=",")

print data

Excel

python 读写 Excel文件

用xlrd和xlwt读写excel

首先下载安装xlrd和xlwt这两个库。

1、打开excel

readbook =xlrd.open_workbook(r'\test\canying.xlsx')

2、获取读入的文件的sheet

sheet = readbook.sheet_by_index(1)#索引的方式,从0开始

sheet = readbook.sheet_by_name('sheet2')#名字的方式

3、获取sheet的最大行数和列数

nrows = sheet.nrows#行

ncols = sheet.ncols#列

4、获取某个单元格的值

lng = table.cell(i,3).value#获取i行3列的表格值

lat = table.cell(i,4).value#获取i行4列的表格值

5、打开将写的表并添加sheet

writebook = xlwt.Workbook()#打开一个excel

sheet = writebook.add_sheet('test')#在打开的excel中添加一个sheet

6、将数据写入excel

sheet.write(i,0,result0)#写入excel,i行0列

sheet.write(i,1,result1)

7、保存

writebook.save('answer.xls')#一定要记得保存

详细代码

coding=utf-8

import xlrd

import xlwt

import datetime

import os

class excelProcess:

def \_\_init\_\_(self,keywordExcelFile,mainExcelFile):
    self.keywordExcelFile = keywordExcelFile
    self.mainExcelFile = mainExcelFile
def WriteLog(self, message,date):
    fileName = os.path.join(os.getcwd(),  date  +   '.txt')
    with open(fileName, 'a') as f:
        f.write(message)
def WriteSheetRow(self,sheet, rowValueList, rowIndex, isBold):
    i = 0
    style = xlwt.easyxf('font: bold 1')
    # style = xlwt.easyxf('font: bold 0, color red;')#红色字体
    # style2 = xlwt.easyxf('pattern: pattern solid, fore\_colour yellow; font: bold on;') # 设置Excel单元格的背景色为黄色,字体为粗体
    for svalue in rowValueList:
        if isBold:
            sheet.write(rowIndex, i, svalue, style)
        else:
            sheet.write(rowIndex, i, svalue)
        i = i + 1
def save\_Excel(self):
    wbk = xlwt.Workbook()
    sheet = wbk.add\_sheet('sheet1', cell\_overwrite\_ok=True)
    headList = ['IR\_SITENAME', 'IR\_AUTHORS', 'SY\_INFOTYPE', 'RID', 'IR\_URLTITLE','SY\_KEYWORDS',
                'IR\_URLNAME', 'IR\_URLTIME',
                'IR\_GROUPNAME', 'IR\_CHANNEL',
                'SY\_BB\_COMMON', 'summary', 'keyword'
                ]
    rowIndex = 0
    self.WriteSheetRow(sheet, headList, rowIndex, True)
    for i in range(1, 11):
        rowIndex = rowIndex + 1
        valueList = []
        for j in range(1, 14):
            valueList.append(j \* i)
        self.WriteSheetRow(sheet, valueList, rowIndex, False)
    fileName = os.path.join(os.getcwd(),'test.xlsx')
    wbk.save(fileName)

新的一年,祝大家元旦快乐,都能成为Python大神!!!

本文分享自微信公众号 - Python编程和深度学习(Python_Deeplearning)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-01-01

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • FocusNet:解决小器官难分割问题(MICCAI 2019)

    今天分享一篇发表在MICCAI 2019上的关于医学影像处理中小器官分割的论文:FocusNet: Imbalanced Large and Small Org...

    Minerva
  • 项目笔记 LUNA16-DeepLung:(二)肺结节检测

    在前面进行了肺结节数据的预处理之后,接下来开始进入肺结节检测环节。首先附上该项目的Github链接:https://github.com/Minerva-J/D...

    Minerva
  • 目标检测系列之四(YOLO V1、YOLO V2、YOLO V3)

    前面文章我们介绍过两阶段Two-Stage算法(目标检测系列之二(R-CNN、Fast R-CNN、Faster R-CNN、Mask R-CNN)),先产生候...

    Minerva
  • 接口测试框架——第二篇

    用户2149234
  • Python读取Excel文件sheet名性能优化

    直接使用pandas读取整个Excel文件,再从中取列名。这种场景对于小的Excel文件还适用,但数据量上升到10M+时,取个sheet name要26s之久。...

    Ewdager
  • 强网杯线下Web签到和CVE-2019-9081

    强网杯有一个web题目 序列化getshell 算是签到题目laravel-5.7rce首先先搭建环境

    用户5878089
  • iOS iOS与html进行交互

    实现的 效果就是上边那样:首先通过webview 进行网络请求 然后进行显示。          然后点击下一页的按钮 通过js的响应显示另一个网页      ...

    用户1219438
  • 当selenium被识别爬虫后

    因为某站发版,在修一个以前的项目,用Selenium驱动Chrome来做的,然后在某页面需要点击,无论怎么做都失效,我尝试过如下方法:

    小歪
  • python中paramiko的sftp

    返回一个已给定的路径中包含文件或目录的列表。 它不包含特别的条目“.”“..”即使他们存在于文件夹中。该方法为了尽可能接近的映射os.listdir。对于一个完...

    py3study
  • 计算机的基本组成

    严格来讲计算机从诞生到现在经历了很多阶段,已经发展成为一种自动地、高速地、精确地进行信息处理的电子设备,也是20世纪的重大发明之一。

    刘盼

扫码关注云+社区

领取腾讯云代金券