专栏首页Crossin的编程教室【Python 第33课】 处理文件中的数据

【Python 第33课】 处理文件中的数据

我们已经知道了如何读取和写入文件。有了这两个操作文件的方法,再加上对文件内容的处理,就能写一些小程序,解决不少日常的数据处理工作。

比如我现在拿到一份文档,里面有某个班级里所有学生的平时作业成绩。因为每个人交作业的次数不一样,所以成绩的数目也不同,没交作业的时候就没有分。我现在需要统计每个学生的平时作业总得分。

记得我小的时候,经常有同学被老师喊去做统计分数这种“苦力”。现在电脑普及了,再这么干就太弱了。用python,几行代码就可以搞定。

看一下我们的文档里的数据:

#-- scores.txt

刘备 23 35 44 47 51

关羽 60 77 68

张飞 97 99 89 91

诸葛亮 100

1.先把文件读进来:

f = file('scores.txt')

2.取得文件中的数据。因为每一行都是一条学生成绩的记录,所以用readlines,把每一行分开,便于之后的数据处理:

lines = f.readlines()

f.close()

提示:在程序中,经常使用print来查看数据的中间状态,可以便于你理解程序的运行。比如这里你可以print lines,看一下内容被存成了什么格式。

3.对每一条数据进行处理。按照空格,把姓名、每次的成绩分割开:

for line in lines:

data = line.split()

接下来的4、5两个步骤都是针对一条数据的处理,所以都是在for循环的内部。

4.整个程序最核心的部分到了。如何把一个学生的几次成绩合并,并保存起来呢?我的做法是:对于每一条数据,都新建一个字符串,把学生的名字和算好的总成绩保存进去。最后再把这些字符串一起保存到文件中:

sum = 0

for score in data[1:]:

sum += int(score)

result = '%s\t: %d\n' % (data[0], sum)

这里几个要注意的点:

对于每一行分割的数据,data[0]是姓名,data[1:]是所有成绩组成的列表。

每次循环中,sum都要先清零。

score是一个字符串,为了做计算,需要转成整数值int。

result中,我加了一个制表符\t和换行符\n,让输出的结果更好看些。

5.得到一个学生的总成绩后,把它添加到一个list中。

results.append(result)

results需要在循环之前初始化results = []

6.最后,全部成绩处理完毕后,把results中的内容保存至文件。因为results是一个字符串组成的list,这里我们直接用writelines方法:

output = file('result.txt', 'w')

output.writelines(results)

outpus.close()

大功告成,打开文件检验一下结果吧。

以下是完整程序,把其中print前面的注释符号去掉,可以查看关键步骤的数据状态。不过因为字符编码的问题,list的中文可能会显示为你看不懂的字符。

f = file('scores.txt')

lines = f.readlines()

#print lines

f.close()

results = []

for line in lines:

#print line

data = line.split()

#print data

sum = 0

for score in data[1:]:

sum += int(score)

result = '%s \t: %d\n' % (data[0], sum)

#print result

results.append(result)

#print results

output = file('result.txt', 'w')

output.writelines(results)

output.close()

面向零基础初学者的编程课

每天5分钟,轻松学编程

回复『 p 』查看课程目录

回复『 t 』查看习题列表

本文分享自微信公众号 - Crossin的编程教室(crossincode)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2013-07-10

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 【Python 第65课】pickle

    在之前的课程中,我们有讲到通过文件来保存、中转数据(参见第31、32、33课)。在使用文件存储时,通常需要对数据进行一些处理,按照一定的规范把数据整理成文本,再...

    Crossin先生
  • Python 送你一棵圣诞树

    有人要说了,圣诞节是耶稣诞生的日子,我又不信基督教,有啥好庆祝的。这你就有所不知了,Python 的诞生也跟圣诞节有关:1989 年,那是一个冬天,那年的第一场...

    Crossin先生
  • Python做量化|使用AlgoPlus接收期货实时行情

    金融领域也是 Python 的重要方向之一,我知道有一些读者就是冲着做量化交易才接触 Python 的。今天给大家分享一个使用 Python 的期货交易API。

    Crossin先生
  • 2.2 搜索就是所有

    刚刚情人节过去,也想来一篇数据分析的实例。别黑我,别恶心我。从网上找了一份2000W的数据,粗略处理后,导入MySql,试着看看MySql这2000W数据的效果...

    幽鸿
  • 【C语言笔记】函数指针作为结构体成员

    在C语言程序中,数据结构和算法是两个基本的元素。C语言的基本数据类型、结构体、数组和联合体是数据结构的代表;C语言中的函数则是算法的代表。只有将数据结构和算法有...

    正念君
  • BootstrapTable固定头和底部

    采用的bootstrapTable样式与js的版本是1.15.4,采用比较低的版本会在有滚动条的情况下,表格不对齐

    tianyawhl
  • 【前端统计图】echarts实现单条折线图

    祈澈菇凉
  • 【前端统计图】echarts实现简单柱状图项目地址下载:

    祈澈菇凉
  • Terraform语法入门

    HCL是Terraform的配置语言,它是HashiCorp发明的一种声明式语言,能够以更加简短和人性化的方式来描述资源。本文主要介绍HCL配置语言的基本语法及...

    oliverpei
  • 【干货】手把手教你搭建评分卡模型

    【前方高能】本篇文章是从零开始构造评分卡模型,各个环节都比较详细,故内容比较长,可能会占用你较长的时间,谢谢谅解。

    1480

扫码关注云+社区

领取腾讯云代金券