首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

python统计文件行数

需求: 需要统计一个文件的行数....讨论: 最简单的办法是把文件读入一个大的列表中,然后统计列表的长度.如果文件的路径是以参数的形式filepath传递的,那么只用一行代码就可以完成我们的需求了: count = len(open(filepath...open(thefilepath, 'rU')):     pass count += 1 另外一种处理大文件比较快的方法是统计文件中换行符的个数'\n '(或者包含'\n'的字串,如在windows...当 外部系统提供统计行数的方法时,你可以使用它们(通过os.popen),如unix的wc - l.当然,通过自己的程序来完成会更简单,快捷和通用.你可以假设大多数的文本文件都有合理的大小,所以把它们一次读入内存中处理是可行的...,而最慢的方法是统计换行符的个数.在实际中,假如不考虑处理那些好几百M的大文件,我总是会选中第一种最简单的方法.

2K20
您找到你想要的搜索结果了吗?
是的
没有找到

Linux 统计文件个数

统计 统计当前文件夹下文件的个数,包括子文件夹里的 ls -lR|grep "^-"|wc -l [zhou@localhost logs]$ ls -lR|grep "^-"|wc -l 73 统计文件夹下目录的个数...,包括子文件夹里的 ls -lR|grep "^d"|wc -l 统计当前文件夹下文件的个数 ls -l |grep "^-"|wc -l 统计当前文件夹下目录的个数 ls -l |grep "^d"|...wc -l 备注: 统计输出信息的行数 wc -l 将长列表输出信息过滤一部分,只保留一般文件,如果只保留目录就是 ^d grep "^-" 2.查找 查找文件大小大于50M的文件 find / -size...终端的打印结果输出到文本文件中 方法1:利用符号 > 和 >> 两者的区别在于 符号 ">" 代表重写要输出的文件 [zhou@localhost logs]$ pwd > /home/zhou/path.txt...[zhou@localhost logs]$ cat /home/zhou/path.txt /mydata/tomcat9/logs ">>"代表要追加要输出的文件,不改变原文件的内容 假设文件test1

2.9K20

python编写文件统计脚本

,以及自己要找的具体文件类型(例:以".py"结尾的文件),并读取每个文件的第一行(一般为注释说明,这样就能大致了解这个文件是干事什么的) 先编写二级目录文件统计脚本 代码如下: #文件统计 os.chdir...如何实现多级目录中文件统计呢,这里用函数的递归调用方式来实现 代码如下: #文件统计 def sfile(dir,layer=1): print(" "*(layer-1)+dir)...上图可以看到实现了多级目录中统计".py"结尾的文件,并打印出每个文件的第一行。  ...注:想统计整个盘符下的某种文件类型,命令提示符(cmd)需要管理员权限,不然会提示拒绝访问 !!!!...未解决问题:如何实现统计"F盘"中所有的jpg文件,但不显示(打印)目录中没有jpg文件的路径,只显示目录中有jpg文件的路径 本人脑袋要爆炸了,实在想不出,有想法的博友,给点意见

61210

linux下统计文件数目+linux统计指定时间的文件总数

如果ls -lR|grep "^-"|wc-l则可以连子目录下的文件一起统计。...grep ^- 这里将长列表输出信息过滤一部分,只保留一般文件,如果只保留目录就是 ^d  wc -l 统计输出信息的行数,因为已经过滤得只剩一般文件了,所以统计结果就是一般文件信息的行数,又由于一行信息对应一个文件...需要说明的是第二种方法会比第一种方法快很多,尤其是也统计子目录时。...linux统计指定时间的文件总数 由于工作原因,需要统计某目录下atime时间大于365天的文件,google搜索之后,发现find命令异常强大。...-atime +365 网上有答案; -exec:表示执行后面的命令; ls -l:略过; {} \; :表示前面find...找到的结果;  grep "^-": 过滤,只保留文件; wc -l: 统计数目

6K40

Linux统计文件夹下的文件数目

通过这三个命令的组合可以统计目录下文件文件夹的个数。...统计当前目录下文件的个数(不包括目录) $ ls -l | grep "^-" | wc -l 统计当前目录下文件的个数(包括子目录) $ ls -lR| grep "^-" | wc -l 查看某目录下文件夹...(目录)的个数(包括子目录) $ ls -lR | grep "^d" | wc -l 命令解析: ls -l 长列表输出该目录下文件信息(注意这里的文件是指目录、链接、设备文件等),每一行对应一个文件或目录...,ls -lR是列出所有文件,包括子目录。...grep "^-" 过滤ls的输出信息,只保留一般文件,只保留目录是grep "^d"。 wc -l 统计输出信息的行数,统计结果就是输出信息的行数,一行信息对应一个文件,所以就是文件的个数。

35.8K61

Linux统计文件夹下的文件数目

通过这三个命令的组合可以统计目录下文件文件夹的个数。...1、统计当前目录下文件的个数(不包括目录) $ ls -l | grep "^-" | wc -l 2、统计当前目录下文件的个数(包括子目录) $ ls -lR| grep "^-" | wc -l 3...、查看某目录下文件夹(目录)的个数(包括子目录) $ ls -lR | grep "^d" | wc -l image.png 命令解析: ls -l 长列表输出该目录下文件信息(注意这里的文件是指目录...、链接、设备文件等),每一行对应一个文件或目录,ls -lR是列出所有文件,包括子目录。...grep "^-" 过滤ls的输出信息,只保留一般文件,只保留目录是grep "^d"。 wc -l 统计输出信息的行数,统计结果就是输出信息的行数,一行信息对应一个文件,所以就是文件的个数。

3.3K20

统计文件中出现的单词次数

is the is world grace the kevin art the kevin the is kevin 统计kevin.txt文件中出现的单词次数 第一种方法:结合grep和awk编写shell...该操作块是在文件输入之前执行的,也就是不需要输入任何文件数据,也能执行该模块。 BEGIN模块常用于设置修改内置变量如(OFS,RS,FS等),为用户自定义的变量赋初始值或者打印标题信息等。...awk每接收文件的一行,然后执行相应的命令来处理。...END{print "the count is ",count}' /root/kevin.txt the count is 3 第四种方式:统计kevin.txt文件中的单词个数,并指定排名个数(...分为以下几步: 1)将文本文件以一行一个单词的形式显示出来; 2)将单词中的大写字母转化成小写字母,即Word和word认为一个单词; 3)对单词进行排序; 4)对排序好的单词列表统计每个单词出现的次数

3.7K111

Linux_文件查看、操作、统计命令

Linux_文件查看、操作、统计命令 文件的6种看法 (1)head :查看文件头10行 (2)tail:查看文件末尾10行 head / tail -n :查看文件的前/后 n 行,默认 10 行 例如...:head -n 2 Data/example.fq (3)cat:查看文本文件的内容,将文件所有内容输出到屏幕 常见参数 -A ## 打印所有内容,包括特殊字符,如制表符 -n ## 打印出所有行号,...#写完后,打印file1文件中的内容 其他 zcat:可以查看压缩的文本文件 tac:逆向查看 cat Data/example.gtf | head -n 3 # | 管道符。...keyword”进行关键词查询 #进入文件后再进行关键词的查询 n/N:上下浏览关键词 (5)more:多看一点 more:逐页查看,按空格翻页,按回车换行 文本统计 wc:统计文本 常见参数 -...l #统计行数 -w #统计字符串数 -c #统计字节数 cut:文本切割 常见参数: -d #指定分隔符,默认\t; -f #输出哪几列(字段fields) 例如:-f less -SN Data/example.gtf

1.7K00

Linux统计文件夹下文件文件夹的个数

统计文件夹下文件的个数 ls -l |grep "^-"|wc -l 统计文件夹下目录的个数 ls -l |grep "^d"|wc -l 统计文件夹下文件的个数,包括子文件夹里的 ls -lR...|grep "^-"|wc -l 如统计/home/han目录(包含子目录)下的所有js文件则: ls -lR /home/han|grep js|wc -l 或 ls -l "/home/han"|...grep "js"|wc -l 统计文件夹下目录的个数,包括子文件夹里的 ls -lR|grep "^d"|wc -l 说明: ls -lR 长列表输出该目录下文件信息(R代表子目录注意这里的文件,不同于一般的文件...,可能是目录、链接、设备文件等) grep "^-" 这里将长列表输出信息过滤一部分,只保留一般文件,如果只保留目录就是 ^d wc -l 统计输出信息的行数,因为已经过滤得只剩一般文件了,所以统计结果就是一般文件信息的行数...,又由于一行信息对应一个文件,所以也就是文件的个数。

5.4K60

Python读取文件后进行词频统计

2 问题 我们在使用python函数获取文件后,有时需要对该文件进行词频统计。 本文将通过对英文文件的读取和中文文件的读取进行讲解。...3 方法 一.统计英文文档中的词频 统计英文词频的第一步是分解并提取英文文章的单词,同一个单词会存在大小写不同形式,但计数却不能区分大小写,可通过lower()将字母变为小写。...全模式,返回一个列表类型 jieba.lcut_for_search(s) 搜索引擎模式,返回一个列表类型 jieba.add_word(w) 向分词词典中增加新词w 使用jieba分词之后,词频统计方法与英文词频统计方法类似...range(15): word,count = items[i] print("{0:5}".format(word,count)) 运行效果: 3 结语 本文对利用python读取文件后进行词频统计方法做了讲解...,通过读取文件,对jieba库也做了详细的介绍,在与文档类的工作时,jieba库是一个非常好用的第三方库,更多用法可以自行探索学习。

2.7K20
领券