前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Shell逐行读取文件的4种方法

Shell逐行读取文件的4种方法

原创
作者头像
用户1685462
修改2021-08-30 14:15:24
1.5K0
修改2021-08-30 14:15:24
举报
文章被收录于专栏:网站教程

在Linux中有很多方法逐行读取一个文件的方法,其中最常用的就是下面的脚本里的方法,而且是效率最高,使用最多的方法。为了给大家一个直观的感受,我们将通过生成一个大的文件的方式来检验各种方法的执行效率。

方法1:while循环中执行效率最高,最常用的方法。

代码如下:

function while_read_LINE_bottm(){ While read LINE do echo $LINE done  < $FILENAME }

注释:我习惯把这种方式叫做read釜底抽薪,因为这种方式在结束的时候需要执行文件,就好像是执行完的时候再把文件读进去一样。

方法2 : 重定向法;管道法: cat $FILENAME | while read LINE

代码如下:

Function While_read_LINE(){ cat $FILENAME | while read LINE do echo $LINE done }

注释:我只所有把这种方式叫做管道法,相比大家应该可以看出来了吧。当遇见管道的时候管道左边的命令的输出会作为管道右边命令的输入然后被输入出来。

方法3: 文件描述符法

代码如下:

Function while_read_line_fd(){ Exec 3<&0 Exec 0<$FILENAME While read LINE Do Echo $LINE Exec 0<&<3 }

注释: 这种方法分2步骤,第一,通过将所有内容重定向到文件描述符3来关闭文件描述符0.为此我们用了语法Exec 3<&0 。第二部将输入文件放送到文件描述符0,即标准输入。

方法4    for  循环。

代码如下:

function  for_in_file(){ For  i  in  `cat $FILENAME` do echo $i done }

注释:这种方式是通过for循环的方式来读取文件的内容相比大家很熟悉了,这里不多说。对各个方法进行测试,看那方法的执行效率最高。

首先我们用脚本(脚本见附件)生成一个70000行的文件,文件位置在/scripts/bigfile。然后通过下面的脚本来测试各个方法的执行效率,脚本很简单,不再解释。

代码如下:

#!/bin/bash FILENAME="$1" TIMEFILE="/tmp/loopfile.out" > $TIMEFILE SCRIPT=$(basename $0) function usage(){ echo -e "\nUSAGE: $SCRIPT file \n" exit 1 } function while_read_bottm(){ while read LINE do echo $LINE done < $FILENAME } function while_read_line(){ cat $FILENAME | while read LINE do echo $LINE done } function while_read_line_fd(){ exec 3<&0 exec 0< $FILENAME while read LINE do echo $LINE done exec 0<&3 } function for_in_file(){ for i in  `cat $FILENAME` do echo $i done } if [ $# -lt 1 ] ; then usage fi echo -e " \n starting file processing of each method\n" echo -e "method 1:" echo -e "function while_read_bottm" time while_read_bottm >> $TIMEFILE echo -e "\n" echo -e "method 2:" echo -e "function while_read_line " time while_read_line >> $TIMEFILE echo -e "\n" echo -e "method 3:" echo "function while_read_line_fd" time while_read_line_fd >>$TIMEFILE echo -e "\n" echo -e "method 4:" echo -e "function  for_in_file" time  for_in_file >> $TIMEFILE

执行脚本后: [root@localhost shell]# ./while /scripts/bigfile 脚本输出内容:

代码如下:

method 1: function while_read_bottm real    0m5.689s user    0m3.399s sys    0m1.588s method 2: function while_read_line real    0m11.612s user    0m4.031s sys    0m4.956s method 3: function while_read_line_fd real    0m5.853s user    0m3.536s sys    0m1.469s method 4: function  for_in_file real    0m5.153s user    0m3.335s sys    0m1.593s

下面我们对各个方法按照速度进行排序。

代码如下:

real    0m5.153s    method 4 (for 循环法) real    0m5.689s    method 1  (while 釜底抽薪法) real    0m5.853s    method 3    (标识符法) real    0m11.612s  method 2    (管道法)

由此可见在各个方法中,for语句效率最高,而在while循环中读写文件时,

代码如下:

while read LINE do echo $LINE done < $FILENAME

方式执行效率最高。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档