前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Linux文件随机抽取N行

Linux文件随机抽取N行

作者头像
生信编程日常
发布2020-05-26 22:01:18
8.2K0
发布2020-05-26 22:01:18
举报

有时候需要从大文件中随机抽取N行出来进行模拟,但是用python或者别的语言感觉不太方便,linux下直接分割感觉会更快捷。一般可以考虑以下的方法:

1. shuf
shuf -n100 filename # 从文件中随机选取100行
2. sort
sort -R filename | head -n100

-R参数是将文件随机顺序sort。

3. awk

awk是一个处理文件神器,可以像下面这么写(别的写法也可实现):

awk 'BEGIN{srand()} {print rand()"\t"$0}' filename | sort -nk 1 | head -n100 | awk -F '\t' '{print $2}' # 假如输出的内容只有一列

awk 'BEGIN{srand()} {print rand()"\t"$0}' filename 这一句话,strand()是设定随机数种子,必须写在BEGIN中才能正常运行;rand()是产生0到1之间的随机数。当只运行这一句话时输出:

第一列是产生的随机数。sort -nk 1是根据第一列排序,运行后输出:

因为种子不一样,所以结果与上图不同。

最后选取想要的行数,然后输出除了第一列的内容就可以了。

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. shuf
  • 2. sort
  • 3. awk
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档