linux大文件分割

linux下文件合并是用cat来实现,那么将大文件分割成小文件怎么办呢? 我们可以用split命令来实现,既可以指定按行分割也能指定按大小分割,非常方便实用。

  1. 指定行数分割
# 格式为: split [OPTION] ... [FILE] [PREFIX]
# 比如: 
split -l 5 large.txt test_line_

以一个名为large.txt的文件为例,里面内容为1-10十行十个数字,运行上边代码可以得到两个文件: test_line_aa和test_line_ab,其中各有五行。最后test_line_指定了新文件的前缀,如果不给的话,那么split会自动分配一个前缀。常用x开头。

  1. 指定大小分割
split -b 10k large.txt test_size_

以上分割的时候后缀是以aa, ab等字母结尾,而用数字结尾会比较直观。这可以用其中的-d和-a参数进行调整。-d是指系数是数字而不是默认的字母,-a是指后边有几位数(如-a 3 指的文件后缀数字有三位)。

split -l 5 large.txt -d -a 2 test_line_

此处需要注意,MacOS中的split参数更少,比如没有-d参数,这么写会提示报错。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • ggplot2循环出图

    在用ggplot画图的过程中,我们常常希望能够循环某个变量同时画很多图。如我们的数据是testdata

    生信编程日常
  • awk常用命令

    awk在处理文件的时候,常常比编写脚本更加方便,处理速度也更快,下边总结了一些awk的常用用法。

    生信编程日常
  • RNAseq下游分析--edgeR +cluserprofiler

    RNAseq分析可以用hisat2+samtools+stringtie得到表达矩阵,后面可以通过edgeR + clusterprofiler分析。

    生信编程日常
  • Redis中的集合类型是怎么实现的?

    本文是《Redis内部数据结构详解》系列的第七篇。在本文中,我们围绕一个Redis的内部数据结构——intset展开讨论。(注:后台发送Redis可以获得全部R...

    Leetcode名企之路
  • 墨西哥前总统支持区块链

    在世界各地,区块链已经开始获得主流的欢迎。企业将其潜力视为一种安全可靠的信息安全和保密方式。甚至很多国家也已经开始推广区块链,以制止政治腐败(或至少减少腐败)。

    金融科技先驱者
  • Django进阶-9-ORM分组与聚合查询

    prefetch_related:不做连表,多次单表查询外键表 ,去重之后显示, 2次单表查询(有几个外键做几次1+N次单表查询)

    小团子
  • Python+matplotlib绘制柱状图并设置坐标轴有效刻度

    问题描述:在使用matplotlib绘图时,一般会自动设置坐标轴刻度。很多时候,这个自动设置并不合适,用户更希望绘制结果的坐标轴上只显示有效刻度,也就是只显示有...

    Python小屋屋主
  • AngularJS 使用ngOption实现下拉列表

    最近使用到了ngOption实现下拉选择列表,由于需要实现分组等功能,百度了下没有太好的文章,就百度到一篇英文的帖子,按照其中的代码很顺利的搞定了。 本篇根...

    用户1154259
  • Linux 流量监控工具 – iftop(安装、相关参数说明)

    Zip
  • 区块链2.0-从比特币跳水说起

    Rainbond开源

扫码关注云+社区

领取腾讯云代金券