首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

java:快速文件分割及合并

文件分割与合并是一个常见需求,比如:上传大文件时,可以先分割成小块,传到服务器后,再进行合并。...很多高大上的分布式文件系统(比如:google的GFS、taobao的TFS)里,也是按block为单位,对文件进行分割或合并。 看下基本思路: ?...如果有一个大文件,指定分割大小后(比如:按1M切割) step 1: 先根据原始文件大小、分割大小,算出最终分割的小文件数N step 2: 在磁盘上创建这N个小文件 step 3: 开多个线程(线程数...=分割文件数),每个线程里,利用RandomAccessFile的seek功能,将读取指针定位到原文件里每一段的段首位置,然后向后读取指定大小(即:分割块大小),最终写入对应的分割文件,因为多线程并行处理...,把关于文件读写的功能,全封装到FileUtil类: 1 package com.cnblogs.yjmyzz; 2 3 import java.io.*; 4 import java.util

3.6K100
您找到你想要的搜索结果了吗?
是的
没有找到

文件查看分割命令

#使用split命令将上面创建的date.file文件分割成大小为10KB的小文件: WeiyiGeek.split分割 #示例2.文件分割成多个带有字母的后缀文件,如果想用数字后缀可使用-d参数...:用于将一个大文件分割成小的碎片,并且将分割后的每个碎片保存成一个文件。...csplit命令是split的一个变体,他们的不同点: split只能够根据文件大小或行数来分割 csplit能够根据文件本身特点来分割文件。 语法参数: csplit [选项]......Chapter X"/ #把文件以字符串"Chapter X"为分界符,分成两部分 #承上例, 但分割文件时以"Chapter X"字符串往下4行才是分割点 $csplit textfile /...这听起来很酷,但是如果文件不能等分,则可能会失败 ---- 0x02 内容分割与排序 cut 命令 描述:用来显示行中的指定部分,删除文件中指定字段,在文件的每一行中提取片断,在 每个文件 FILE 的

3.8K20

Linux 大文件分割合并

分割文件 文件分割可以使用split命令,该即支持文本文件分割,又支持二进制文件分割;而合并文件可以使用cat命令。 1.1 文本文件分割 分割文本文件时,可以按文件大小分割,也可以按文本行数分割。...按文件大小分割文件大小分割文件时,需要以-C参数指定分割后的文件大小: $ split -C 100M large_file.txt stxt 如上所示,我们将大文件large_file.txt按100M...大小进行分割,并指定了分割文件前缀stxt;当不指定前缀时,split会自动对分割文件进行命名,一般会以x开头。...按行分割 文本文件还可以以行为单位进行分割,以行数进行分割时会忽略文件大小,并以-l参数指定分割文件的行数: $ split -l 1000 large_file.txt stxt 1.2 二进制文件分割...二进制文件分割类似于按大小分割文本文件,不同的是以-b参数来指定分割后的文件大小: $ split -b 100M data.bak sdata 2.

4.5K20

Python 分割合并大文件

有时候,我们需要把一个大文件发送给别人,但是限于传输通道的限制,比如邮箱附件大小的限制,或者网络状况不太好,需要将大文件分割成小文件,分多次发送,接收端再对这些小文件进行合并。...今天就来分享一下用 Python 分割合并大文件的方法。 思路及实现 如果是文本文件,可以按行数分割。无论是文本文件还是二进制文件,都可以按指定大小进行分割。...使用 Python 的文件读写功能就可以实现文件分割与合并,设置每个文件的大小,然后读取指定大小的字节就写入一个新文件,接收端依次读取小文件,把读取到的字节按序写入一个文件,就可以完成合并。.../output") split.bysize(size = 1024*1000*10) # 每个文件最多 10MB 执行之后,我们就可以在 output 文件夹里看到分割好的文件: 你也可以按照文件行数进行分割.../merge", outputfilename = "merged.rar") merge.merge() 执行之后就可以在 merge 目录内看到合并后的文件: 最后的话 本文分享了一个文件分割与合并的工具

95010

文件分割与重组技巧

简述 由于各种不同的问题,我们经常会遇到需要将一个大文件分割存储的问题。...比如github里单个文件大小一般不能超过100M、比如FAT32文件系统里单个文件大小不能超过4G,比如我们想把某一个数据文件分割存储和查看,比如对日志文件进行分割保存等等。...文件分割--split split命令用来将一个大文件分割成多个小文件,可以固定大小分割(常用于分割二进制文件),还可以固定行数分割(常用于分割文本文件)。...subdata-ac subdata-ae subdata-ag -l参数指定每个文件的行数,然后带分割的数据文件,以及分割后重新命名的文件前缀。...按大小分割 $ split -b 10M data subdata- -b参数指定用二进制分割,也就是指定文件大小,剩下的与按行分割类似。

80720

java字符串按照特定字符分割_java 字符串分割

问题描述: // 把字符串”192.168.1.1″按照小圆点进行分割分割成”192″,”168″,”1″,”1″四个字符串。...在正则表达式中表示匹配任意一个字符,经过转义之后,”.”才是本身的含义,才能得到正确的分割结果。下面主要探讨上述错误写法中得到的字符串组为什么大小为0。...下面是split函数源代码(java.util.regex.Pattern.split) public String[] split(CharSequence input, int limit) {...对于split函数而言,就是就是以任意字符为分隔符进行分割,那么“192.168.1.1”按照任意字符分割等价于“ccccccccccc”按照“c”进行分割,那么分割结果肯定都是空串。...split函数中最后的while循环会将分割之后的字符串组,从后往前清理空字符串,所以“.”在不转义的情况下,分割字符串得到的结果为空。

2.8K10

文件分割、命名脚本 - Python

日志文件分割、命名 工作中经常会收到测试同学、客户同学提供的日志文件,其中不乏几百M一G的也都有,毕竟压测一晚上产生的日志量还是很可观的,xDxD,因此不可避免的需要对日志进行分割,通常定位问题需要针对时间点...,因此最好对分割后的日志文件使用文件中日志的开始、结束时间点来命名,这样使用起来最为直观,下面给大家分享两个脚本,分别作分割、命名,希望能够给大家提供一点点帮助; 大文件分割 用法: python split_big_file.py...输入文件全路径名 输入期望的分割后每个小文件的行数 Just wait..../get_name_logfile.py '+dir_name) 文件按照开始、结束行时间戳重命名 用法: python get_name_logfile.py log.txt python get_name_logfile.py...logs 参数选择文件或者文件夹均可,如果是文件夹,则会针对文件夹中的每个文件做处理(不会递归到文件夹下文件夹中的文件哦); 代码如下: # -*- coding:utf-8 -*- import

77321

Linux 使用split命令分割文件

概述 split 命令可以将一个大文件分割成很多个小文件。在默认情况下将按照每1000行切割成一个小文件,默认前缀为 x。没有输入或输入为 - 时,从标准输入中读取。 2....实例 4.1 按行分割 xiaosi@ying:~/test/input$ split -6 a.txt 或者 xiaosi@ying:~/test/input$ split -l 6 a.txt 执行以上命令后...而在这些小文件中,每个文件都至多6行数据(最后一个文件有可能不满6行)。...xae xiaosi@ying:~/test/input$ cat a.txt | wc -l 28 xiaosi@ying:~/test/input$ cat xae | wc -l 4 4.2 按文件大小分割...xiaosi 52428800 4月 8 18:25 xac -rw-rw-r-- 1 xiaosi xiaosi 7713600 4月 8 18:25 xad 4.3 修改后缀 上述示例中,文件分割成多个带有字母的后缀文件

2.8K50

通过split命令分割文件

最后还是决定先把大文件分割成数个小文件,再用UltraEdit来查看这些文件。 使用split命令分割文件 在Linux下,切割和合并文件可以使用split和cat命令来实现。...假设现在有个6GB大小的文件test.log,这里简单介绍下几种分割的方式: 按大小分割文件 1 split -b 1000000000 test.log -b参数表示按字节大小进行分割,在数字后边要指定被分割文件名...这个命令表示按1000000000byte的大小进行分割,近似于1GB,大概是953MB的大小。对于这个6GB大小的文件test.log,会被分割成6个小文件。...如果你分割了非常多的小文件,当文件名到了xyz之后,会变成xzaaa、xzaab、xzaac、xzaad……所以不用担心小文件过多而导致文件重名什么的。...-number,上边的命令表示按照1000行一个小文件进行分割

1.7K10

Java分割字符串

java中按某个标识符分割字符串的方法如下: Scanner scanner = new Scanner(System.in); String source = scanner.next...= 0; i < sourceArray.length; i++) { System.out.println(sourceArray[i]); } 如果需要指定分割后的数量的话...Scanner scanner = new Scanner(System.in); String source = scanner.next(); // 最多分割出3个字符串...(不能得到正确结果)转义字符时,”*”,”+“时出错抛出异常,都必须在前面加必须得加”\”,如split(\|); 2、如果用”“作为分隔,就得写成这样:String.split(”\\”),因为在Java...”\“来表示”“的,字符串得写成这样:String Str=“a\b\c”; 转义字符,必须得加”\”; 3、如果在一个字符串中有多个分隔符,可以用”|“作为连字符,比如:String str=“Java

1.7K10
领券