前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >HDFS之自定义上传、下载文件的大小

HDFS之自定义上传、下载文件的大小

作者头像
孙晨c
发布2020-07-10 10:19:20
4820
发布2020-07-10 10:19:20
举报
文章被收录于专栏:无题~无题~

在之前的总结中,对文件的上传和下载都是默认的全部大小。

那么,如何做到上传文件时,只上传这个文件的一部分或只下载文件的某一部分?

官方实现的代码:

代码语言:javascript
复制
	  InputStream in=null;
      OutputStream out = null;
      try {
        in = srcFS.open(src);
        out = dstFS.create(dst, overwrite);
        IOUtils.copyBytes(in, out, conf, true);
      } catch (IOException e) {
        IOUtils.closeStream(out);
        IOUtils.closeStream(in);
        throw e;
      } 

可以看到,变量in就是输入流,即要上传的文件;变量out就是输入流,先目标文件系统写入。 变量srcFS:目标文件所在路径,调用了open()方法便生成了输入流;变量dstFS:写入路径,调用create()方法便生成了输出流。然后使用copyBytes()方法即流拷贝,并最后传入参数true,表示方法结束后关闭输入输出流。但是使用流拷贝也是全部的下载上传,下面我参照官方的写法可以实现自定义大小上传和下载!


首先对一些变量名的解释: fs:HDFS的文件系统 localFs:本地的文件系统

代码语言:javascript
复制
public class TestCustomUploadAndDownload {

   private FileSystem fs;
   private FileSystem localFs;
   private Configuration conf = new Configuration();
	
	@Before
	public void init() throws IOException, URISyntaxException {
		//创建一个客户端对象
		 fs=FileSystem.get(new URI("hdfs://hadoop101:9000"),conf);
		 localFs=FileSystem.get(new Configuration());
	}
	
	@After
	public void close() throws IOException {
		if (fs !=null) {
			fs.close();
		}
	}
	
	// 从本地文件系统上传文件到HDFS,只上传文件的前10M
	@Test
	public void testCustomUpload() throws Exception {
		
		//提供两个Path,和两个FileSystem
		Path src=new Path("e:/悲惨世界(英文版).txt");
		Path dest=new Path("/悲惨世界(英文版)10M.txt");
		
		// 使用本地文件系统中获取的输入流读取本地文件
		FSDataInputStream is = localFs.open(src);
		
		// 使用HDFS的分布式文件系统中获取的输出流,向dest路径写入数据
		FSDataOutputStream os = fs.create(dest, true);
		
		// 1k
		byte [] buffer=new byte[1024];
		
		// 流中数据的拷贝
		for (int i = 0; i < 1024 * 10; i++) {	
			is.read(buffer);
			os.write(buffer);
		}
		
		//关流
		 IOUtils.closeStream(is);
	     IOUtils.closeStream(os);
	}
	
}
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2020-07-08 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
云 HDFS
云 HDFS(Cloud HDFS,CHDFS)为您提供标准 HDFS 访问协议,您无需更改现有代码,即可使用高可用、高可靠、多维度安全、分层命名空间的分布式文件系统。 只需几分钟,您就可以在云端创建和挂载 CHDFS,来实现您大数据存储需求。随着业务需求的变化,您可以实时扩展或缩减存储资源,CHDFS 存储空间无上限,满足您海量大数据存储与分析业务需求。此外,通过 CHDFS,您可以实现计算与存储分离,极大发挥计算资源灵活性,同时实现存储数据永久保存,降低您大数据分析资源成本。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档