我有一组GZIP文件,我正在通过HTTP访问这些文件。每个文件的大小可能高达几百MB。我需要从这些压缩文件中的文件中读取头几千字节(头)。
这是我目前的做法:
URL url = new URL("http://example.com/file123.gz");
DataInputStream ds = new DataInputStream(new GZIPInputStream(url.openStream()));
byte[] header = new byte[5760];
ds.readFully(header);我需要做的是从这个GZIP文件中的文件下载第5760字节,但我不希望Java下载整个文件(通常超过几MB)。
我的问题是- Java首先下载整个GZIP文件,然后解压缩它,还是只下载必要数量的数据来填充byte[5760]缓冲区?如何才能找到从HTTP服务器实际下载了多少数据?
发布于 2014-08-07 09:47:46
您不能指定实际下载了多少数据。
为您的请求提供服务的and服务器将打开请求的文件,并通过tcp连接发送整个内容(前面有http响应头)。
这意味着整个文件将被发送给您,除了在正确的时间关闭底层连接之外,您不能对它做任何事情,但是这样做并不容易,特别是不能可靠地工作。这意味着:从输入流中读取5760字节(此时,输入流包含的字节已经超过了那5760字节!)然后关闭流和连接-但这并不意味着在此期间收到了更多的数据
要想知道你实际收到了多少,你必须完整地阅读你的输入流,并检查它的长度。
https://stackoverflow.com/questions/25179022
复制相似问题