腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
spark-xml
与
gzip
输入
文件
、
、
当我试图加载带有
spark-xml
输入
格式的get
文件
时,我总是得到一个空的dataframe。当加载
gzip
文件
与
文本
输入
格式,它都可以正常工作。我做错了什么吗?还是
spark-xml
不支持这一点?
浏览 2
提问于2016-08-23
得票数 0
1
回答
在Hadoop的上下文中,压缩编解码器的可拆分性意味着什么?
、
、
我的第一个猜测是,某些编解码器将元数据作为头/拖车添加到压缩
文件
中,这意味着如果将压缩
文件
拆分为多个HDFS块进行存储,则除非将其所有拆分合并在一起,否则就没有任何用处。如果是这样的话,如何将不可拆分的
文件
的分块(块)发送给mappers以
输入
到MR应用程序? 我知道hadoop确实支持
gzip
(不可拆分的编解码器),但我并不完全理解它是如何支持的。
浏览 2
提问于2017-05-11
得票数 2
回答已采纳
2
回答
gzip
压缩函数的单一测试?
、
、
给定一个
gzip
规范的实现,如何测试它是否按照规范进行压缩,即一个有效的
gzip
文件
? 我的么正测试压缩一个
输入
,然后将其解压缩,将
输入
与
解压缩后的输出进行比较。我认为这不足以保证它满足规范。谁知道测试
gzip
压缩函数的有效策略?
浏览 2
提问于2013-02-05
得票数 0
回答已采纳
1
回答
Zlib解压缩函数复制而不是解压缩
、
、
fwrite(buffer, 1, num_read, outfile); gzclose(fi);} 这段代码导致复制我提供给它的任何
文件
浏览 2
提问于2016-04-16
得票数 0
1
回答
使用spark删除XML中没有特定值的节点
、
、
如何删除XML输出中没有Zcode=XYZ的节点?SQL输出为: [[00000016,, 04,, XYZ], [00000016,, 04,,]] 使用JAXB逻辑生成XML的代码: var abclist: Seq[Row] = x.getAs[Row]("TVchannels").asInstanceOf[Seq[Row]]if (abclist != null) { abcobj.setC
浏览 14
提问于2020-07-22
得票数 0
3
回答
从STDIN读取数据时压缩
文件
、
、
在Linux上从标准
输入
读取数据时,是否可以压缩(创建压缩存档)数据?
浏览 1
提问于2009-11-19
得票数 140
回答已采纳
2
回答
gzip
表单
输入
文件
、
、
、
我上传表单的主要用途是csv
文件
。我已经使用pako来压缩我的json (在请求url中)。 $.each(obj.files, function(j, file) { })Edit1:我已经设法(我想)用pako压缩了这些
文件
,但是有一个问题--异
浏览 0
提问于2015-09-28
得票数 1
4
回答
如何将多行linux命令转换为一行命令
、
、
、
R > ${db}-$(date +%m-%d-%y).sql
gzip
浏览 0
提问于2011-10-31
得票数 2
回答已采纳
1
回答
gzip
-d和zcat的区别
、
、
我想知道使用
gzip
-d和zcat进行解压缩时有什么区别。 有时,当我尝试
gzip
-d时,它会说未知的后缀--忽略。然而,zcat工作得很完美。
浏览 0
提问于2020-02-14
得票数 1
回答已采纳
2
回答
破折号的意思是什么?
、
mongodump -db somedb --collection somecollection --out - |
gzip
> dump.gz 上图中的破折号是什么意思?我好像和隧道有关。
浏览 3
提问于2015-12-16
得票数 0
回答已采纳
1
回答
在AWS Elastic Map Reduce中禁用
Gzip
输入
解压缩
、
、
、
、
我正在对压缩的.arc
文件
运行MapReduce任务。
与
这个类似,我遇到了一些困难,因为
Gzip
解压是自动运行的(因为
文件
有.gz扩展名),但是它导致了换行符/回车符按照Unix
文件
编码呈现为换行符的问题。这使得
输入
完全不可读,因为它依赖于
文件
中嵌入的特定字符数。我正在尝试禁用
Gzip
解压,这样我就可以在我的映射器中正确地进行解压。有没有办法防止
Gzip
对我的
输入
进行解压缩? 谢谢,-Geoff
浏览 0
提问于2012-03-28
得票数 2
回答已采纳
1
回答
PHP中的GZipStream
、
、
、
我可以使用php压缩和压缩,但问题是,php的zip
文件
和c#的zip
文件
都是不同的。我想要和c#完全一样的输出。 }我在PHP中尝试的是同样的东西,为此我使用了gzcompress函数,然后在压缩
文件
内容之后,我使用ZipArchive来压缩
文件
。
浏览 2
提问于2017-11-25
得票数 2
4
回答
随机访问
gzip
流
、
、
、
、
我希望能够随机访问gzipped
文件
。我可以对其进行一些预处理(例如,构建某种索引),前提是预处理的结果要比
文件
本身小得多。 用1Mb块重新压缩
文件
,并按照上面的步骤进行。这样做的缺点是将所需的磁盘空间加倍。编写一个简单的
gzip
格式解析器,
浏览 11
提问于2010-03-26
得票数 13
回答已采纳
1
回答
在python中压缩csv
文件
、
、
、
我尝试使用
gzip
压缩csv
文件
,但返回给变量的路径为空。zip_file = subprocess.check_output(["
gzip
", "-f", file_name]) print zip_file
浏览 12
提问于2020-03-06
得票数 0
1
回答
有确定性压缩算法吗?
是否有任何确定性压缩算法--也就是说,给定相同的
输入
,总是产生相同输出的算法? 据我所知,所有广泛使用的压缩算法都是“自适应的”,并将根据它们目前使用的任何启发式来改变它们的输出。
浏览 0
提问于2015-08-18
得票数 -2
1
回答
如何检查STDIO流是否被压缩,从而将其压缩到相同的流中。
、
、
、
、
我最初的想法是:但是,这会导致第二个枪支拉链(
gzip
: stdin: unexpected end of file)出现空的stdin。我怀疑流只能读取一次,而且mimetype已经完成了它,从而导致了zcat的空
输入
浏览 4
提问于2022-01-18
得票数 0
回答已采纳
1
回答
在Spark DataFrame SQL中获取不带路径的
文件
名
、
、
我有一个Spark Dataframe,它通过
spark-xml
包含来自已解析的XML
文件
夹的数据。我想添加一个包含源
文件
的列,这可以通过input_file_name()函数轻松完成。问题是这会返回整个路径,而我只需要
文件
名。因此,我尝试在spark SQL中注册一个UDF,它提取
文件
名,但最后得到一个空列。这个函数可以工作,但显然它得到了空值作为
输入
,我不明白为什么。编辑:示例 如果我通过df.selectExpr('input_file_name()')选择fi
浏览 0
提问于2016-11-10
得票数 3
3
回答
控制gziped日志
、
、
Gzip
似乎没有提供任何附加或连接选项,但也许我错过了一些明显的选项。这个问题表明,直壳级联“工作”,因为档案可以解压缩,但
gzip
-l不工作似乎有点不可靠。 或者,也许这仍然是一种糟糕的做事方式。
浏览 0
提问于2009-08-19
得票数 1
回答已采纳
1
回答
需要解决方案来使用通配符来存档一个
文件
夹,不包括所有的.log和.err
文件
、
、
、
我希望将所有
文件
和
文件
夹存档在/app/jboss下,而不包括所有.log和.err
文件
。/app/jboss下的目录结构过于庞大和复杂。 因此,应该排除以下几个示例
文件
。[root@myhost moht_bkp]# find /app/jboss -not -name "*.log*" | cpio -o |
gzip
> /app/moht_bkp/test.gz
浏览 0
提问于2020-07-18
得票数 -2
回答已采纳
1
回答
在Hadoop中,如何将整个
文件
作为mapper的
输入
?
、
、
最近一位面试官问我这个问题:他说这是错误的。
浏览 1
提问于2014-02-04
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
腾讯会议
活动推荐
运营活动
广告
关闭
领券