腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如
何在
HDFS
上
复制
拼图
文件
并
覆盖
旧
文件
、
、
我的问题是,假设我们在
HDFS
上有两个
拼图
文件
:file1.parket和file2.parket,它们位于不同的路径中,我想
复制
file1.parket来替换file2.parquet。我使用了命令
hdfs
dfs -cp -f /path1/file1.parquet /path2/file2.parqet,没有抛出错误,但是file2.parquet根本没有改变。我必须先删除file2.parket,然后再
复制
file1.parquet。 有
浏览 11
提问于2020-06-04
得票数 2
2
回答
覆盖
拼图
文件
在spark中抛出异常
、
、
、
我正在尝试从
hdfs
位置读取
拼图
文件
,做一些转换
并
覆盖
相同位置的
文件
。我必须在相同的位置
覆盖
文件
,因为我必须多次运行相同的代码。下面是我写的代码 val df = spark.read.option("header", "true").option("inferSchema", "true").parquet("
hdfs
://
浏览 0
提问于2018-09-04
得票数 1
1
回答
更改
拼图
文件
的模式?
、
我的
拼图
文件
的当前模式是:org.apache.spark.sql.types.StructType = StructField(route,StringType,true), StructField(wgt,StringType,true))org.apache.spark.sql.types.StructType= StructField(route,StringType,true), Struct
浏览 11
提问于2021-06-02
得票数 0
1
回答
Spark无法读取Hadoop 3中的擦除编码
拼图
文件
、
、
、
我使用Intel ISA-L库在RHEL 6.7 linux机器
上
构建了Hadoop 3.2.0。此外,还在Hadoop安装中启用了本地库支持。我已经在这个测试集群
上
使用"haoop fs - copyFromLocal“和RS-6-3-1024k编码器策略
复制
了一些
拼图
格式的
文件
。然而,当我尝试使用Spark 2.4.3读取这些
拼图
文件
时,我得到了下面的异常。请注意,我能够使用hadoop命令、
HDFS
web界面等将这些
文件</e
浏览 3
提问于2019-08-14
得票数 2
1
回答
使用Parquet
文件
格式为方案数据创建配置单元(0.10)表
、
、
、
、
我成功地使用avro Tools ReflectData创建了Avro schema,
并
使用ReflectDatumWriter将数据写出avro
文件
。在Hive中,我能够创建一个表,
并
使用 ('avro.schema.url'='
hdfs
:///schema.avsc');假设我完成了该任务,并在拼接
文件
中具有相同的数据。如
何在
浏览 1
提问于2014-10-15
得票数 0
1
回答
以分布式模式部署Hadoop程序
我已经在Hadoop单机模式下运行
并
测试了它。有谁能指导我怎么做吗?
浏览 1
提问于2015-07-17
得票数 0
2
回答
如
何在
Spark
上
删除
拼图
文件
?
、
、
我已经使用DataFrame.saveAsParquet()命令在Spark
上
保存了一个
拼图
文件
。 如何通过python代码删除/移除此
文件
?
浏览 2
提问于2016-06-03
得票数 3
回答已采纳
1
回答
将数据从
HDFS
/S3端口到本地
文件
系统并在Java中加载
、
、
、
、
我有一个在EMr集群
上
运行的Spark作业,它将一个DataFrame写到
HDFS
(然后是s3-dist-cp-ed到S3)。数据大小不大(另存为parquet时为2 GB )。然后将S3中的这些数据
复制
到本地
文件
系统(运行Linux的EC2实例),然后加载到Java应用程序中。原来我不能有parquet格式的数据,因为parquet是为
HDFS
设计的,不能在本地
文件
系统中使用(如果我错了,请告诉我如
何在
本地
文件
系统
上
读取
拼
浏览 10
提问于2018-07-20
得票数 0
2
回答
如何使用Spark Streaming更新
拼图
文件
?
、
、
我正在从Kafka获取实时数据,
并
使用Spark处理这些数据。因为这个表需要频繁更新,所以需要花费很多时间。
浏览 18
提问于2019-11-03
得票数 0
2
回答
更改
HDFS
中现有
文件
的
复制
、
、
、
、
但
复制
因子保持不变 有没有人可以建议我如何更改现有
文件
的
复制
因子?
浏览 48
提问于2018-03-20
得票数 1
回答已采纳
1
回答
如
何在
hadoop中的namenodes之间切换?
、
、
伪码集群:现在我需要修改一些/conf
文件
。我将更改配置
文件
,并将名称节点格式化为"Root2“,使其生效。如果我浏览
HDFS
,它将是空的(这意味着它将不包含先前为“Root1
浏览 2
提问于2012-03-12
得票数 0
3
回答
使用大量数据集时,性能会非常慢
、
我在
HDFS
中有一个小的
拼图
文件
(7.67MB),用snappy压缩。该
文件
有1,300行和10500列,均为双精度值。当我从
拼图
文件
创建一个数据框
并
执行一个简单的操作,
如
计数,它需要18秒。table").show)|count(1)|| 1300|能做些什么来提高宽
文件
的性能吗
浏览 4
提问于2018-09-12
得票数 2
5
回答
打开
HDFS
中存储的
文件
,以便在VI中编辑
、
、
、
我想使用VI直接在
HDFS
中编辑一个文本
文件
,而不必将它
复制
到本地,编辑它,然后从本地
复制
它。这个是可能的吗? 编辑:在Cloudera的Hue UI中,这曾经是可能的,但现在不再是这样了。
浏览 22
提问于2014-11-07
得票数 11
回答已采纳
2
回答
镶木地板内饰& Spark
、
、
+ "/Trades_" + tradedateInt + ".parquet" tradesdf.write.mode("overwrite").parquet(TradesWritePath)
如
您所见因此,作为示例,第一天的第一个
文件
将存储在
文件
夹中 交易/2019/08/25 然后第二天,它就会在
文件
夹里 交易/2019/08/26 问题是,当所有数据都被放入时,日期
上
浏览 7
提问于2019-09-09
得票数 0
回答已采纳
2
回答
您可以使用
HDFS
作为主存储吗?
、
、
、
将数据保存在Hadoop中
并
使用Spark/Hive等方式使用可靠吗? 使用
HDFS
作为您的主存储有哪些优势?
浏览 8
提问于2019-04-07
得票数 1
1
回答
如
何在
ADF中重命名
文件
名?
、
、
我正在动态地将数据从sql
复制
到ADLS,我想在
复制
到adls之后重命名
文件
名。如何做到这一点?请求您的建议。问候你,阿肖克
浏览 3
提问于2021-06-03
得票数 0
2
回答
HDFS
在哪里存储它的
文件
、
单个节点
HDFS
在哪里存储与实际
文件
系统有关的
文件
?hadoop fs -copyFromLocal /home/cloudera/sample.txt
hdfs
://localhost/user/cloudera/sample.txt 实际
上
,如果我使用L
浏览 0
提问于2015-12-30
得票数 2
2
回答
Spark没有使用core-site.xml中的正确配置
、
、
、
、
当我试图用file://test ()从指定的位置(
如
/test )读取
拼图
文件
时,我得到一个错误,提示spark.read.parquet不存在。将core-site.xml作为资源添加到代码中时它确实在
hdfs
我的问题是如何确保spark读取core-site.xml
并
使用
hdfs
作为默认
文件<
浏览 5
提问于2019-06-25
得票数 1
2
回答
是有一个大的
拼图
文件
好,还是有许多小的
拼图
文件
更好?
、
、
据我所知,
hdfs
会将
文件
分成类似64mb的块。我们有流式传输的数据,我们可以将它们存储到大型
文件
或中型
文件
中。列式
文件
存储的最佳大小是多少?如果我可以将
文件
存储到最小列为64mb的位置,是否会比拥有1 1gb的
文件
节省任何计算时间?
浏览 1
提问于2017-03-21
得票数 25
回答已采纳
1
回答
HDFS
(Hadoop)
、
、
在
HDFS
上
追加
文件
(Cloudera2.0.0-cdh4.2.0)时,我遇到了错误。导致错误的用例是: 追加先前创建的
文件
。Nodes: current=[host1:50010, host2:50010], original=[host1:50010, host2:50010]) at org.apache.hadoop.
hdfs
.DFSOutputStream(DF
浏览 2
提问于2013-03-11
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何在OS X上隐藏文件并使隐藏文件可见
电脑上复制粘贴同名文件被覆盖了怎么办
如何在EasyX中将文件中的汉字绘制到窗体上?并避免出现乱码?
将 Oozie 迁移到 CDP
案例:HDFS分布式文件系统
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券