腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
4
回答
火花基本面
、
、
在复习基本面时,我不太清楚一些基本
的
事情: 查询1.对于
分布式
处理--可以不使用
HDFS
-
Hadoop
文件系统
而在集群上工作(比如创建自己
的
分布式
文件系统
),还是需要一些基本
的
分布式
文件系统
,如
HDFS
查询2.如果我们已经在
HDFS
中加载了一个文件(作为
分布式
块),那么Spark将再次将其转换为块,并在其级别上
重新
分发(用于
浏览 7
提问于2015-08-24
得票数 1
回答已采纳
1
回答
查找火花作业输出文件
的
位置
、
我正在AWS上
的
EMR集群
中
测试火花放电作业。目标是使用Lambda函数触发火花作业,但现在我正在手动运行火花作业。因此,我将SSH发送到主节点,然后运行spark作业,如下所示:我
的
桶参数传递给火花作业。
hdfs
://ip-xxx-xx-xx-xx.ec2.internal:8020/home/
hadoop
/o
浏览 4
提问于2019-12-03
得票数 0
1
回答
hadoop
在windows上,如何将D:\folder1和E:\folder1添加到
hdfs
?
hadoop
fs -put popularNames.txt /user/
hadoop
/dir1/popularNames.txt 我
的
文件夹非常大,大约有3 TB。我不想复制文件夹,我想将
hdfs
设置到该位置。怎么做呢?
浏览 0
提问于2016-06-25
得票数 0
8
回答
"
hadoop
fs“shell命令和"
hdfs
dfs”shell命令有什么区别?
、
它们应该是相等
的
吗?jenkins在Mon Apr 22 10:48:26 PDT 2013编译
的
Hadoop
2.0.0-mr1-cdh4.2.1 Subversion git://ubuntu-slave07
浏览 138
提问于2013-08-09
得票数 118
回答已采纳
2
回答
HDFS
和
Hadoop
1.0.3
中
的
疑问
、
、
然后是$
HADOOP
_HOME/bin/start-all.sh。) 我使用put将文件放在
HDFS
中
。Q5.)我创建
的
这些文件位于/user/yv/
中
。它们到底在/user/yv/在哪里?它们是否在我
的
核心-
浏览 2
提问于2012-10-02
得票数 0
回答已采纳
2
回答
MapReduce
中
输入拆分
的
主要原因是什么?
、
、
在
中
描述了输入文件被划分为M个输入分割。我知道
Hadoop
中
的
HDFS
自动对64MB
的
块进行
分区
(默认),然后将这些块复制到集群
中
的
少数其他节点,以提供容错。我想知道
HDFS
中
的
这种文件
分区
是否意味着在提到
的
MapReduce论文中描述
的
输入拆分。容错是造成这种分裂
的
唯一原因,还是有更重要
的
原
浏览 0
提问于2012-10-15
得票数 4
回答已采纳
1
回答
Spark支持gzip格式吗?
、
、
、
、
对于大数据项目,我计划使用,它有一些很好
的
功能,比如重复工作负载
的
内存计算。它可以在本地文件上运行,也可以在
HDFS
上运行。有没有办法手动实现gzipped文件
的
读取,或者在读取.gz文件时解压已经自动完成了?
浏览 1
提问于2013-04-30
得票数 46
回答已采纳
1
回答
卡桑德拉与
Hadoop
、
Cassandra使用Cassandra
文件系统
(CFS),
Hadoop
使用
Hadoop
分布式
文件系统
(
HDFS
)卡桑德拉可以用
HDFS
代替CFS?
浏览 0
提问于2014-04-03
得票数 0
1
回答
如何指定在提交Spark应用程序时从
HDFS
读取数据
的
位置?
、
我已经成功地部署了spark集群,但是对于如何在从服务器上分发我
的
HDFS
数据感到困惑吗?是否需要手动将数据放在从节点上,以及如何指定从客户端提交应用程序时从何处读取数据?我已经搜索了多个论坛,但没有找到如何在没有使用
Hadoop
的
情况下使用
HDFS
与Spark。
浏览 0
提问于2017-12-03
得票数 0
回答已采纳
1
回答
在Tez
中
运行"count(*)“时行为上
的
差异
、
、
、
我在
Hadoop
分布式
文件系统
路径和相关
的
hive表上有一个文件。这张桌子两边有30个隔板。我从
HDFS
中
删除了5个
分区
,然后在hive表上执行"msck repair table <db.tablename>;"。它完成了精细但输出 我尝试运行select count(*) <db.tablename>; (在tez上
浏览 1
提问于2019-08-27
得票数 1
回答已采纳
2
回答
Hadoop
(
HDFS
) -文件版本控制
、
、
在给定
的
时间,我
的
应用程序中有用户
文件系统
(apache )。随着它
的
规模越来越大,我怀疑是否要迁移到
hadoop
(
HDFS
),因为我们还需要运行一些统计数据。问题:当前
文件系统
提供文件
的
版本控制。在
HDFS
中
是否已经有什么可用于管理文件版本
的
东西了,还是我真的必须自己编写它(不想
重新
发明热水,但也找不到合适
的
解决方案)。答案 有关详细信息,请参见下文对答复<e
浏览 7
提问于2017-03-13
得票数 5
回答已采纳
1
回答
本机
文件系统
上
的
Spark行为
、
、
我们正在试验在我们
的
项目中运行Spark,没有
Hadoop
,也没有像
HDFS
这样
的
分布式
存储。Spark安装在具有10核和16 on
的
单个节点上,并且该节点不属于任何群集。假设Spark driver占用2个内核,其余
的
在执行时被执行器(每个2个)消耗。如果我们处理存储在Spark本地磁盘
中
的
一个大CSV文件(大小为1 GB)作为RDD,并将其
重新
分区
到4个不同
的
分区</e
浏览 10
提问于2019-02-01
得票数 0
回答已采纳
1
回答
如何在现有系统
中
实现
Hadoop
框架
、
、
、
、
我计划在我
的
基于web
的
应用程序
中
实现
Hadoop
框架。但我只是将其托管在本地主机
中
。我计划实现mapreduce和
hdfs
作为
分布式
文件系统
。问题是,我要做
的
第一步是什么?我应该从什么开始呢?我对
Hadoop
框架进行了深入
的
研究。了解它是如何工作
的
,并尝试使用互联网上
的
wordcount示例。
浏览 2
提问于2015-02-04
得票数 0
1
回答
Hadoop
到底是干什么用
的
,主要
的
应用场景和应用领域是什么?
Hadoop
到底是干什么用
的
,主要
的
应用场景和应用领域是什么,主要解决
的
核心问题又是什么,我们个人可以用它来干什么 产生价值呢?
浏览 961
提问于2020-09-24
0
回答
上传文件到
HDFS
是否会自动以
分布式
方式存储文件?
、
我刚刚开始学习
Hadoop
,我对如何以
分布式
方式存储数据感到有点困惑。我有MPI背景。对于MPI,我们通常有一个主处理器,它将数据发送到各种其他处理器。这是由程序员显式完成
的
。有了
Hadoop
,您就拥有了
Hadoop
分布式
文件系统
(
HDFS
)。那么,当您将本地服务器
中
的
某些文件放入
HDFS
时,
HDFS
是否会自动以
分布式
方式存储此文件,而无需程序员执行任何操作?<e
浏览 8
提问于2019-01-26
得票数 1
回答已采纳
2
回答
在
hadoop
的
映射阶段写入本地文件
、
Hadoop
将中间结果写入本地磁盘,将reducer
的
结果写入
HDFS
。
HDFS
是什么意思。它在物理上翻译成什么?
浏览 1
提问于2012-09-14
得票数 0
回答已采纳
1
回答
在Amazon EMR
中
,Hue
中
的
文件存储在何处
、
、
如果我转到http://ec2-****:8888/hue/home/上
的
色调链接,我可以访问色调仪表板,创建和保存文件等。但是,当我使用SSH浏览系统时,我无法看到这些文件。这些文件存储在系统
中
的
什么位置?
浏览 1
提问于2020-11-12
得票数 4
4
回答
对于火花工作负载是否需要
HDFS
?
、
、
、
、
HDFS
并不是必要
的
,但在某些地方出现了建议。将
HDFS
用于火花工作负载有什么好处?
浏览 8
提问于2015-09-19
得票数 5
8
回答
Hadoop
和HBase
、
你好,我是hbase和
hadoop
的
新手。我找不到为什么我们要在hbase上使用
hadoop
。我知道
hadoop
是一个
文件系统
,但是我读到我们可以在没有
hadoop
的
情况下使用hbase,那么我们为什么要使用
hadoop
呢? thx
浏览 1
提问于2012-05-19
得票数 10
回答已采纳
1
回答
是否可以从非
HDFS
文件系统
HBASE连接
HADOOP
?
、
、
、
hbase-site.xml @HBase
的
配置<property> <value>file:///D:/LocalData/
浏览 1
提问于2015-03-24
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券