文件分布式系统hdfs - 腾讯云开发者社区

腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

4回答

火花基本面

、、

在复习基本面时，我不太清楚一些基本的事情：查询1.对于分布式处理--可以不使用HDFS - Hadoop文件系统而在集群上工作(比如创建自己的分布式文件系统)，还是需要一些基本的分布式文件系统，如HDFS查询2.如果我们已经在HDFS中加载了一个文件(作为分布式块)，那么Spark将再次将其转换为块，并在其级别上重新分发(用于分布式</

浏览 7提问于2015-08-24得票数 1

回答已采纳

2回答

Python/Dask支持的分布式文件系统

、、、、

Dask支持哪些分布式文件系统？具体来说，您可以从哪个文件系统中读取dask.dataframe？从Dask文档中，我可以看到HDFS当然是受支持的。是否支持任何其他分布式文件系统，如Ceph等？我可以在这里找到一些关于支持其他文件系统的想法的讨论：，但没有最后的结论，只是HDFS比其他选项“更糟糕”。谢谢你的帮助!

浏览 3提问于2018-05-11得票数 3

回答已采纳

1回答

hadoop在windows上，如何将D:\folder1和E:\folder1添加到hdfs？

hadoop fs -put popularNames.txt /user/hadoop/dir1/popularNames.txt 我的文件夹非常大，大约有3 TB。我不想复制文件夹，我想将hdfs设置到该位置。怎么做呢？

浏览 0提问于2016-06-25得票数 0

8回答

"hadoop fs“shell命令和"hdfs* dfs”shell命令有什么区别？*

、

但是，为什么"hadoop fs“命令显示hdfs files，而"hdfs dfs”命令显示本地文件？

浏览 138提问于2013-08-09得票数 118

回答已采纳

1回答

HBase独立性能与在HDFS集群上运行的比较

、、

目前，我只在独立模式下进行测试，在这种模式下，HBase使用本地文件系统存储数据。我想知道，在分布式模式下使用一个实际的HDFS是否会显着地提高性能，还是只会产生相同的结果。我问自己的第二个问题是，是否可以将独立的HBase配置为只将数据持久化到内存(RAM)，而不是将其写入文件系统以进行性能评估。

浏览 2提问于2015-04-07得票数 5

0回答

我刚刚开始学习Hadoop，我对如何以分布式方式存储数据感到有点困惑。我有MPI背景。对于MPI，我们通常有一个主处理器，它将数据发送到各种其他处理器。这是由程序员显式完成的。有了Hadoop，您就拥有了Hadoop分布式文件系统(HDFS)。那么，当您将本地服务器中的某些文件放入HDFS时，HDFS是否会自动以分布式方式存储此文件，而无需程序员执行任何操作？HDFS这个名字似乎暗示了这一点，但我只

浏览 8提问于2019-01-26得票数 1

回答已采纳

1回答

如何指定在提交Spark应用程序时从HDFS读取数据的位置？

、

我已经成功地部署了spark集群，但是对于如何在从服务器上分发我的HDFS数据感到困惑吗？是否需要手动将数据放在从节点上，以及如何指定从客户端提交应用程序时从何处读取数据？我已经搜索了多个论坛，但没有找到如何在没有使用Hadoop的情况下使用HDFS与Spark。

浏览 0提问于2017-12-03得票数 0

回答已采纳

5回答

如果没有HDFS，Apache纱线可以使用吗？

、、、

我想使用我自己的分布式堆外文件系统。运行纱线需要哪些Hadoop组件？

浏览 4提问于2017-03-02得票数 9

回答已采纳

1回答

没有高密度的NoSQL

、、、、

由于历史原因，HBASE构建在HDFS的顶部；正是出于历史原因，HBASE是Google的克隆，而后者又依赖于GFS，因此也依赖于HDFS。HBASE不需要HDFS的很大一部分，但它依赖于HDFS来实现冗余。1)在不依赖HDFS的情况下实现冗余的NoSQL数据库的例子有哪些？2)如果不使用HDFS，就会有另一个分布式文件

浏览 3提问于2016-08-19得票数 1

回答已采纳

3回答

文件是否需要在HDFS中才能在分布式缓存中使用？

、、

Exception in thread "main" java.lang.IllegalArgumentException: Wrong FS: file:/path/to/my.jar, expected: hdfs://ec2-xx-xx-xx-xxx.compute-1.amazonaws.com 如果我尝试将本地文件添加到hadoop中的分布式缓存。当文件在HDFS上时，我没有得到这个错误(显然，因为它使用的是预期的文件

浏览 3提问于2012-03-16得票数 2

1回答

卡桑德拉与Hadoop

、

Cassandra使用Cassandra文件系统(CFS)，Hadoop使用Hadoop分布式文件系统(HDFS) 我已经在HDFS上使用Pig了，我想安装Cassandra。卡桑德拉可以用HDFS代替CFS?

浏览 0提问于2014-04-03得票数 0

1回答

Hadoop到底是干什么用的，主要的应用场景和应用领域是什么？

Hadoop到底是干什么用的，主要的应用场景和应用领域是什么，主要解决的核心问题又是什么，我们个人可以用它来干什么产生价值呢?

浏览 961提问于2020-09-24

2回答

从hdfs加载文件csv

、

我试图将CSV文件上载到分布式文件系统hdfs中，其中包括： But I get the following error: 

浏览 1提问于2018-10-31得票数 2

回答已采纳

2回答

在hadoop的映射阶段写入本地文件

、

Hadoop将中间结果写入本地磁盘，将reducer的结果写入HDFS。HDFS是什么意思。它在物理上翻译成什么？

浏览 1提问于2012-09-14得票数 0

回答已采纳

1回答

是否可以从非HDFS文件系统HBASE连接HADOOP？

、、、

hbase-site.xml @HBase的配置<property> <value>file:///D:/LocalData/HBASEDATA/</value>

浏览 1提问于2015-03-24得票数 0

回答已采纳

1回答

无法从Python脚本中的HDFS访问目录

、、、

/usr/bin/env python3 df.to_csv(r'hdfs://quickstart.cloudera.8020

浏览 1提问于2019-06-03得票数 3

3回答

网格计算和HDFS(Hadoop分布式文件系统)有什么区别？

、、

有没有人可以解释HDFS和网格计算之间的主要区别？

浏览 5提问于2014-11-12得票数 1

1回答

Oracle coherence和Hadoop HDFS之间的区别是什么

、、、

Oracle Coherence和Hadoop HDFS之间的区别是什么，读过HDFS和coherence (但没有什么是清楚的)听起来都是一样的。

浏览 0提问于2012-09-30得票数 4

2回答

HDFS和ADLS有什么区别？

、、

与HDFS不同的是，我对天蓝色数据湖的存储方式感到困惑。有谁能简单地解释一下吗？

浏览 2提问于2020-07-09得票数 1

回答已采纳

2回答

Linux和Hadoop文件系统的区别

、、

Linux文件系统和Hadoop文件系统有什么不同？我几乎不认识他们，只想知道更多的细节。

浏览 3提问于2014-11-04得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

火花基本面

Python/Dask支持的分布式文件系统

hadoop在windows上，如何将D:\folder1和E:\folder1添加到hdfs？

"hadoop fs“shell命令和"hdfs* dfs”shell命令有什么区别？*

HBase独立性能与在HDFS集群上运行的比较

上传文件到HDFS是否会自动以分布式方式存储文件？

如何指定在提交Spark应用程序时从HDFS读取数据的位置？

如果没有HDFS，Apache纱线可以使用吗？

没有高密度的NoSQL

文件是否需要在HDFS中才能在分布式缓存中使用？

卡桑德拉与Hadoop

Hadoop到底是干什么用的，主要的应用场景和应用领域是什么？

从hdfs加载文件csv

在hadoop的映射阶段写入本地文件

是否可以从非HDFS文件系统HBASE连接HADOOP？

无法从Python脚本中的HDFS访问目录

网格计算和HDFS(Hadoop分布式文件系统)有什么区别？

Oracle coherence和Hadoop HDFS之间的区别是什么

HDFS和ADLS有什么区别？

Linux和Hadoop文件系统的区别

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐