linux 挂载hdfs_linux 查看hdfs_linux 只安装hdfs - 腾讯云开发者社区

、

你好，我对Hadoop中的以下命令有一些问题(因为我是Linux/Ubuntu的新手)： bin/hadoop dfs -copyFromLocal /tmp/folder /user/hduser/folder 这会将文件从本地文件系统复制到HDFS；是否可以从Ubuntu的GUI访问HDFS？而不在shell中使用"-ls“？就像在中一样，我想打开HDFS文件所在的文件夹in...Would这是可能的吗？谢谢

浏览 3提问于2012-05-31得票数 1

回答已采纳

1回答

是否可以将Hadoop Linux服务器路径挂载到其他非hadoop linux服务器路径？

、

我是否可以将Hadoop Linux服务器本地路径(非HDFS)装载到其他非hadoop linux服务器路径谢谢

浏览 1提问于2015-10-31得票数 0

1回答

Linux和HADOOP安装在计算机的一个驱动器上，我可以在计算机的另一个驱动器上安装HDFS吗？

、、

我是学习HADOOP的初学者。我有一台windows笔记本电脑，硬盘被分成4个驱动器。我最近清空了一个驱动器(D驱动器)，并在其上安装了Ubuntu14.04，并安装了HADOOP和HIVE。现在，当我试图通过linux在HADOOP上工作时，我面临着空间限制。 LINUX安装在D驱动器上，Windows安装在C驱动器中。当我想将本地文件系统中的数据移动到蜂箱中时，我必须先将其复制到HDFS中，然后再复制到蜂箱中，现在我的问题是，在这方面，我的计算机上的其他两个驱动器在这方面是否有任何用处，要么作为本地文件系统，要么作为HDFS，最重要的是作为HDFS。如果是，请告诉我怎么做。任何帮助都是非常

浏览 0提问于2015-04-20得票数 1

回答已采纳

1回答

如何在Cloudera上挂载HDFS？

、、、、

我正在运行Cloudera 5.3的集群上工作，我已经按照所有说明创建了一个NFS网关，它运行得很好。我的问题是，我仍然不能将HDFS目录看作Linux文件系统(这是RHEL 6)的一部分。我不是UNIX管理员，所以我没有安装目录的经验，而且我在网上找到的文档对这个特定的问题也没有帮助。我试过简单的 mount / 在作为NFS网关的机器上，但这不起作用。当我尝试从另一台集群计算机使用 mount <myNFSgateway>:/ / 我看不到网关服务器上的任何文件，也看不到HDFS中的任何文件(尽管我可以使用hdfs dfs -ls很容易地看到这些文件)。设置了NFS后，如何将

浏览 0提问于2015-04-23得票数 2

1回答

将文件从wsl复制到运行在码头上的hdfs

、、

我正在尝试将文件从本地驱动器复制到hdfs。我在码头上运行Hadoop作为图像。我尝试在MapReduce上执行一些练习，因此，我希望将数据文件从本地驱动器(假设我的d:驱动器)复制到hdfs。我尝试了下面的命令，但是它在ssh: connect to host localhost port 22: Connection refused中失败了 scp -P 50070 /mnt/d/project/recreate.out root@localhost:/root 由于我刚接触Hadoop和大数据，我的解释可能很糟糕。请容忍我。我正试图在windows子系统Linux (WSL)中完成

浏览 2提问于2018-12-27得票数 0

回答已采纳

2回答

能否将Azure数据集作为驱动器安装在linux服务器上？

、、、

我们的最终目标是让Linux服务器作为挂载文件系统直接访问Azure Datalake。微软声称Azure Datalake与hdfs兼容，所以我们想知道是否可以直接通过Fuse或通过Hadoop系统直接挂载？在Azure能买到的任何东西。不顾一切地寻找做过这件事的人的例子。

浏览 5提问于2017-08-28得票数 0

1回答

从远程linux服务器向Hadoop HDFS传输文件

、、

我需要将文件从远程Linux服务器直接传输到HDFS。我在远程服务器上放置了keytab，在kinit命令激活后，我无法浏览HDFS文件夹。我知道从边缘节点我可以直接将文件复制到HDFS，但是我需要跳过边缘节点，直接将文件传输到HDFS。我们怎样才能做到这一点。

浏览 1提问于2018-09-26得票数 0

2回答

如何将远程主机中的文件夹作为管道中的损坏目录路径访问

、、、、

这是我的FlumeHadoop.conf文件。 a1.sources = r1 a1.sinks = k1 a1.channels = c1 # Describe/configure the source a1.sources.r1.type = spooldir a1.sources.r1.channels = c1 a1.sources.r1.spoolDir = /home/rabindra/idirectory a1.sources.r1.basenameHeader=true # Use a channel which buffers events in memory a1.c

浏览 1提问于2016-02-01得票数 0

3回答

如何安装安全的HDFS？

、、

要让标准文件系统用户或程序将HDFS名称空间视为本地挂载目录，CDH4即有一个组件。它正在与非安全HDFS一起工作，但是在Kerberos安全的HDFS上，如何在那里实现呢？泰克斯。

浏览 4提问于2012-06-29得票数 0

1回答

集群主机的存储空间比HDFS似乎识别/访问的要多？如何增加HDFS存储的使用？

、、

当HDFS (HDP v3.1.0) 耗尽存储空间时出现问题，(这也会导致火花作业挂在可接受的模式中)。我假设有一些配置，我可以让HDFS使用节点主机上已经存在的更多存储空间，但是快速搜索到底是什么还不清楚。有更多经验的人能帮上忙吗？在安巴里UI，我看到了..。 (来自安巴里UI) (来自NameNode UI)。然而，当通过ambari查看整个主机时，似乎仍然有很大的空间留给集群主机(列表中的最后4个节点是数据节点，每个节点总共有140 in的存储空间)。不确定什么设置是相关的，但这里是ambari中的一般设置：我对“HDFS预留空间”设置的解释是，它表明应该为非DFS保

浏览 3提问于2020-05-26得票数 1

回答已采纳

3回答

无法找到apt安装hadoop-0.20-fuse包

、、、

我需要安装一个“可安装的HDFS”。在四处寻找时，我得到了几个教程： (和其他类似的) 他们都是从sudo apt-get install hadoop-0.20-fuse开始的。但这不管用。我收到错误：the package cannot be found。我对Linux还不熟悉。我怎样才能让我的Ubuntu找到这个包裹？(Ubuntu12.10新安装的LTS。从那以后，我做的唯一一件事就是安装和配置Hadoop和HBase。我还搜索了更多的内容，发现了以下内容：在自述文件的“如何使用部分”中，在可下载的tar中，有关于在Debian/Ubuntu上使用sudo ap

浏览 1提问于2012-10-29得票数 3

1回答

我们可以使用HDFS来存储git存储库吗？

、、、、

我希望为高可用性、自动故障转移和性能创建一个可伸缩的git存储库。我认为HDFS非常适合这种情况。但我不知道是否可以将它与git存储库一起使用。有人能举个例子吗？如何使用hdfs存储git存储库？

浏览 8提问于2016-11-10得票数 2

回答已采纳

1回答

hdfs中不支持通配符，在Hadoop2.3.0-cdh5.1.3中放置命令？

、

我试图将每天的apache访问日志文件移动到Hive外部表，方法是每月将日志文件处理到相关的HDFS文件夹中。我尝试使用通配符，但似乎hdfs不支持它？(文件似乎是说它应该支持它)。复制单个文件工作： $ sudo HADOOP_USER_NAME=myuser hdfs dfs -put /user/myuser/prod/apache_log/2015/01/ 但是，以下所有文件都抛出“没有这样的文件或目录”： $ sudo HADOOP_USER_NAME=myuser hdfs dfs -put /user/myuser/prod/apache_log/2015/01/ p

浏览 0提问于2015-02-27得票数 0

1回答

将本地HDFS文件系统浏览器与IntelliJ IDEA集成

、、、

我使用我所在大学的HDFS集群研究了MapReduce范例，并通过色调访问它。从色调上看，我可以浏览文件，阅读/编辑它们等等。所以在这个集群中，我需要：一个普通的文件夹，我在其中放置MapReduce.jar 访问HDFS中的结果我非常喜欢编写MapReduce应用程序，因此我已经正确地将本地HDFS配置为个人游乐场，但目前我只能访问它，这确实是浪费时间的命令行(如)。通过SFTP远程主机连接，我可以“直接”访问我彻底的IntelliJ想法的HDFS，下面是“用户正常文件夹”：这里是HUE的HDFS，我从中得到了结果：显然，在我的本地机器中，“普

浏览 2提问于2018-01-22得票数 0

回答已采纳

1回答

为kubernetes集群中的hadoop pod挂载外部磁盘时出现问题

、

背景:我有一个kubernetes集群，它有一个spark集群(在集群外有驱动程序)和hadoop pod。我将hadoop pod的文件夹路径挂载到一个外部磁盘上。问题:当spark cluster尝试在hdfs中创建检查点文件夹时，我得到以下异常。 java.io.EOFException: End of File Exception between local host is: "jfgubq745vn2ym-tg1isslukll1u3/10.92.0.135"; destination host is: "dev-dev-hadoop":9000;

浏览 0提问于2015-08-25得票数 0

1回答

我们是必须为HDFS文件系统格式化datanode，还是只需要格式化namenode

、、、

在设置伪集群或全集群时，我们是否需要格式化数据节点来安装HDFS文件系统，或者我们只需要格式化namenode。我问这个是因为，我在许多博客上读到过，HDFS按顺序将数据存储在硬盘上，它是一个抽象层，将数据存储在大块上，而不是主机文件系统提供的默认块大小存储。如果我们不格式化datanode，那么HDFS的强大功能就会失效。

浏览 43提问于2019-01-15得票数 2

1回答

错误:找不到流jar

、

每当我运行以下代码从分布式文件系统(hdfs)将.csv文件下载到本地系统时，我都会得到以下错误错误:找不到流jar 我执行的命令是 dumbo cat <hdfs path for .csv file> -hadoop $HADOOP_INSTALL > <.csv file path in local system> 我想让.csv文件在中打开。谢谢。

浏览 6提问于2016-01-18得票数 0

1回答

如果hadoop中的第三方API只使用本地文件系统路径，如何使用这些API从hdfs读取文件？

、

我有很大的mbox文件，我使用第三方API，如mstor，使用hadoop解析mbox文件中的消息。我已经把这些文件上传到hdfs中了。但问题是，此API仅使用本地文件系统路径，如下所示 MessageStoreApi store = new MessageStoreApi(“file location in locl file system”); 我在这个API中找不到可以从stream初始化的构造函数。因此我无法读取hdfs流并对其进行初始化。现在我的问题是，我是否应该将文件从hdfs复制到本地文件系统，并从本地临时文件夹对其进行初始化？因为这就是我现在一直在做的：目前，My Map函

浏览 4提问于2012-07-23得票数 1

回答已采纳

1回答

如何在hadoop配置中选择目录列表？

、

我已经下载了一个用于设置hadoop配置的脚本。它包含具有以下块的/scripts/directories.sh文件： # Space separated list of directories where NameNode will store file system image. For example, /grid/hadoop/hdfs/nn /grid1/hadoop/hdfs/nn DFS_NAME_DIR="TODO-LIST-OF-NAMENODE-DIRS"; # Space separated list of directories where DataN

浏览 3提问于2015-01-15得票数 0

1回答

增加HDP 2.3 3节点群集中的HDFS磁盘大小

、、、

在POC的3节点集群安装中，我的第三个注意事项是DataNode，它有大约200 GB的磁盘空间。根据ambari的HDFS磁盘使用小部件，我当前的HDFS使用情况如下：已用DFS : 512.8 MB (1.02 %)；非DFS使用8.1 GB (16.52%)；剩余40.4 GB (82.46 %) 当我执行df -h检查磁盘大小时，我可以看到tmpfs占用了大量空间，如以下屏幕截图所示：我如何才能将该空间用于我的HDFS。我的节点3有200 GB的硬盘空间

浏览 1提问于2016-02-25得票数 0

1回答

将数据文件插入HDFS

、

我有太字节的CSV文件，我需要摄取到HDFS中，文件驻留在应用程序服务器上，我可以在边缘节点上使用FTP数据，并使用以下任何方法。 HDFS CLI (-put) Mounting HDFS Using ETL tools 我想知道哪种方法在性能方面会更好，请建议

浏览 2提问于2015-05-19得票数 0

3回答

HadoopFS (HDFS)作为分布式文件存储

、

我正在考虑使用HDFS作为我们的客户端视频托管服务的水平缩放文件存储系统。我主要担心HDFS不是为这个需求而开发的，这更多的是“一个开源系统，目前正在需要处理大量数据的情况下使用”。我们不想处理数据，只是存储它们，在HDFS的基础上创建一些类似于亚马逊内部小型S3模拟的东西。也许重要的时刻是，存储的文件大小将相当大，从100Mb到10Gb。有没有人使用HDFS来达到这样的目的？

浏览 0提问于2011-05-26得票数 5

1回答

如何增加HDFS集群上dfs的空间

、、

我们有4个datanode集群，当我查看datanode信息时，...there是在大约98 of ...but的每个数据节点上具有很大的空间。它只需要10 it. 我们怎样才能让它使用所有的98 of，而不像图像中所示的那样耗尽空间？这是名称节点上的hdfs-site.xml <configuration> <property> <name>dfs.replication</name> <value>2</value> </property>

浏览 0提问于2017-01-17得票数 0

1回答

Confluent Control Center上载连接器错误

、、

我使用的是windows10，并使用docker container来运行confluent控制中心。我正在尝试上传一个可以在confluent集线器上找到的预先构建的连接器：我得到以下错误：“无效的连接器类。请检查连接器配置文件。” 我正在尝试上传具有以下.properties文件的连接器 name=hdfs-sink connector.class=io.confluent.connect.hdfs.HdfsSinkConnector tasks.max=1 topics=test_hdfs hdfs.url=hdfs://localhost:9000 flush.size=3

浏览 17提问于2021-02-24得票数 0

1回答

如何将存储在另一个(非分布式)服务器上的HDFS文件中的数据存档？

、、、

我有一个项目文件夹，其中包含大约。50 GB (non-distributed hadoop集群(CDH5.14)上的文件，我需要归档和将移动到<code>E 110</code>另一个主机<code>E 211</code>或Linux中)。这只是一次作业--我不打算很快将数据带回HDFS，但是应该有一种方法将其部署回到分布式文件系统。做这件事的最佳方法是什么？不幸的是，我没有另一个hadoop集群或云环境来放置这些数据。如果有任何提示，我将不胜感激。

浏览 4提问于2019-10-07得票数 0

1回答

cc机箱无法找到libjvm.so，即使它是通过RUSTFLAGS='-L‘提供的

、

我使用cc-rs构建了一个rust/c混合项目: hdfs-jni。简而言之，hdfs-jni重新建立在Apache Hadoop提供的libhdfs.so之上，而libhdfs.so本身也依赖于libjvm.so，因为它是HDFS java方法的包装器。在我的build.rs 我提供了指向包含libjvm.so的目录的println!("cargo:rustc-link-search=all={}/jre/lib/amd64/server", val);。另外，我将libjvm.so目录传递给RUSTFLAGS='-L /usr/local/hadoop/li

浏览 85提问于2021-09-01得票数 0

回答已采纳

1回答

如何监视hdfs目录并将hdfs中到达的最新文件复制到本地？

、、、

我想在bash/python中写一个脚本，这样脚本就可以复制到达hdfs目录的最新文件。我知道我可以在本地使用inotify，但如何在hdfs?中实现它可以请您分享它的示例代码。当我在谷歌上搜索它时，它给我提供了一个比inotify更简单的长codes.Is (如果它太复杂了)。

浏览 5提问于2019-08-26得票数 0

1回答

从windows上的星星之火到HDFS存储文件

、、、

我已经在本地windows机器上的linux中安装了Hadoop/YARN。在同一台windows机器(不在VM中)上，我已经安装了Spark。在windows上运行spark时，我可以读取HDFS中存储的文件(在linux中)。 val lines = sc.textFile("hdfs://MyIP:9000/Data/sample.txt") 当保存一个用于HDFS saveAsTextFile("hdfs://MyIP:9000/Data/Output")的文件时，我得到以下错误： org.apache.hadoop.security.AccessCo

浏览 1提问于2018-09-16得票数 0

回答已采纳

1回答

在复制到HDFS时忽略输入文件中的第一行/最后一行的Hadoop命令

、

我在Linux中有一个输入文件，它有一个头文件。我无法修改此文件，因为只有只读访问该文件。我能够使用copyFromLocal命令成功地将这个文件从Linux复制到HDFS。但是头不应该出现在HDFS文件中，而且我没有权限修改Linux输入文件以删除头文件。在将文件从Linux复制到HDFS时，还有其他方法可以跳过/忽略标头吗？比如copyFromLocal -1 input_file_name hdfs_file_name？

浏览 2提问于2017-09-18得票数 0

回答已采纳

1回答

Cloudera Hadoop VM 5.10 -找到HDFS路径吗？

、

安装Cloudera并将数据文件加载到HDFS中。命令"hadoop -ls /“帮助我验证hdfs中的数据。但是想知道它居住的物理位置吗？任何建议都会有帮助。

浏览 1提问于2017-11-04得票数 0

回答已采纳

1回答

FSNamesystem NameNode启动失败，错误: Hadoop初始化失败。java.io.FileNotFoundException

我得到的例外是， 2011-07-13 12:04:13,006 ERROR org.apache.hadoop.hdfs.server.namenode.NameNode: java.io.FileNotFoundException: File does not exist: /opt/data/tmp/mapred/system/job_201107041958_0120/j^@^@^@^@^@^@ at org.apache.hadoop.hdfs.server.namenode.FSDirectory.unprotectedSetPermission(FSDirecto

浏览 1提问于2011-07-13得票数 1

2回答

如何在HDFS中更新文件

、、

我知道HDFS是写一次，读很多次。假设如果我想在HDFS中更新一个文件，有什么方法可以做到吗？提前谢谢你！

浏览 0提问于2016-08-24得票数 15

1回答

在挂载HDFS时遇到"mount.nfs:挂载系统调用失败“

、、

我正在尝试按照URL 中的内容挂载HDFS文件系统。但是在最后的mount语句中，我得到了mount.nfs: mount system call failed 我在执行以下命令时获得了该输出： mount -t nfs -o vers=3,proto=tcp,nolock,noacl <HDFS server name>:/ <existing local directory> 我正在伪分布式模式下运行hadoop。

浏览 3提问于2014-11-06得票数 3

1回答

如何使用Ruby在MapR中保存文件

、、、

有没有办法使用Hadoop的MapR发行版将文件保存在HDFS中？显然，有一个称为thriftfs的Thrift API，它使得从客户端与HDFS通信成为可能，但看起来它并没有与MapR捆绑在一起。

浏览 0提问于2012-01-19得票数 1

回答已采纳

1回答

HDFS +在HDFS文件夹与本地文件系统文件夹之间创建简单链接

、、

我在谷歌搜索但没有找到，是否可以在HDFS文件夹与本地文件夹之间创建链接？示例我们希望在HDFS中的/home/hdfs_mirror本地文件夹中的folder_1之间创建链接。 HDFS文件夹： su hdfs $ hdfs dfs -ls /hdfs_home/folder_1 Linux本地文件夹： ls /home/hdfs_mirror

浏览 0提问于2019-02-26得票数 0

5回答

Hadoop中的校验和验证

、、

在通过Webhdfs将文件从Linux服务器移动到Hadoop (HDFS)后，我们是否需要验证校验和？我希望确保HDFS上的文件在复制后不会损坏。但是检查校验和是必要的吗？我读取客户端在将数据写入HDFS之前执行校验和有没有人可以帮助我理解如何确保Linux系统上的源文件与使用webhdfs的Hdfs上的摄取文件相同。

浏览 1提问于2015-08-10得票数 13

1回答

如何在nfs文件系统中存储apache检查点

、

我正在使用Apache 1.10.0从RabbitMQ中提取数据流，现在在内存中使用默认的检查点配置。现在，当任务管理器重新启动时，我需要将状态和检查点存储在文件系统中，所有演示都应该使用“HDFS ://namenode:4000/.”，但是现在我没有HDFS集群，我的Apache Flink运行在kubernetes集群中，如何在文件系统中存储我的检查点？我阅读了Apache的并告诉我它支持：可以重放记录一定时间的持久(或持久)数据源。这些源的例子是持久消息队列(例如Apache、RabbitMQ、Amazon、Google PubSub)或文件系统(例如HDFS、S3、GFS、N

浏览 5提问于2020-04-09得票数 0

回答已采纳

1回答

如何在动态hdfs目录上创建分区配置单元表

、、、、

我很难让hive发现在HDFS中创建的分区下面是HDFS中的目录结构 warehouse/database/table_name/A warehouse/database/table_name/B warehouse/database/table_name/C warehouse/database/table_name/D A、B、C、D是来自列type的值当我使用以下语法创建配置单元表时 CREATE EXTERNAL TABLE IF NOT EXISTS table_name(`name` string, `description` string) PARTITIONED BY

浏览 20提问于2019-10-25得票数 1

回答已采纳

1回答

Hadoop NFS挂载问题

、、、

我正在尝试将windows Server 2012中的一个NFS共享挂载到我的Hadoop集群(运行Hadoop2.7.3)上，这样它就可以对上传到Windows server的文件运行MapReduce。Hadoop集群在raspberry pi 2(其中8个)上运行，我已经了解了Hadoop 上的配置我尝试将NFS挂载到主服务器上的HDFS目录(/hdfs/tmp/datanode)上，但在namenode上无法访问。我是不是把它装错地方了？

浏览 15提问于2017-03-15得票数 0

1回答

系统分区上的DateNode目录？

、、、、

我们在Hadoop集群上耗尽了以这种方式设置的空间： 1X1TBHDD/ <- Ubuntu系统分区 3x1.5TbHDD /data1 /data2 /data3 <- HDFS数据量系统分区几乎不被使用(97%空闲)，也不会用于与hadoop无关的任务。将系统分区作为HDFS数据dir添加到DataNode配置中是否安全？恐怕Hadoop填充了分区，使系统无法使用。最好的方法可能是设置单独的lvm卷或重新分区磁盘。但我会避免走这条路。 hadoop是否尊重unix配额？例如，如果我从系统分区添加一个目录，并通过配额限制hadoop用户仅使用例如0.5TB

浏览 4提问于2012-11-14得票数 1

回答已采纳

2回答

如何将EC2上的特定实例挂载分配给HDFS

、、、

我正在尝试使用i2实例安装单节点hadoop集群，并希望将800 GB固态硬盘的一个实例存储挂载分配给HDFS，但不确定如何执行此操作。默认的i2实例附带2个800 GB的固态硬盘实例存储，我想将其中一个专门用于HDFS，另一个用于其他一些工作负载。 /dev/xvdb --已将其挂载到/mnt/hdfs -我希望确保我所有的HDFS数据都存储在此处/dev/xvdc --已将其挂载到/mnt/data。谢谢。

浏览 7提问于2016-05-06得票数 0

1回答

HDFS或HBase中是否存在最大存储空间配置？

、、、

HDFS或HBase中是否存在最大存储空间配置？我发现 dfs.data.dir：“逗号分隔的路径列表在DataNode的本地文件系统上存储其块”和 dfs.datanode.du.reserved：，但它是为HDFS预留的非DFS空间在中对于HBase，我发现了一些堆大小配置和压缩间隔，Memstore刷新大小，但这些配置似乎都不能调节单个节点的最大大小。对HBase或HDFS是否有任何配置来调节它们在单个节点中将占用多少空间？ (我正在一台机器上运行测试)

浏览 1提问于2021-08-24得票数 1

回答已采纳

2回答

是否存在将本地文件夹用作Hadoop HDFS文件夹的可行且简单的选项

、、、

我在一个速度极快的SAN磁盘上有一大块文件，我喜欢在它们上执行配置单元查询。一个明显的选择是使用如下命令将所有文件复制到HDFS中： hadoop dfs -copyFromLocal /path/to/file/on/filesystem /path/to/input/on/hdfs 然而，我不想创建我的文件的第二个副本，只是为了在其中进行配置单元查询。有没有办法将HDFS文件夹指向本地文件夹，以便Hadoop将其视为实际的HDFS文件夹？这些文件不断地添加到SAN磁盘中，因此Hadoop需要在添加新文件时查看它们。这类似于Azure的HDInsight方法，即将文件复制到blob存储

浏览 1提问于2017-05-24得票数 1

2回答

将文件从NFS或本地FS复制到HDFS

、、、、

我试图将大量文件(100k+，总大小为2TB)从NFS复制到HDFS。怎样才是最有效的方法。在将其挂载到边缘节点后，我尝试了以下选项 hdfs dfs -put :由于内存错误而失败，传输也很慢 distcp :由以下原因引起的错误： org.apache.hadoop.tools.mapred.RetriableFileCopyCommand$CopyReadException: java.io.FileNotFoundException：但是，该文件存在。我在没有使用NFS挂载位置的情况下，在本地文件上尝试了同样的方法。我知道distcp的其中一个警告是，目的地必须被

浏览 4提问于2019-07-12得票数 1

回答已采纳

2回答

WEBHDFS REST API可将文件从windows服务器/本地文件夹/桌面复制/移动到HDFS

、、、、

使用WEBHDFS REST API调用，我是否可以将文件从Windows计算机(即windows服务器或windows本地文件夹或桌面)传输或复制到Hadoop-HDFS文件系统？如果是，是否有任何示例命令信息？我已经尝试过了，而且我能够使用 Windows -> (使用ftp)-> Linux目录-> (使用webhdfs) -> HDFS，这是两个步骤的过程，我正在寻找直接从Windows -> (webhdfs) -> HDFS的一个步骤的过程。我也参考了中的有用信息。示例:如果我的文件在E:\user\accounts.txt中，并且我想使

浏览 4提问于2016-08-12得票数 2

2回答

Hadoop: hdfs -text的倒数

、、、

在Hadoop中，hdfs dfs -text和hdfs dfs -getmerge命令允许从命令行轻松读取HDFS中压缩文件的内容，包括连接到其他命令进行处理(例如wc -l <(hdfs dfs -getmerge /whatever 2>/dev/null))。这些命令是否相互对应，允许将内容从命令行()推送到HDFS，同时支持与上述命令相同的压缩和格式特性？hdfs dfs -put似乎只是将本地文件的原始副本复制到HDFS，而不需要压缩或容器格式的更改。建议使用命令行工具来操作这种格式和压缩算法的答案也是受欢迎的。我通常会在CompressedStream中看到Sna

浏览 4提问于2016-03-15得票数 1

回答已采纳

1回答

将Kafka和HDFS与码头集装箱连接起来

、、、

你好，伙计们，我想把卡夫卡和HDFS和卡夫卡连接起来，但我仍然面临着一个我无法摆脱的问题。我正在使用这个例子： I首先用: docker-compose -d启动HDFS 然后，我用debezium网站上的图片启动了动物园管理员kafka和mysql。。码头运行-it -rm-名称动物园管理员-网络码头-hadoop-主机_默认-p 2181:2181 -p 2888:2888 -p 3888:3888 debezium/动物园管理员:1.0 docker run -it -rm-名称kafka --网络停靠器-hadoop-master_ -e ZOOKEEPER_CONNECT=z

浏览 12提问于2020-01-21得票数 0

回答已采纳

1回答

如何在linux上将ini文件创建为HDFS

、、、、

我是linux新手。Cloudera 提到在cloudera 5.4上创建哨兵-Provider.ini文件作为HDFS文件。我找不到关于如何在linux上创建ini文件的好文章。我试图在cloudera设置上配置Apache，使其具有基于角色的蜂窝元数据安全性如何在linux上创建作为HDFS的ini文件？

浏览 1提问于2016-03-03得票数 0

回答已采纳

1回答

查找HDFS节点上的超级用户

、

HDFS节点在CentOS上启动。如何找到启动HDFS节点的Linux用户？

浏览 3提问于2017-04-17得票数 0

回答已采纳

1回答

如何将纱线应用程序日志保存在本地文件系统而不是HDFS中？

、、、

我将yarn.log-aggregation-enable设置为true，使NodeManager立即将所有容器日志连接到一个文件中，并将它们上传到${yarn.nodemanager.remote-app-log-dir}/${user.name}/logs/<application ID>中的HDFS中，并从本地用户日志目录中删除它们。我希望将这些日志保存在本地文件系统(而不是HDFS)中一段时间，以便将这些日志转发到像ELK这样的持久日志机制中。

浏览 4提问于2020-05-02得票数 0