查看hdfs大文件系统_hdfs删除大文件系统_hdfs写入大文件系统 - 腾讯云开发者社区

hadoop

在Hadoop中，考虑一个大文件已经加载到hdfs文件系统的场景，使用hdfs dfs put或hdfs dfs CopyFromLocal命令，大文件将被拆分成块(64MB)。

浏览 3提问于2014-12-31得票数 0

1回答

如何对HDFS中的文件使用linux命令？

hadoop、hdfs

我在HDFS中有一个大文件，希望将它分成多个块。但是，该文件在HDFS中，我不希望(不能)将其复制到本地文件系统中。如何对HDFS中的文件直接使用拆分命令？

浏览 0提问于2017-02-03得票数 0

2回答

为什么在存在hdfs的情况下使用hbase

hadoop、hadoop-streaming、hadoop2、hadoop-partitioning

为什么即使hdfs可用于存储，hadoop仍在使用hbase？数据是否存储在hbase中？如果是，那么hdfs将扮演什么角色？

浏览 0提问于2015-04-27得票数 0

2回答

如何将大文件从HDFS上传到S3

hadoop、amazon-web-services、amazon-s3、hdfs

在将一个大文件(大于5GB)从HDFS上传到S3时，我遇到了一个问题。有没有一种方法可以直接将文件从HDFS上传到S3，而无需将其下载到本地文件系统并使用多部分？

浏览 5提问于2016-01-07得票数 1

回答已采纳

3回答

hadoop fs -text vs hadoop fs -cat vs hadoop fs -get

file、hadoop、hdfs

我相信下面所有的命令都可以用来将hdfs文件复制到本地文件系统。有什么不同/情景利弊。( Hadoop新手在这里)。hadoop fs -text /hdfs_dir/* >> /local_dir/localfile.txt hadoop fs -cat /hdfs_dir/* >> /local_dir/localfile.txthadoop fs -get /hdfs_dir&

浏览 0提问于2014-09-19得票数 2

1回答

如何使用hadoop流和ruby映射器/缩减程序设置分布式map-reduce作业？

ruby、hadoop、hadoop-streaming

不过，我对分布式系统的行为并不清楚。另外，我如何开始实际运行流作业，以便它在两个系统上以并行方式运行？

浏览 2提问于2012-04-30得票数 0

回答已采纳

1回答

fs.s3.buffer.dir中临时文件的累积

hadoop、amazon-web-services、amazon-s3、amazon-ec2、hive

我正在使用s3运行EC2集群(s3://文件系统)。在这里，当我运行任何hive查询或对非常大的数据进行操作的hadoop命令时，它会在将临时文件复制到s3之前/之后将它们复制到节点上的本地磁盘上。

浏览 0提问于2015-11-24得票数 0

3回答

将文件示例从hdfs复制到本地fs？

hadoop

我在hdfs中有一个大文件我想把前100行从这个位置复制到本地文件系统..。而且数据非常敏感，所以我对实验有一定的抵抗力。将样本数据从hdfs复制到本地fs的正确方法是什么。

浏览 4提问于2013-08-29得票数 0

回答已采纳

1回答

在Hive - Hbase -Integration中，数据是如何在Hive和HBase之间移动或反射的。

hadoop、hive、hbase、hdfs

根据我的理解，HIVE和HBASE都使用HDFS来存储数据。当我们integrate HIVE and HBASE 数据是如何在它们之间移动的？还是说数据不会移动，只是反映出来呢？

浏览 2提问于2014-01-18得票数 2

回答已采纳

1回答

FileStatus对象块大小

hadoop、hdfs

根据HDFS指南，对于较小的文件大小，hadoop不会分配用于通过数据节点存储文件数据的完整数据块。我正在使用FileStatus和java api进行连接，以获取与文件路径相关联的元数据信息。FileSystem fs = FileSystem.get(URI.create("hdfs://10.0.7.111:8020/"), conf); iterator = fs.listFiles(File : hdfs://10.0.7.111:8020/t1&#x

浏览 2提问于2014-07-07得票数 0

1回答

Hadoop >在Hadoop作业运行时，datanode和namenode进程是否正在运行

hadoop、hdfs

我确信当通过"hdfs dfs“命令将本地文件系统中的大文件加载到HDFS时，会使用它们。但它是否也在Hadoop MapReduce作业运行时使用？

浏览 0提问于2015-11-14得票数 0

1回答

使用HDFS或S3运行Spark应用程序

amazon-s3、apache-spark、hdfs

在我的spark应用程序中，我只想访问一个大文件，并将计算分布在EC2上的许多节点上。使用S3中的sc.textFile()函数加载文件对我来说非常方便。但是，我可以花一些精力将数据加载到HDFS，然后从那里读取数据。我的问题是，HDFS的性能会更好吗？我的代码涉及spark partitions(mapPartitions transforamtion)，所以我的初始文件系统是什么真的很重要吗？

浏览 2提问于2015-11-08得票数 1

2回答

水槽HDFS接收器不断滚动小文件

hadoop、hdfs、twitter4j、cloudera、flume

我正在尝试使用flume将twitter数据流到hdfs中，下面是：TwitterAgent.sinks.HDFS.type = hdfsTwi

浏览 5提问于2014-03-03得票数 2

回答已采纳

2回答

R将大型CSV文件转换为HDFS

r、csv、hadoop、hdfs、rhadoop

这将留下一个巨大的CSV文件，将其转换为HDFS是否有意义，以便能够进行相关分析？除了this...or之外，对每个csv文件分别进行分析，然后在最后将其合并，会更有意义吗？我在想，也许是一种分布式文件系统，并使用amazon上的一组机器来高效地执行分析。看看rmr ，它将数据转换成HDFS，但显然对于真正大的data...how来说这并不令人惊讶，人们会以一种允许高效分析的方式转换csv吗？

浏览 7提问于2015-02-14得票数 0

2回答

如何理解"hadoop有利于顺序数据访问“

hadoop

我试着比较一下在本地文件系统和HDFS之间编写一个大文件的性能。结果有点让我困惑。从本地写到的时间比HDFS短。我不明白"Hadoop有利于顺序数据访问“的概念.

浏览 3提问于2015-09-07得票数 1

回答已采纳

1回答

hadoop t-file和datablock的关系？

hadoop

我的理解是Hadoop获取一个大文件，并将其保存在“Datablock”块中。这些数据块是否存储在T文件中？数据块和T文件之间的关系是1-1吗？

浏览 1提问于2012-04-21得票数 0

1回答

在本文的上下文中，“数据的本地缓存”意味着什么？

hadoop、hdfs

从下面的文本- ()段落中，它提到顺序可读的大文件不适合本地缓存。但我不明白这里的地方意味着什么..。我认为有两个假设:一个是来自HDFS的客户端缓存数据，另一个是datanode缓存其本地文件系统中的hdfs数据，或者是客户机可以快速访问的内存。有谁能解释得更多吗？非常感谢。特别是：使用HDFS的应用程序被假定执行长时间的连续流读取文件。HDFS被优化以提供流读取性能；这是以牺牲对文件中任意位置的随机查找时间为代价的。由于文件大小大以及读取的顺序性，系统没有提供一种

浏览 3提问于2012-04-11得票数 3

回答已采纳

2回答

在hadoop中保存和访问表状数据结构

hadoop、data-structures、mapreduce、hdfs、bigdata

我想用MapReduce编程在HDFS中保存和访问一个类似于数据结构的表。此DS的一部分如下图所示。此DS有数万列和数百行，所有节点都应该可以访问它。谢谢。

浏览 2提问于2016-10-04得票数 0

1回答

用Dask从文件系统/S3中并行读取文件块？

distributed-computing、dask

我正在整理一个概念证明，在分布式环境中，我希望使用PyCuda来处理字符数据的大文件(每个任务在一个文件中~8GB)- AWS是具体的。我知道HDFS将分割数据文件并将其分发给工作人员，但我正在尽量保持环境的简单性，如果不必安装Hadoop，我宁愿不必安装Hadoop。鉴于上述段落和Dask框架，当前对文件系统的建议是什么？我是继续使用HDFS，还是有更好/更简单的解决方案？

浏览 2提问于2016-05-16得票数 3

回答已采纳

1回答

是否允许通过合并或重新分区来合并HDFS中的小文件(但合并后会很大)？

apache-spark、hadoop、pyspark、apache-spark-sql、hdfs

我正在使用HDFS -接收器-连接器来使用Kafka的数据进入HDFS。这个目录是按日期创建的；所以我想通过每天的批处理将许多小文件合并到一个大文件中是很棒的。(我预计HDFS将自动将一个大文件分割成块大小。)HDFS是否允许90~100 be？我不需要担心吗？有人能告诉我是否有合并小型<em

浏览 7提问于2022-03-22得票数 0

回答已采纳

点击加载更多