我知道HDFS是关于写一次并多次读类型的。据我所知,不可能(随机)更新HDFS中的文件,因为一个文件存储在分布式环境(作为块)中,每个块都复制在其他节点上,数据节点甚至很难更新这些复制的块。
但是,我的问题是,是否可以使用色彩工具更新HDFS中的文件?因为,我已经使用hue工具更新了许多文件(存储在HDFS中),并在其中运行了map--减少作业。那么,hue如何能够更新HDFS中的文件呢?色调在背景中会起什么作用吗?通过hue进行的更新是否真的更新到了同一个文件?或者hue删除文件并重写整个文件(包括我们想更新的新数据)?
发布于 2015-01-21 23:48:28
Hue删除和重写整个文件,因为HDFS不支持版本。您可以注意到,目前Hue只将版本限制在小文件上。
下面是一篇关于HDFS文件浏览器的博文,以了解更多的信息。
https://stackoverflow.com/questions/28058447
复制相似问题