hadoop 计算存储分离_计算存储分离_存储计算分离-计算组件 - 腾讯云开发者社区

apache-spark、hadoop

我正在使用Hadoop设置一个包含两个data+compute节点和两个纯计算节点的集群。我正在使用Spark with Yarn进行数据处理。对于前一种类型的节点，我只需将host-name添加到workers配置中，hadoop会自动在这些节点上启动hdfs和YARN。但是对于仅用于计算的节点，我不希望它们运行dfs。我找不到任何hadoop配置来将特定节点排除在运行dfs之外。有人能告诉我设置这种节点分布的正确方法吗？

浏览 25提问于2021-05-17得票数 0

回答已采纳

2回答

Hadoop客户端与集群分离

hadoop、cluster-computing、vpn、hadoop2

我也是hadoop，linux的新手。我的教授要求我们使用端口映射或VPN分离Hadoop客户端和集群。我不明白这种分离的含义。有人能给我个提示吗？我有一些天真的想法： 1.创建客户端计算机并安装hadoop。2.将fs.default.name设置为hdfs://maste

浏览 1提问于2016-02-10得票数 1

回答已采纳

1回答

hadoop集群上的存储数据库

hadoop

我正在学习Hadoop和Hive服务器，我对一些事情感到困惑。假设我用三台机器构建了hadoop集群，然后开始用PHP/MySQL脚本存储图像。现在，对于一个MySQL数据库，我可以在同一个Hadoop服务器上安装Hive，还是必须构建另一个Hadoop服务器来使用Hive存储MySQL数据库。是否需要分离Hadoop文件服务器和Hadoop数据库服务器？或者您可以将所有内容存储在同一个Hadoop

浏览 0提问于2015-06-03得票数 0

1回答

Hadoop:面向多用户的伪分布式模式

hadoop

我已经使用root用户凭据在伪分布式模式下设置Hadoop。我希望提供对多个用户(比如hadoop1、hadoop2等)的访问，以便能够在这个集群上提交和运行MapReduce作业。- Added users hadoop1 and hadoop2 to a group called "hadoop".> - C

浏览 3提问于2013-11-25得票数 1

回答已采纳

3回答

火花和Hadoop有什么不同？

hadoop、apache-spark

在其主页中，有人说它比Hadoop框架更好。但是他们说:火花运行在Hadoop..。我真的不明白为什么可以在Hadoop上运行，而它应该比Hadoop更好。有人能解释一下这两者之间的等级吗？

浏览 6提问于2017-10-22得票数 1

回答已采纳

2回答

为什么BigQuery有自己的存储空间？

google-bigquery

BigQuery有自己的存储系统，与完全分离。我的问题是:为什么BQ不像Hadoop那样直接处理存储在GCS上的数据？这种设计的好处和必要性是什么？

浏览 1提问于2019-01-17得票数 1

回答已采纳

1回答

SQL 2016 PolyBase计算下推到使用WASBS (又名Azure Blob )的Hadoop

sql、azure、hadoop、polybase

我们有一个系统，其中大多数文件存储在Azure存储帐户Blob中。从Hadoop访问文件需要WASBS:// file系统类型。我希望将SQL2016Polybase配置为将HDI集群中存储在Azure blobs中的某些数据查询的下推计算。这意味着，当使用Azure Bl

浏览 6提问于2017-02-24得票数 2

3回答

hadoop集群中的边缘节点

hadoop、bigdata

有人能给我解释一下hadoop中Edge节点的架构吗？我只能在互联网上找到定义，我有以下问题- 1)边缘节点必须是集群的一部分吗(如果它在集群内，我们有什么优势？)它是否在hdfs中存储任何数据块。

浏览 5提问于2013-05-22得票数 12

6回答

如何搭建Hadoop处理环境？

apache、mapreduce、分布式、hadoop、数据处理

Apache Hadoop 是用于开发在分布式计算环境中执行数据处理应用程序的框架。旨在从单个服务器提供存储和计算资源的方式扩展到数千台机器。Apache Hadoop的核心部分由存储部分（Hadoop分布式文件系统）及其数据处理部分（MapReduce）组成。Hadoop将文件分割成大块，并将它们分发到群集中的节点上。那么如何搭建Hadoop处理环境？

浏览 1967提问于2018-10-24

1回答

是否在HDFS集群上重新分配数据？

apache-spark、hadoop、hdfs

我正在阅读Hadoop和Spark文档，以了解spark如何在Hadoop集群上工作。根据Hadoop文档，Hadoop集群是一组具有计算和数据存储能力的通用硬件，它们还假定“移动计算比移动数据便宜”。现在，当我处理一个大文件，它是存储在HDFS上使用火花。Spark是否会随机地将文件中的数据重新分发到Hadoop集群，或者它知道存储数据分区的节点将要求各自的节点处理其数据？我提出了这个问题，因为没有提到火花如何处

浏览 11提问于2022-09-13得票数 1

回答已采纳

1回答

使用Windows Azure for MapReduce的优势

azure、hadoop、mapreduce

我正在尝试使用Hadoop开发一个可以在Windows Azure上运行的MapReduce应用程序。即:使用Windows Azure集群进行部署。

浏览 1提问于2014-10-16得票数 0

3回答

用于处理大数据的MySQL集群与Hadoop

hadoop、mapreduce、hive、bigdata、mysql-cluster

我想知道使用MySQL集群和使用Hadoop框架的优缺点。什么是更好的解决方案。我想听听你的意见。Hadoop有什么缺点吗？没有实时数据访问。分析数据可能需要几分钟或几个小时。为什么Hadoop是处理大数据的圣杯？你的意见是什么？

浏览 7提问于2014-01-29得票数 2

1回答

为什么星火强调去耦模式，mem，存储？

apache-spark、rdd

以及将模式与存储分离。这种脱钩的重要性是什么？这是为了微型服务的好处还是可插拔性？

浏览 0提问于2018-08-13得票数 0

回答已采纳

7回答

Hadoop Vs数据湖

hadoop、data-warehouse、data-lake

我在谷歌上查到了术语数据湖通常与面向Hadoop的对象存储相关联。在这种情况下，组织的数据首先加载到Hadoop平台，然后将业务分析和数据挖掘工具应用于其驻留在Hadoop的商品计算机集群节点上的数据。 Hadoop也做了同样的事情。我们有存储的HDFS和用于计算的MapRedu

浏览 8提问于2016-03-14得票数 16

1回答

一个Hadoop节点的目的是什么？

hadoop

我对Hadoop并不熟悉，所以这似乎是个愚蠢的问题。那么一个Hadoop节点的目的是什么呢？它只有一台计算机，所以没有资源的分配或共享？

浏览 2提问于2017-11-30得票数 0

回答已采纳

2回答

为什么在最新的Hadoop中没有内存计算功能？

apache-spark、hadoop、in-memory

我们都知道，Spark使用RAM存储处理过的数据，Spark和Hadoop都使用RAM进行计算，这使得Spark可以以极快的速度访问数据。但是，如果这是一个有很大区别的东西(除了钨和催化剂)，我们可以把它添加到Hadoop中。为什么我们没有仅仅改变Hadoop中的存储例程(在内存中使用它)，而不是完全发明一个不同的工具(Apache )？是否还有其他限制阻止Hadoop在内存存储中实现？

浏览 0提问于2021-01-16得票数 1

回答已采纳

1回答

云计算中Hadoop的数据局部性

hadoop、amazon-web-services、mapreduce、cloud

目前，Hadoop通过将任务分配给包含数据的节点或接近该节点的节点(例如相同的机架)来实现数据局部性。但是，我想知道是否可以将相同的概念应用于部署在一组虚拟机上的云计算中，因为有关物理层的信息，例如哪些物理机器当前承载了这些VM，可能是不可用的。

浏览 5提问于2014-01-21得票数 2

回答已采纳

1回答

谷歌云点击部署hadoop

hadoop、google-cloud-storage、google-cloud-platform、google-hadoop

为什么google cloud click to deploy hadoop工作流程需要选择本地持久磁盘的大小，即使您计划将hadoop连接器用于云存储？默认大小为500 GB。在google云中使用hadoop云存储连接器时，是否有推荐的持久化磁盘大小？“在Google Cloud平台上部署Apache HadoopHadoop将部署在单个集群中。H

浏览 7提问于2014-11-23得票数 0

1回答

在另一个框架上执行Pig

hadoop、apache-pig

从这个意义上说，理论上应该可以在任何框架中执行Pig拉丁语，尽管目前，它意味着在Hadoop环境中执行。将Pig拉丁语切换到运行在不同的框架上会有多难？如果有的话，有没有任何扩展点，或者Pig拉丁语与Hadoop紧密耦合？

浏览 3提问于2011-10-13得票数 1

回答已采纳

3回答

为什么要使用Hadoop？

java、hadoop

我对Hadoop的用法并不感到困惑。我不知道何时何地使用Hadoop。根据定义，这项工作还由Oracle、MSSQL等其他数据库完成，即跨集群存储和处理数据。那么使用Hadoop还有什么优点呢？

浏览 3提问于2015-08-12得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何将仅计算节点添加到Hadoop集群

Hadoop客户端与集群分离

hadoop集群上的存储数据库

Hadoop:面向多用户的伪分布式模式

火花和Hadoop有什么不同？

为什么BigQuery有自己的存储空间？

SQL 2016 PolyBase计算下推到使用WASBS (又名Azure Blob )的Hadoop

hadoop集群中的边缘节点

如何搭建Hadoop处理环境？

是否在HDFS集群上重新分配数据？

使用Windows Azure for MapReduce的优势

用于处理大数据的MySQL集群与Hadoop

为什么星火强调去耦模式，mem，存储？

Hadoop Vs数据湖

一个Hadoop节点的目的是什么？

为什么在最新的Hadoop中没有内存计算功能？

云计算中Hadoop的数据局部性

谷歌云点击部署hadoop

在另一个框架上执行Pig

为什么要使用Hadoop？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐