Loading [MathJax]/jax/output/CommonHTML/config.js

开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >Hadoop工作负载

问Hadoop工作负载
EN

Stack Overflow用户

提问于 2011-04-21 19:04:44

回答 1查看 2.1K关注 0票数 0

我目前正在使用hadoop中的字数统计应用程序作为基准。我发现cpu的使用率几乎一直保持在80-90%左右。我希望cpu使用率不稳定。是否有hadoop应用程序可以为我提供此功能？非常感谢。

语音识别特惠，低至14.9元！

提供业界非常具有性价比的语音识别服务，超高识别准确率，适用多场景

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2011-04-21 20:22:25

我不认为有一种方法可以限制或指定hadoop使用的范围。Hadoop将使用可用的CPU。当我运行大量作业时，我经常处于90%+范围内。

控制CPU使用率的一种方法是更改每个任务跟踪器可以同时运行的映射器/减速器的最大数量。这是通过$HADOOP_HOME/conf/core-site.xml中的mapred.tasktracker.{map|reduce}.tasks.maximum设置完成的。

当映射器/减少器数量有限时，它将在任务跟踪器上使用较少的CPU。

另一种方法是在设置作业时设置mapred.tasktracker.{map|reduce}.tasks的配置值。这将迫使该作业使用那么多的映射器/减少器。这个数字将在可用的任务跟踪器中分配，因此，如果您有4个节点，并且希望每个节点有1个映射器，则应将mapred.tasktracker.map.tasks设置为4。也有可能，如果一个节点可以运行4个映射器，它将运行所有4个映射器，我不知道hadoop将如何拆分任务，但强制每个作业一个数字是一种选择。

我希望这能帮你找到你要去的地方。我还是不太明白你在找什么。:)

票数 2

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/5748585

复制

相关文章

hadoop负载均衡与垃圾回收

hadoop 分布式安全

负载均衡负载的均衡，是分布式系统中一个永恒的话题，要让大家各尽其力齐心干活，发挥各自独特的优势，不能忙得忙死闲得闲死，影响战斗力。而且，负载均衡也是一个复杂的问题，什么是均衡，是一个很模糊的概念。比如，在分布式文件系统中，总共三百个数据块，平均分配到十个数据服务器上，就算均衡了么？其实不一定，因为每一个数据块需要若干个备份，各个备份的分布应该充分考虑到机架的位置，同一个机架的服务器间通信速度更快，而分布在不同机架则更具有安全性，不会在一棵树上吊死。。。在这里说的负载均衡，是宽泛意义上的均

闵开慧

2018/03/30

1.1K0

Hadoop 图解HDFS工作原理

大数据存储 node.js

结合Maneesh Varshney的漫画改编，为大家分析HDFS存储机制与运行原理。

smartsi

2019/08/07

2.6K0

Hadoop MapReduce 工作过程

编程算法 xml mapreduce

一个MapReducer作业经过了input，map，combine，reduce，output五个阶段，其中combine阶段并不一定发生，map输出的中间结果被分到reduce的过程成为shuffle（数据清洗）。

smartsi

2019/08/07

1K0

什么是电子负载？电子负载的工作原理

从功能上来说，电子负载和电源完全相反，电源用于给电子产品供电，而电子负载用于吸收或消耗功率。但从工作方式上来说，电源和电子负载有非常相似，通常工作在恒压CV模式或恒流CC模式。在实际应用中，电子负载的工作模式也通常与电源的工作模式相反，即恒压CV源需要使用恒流CC模式的电子负载，而恒流CC源使用恒压CV模式的电子负载。当然，几乎绝大部分的电子负载还有另一种恒阻CR模式，用于模拟现实中的电阻特性电子产品。

MCU起航

2020/06/29

4.7K0

Hadoop框架：NameNode工作机制详解

node.js 安全存储大数据

NameNode运行时元数据需要存放在内存中，同时在磁盘中备份元数据的fsImage，当元数据有更新或者添加元数据时，修改内存中的元数据会把操作记录追加到edits日志文件中，这里不包括查询操作。如果NameNode节点发生故障，可以通过FsImage和Edits的合并，重新把元数据加载到内存中，此时SecondaryNameNode专门用于fsImage和edits的合并。

知了一笑

2020/11/02

7470

Hadoop框架：NameNode工作机制详解

Hadoop框架：DataNode工作机制详解

node.js 大数据 xml

DataNode上数据块以文件形式存储在磁盘上，包括两个文件，一个是数据本身，一个是数据块元数据包括长度、校验、时间戳；

知了一笑

2020/11/02

7380

Hadoop框架：DataNode工作机制详解

云计算工作负载需要哪些保护

安全网络安全

组织出于各种原因采用多个云平台，例如提高效率和分配计算资源。根据《2021年Flexera云现状报告》，92%的企业采用了多云战略，80%的企业采用了混合云战略。但这些企业也经常经历管理复杂性的增加，这会影响安全性并增加风险。在多个部署点(包括分散的数据中心、混合和多云)上分发大量应用程序，扩大了攻击面，同时，这些分布式环境的可见性继续缩小。

CloudBest

2021/09/24

1.1K0

dubbo工作原理，集群容错，负载均衡

dubbo主要核心部件 Remoting：网络通信框架，实现了sync-over-async和request-response消息机制。 RPC：一个远程过程调用的抽象，支持负载均衡、容灾和集群功能。

MonroeCode

2018/02/09

1.3K0

dubbo工作原理，集群容错，负载均衡

云计算工作负载的高级保护

云计算企业安全

随着网络威胁环境的扩大，企业不仅需要保护自己免受应用程序元素本身的配置和管理风险，还需要防范源自云计算应用程序编程接口(API)和用户界面(UI)的风险。因此，现在开始建立对云计算工作负载的一致可见性至关重要，尤其是那些跨越多个云平台环境的工作负载。

静一

2021/07/30

5420

几种常见负载均衡算法工作原理

编程算法 tcp/ip

顾名思义将请求按顺序轮流地分配到后端服务器上，它均衡地对待后端的每一台服务器，而不关心服务器实际的连接数和当前的系统负载。

兜兜毛毛

2021/04/15

8640

linux负载高但cpu使用率低_cpu工作负载

average load process sleep 进程

做为一个性能测试工程师，每当我们发现计算机变慢的时候，我们通常的标准姿势就是执行 uptime 或 top 命令，来了解系统的负载情况。

全栈程序员站长

2022/10/01

5.2K0

linux负载高但cpu使用率低_cpu工作负载

dubbo工作原理，集群容错，负载均衡

Remoting：网络通信框架，实现了sync-over-async和request-response消息机制。

MonroeCode

2018/01/10

1.2K0

Kubernetes运维之工作负载DaemonSet

运维工作集群进程网络

DaemonSet 确保全部（或者某些）节点上运行一个 Pod 的副本。当有节点加入集群时，也会为他们新增一个 Pod 。当有节点从集群移除时，这些 Pod 也会被回收。删除 DaemonSet 将会删除它创建的所有 Pod。使用 DaemonSet 的一些典型用法：

王先森sec

2023/04/24

4200

Kubernetes运维之工作负载DaemonSet

Hadoop实战之前的准备工作

http hadoop java jdk html

俗语说，“磨刀不误砍柴工”。Hadoop操作前的准备工作可以加快Hadoop的操作与应用。

星哥玩云

2022/06/30

2860

浅论Hadoop应用工作思路

hadoop 大数据

随着企业对大数据越来越重视，hadoop应用达到了前所未有的高度。今天聊聊hadoop应用的工作思路，我想了下以下几方面，和大家一起讨论：首先最重要的是建立一支以开发人员为主的团队。 Hadoop虽然很火，但是还是在初级阶段，开源的东西存在业务不完全匹配，成熟度低等诸多问题。所以不管是什么公司，什么部门，应该建设一支以开发人员为主的团队。立足于能读懂开源代码，能修改bug，可以根据自己的场景进行适度匹配。团队建立之后，以团队技能成熟度模型为指导，牵引团队技能逐渐成熟，达到事成人爽。关于团队成熟度，以前写

大数据和云计算技术

2018/03/08

5280

在TKE集群中新建工作负载

容器容器镜像服务

需要明白的是工作负载（workload）指的是Deployment、StatefulSet、DaemonSet、CronJob、Job。

马凌鑫

2019/04/10

1K0

【云驻共创】详解Kubernetes工作负载管理

希望读者通过接下来代码加图文的介绍对工作负载的概念以及使用场景有更清晰的认识和帮助。

程思扬

2022/04/11

9350

（译）针对 Kubernetes 工作负载的策略工具

本文所讲的策略，指的是在 Kubernetes 中，阻止特定工作负载进行部署的方法。

崔秀龙

2020/07/20

5560

KubeVirt上的虚拟化GPU工作负载

容器 https kubernetes 网络安全 kvm

在这段2019年北美KubeCon视频中，Red Hat的David Vossel和NVIDIA的Vishesh Tanksale探索了KubeVirt背后的架构，以及NVIDIA如何利用该架构为Kubernetes上的GPU工作负载提供动力。以NVIDIA的GPU工作负载为例进行研究，它们提供了一个重点视图，以了解主机设备透传是如何通过KubeVirt完成的，并提供了一些性能指标，将KubeVirt与独立KVM进行比较。

CNCF

2020/02/20

3.9K0

KubeVirt上的虚拟化GPU工作负载

Hadoop之HDFS03【NameNode工作原理】

node.js 数据结构存储大数据

每隔一段时间，会由secondary namenode将namenode上积累的所有edits和一个最新的fsimage下载到本地，并加载到内存进行merge（这个过程称为checkpoint）

用户4919348

2019/04/18

7340

相似问题

hadoop负载均衡

30

Hadoop MapReduce负载平衡

11

Hadoop中的负载平衡

13

改进hadoop中的负载均衡

10

Hadoop，机器之间负载不均匀

10

活动推荐

提供大模型在企业的应用构建、高效便捷

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例