rpc hadoop_hadoop rpc_如何配置hadoop rpc的超时？ - 腾讯云开发者社区

什么是RPC机制 Remote Procedure Call（简称：RPC):远程过程调用协议。 RPC是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在，如TCP或UDP，为通信程序之间携带信息数据。在OSI网络通信模型中，RPC跨越了传输层和应用层。RPC使得开发包括网络分布式多程序在内的应用程序更加容易 RPC的运行模式 RPC采用客户机/服务器模式。请求程序就是一个客户机，而服务提供程序就是一个服务器。首先，客户机调用进程发送一个有进程参数

您找到你想要的搜索结果了吗？

是的

没有找到

hadoop 异常记录 ERROR: org.apache.hadoop.hbase.MasterNotRunningException: Retried 7 times

当我把hadoop、hbase安装配置（具体参考这里）好了之后，启动hbase的shell交互模式，输入命令却出现了下面这样的错误： ERROR: org.apache.hadoop.hbase.MasterNotRunningException: Retried 7 times 这是为什么呢，Master为什么没有启动起来呢？查看logs目录下的Master日志，发现有以下信息： 2012-02-01 14:41:52,867 FATAL org.apache.hadoop.hbase.master.

0578-5.15.1-Kerberos环境下Java应用程序认证超时异常分析

在Kerberos环境中，我们的应用程序通过Java代码来提交任务需要先进行Kerberos凭证的初始化然后进行应用程序的提交，本文档主要讲述Java应用程序长时间运行作业Kerberos不自动重新认证问题

Hadoop中的RPC

在hadoop中，客户端与namenode、datanode与namenode、dfsadmin与namenode、客户端与resourcemanager等模块之间的交互都采用rpc的方式进行，本文就来聊聊hadoop中rpc的实现。

Hadoop Yarn RPC 未授权访问漏洞

Apache Hadoop YARN （Yet Another Resource Negotiator）是一种新的 Hadoop 资源管理器，它是一个通用资源管理系统，可为上层应用提供统一的资源管理和调度，它的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处。 HadoopYarn默认对外开放RPC服务，攻击者可利用RPC服务执行任意命令，进而控制服务器。同时由于Hadoop Yarn RPC服务访问控制机制开启方式与REST API不一样，因此即使在 REST API有授权认证的情况下，RPC服务所在端口仍然可以未授权访问。

大数据技术之集群数据迁移

启动完毕后，将apache集群中，hive库里dwd,dws,ads三个库的数据迁移到CDH集群

Hadoop、HBase配置Ganglia指南（metrics1）

Server端： yum install rrdtool ganglia ganglia-gmetad ganglia-gmond ganglia-web httpd php Client端： yum install ganglia-gmond 创建RRD目录 mkdir -p /var/lib/ganglia/rrds chown ganglia:ganglia /var/lib/ganglia/rrds 编辑/etc/ganglia/gmond.conf cluster { name = "DFS" owner = "unspecified" latlong = "unspecified" url = "unspecified" } udp_send_channel { #bind_hostname = yes # Highly recommended, soon to be default. # This option tells gmond to use a source address # that resolves to the machine's hostname. Without # this, the metrics may appear to come from any # interface and the DNS names associated with # those IPs will be used to create the RRDs. mcast_join = master.hadoop.test port = 8649 ttl = 1 }

Hadoop源码分类概要整理

最近突然觉得，很多掌握的都还是很浅的原理，需要更深入细粒度去了解整个分布式系统的运转机制。于是。。开始作死而又作死而又作死的源码之旅。

Linux NFS服务器详解

NFS是Network FileSystem的缩写，即网络文件系统，它可以实现挂载远程电脑上的设备到本地从而像访问本地磁盘一样操作，有点类似于windows 的网上邻居。是SUN公司1984年开发的，v1版本只在SUN公司内部使用过，v2, v3, v4是公开版本，一般红帽5默认是v3版本，红帽6默认目前最新的v4版本。

使用Ganglia监控Hadoop及HBase集群

Ganglia 是 UC Berkeley 发起的一个开源监视项目，设计用于测量数以千计的节点。每台计算机都运行一个收集和发送度量数据（如处理器速度、内存使用量等）的名为 gmond 的守护进程。它将从操作系统和指定主机中收集。接收所有度量数据的主机可以显示这些数据并且可以将这些数据的精简表单传递到层次结构中。正因为有这种层次结构模式，才使得 Ganglia 可以实现良好的扩展。gmond 带来的系统负载非常少，这使得它成为在集群中各台计算机上运行的一段代码，而不会影响用户性能。

Hadoop2.2.0 HDFS暂时不支持并发追加

由多个客户端对同一个文件发起并发追加操作后，只有最后发起的那个客户端抢得追加的锁，其他客户端报错：

Hadoop阅读笔记（七）——代理模式

关于Hadoop已经小记了六篇，《Hadoop实战》也已经翻完7章。仔细想想，这么好的一个框架，不能只是流于应用层面，跑跑数据排序、单表链接等，想得其精髓，还需深入内部。　　按照《Hadoop阅读笔记（五）——重返Hadoop目录结构》中介绍的hadoop目录结构，前面已经介绍了MapReduce的内部运行机制，今天准备入手Hadoop RPC，它是hadoop一种通信机制。 RPC（Remote Procedure Call Protocol）——远程过程调用协议，它是一种通过网络从远程计算机程序

010

HDFS——JN扩容的正确姿势

有一段时间没有更文了，一方面是之前准备的hudi系列由于一些细节还没研究得很清楚，暂时没有继续更新。另一方面，最近事情相当多，回家后收拾收拾就十一二点了，也就没有再进行总结输出了。

Hadoop运维–HA抛出journalnode can not write

为什么说程序员到了不得不掌握RPC的时候了！

随着企业 IT 服务的不断发展，单台服务器逐渐无法承受用户日益增长的请求压力时，就需要多台服务器联合起来构成「服务集群」共同对外提供服务。同时业务服务会随着产品需求的增多越来越肿，架构上必须进行服务拆分，一个完整的大型服务会被打散成很多很多独立的小服务，每个小服务会由独立的进程去管理来对外提供服务，这就是「微服务」。

YARN任务运行中的Token

上一篇文章中，主要讲解了token的一些通用知识，以及hadoop中，token的实现和通用数据结构及流程。

Ganglia监控Hadoop相关配置及监控指标说明

修改配置文件：$HADOOP_HOME/etc/hadoop/hadoop-metrics.properties 添加如下内容： *.sink.ganglia.class=org.apache.hadoop.metrics2.sink.ganglia.GangliaSink31 *.sink.ganglia.period=10 # default for supportsparse is false *.sink.ganglia.supportsparse=true *.sink.ganglia.slope=jvm.metrics.gcCount=zero,jvm.metrics.memHeapUsedM=both *.sink.ganglia.dmax=jvm.metrics.threadsBlocked=70,jvm.metrics.memHeapUsedM=40 #192.168.0.100组播地址 8801是接受和发送数据端口 namenode.sink.ganglia.servers=239.2.11.71:8801 datanode.sink.ganglia.servers=239.2.11.71:8801 jobtracker.sink.ganglia.servers=239.2.11.71:8801 tasktracker.sink.ganglia.servers=239.2.11.71:8801 maptask.sink.ganglia.servers=239.2.11.71:8801 reducetask.sink.ganglia.servers=239.2.11.71:8801

Hadoop ha之Journal Storage Directory nor formatted

情况是这样的，Hadoop ha下，集群QJM的数据丢了，之后启动namenode后报Journal Storage Directory nor formatted，导致namenode启动失败，如下List-1所示:

深入理解RPC——RPC在企业服务中的核心价值

【Hadoop】org.apache.hadoop.ipc.xxx不存在

想在 IDEA 上运行 Hadoop 的单测，以为 Maven 相关的依赖和插件下载好就能跑了是吧？果不其然，没那么简单，下面就收到一个报错了: org.apache.hadoop.ipc.xxx不存在，见下图。

大数据面试题（二）：Hadoop的联邦机制核心高频面试题

采用多台NN组成联邦。NN是独立的，NN之间不需要相互调用。NN是联合的，同属于一个联邦，所管理的DN作为block的公共存储。

011

一文搞懂hadoop的metrics

一个成熟的项目通常都会自带提供metric，反映运行时内部的各个信息，以方便进行监控运维。hadoop也不例外，通过jmx可以查看内部各个metrics信息，本文就来聊聊hdfs的metrics。

大数据面试题（二）：Hadoop的联邦机制核心高频面试题

采用多台NN组成联邦。NN是独立的，NN之间不需要相互调用。NN是联合的，同属于一个联邦，所管理的DN作为block的公共存储。

使用HDFS客户端java api读取hadoop集群上的信息

本文介绍使用hdfs java api的配置方法。 1、先解决依赖，pom <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-client</artifactId> <version>2.7.2</version> <scope>provided</scope> </dependency> 2、配置文件，存放h

Hadoop监控系统

XMonitor监控系统( svn目录 svn.d.xiaonei.com/Hadoop/Xmonitor)

Spark入门，概述，部署，以及学习（Spark是一种快速、通用、可扩展的大数据分析引擎）

1：Spark的官方网址：http://spark.apache.org/ 1：Spark生态系统已经发展成为一个包含多个子项目的集合，其中包含SparkSQL、Spark Streaming、GraphX、MLlib等子项目，Spark是基于内存计算的大数据并行计算框架。Spark基于内存计算，提高了在大数据环境下数据处理的实时性，同时保证了高容错性和高可伸缩性，允许用户将Spark部署在大量廉价硬件之上，形成集群。 2：Spark是MapReduce的替代方案，而且兼容HDFS、Hive，可融入Hado

RPC 架构初探

RPC的全称是Remote Procedure Call，它是一种进程间的通信方式。允许像调用本地服务一样调用远程服务，它的具体的实现方式可以不同，例如Spring的HTTP Invoker，FaceBook的Thrift二进制私有协议通信。

「EMR 运维指南」之 Impala 关联 Sentry + Hue

在EMR集群带公网master节点部署sentry服务，Impala的GROUP组需要在Impala server节点上进行创建系统组与之关联。

011

FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.tez.TezTask

java客户端无法上传文件到hdfs

学些hadoop。遇到这个问题，查找网上好多资料，一般都是说namenode和datanode不同步导致的，或者防火墙没开50010端口，或者nameNode和datanode无法通信导致的。

org.apache.hadoop.security.AccessControlException: Permission denied: user=root, access=WRITE, inode

org.apache.hadoop.security.AccessControlException: Permission denied: user=root, access=WRITE, inode="/user":hdfs:supergroup:drwxr-xr-x

Hadoop-HDFS浅谈

HDFS是Hadoop中进行分布式存储的组件,旨在提供可靠的, 可扩展的, 高吞吐, 高并发的大数据访问. HDFS是一个主/从（Mater/Slave）体系结构，主要节点是NameNode, DataNode.

phoenix安装---安装系列十

<url>https://repository.cloudera.com/artifactory/cloudera-repos</url>

大数据进阶之Spark运行流程

在大数据的诸多技术框架当中，Spark发展至今，已经得到了广泛的认可。Hadoop与Spark可以说是企业级数据平台的主流选择，基于不同的应用场景，来搭建符合需求的大数据系统平台。今天我们就来讲讲其中的Spark，Spark核心运行流程。

一脸懵逼加从入门到绝望学习hadoop之 org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.security.AccessControlE

010

解决spark sql读取hudi表出现偶然读不出来数据问题

用beeline连接spark thriftserver或者kyuubi（spark 3.3.0）查询hudi mor表，发现对于同一个spark SQL在同一个beeline session里面不同时间查到的东西都是一样的。比如我用select count(*) from xxx。除此之外还有个问题就是，在同一个beeline session里面再过一段时间后，由于有些文件被合并了，再查会报以前的log文件找不到的问题。

一文搞定Journal Node原理

hdfs的HA机制，具体来说可以分为两部分，一部分是基于zkfc、zookeeper完成nn之间的选主；而另一部分则是nn之间的元数据共享与同步。

could only be replicated to 0 nodes, instead of 1

出现这种异常是因为数据冲突造成的，可以把通过日志查看，解决办法：删掉tmp文件夹下生成的dfs文件，重新format一下，问题解决。

Failed to place enough replicas

如果DataNode的dfs.datanode.data.dir全配置成SSD类型，则执行“hdfs dfs -put /etc/hosts hdfs:///tmp/”时会报如下错误：

Hadoop JMX监控和预警

Hadoop slave node会定期发出一些metrics信息来反映服务的健康状况，服务团队可以通过查看这些metrics来了解服务是否处于健康状态，并回溯了解历史表现。一些典型的用例是：

从源码中分析 Hadoop 的 RPC 机制

RPC是Remote Procedure Call（远程过程调用）的简称，这一机制都要面对两个问题对象调用方式；序列/反序列化机制在此之前，我们有必要了解什么是架构层次的协议。通俗一点说，就是我

spark1.x升级spark2如何升级及需要考虑的问题

问题导读 1.spark2升级哪些内容变化？ 2.升级中spark哪些没有发生变化？ 3.cloudera中，spark1和spark2能否并存？ 4.升级后，可能会遇到什么问题？ spark2出来已经很长时间了，但是由于spark1.6比较稳定，很多依然在使用。如果想使用spark2，那么该如何升级。我们window升级一般为直接点击升级即可，剩下的事情，不用我们管。但是spark的升级确实有点出乎意料。相当于我们直接安装，但是可以借用以前的配置，比如配置文件基本是不变的，如果目录相同，环境变量

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐