首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

大数据面试题百日更新_Hadoop专题(Day01)

1.客户端发起文件上传请求,通过RPC与NN(NameNode)建立通讯,NN根据检查文件,父目录是否已存在做出反馈 2.客户端请求第一个block该传输到哪些DN(DataNode)上; 3.NN根据配置文件中机架感知原理及备份数量进行文件分配,返回可用的DN地址,如:A、B、C 4.客户端请求3台DN中的一台A上传数据(本质是RPC调用,建立pipeline),A收到后传给B,B传给C,将整个管道建立起来,后逐级返回客户端。 5.客户端开始往A传第一个block(先进行本地缓存,以packet为单位,每个packet64k),A收到后给B,B传给C,A每传一个都会等待应答。 6.数据被切分成一个个packet在pipeline依次传输,收到后反方向逐个发送ack正确应答命令,最终有第一个DN节点A将pipelineack发送给client; 7,关闭写入流; 8.当一个block完成后,client进行第二个block传输;

03
领券