202109060657 - hadoop架构和读写流程

news/2025/3/20 19:19:31/文章来源:https://www.cnblogs.com/route/p/18783778

1. 整体架构

hdfs架构

zk

monode高可用。HA的工作原理？是否需要每个datanode监听zk？

namenode

NameNode(nn):Hdfs集群的管理者，Master
管理Hdfs的名称空间（NameSpace）
维护副本策略
记录文件块（Block）的映射信息
负责处理客户端读写请求

datanode

DataNode:NameNode下达命令，DataNode执行实际操作，Slave节点。
保存实际的数据块
负责数据块的读写

yarn架构

2. 读写流程

client负责文件的切分
向datanode写/读数据
与namenode交互获取block位置

1. 客户端通过Distributed FileSystem向NameNode请求下载文件，NameNode通过查询元数据，找到文件块
所在的DataNode地址。
2. 挑选一台DataNode（就近原则，然后随机）服务器，请求读取数据。
3. DataNode开始传输数据给客户端（从磁盘里面读取数据输入流，以Packet为单位来做校验）。
4. 客户端以Packet为单位接收，先在本地缓存，然后写入目标文件。

1. 客户端通过Distributed FileSystem模块向NameNode请求上传文件，NameNode检查目标文件是否已存在，父目录是否存在。
2. NameNode返回是否可以上传。
3. 客户端请求第一个 Block上传到哪几个DataNode服务器上。
4. NameNode返回3个DataNode节点，分别为dn1、dn2、dn3。 5. 客户端通过FSDataOutputStream模块请求dn1上传数据，dn1收到请求会继续调用dn2，然后dn2调用dn3，将这个通信管道建立完成。
6. dn1、dn2、dn3逐级应答客户端。
7. 客户端开始往dn1上传第一个Block（先从磁盘读取数据放到一个本地内存缓存），以Packet为单位，dn1收到一个Packet就会传给dn2，dn2传给dn3；dn1每传一个packet会放入一个确认队列等待确认。
8. 当一个Block传输完成之后，客户端再次请求NameNode上传第二个Block的服务器。（重复执行3-7步）。

3. map reduce原理

4. yarn流程

resourcemanager -> application master -> map task / reduce task

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/902156.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

基于风险的完整性和检查建模(RBIIM)MATLAB仿真

基于风险的完整性和检查建模(RBIIM)MATLAB仿真

1.程序功能描述基于风险的完整性和检查建模(Risk-Based Integrity and Inspection Modeling ,RBIIM)MATLAB仿真，对比prior density，posterior perfect inspection，posterior imp inpection，cummulative posterior imperfect inspection四个指标。 2.测试软件版本以及…

阅读更多...

202108151156 - kafka消费积压案例

202108151156 - kafka消费积压案例

0. 背景上游厂家生产信令数据，我方消费kafka数据，过滤后插入HBase。上游生产的信令数据分了4个主题，每个主题有若干分区，这4个主题的数据消费后都插入同一张HBase表。问题：kafka消息积压达到百亿。以下以topic1为例，有6个分区。 1. 查看消费滞后情况 kafka-consumer-…

阅读更多...

mysql 多表怎么连接的

mysql 多表怎么连接的

前言简单描述一下多表怎么连接的。正文首先，我们得抛开我们一些自以为是的想法。我想过这个问题，就是为什么我们背乘法口诀的时候，我们总是背： 22 = 4， 99=81 这样背下去，似乎这是口诀。然而这是缓存，不是计算，既然不是计算那么就不是逻辑学。我们理所当然的想9*9…

阅读更多...

202108120808 - 类加载器及双亲委派机制

202108120808 - 类加载器及双亲委派机制

Bootstrap ClassLoader 这是加载器中的大 Boss，任何类的加载行为，都要经它过问。它的作用是加载核心类库，也就是 rt.jar、resources.jar、charsets.jar 等。当然这些 jar 包的路径是可以指定的，-Xbootclasspath 参数可以完成指定操作。这个加载器是 C++ 编写的，随着 JVM …

阅读更多...

keil仿真时导出数据操作

keil仿真时导出数据操作

keil仿真时导出数据操作 save D:\savedata.txt 0x20001013,0x20001035

阅读更多...

spring-boot-starter-validation

spring-boot-starter-validation

官方提供的注解 spring-boot-starter-validation 是 Spring Boot 提供的一个 starter，是一个用于验证 Java Bean 的标准，它提供了一套注解和相应的运行时 API 来定义和执行校验规则。具体来说，当你在项目中引入 spring-boot-starter-validation 后，你可以使用一系列预定义…

阅读更多...

省选算法复习

省选算法复习

省选算法复习 1. 线段树优化建图当我们需要向区间内所有点连边或者从区间中所有点连到某个点的时候，便可以使用线段树来优化，如果需要从区间每一个点连到另一个区间每一个点的话，加一个虚点就好了。这不是一个很困难的技巧，关键在于要建模。 P5471 [NOI2019] 弹跳 - 洛谷…

阅读更多...

fastadmin订单父子表管理端

fastadmin订单父子表管理端

fastadmin后台父子表使用方法发布于 2021-01-22 12:48:10fastadmin后台的所有表格都是支持父子表配置的，只需要简单修改一下对应的JS即可，下面直接进入主题。示例是我的全国省市行政区划表，是从国家统计局网站采集下来的，共五级行政数据，非常适合用来做父子表，按照级别一…

阅读更多...

Rudolf and k Bridges

Rudolf and k Bridges

Rudolf and k Bridges 题目大致题意上图为俯视图有一个\(nXm\)的网格，下标从\(1-n\) 以及从 \(1-m\)，\((i, j)\) 的值就是这个这垂直一格水的深度现在要安装支架，有几个信息：\((i, 1)\) 和 \((i, m)\) 处必须要安装相邻支架的距离不能超过 \(d\), 相邻距离为 \(abs(j - …

阅读更多...

背离Divergence Trading ，贪小便宜

背离Divergence Trading ，贪小便宜

趋势交易（trend trading）和背离交易（divergence trading），代表了两种不同的交易策略。做背离交易相当于赌市场短期失效，承认你比市场聪明，虽然能赚小钱，但往往是亏大钱的根源。贪小便宜爱背离，贪小便宜(gain small advantages)不爱止损(cut losses)，所以背离和不止损…

阅读更多...

在鸿蒙NEXT开发中实现一个语音识别组件

在鸿蒙NEXT开发中实现一个语音识别组件

鸿蒙系统发布以后都不知道叫它5.0版本还是NEXT版本了，哈哈，反正是最新版本就对了。对于语音转换文字，鸿蒙系统提供了离线语音识别模型speechRecognizer，语种目前支持中文，识别效果非常不错。今天要分享的是使用speechRecognizer实现一个语音识别组件。要实现语音识别，首先…

阅读更多...

激光代加工产品一览-代加工-外协加工-委外加工-激光代加工-河南郑州亚克力切割雕刻代加工-芯晨微纳（河南）

激光代加工产品一览-代加工-外协加工-委外加工-激光代加工-河南郑州亚克力切割雕刻代加工-芯晨微纳（河南）

关键词：河南省郑州市、激光代加工、激光打标、激光切割、激光雕刻、激光打孔、激光毛化、激光分切简介：芯晨微纳（河南）光电科技有限公司，专注于激光微纳代加工、设备/耗材代理销售、设备租赁、技术推广服务，可处理材料类型及应用范围十分广泛，欢迎来电咨询（韩经理1823…

阅读更多...

推荐文章

最新文章