Hadoop3：HDFS的架构组成-编程知识

Hadoop3：HDFS的架构组成

一、官方文档

我这里学习的是Hadoop3.1.3版本，所以，查看的也是3.1.3版本的文档

在这里插入图片描述
Architecture模块最下面

二、HDFS架构介绍

HDFS架构的主要组成部分，是一下四个部分

1、NameNode(NN)

就是Master节点，它是集群管理者。

1、管理HDFS的名称空间
2、配置副本策略
3、管理数据块（Block）映射信息
4、处理客户端读写请求

2、DataNode

就是Slave节点，干活的。NameNode下达程序命令，DataNode执行具体命令。
1、存储实际的数据块
2、执行数据块的读写操作

3、Client

客户端，web页面也算是客户端，终端命令也是客户端来执行的。

1、切分文件，文件上传到HDFS集群的时候，Client将文件切分成一个个的Block，然后，进行上传
2、与NameNode交互，获取文件的位置信息
3、与DataNode交互，读写数据
4、Client提供一些命令来管理HDFS，比如NameNode的格式化命令
5、Client可以通过一些命令来访问HDFS，比如对HDFS的增删改查操作

4、Secondary NameNode(2NN)

它不是NameNode的热备，当NameNode节点挂掉的时候，它并不能马上替换NameNode并提供服务
实际场景中，一般用两个NameNode来实现高可用，2NN一般不用

1、辅助NameNode，分担工作量
2、在紧急情况下，可辅助恢复NameNode

三、思考题

1、NameNode中的Block大小如何设置？设置多大合适？怎么计算？

1、配置参数dfs.blocksize
在Hadoop2.x/3.x版本中默认大小是128M，1.x版本中是64M。
默认配置在hdfs-default.xml中，我们可以在hdfs-site.xml中自定义配置

<property><name>dfs.blocksize</name><value>134217728</value><description>The default block size for new files, in bytes.You can use the following suffix (case insensitive):k(kilo), m(mega), g(giga), t(tera), p(peta), e(exa) to specify the size (such as 128k, 512m, 1g, etc.),Or provide complete size in bytes (such as 134217728 for 128 MB).</description>
</property>