HDFS中的Federation联邦机制

HDFS中的Federation联邦机制

  • 当前HDFS体系架构--简介
    • 局限性
  • 联邦Federation架构
    • 简介
    • 好处
    • 配置示例

当前HDFS体系架构–简介

当前的HDFS结构有两个主要的层:

  • 命名空间(namespace)
    由文件,块和目录组成的统一抽象的目录树结构。由namenode根据用户操作实时维护树结构
  • 块存储层
    包括两部分:
    • 块管理:namenode执行块管理。块管理通过处理注册和定期心跳来提供DataNode集群成员身份。它处理块报告并迟滞与块相关的操作,如创建,删除,修改或获取块位置。它还维护块的位置,副本位置。为未复制的块管理块复制,并在已复制的块中删除
    • 存储:DataNode通过在本地文件系统上存储块并提供读/写访问权限来管理存储空间
      在这里插入图片描述

局限性

当下的HDFS体系结构仅允许单个namenode委会文件系统名称空间。这货在那个体系目前存在着一些弊端性和局限性:

  • DataNode磁盘存储空间不够增加结点,namenode内存不够是否可以无线扩容。比如:一种是DataNode横向扩展机器增加结点,一种是纵向扩展单机加内存
  • 由于名称空间和存储层紧密耦合,namenode的替代实现很困难。这限制了其他服务直接使用块存储。namenode成了唯一入口
  • 文件系统的操作害限于namenode一次处理的任务数。因此,集群的性能取决于namenode吞吐量
  • 同样,由于使用的那个名称空间,因此使用集群的占用者组织之间没有隔离

联邦Federation架构

简介

  • Federation是namenode之间的Federation,也就是集群中会有多个namenode。多个那么node的情况意味着有多个namespace。注意,这区别于HA模式下的多namenode,HA中他们是拥有同一个namespace
  • Federation体系中多个那么node之间相互独立且不需要互相协调,各自分工,管理自己的区域。每个DataNode要向集群中所有的namenode注册,且周期性的向所有namenode发送心跳和块报告,并执行所有namenode的命令
    在这里插入图片描述

好处

  • 命名空间可伸缩性
    • 使用Federation,可以水平扩展名称空间。这对大型集群或包含太多小文件的集群有利,因为想集群添加了更多的namenode。
  • 性能
    • 由于文件系统操作不熟单个那么node吞吐量的限制,因此可以提高文件系统的性能
  • 隔离
    -由于有多个名称空间,他可以为使用集群的占用者组织提供隔离

配置示例

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/53891.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网页版Java(Spring/Spring Boot/Spring MVC)五子棋项目(二)前后端实现用户的登录和注册功能【用户模块】

网页版Java五子棋项目(二)前后端实现用户的登录和注册功能【用户模块】 在用户模块我们要清楚要完成的任务一、MyBatis后端操作数据库1. 需要在数据库创建用户数据库1. 用户id2. 用户名3. 密码4. 天梯积分5. 总场数6. 获胜场数 2. 创建用户类User和数据库…

arcgis--数据库构建网络数据集

1、打开arcmap软件,导入数据,如下: 该数据已经过处理,各交点处均被打断,并进行了拓扑检查。 2、在文件夹下新建文件数据库,名称为路网,在数据库下新建要素类,并导入道路shp文件&…

网站无法访问的常见原因

有多种问题可能会阻止用户访问您的网站。本文将解决无法访问网站,且没有错误消息指示确切问题的情况,希望对您有所帮助。 无法访问网站的常见原因有: (1)DNS 设置不正确。 (2)域名已过期。 (3)空白或没有索引文件。 (4)网络连接问题。 DNS 设…

jenkins的cicd操作

cicd概念 持续集成( Continuous Integration) 持续频繁的(每天多次)将本地代码“集成”到主干分支,并保证主干分支可用 持续交付(Continuous Delivery) 是持续集成的下一步,持续…

pyspark使用XGboost训练模型实例

遇到一个还不错的使用Xgboost训练模型的githubhttps://github.com/MachineLP/Spark-/tree/master/pyspark-xgboost 1、这是一个跑通的代码实例,使用的是泰坦尼克生还数据,分类模型。 这里使用了Pipeline来封装特征处理和模型训练步骤,保存为…

springboot+vue农产品特产商城销售平台_50kf2 多商家

随着我国经济的高速发展与人们生活水平的日益提高,人们对生活质量的追求也多种多样。尤其在人们生活节奏不断加快的当下,人们更趋向于足不出户解决生活上的问题,南阳特产销售平台展现了其蓬勃生命力和广阔的前景。与此同时,为解决…

Go语音介绍

Go语言介绍 Go 即Golang,是Google公司2009年11月正式对外公开的一门编程语言。 Go是静态强类型语言,是区别于解析型语言的编译型语言。 解析型语言——源代码是先翻译为中间代码,然后由解析器对代码进行解释执行。 编译型语言——源代码编…

zookeeper入门学习

zookeeper入门学习 zookeeper应用场景 分布式协调组件 客户端第一次请求发给服务器2,将flag值修改为false,第二次请求被负载均衡到服务器1,访问到的flag也会是false 一旦有节点发生改变,就会通知所有监听方改变自己的值&#…

ES6基础知识十:你是怎么理解ES6中 Decorator 的?使用场景?

一、介绍 Decorator,即装饰器,从名字上很容易让我们联想到装饰者模式 简单来讲,装饰者模式就是一种在不改变原类和使用继承的情况下,动态地扩展对象功能的设计理论。 ES6中Decorator功能亦如此,其本质也不是什么高大…

TCP Socket 基础知识点(实例是以Java进行演示)

本篇根据TCP & Socket 相关知识点和学习所得进行整理所得。 文章目录 前言1. TCP相关知识点1.1 双工/单工1.2 TCP协议的主要特点1.3 TCP的可靠性原理1.4 报文段1.4.1 端口1.4.2 seq序号1.4.3 ack确认号1.4.4 数据偏移1.4.5 保留1.4.6 控制位1.4.7 窗口1.4.8 校验和1.4.9 紧…

iphone卡在恢复模式怎么办?修复办法分享!

iPhone 卡在恢复屏幕问题是 iPhone 用户在软件更新或恢复期间的常见问题。如果你也遇到此问题,不要着急,接下来我们将探讨 iPhone 卡在恢复屏幕上的主要原因,以及如何轻松修复它。 iPhone卡在恢复屏幕问题上没有一个特别的原因,但…

IO学习-线程

1,使用信号量的方式实现,将倒置以及打印的那道题目, 要求打印,倒置线程,顺序执行。出现的现象为先打印1234567,后打印7654321 不使用flag 运行结果: 2,创建两个线程,其中…