hadoop-3.1.2分布式搭建

news/2025/2/21 4:40:57/文章来源:https://www.cnblogs.com/w-ll/p/18521396

一、准备工作

三台虚拟机:

master、node1、node2

时间同步
关闭防火墙:

systemctl stop firewalld

查看防火墙状态:

systemctl status firewalld

取消防火墙自启:

systemctl disable firewalld

修改主机名

三台分别执行 vim /etc/hostname 并将内容指定为对应的主机

静态IP配置

vim /etc/sysconfig/network-scripts/ifcfg-ens33

关闭NetworkManager,并取消开机自启

systemctl stop NetworkManager
systemctl disable NetworkManager
systemctl status NetworkManager

免密登录

1、生成密钥
ssh-keygen -t rsa
2、配置免密登录
ssh-copy-id master
ssh-copy-id node1
ssh-copy-id node2
3、测试免密登录
ssh node1

配置好映射文件:

vim /etc/hosts
192.168.6.101 master
192.168.6.102 node1
192.168.6.103 node2

配置jdk

java -version

二、hadoop-3.1.1分布式搭建

1、上传解压配置环境变量

  • 解压

tar -zxvf hadoop-3.1.2.tar.gz

  • 配置环境变量

vim /etc/profile

  • 使环境变量生效

source /etc/profile

2、修改配置文件

  • 1、进入hadoop配置文件所在位置,修改hadoop配置文件

cd /usr/local/soft/hadoop-3.1.2/etc/hadoop

  • 2、修改core-site.xml配置文件,在configuration中间增加配置
<configuration>
<property><name>fs.defaultFS</name><value>hdfs://master:9000</value>
</property>
<property><name>hadoop.tmp.dir</name><value>/usr/local/soft/hadoop-3.1.2/tmp</value>
</property>
<property><name>fs.trash.interval</name><value>1440</value>
</property>
</configuration>

  • 3、修改hdfs-site.xml配置文件,在configuration中间增加配置
<configuration>
<property><name>dfs.replication</name><value>1</value>
</property>
<property><name>dfs.permissions</name><value>false</value>
</property>
</configuration>

  • 4、修改yarn-site.xml配置文件,在configuration中间增加配置
<property><name>yarn.resourcemanager.hostname</name><value>master</value>
</property>
<property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value>
</property>
<property><name>yarn.log-aggregation-enable</name><value>true</value>
</property>

  • 5、修改mapred-site.xml配置文件,在configuration中间增加配置
<configuration><property><name>mapreduce.framework.name</name><value>yarn</value></property><property><name>mapreduce.jobhistory.address</name><value>master:10020</value></property><property><name>mapreduce.jobhistory.webapp.address</name><value>master:19888</value></property>
</configuration>

  • 6、修改hadoop-env.sh配置文件
export JAVA_HOME=/usr/local/soft/jdk1.8.0_171

export HDFS_NAMENODE_USER=root
export HDFS_DATANODE_USER=root
export HDFS_SECONDARYNAMENODE_USER=root
export YARN_RESOURCEMANAGER_USER=root
export YARN_NODEMANAGER_USER=root

  • 7、修改 workers 配置文件
node1
node2

  • 8、初始化hdfs

hdfs namenode -format

  • 9、启动hadoop

start-all.sh

master

node1

node2

  • 10、停止hadoop

stop-all.sh

三、格式化集群

  • 1、关闭集群

stop-all.sh

  • 2、删除每个节点的hadoop根目录下的tmp目录

rm -rf tmp/

  • 3、重新格式化 在hadoop的bin目录下执行

hdfs namenode -format

  • 4、重新启动

start-all.sh

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/825472.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

#2024-2025-1学号20241309《计算机基础与程序设计》第六周学习总结

作业信息这个作业属于哪个课程 2024-2025-1-计算机基础与程序设计这个作业要求在哪里 2024-2025-1计算机基础与程序设计第六周作业这个作业的目标作业正文 2024-2025-1学号20241309《计算机基础与程序设计》第六周学习总结教材学习内容总结 《计算机科学概论》第七章: 1. Poly…

目标管理中目标制定的原则是什么

目标管理中目标制定的基本原则可以用SMART准则(具体、可衡量、可达成、相关性、时间限制)来概括。文章将主要探讨五个方面:1、具体性(Specific);2、可衡量性(Measurable);3、可达成性(Achievable);4、相关性(Relevant);5、时间限制(Time-bound),目标需有明确…

猿人学web端爬虫攻防大赛赛题第15题——备周则意怠-常见则不疑

题目网址:https://match.yuanrenxue.cn/match/15 解题步骤看触发的数据包。有个m参数,一看就是经过处理的,我们得知道m是如何组成的。看Initiator模块。还是看request函数,往上一看就看到了m的赋值操作。打断点,触发。看下window.m()的定义。比较好理解的,t1和t2就是对时…

ChatOps是什么

ChatOps是一种运维和开发团队在沟通、协作和自动化方面的实践方法。它的核心思想是将运维和开发操作集成到团队常用的聊天工具中,通过命令行或简单的自然语言指令来执行各种操作和任务,从而提高团队的效率和透明度。一、ChatOps的概念 ChatOps是一种运维和开发团队在沟通、协…

编程 和 数学 的关系是什么

编程 和 数学 的关系有:1. 共同的逻辑思维基础;2. 共享抽象建模的特性;3. 算法与数学之间的紧密联系;4. 数据结构和数学对象的对应关系;5. 计算机科学中的数学理论;6. 创新和问题解决的共同性。编程和数学都建立在严密的逻辑思维基础上。数学是一种形式化的语言,通过推理…

独显直连是啥意思

独显直连(Direct GPU Access,DGA)是一种涉及计算机图形卡和显示系统交互的技术。这种配置方式允许操作系统或应用程序直接与图形卡硬件进行通信,绕过传统的操作系统驱动和API层。独显直连在提高图形性能、降低延迟、并为高性能计算带来优势方面有其独到之处。本文将深入探讨…

Diffuision Policy + RL -------个人博客_ZSY_20241101

Diffusion Policy: Visuomotor Policy Learning via Action DiffusionCheng Chi, Zhenjia Xu, Siyuan Feng, Eric Cousineau, Yilun Du, Benjamin Burchfiel, Russ Tedrake, Shuran Song 原论文链接 投在了IJRR上 点击:原作者论文思路讲解 1. PPO背景引入 这里简要交代PPO的算…

抖音蓝V信息采集器快手蓝V商家联系方式批量提取工具

抖音蓝V信息采集器快手蓝V商家联系方式批量提取工具 作者V♥553813195 关于抖音蓝V信息采集器和快手蓝V商家联系方式批量提取工具,以下是详细的分析:一、抖音蓝V信息采集器 定义与功能 抖音蓝V信息采集器是一款专为抖音平台设计的工具,旨在帮助用户快速、准确地采集具有蓝V认…

halo配置踩坑过程小记

halo配置过程详解写在最前:​ 终于搞定了最后的一步域名解析配置,其实动态博客的折腾程度也不低于当时的hexo吧,也可能当时的痛苦过程已经忘了。。整理一下思路,记录一下配置过程走过的坑。 ​ 我是从hexo用了半年想折腾点新玩意儿的,其实hexo配置自动化部署之后也挺方便的…

wordpress设置自定义字体

wordpress设置自定义字体详解wordpress设置自定义字体: 失败的操作过程:写在最前:试了一天多的引用字体,方法包括但不限于:下载.ttf、.otf格式字体,转化为wotf 、wotf2格式,挂在github仓库用CDN引用,得到css链接​ 然后这里填字体名称和CSS链接,试了很久很久,都失败了…

组合数学与计数原理

组合数学与计数原理 date: 2024/10/29. 不同情况求组合数 求组合数的四种方法。 Lucas 定理 如果 \(p\) 是质数,则对于 \(\forall m, n \in \text{Z},1 \leq m \leq n\),有: \[\binom{n}{m}=\binom{m \bmod p}{n \bmod p}*\binom{m/p}{n/p} (\bmod p) \]即把 \(n,m\) 表示为…

Java面试题中高级进阶(JVM篇Java垃圾回收)

说说Java对象创建过程?知道类的生命周期吗?简述Java的对象结构?如何判断对象可以被回收?JVM的永久代中会发生垃圾回收么?你知道哪些垃圾收集算法?似乎有点模糊了,那就大概看一下面试题吧。前言 本来想着给自己放松一下,刷刷博客,突然被几道面试题难倒!说说Java对象创…