Hadoop 单机部署和测试(一)

Hadoop单机部署和测试

  • 一.单机部署
    • 1.安装 JDK(JDK11)
    • 2.安装 HADOOP
    • 3.测试

一.单机部署

系统版本:cat /etc/anolis-release

在这里插入图片描述

1.安装 JDK(JDK11)

#!/bin/bashTOP_PATH=$(pwd)
JAVA_PATH=/usr/local/java
FILE=`ls $TOP_PATH/ | grep jdk | grep .tar.gz | grep -v grep `## 清空历史版本
if [ -d $JAVA_PATH ];thenrm -rf $JAVA_PATH
fi
## 创建安装目录
mkdir -p $JAVA_PATH
## 解压
tar -zxvf $TOP_PATH/$FILE -C $JAVA_PATH
## 设置环境变量 注意路径上的版本信息 jdk-11.0.19
echo "export JAVA_HOME=/usr/local/java/jdk-11.0.19" >> /etc/profile
echo "export CLASSPATH=$JAVA_HOME/lib:$CLASSPATH" >> /etc/profile
echo "export PATH=$JAVA_HOME/bin:$PATH" >> /etc/profile
source /etc/profile
查看版本:java -version

在这里插入图片描述

2.安装 HADOOP

下载:Apache Hadoop
在这里插入图片描述
在这里插入图片描述

#!/bin/bash
TOP_PATH=$(pwd)
HADOOP_PATH=/usr/local/hadoop
FILE=`ls $TOP_PATH/ | grep hadoop | grep .tar.gz | grep -v grep `## 清空历史版本
if [ -d $HADOOP_PATH ];thenrm -rf $HADOOP_PATH
fiHAD
## 创建安装目录
mkdir -p $HADOOP_PATH
## 解压
tar -zxvf $TOP_PATH/$FILE -C $HADOOP_PATH
## 设置环境变量 注意路径上的版本信息 hadoop-3.3.6
echo "export HADOOP_HOME=/usr/local/hadoop/hadoop-3.3.6" >> /etc/profile
echo "export PATH=${PATH}:${HADOOP_HOME}/bin:${HADOOP_HOME}/sbin" >> /etc/profile
source /etc/profile
查看版本:hadoop version

在这里插入图片描述

3.测试

## 创建测试目录
mkdir /home/input
## 拷贝测试数据
cp $HADOOP_HOME/etc/hadoop/*.xml /home/input/
cd $HADOOP_HOME/
## 测试命令
./bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.6.jar grep /home/input/ /home/output 'dfs[a-z]+'
查看输出结果:cat /home/output/part-r-00000

在这里插入图片描述

验证结果正确性:find /home/input -type f -name "*.xml" | xargs grep dfs

在这里插入图片描述

创建一个测试文件:touch /home/input/text.xml && echo dfstext >> /home/input/text.xml && rm -rf /home/output
重新统计:./bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.6.jar grep /home/input/ /home/output 'dfs[a-z]+'
查看结果:cat /home/output/part-r-00000

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/21296.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

mysql索引的简单使用

删除 goods 表中的 goods_desc 字段及货号字段,并增加 click_count 字段 在 goods_name 列上加唯一性索引(用alter table方式) alter table add unique index uniqididx(goods_name);去查看索引 发现有goods_name的唯一索引 在 shop_price 列上加普通…

Java中Map使用增强for循环和迭代器获取key和value

加油,新时代打工人! java中List集合三种获取集合元素方式 本文运行代码使用 jdk1.8 for 语句比较简单,用于循环数据。 Java迭代器(Iterator)是 Java 集合框架中的一种机制,是一种用于遍历集合&#xff08…

mac桌面时钟 浮动 (python)

浮动时钟,多地时区 app store的都要钱,于是。。。。我们让chatgpt来实现一个吧: 数字: 代码: import sys import datetime import pytzfrom PyQt5.QtWidgets import QApplication, QMainWindow, QGraphicsView, QGr…

MySQL为什么要使用B+树做索引?MySQL索引存储模型推演,B+树在MySQL的落地形式

文章目录 一、什么是索引1、索引初体验2、索引图解3、索引类型 二、索引存储模型推演1、二分查找2、二叉查找树(BST Binary Search Tree)3、平衡二叉树(AVL Tree)(左旋、右旋)(1)平衡…

STL标准模板库 set容器

文章目录 迭代器迭代器的五大分类迭代器系列帮手函数一览 set容器打印任意 STL 容器的printer.hset与vectorset 和 vector 的区别set 和 vector 迭代器的共同点set 和 vector 迭代器的不同点 set 的排序set 的排序:string 会按“字典序”来排set 的排序:…

云计算UPS监控,怎么办?

在大型数据机房中,UPS系统扮演着关键的角色,为计算机和网络设备提供可靠的电力备份。由于数据机房的规模庞大且关键性强,监控UPS系统的可靠性和效率至关重要。 UPS监控可以提供实时的电池状态、负载信息、电网电压等监测数据,并能…

代码随想录打卡

这里写目录标题 1.数组部分1.1二分查找1.2移除元素1.3 有序数组的平方1.4长度最小的子数组1.5螺旋矩阵II 2. 链表部分2.1移除链表元素2.2设计链表2.3反转链表2.4两两交换相邻的节点2.5删除链表的倒数第n个节点2.6环形链表II2.7链表相交 3.哈希表 1.数组部分 1.1二分查找 class…

我司的短信接口被刷了

如何发现的 成本分摊系统,将成本分摊给业务部门时,业务部门对账,发现某一类型的短信用量上涨了100多倍 排查调用来源时,发现来源为C端用户,由于调用量异常高,业务反馈近期无活动,因此怀疑被刷…

服务器数据库中了360后缀勒索病毒怎么办,如何预防勒索病毒攻击?

随着网络技术的不断发展,企业的计算机服务器也受到了网络安全威胁,近日,很多企业的服务器被360后缀勒索病毒攻击,导致企业的数据库中的许多重要数据被加密,无法正常读取打开。360后缀勒索病毒数据BeijingCrypt勒索病毒…

请求响应-日期时间参数的接受

日期参数 由于从前端发送的请求中,日期的格式可能各不相同,使用DateTimeFormat注解完成日期参数格式的转换具体关键代码如下: 在postman中发出对应请求携带对应参数结果如下: 参数名称要与方法中的形参名称一致,免得…

【Python】PyCharm中调用另一个文件的函数或类

🎉欢迎来到Python专栏~PyCharm中调用另一个文件的函数或类 ☆* o(≧▽≦)o *☆嗨~我是小夏与酒🍹 ✨博客主页:小夏与酒的博客 🎈该系列文章专栏:Python学习专栏 文章作者技术和水平有限,如果文中出现错误&…

【IMX6ULL驱动开发学习】18.中断下半部(tasklet、工作队列、中断线程化)

下图表述了Linux内核的中断处理机制,为了在中断执行时间尽量短和中断处理需完成的工作尽量大之间找到一 个平衡点, Linux将中断处理程序分解为两个半部: 顶半部(Top Half) 和底半部(Bottom Half&#xff09…