Seal^_^【送书活动第3期】——《Hadoop大数据分析技术》

Seal^_^【送书活动第3期】——《Hadoop大数据分析技术》

  • 一、参与方式
  • 二、作者荐语
  • 三、图书简介
  • 四、本期推荐图书
    • 4.1 前 言
    • 4.2 本书内容
    • 4.3 本书目的
    • 4.4 本书适合的读者
    • 4.5 配套源码、PPT课件等资源下载
  • 五、目 录
  • 六、🛒 链接直达

在这里插入图片描述

Hadoop框架入门书,可当教材。配套PPT课件、源码,可做教材。书中包括两个大数据分析综合案例,可用于专科本科毕业论文。

一、参与方式

1、关注博主的账号。
2、点赞、收藏、评论博主的文章。
3、在文章下留下评论,每位参与者最多可以评论三次。
4、加入粉丝群,通过小程序自动抽奖。

📚 本次抽奖将 送出1至3本 书籍。

🕚 活动截止时间为 2024年5月12日晚上8点整


注意: 活动结束后,请留意查看您的私信消息。

加入粉丝群,通过小程序自动抽奖。

在这里插入图片描述

二、作者荐语

迟殿委,计算机软件与理论专业硕士,毕业于南昌大学,系统架构设计师。有多年企业软件研发经验和丰富的JavaEE培训经验,熟练掌握JavaEE全栈技术框架,对Java核心编程技术有深刻理解。主要擅长JavaEE系统架构设计、大数据分析与挖掘。

本书系统讲解Hadoop生态圈各组件的核心知识、操作方法和分析技术,并通过两个综合实战项目——影评大数据分析、旅游酒店评价大数据分析,来贯穿Hadoop大数据分析的完整流程。

三、图书简介

伴随Hadoop的成长,Hadoop不再是一个简单的数据分布式存储平台和工具,已经成长为一个完整的生态圈。本书采用Hadoop 3.2.2版本,系统讲解Hadoop生态系统主流的大数据分析技术。本书配套示例源码、PPT课件、教学大纲与编程环境。

本书共分11章。内容包括Hadoop概述与大数据环境准备、Hadoop伪分布式集群搭建、HDFS分布式存储实战、MapReduce实战、ZooKeeper与高可用集群实战、Hive数据仓库实战、HBase数据库实战、Flume数据采集实战、Kafka实战、影评大数据分析项目实战、旅游酒店评价大数据分析项目实战。

本书可作为Hadoop大数据技术初学者的入门书,也可作为Hadoop大数据分析工程师的指导手册,还可作为高等院校或者高职高专大数据专业的教材或教学参考书。

四、本期推荐图书

在这里插入图片描述

4.1 前 言

国家提出要加快 5G 网络和数据中心等新型基础设施建设(简称新基建)的进度。其中,信息化新型基础设施包含云计算、大数据、人工智能、区块链、5G 等内容。大数据是指具有海量(volume)、多模态(variety)、变化速度快(velocity)、蕴含价值高(value)和真实性(veracity)“5V”特征的数据,使得传统的数据存储、管理、分析技术已经无法满足大数据的处理要求。大数据给传统的数据处理和数据分析带来巨大的挑战,已引起学术界和工业界的高度关注。Hadoop正是在这种背景下产生的一个大数据开源平台。许多大型互联网公司,如谷歌、阿里巴巴、百度、京东等互联网公司都急需掌握Hadoop大数据技术的人才,而目前人才市场上大数据技术相关人才由于种种原因存在供不应求的状况,本书在这个背景下创作而成。

4.2 本书内容

本书是一本关于Hadoop 3.2.2大数据平台搭建和数据分析、生态体系主要组件的应用和开发方面的实战书籍,涉及的知识面比较广,涵盖了当前整个Hadoop生态系统主流的大数据开发技术。本书从实践操作与开发讲起,在基本操作已经掌握以后,再回过头来讲解理论知识。所以,本书是先实践再理论,方便读者快速掌握Hadoop大数据分析技术。

全书共分11章,第1章讲解Hadoop框架简介及新版本特性,并详细介绍大数据环境的准备工作,包括Linux操作系统的安装、SSH工具使用和配置等;第2章讲解Hadoop伪分布式的安装和开发体验,使读者熟悉Hadoop大数据开发两大核心组件,即HDFS和MapReduce;第39章讲解Hadoop生态系统各框架HDFS、MapReduce、输入/输出、Hadoop集群配置、ZooKeeper、HBase、Hive、Flume数据采集系统、Kafka等,并通过实际案例加深对各个框架的理解与应用。第1011章分别通过影评大数据分析项目实战和旅游酒店评价大数据分析项目实战,使读者了解完整的大数据项目开发过程,并巩固所学的知识,使之掌握的内容更加系统、全面。

4.3 本书目的

通过本书的学习,读者可以对照书中的步骤成功搭建属于自己的Hadoop大数据集群,并掌握基于Hadoop的大数据分析与开发技术,最终能够独立完成Hadoop大数据分析与开发项目。

4.4 本书适合的读者

本书可作为Hadoop框架初学者的入门书以及大数据分析人员的参考手册,也可作为高校开设大数据平台搭建或大数据开发课程的参考教材。学习本书要求读者有一定的Java编程基础并了解Linux系统的基础知识。本书每一个章节的实践操作内容都有详细清晰的步骤讲解,即使读者没有任何大数据基础,也可以对照书中的步骤成功搭建属于自己的大数据集群,本书是一本真正提高读者动手能力、以实操为主的入门书籍。通过本书的学习,结合每章配套的源代码,读者能够迅速理解与掌握Hadoop大数据相关技术框架,并可以熟练使用Hadoop集成环境进行大数据项目的开发。

4.5 配套源码、PPT课件等资源下载

本书配套源码、PPT课件、教学大纲与编程环境,需要用微信扫描下边二维码获取,可按扫描后的页面提示填写你的邮箱,把下载链接转发到邮箱中下载。

五、目 录

1章  Hadoop概述与大数据环境准备 11.1  大数据定义 21.2  Hadoop生态介绍 21.2.1  Hadoop简介 21.2.2  Hadoop版本简介 41.2.3  Hadoop生态系统和组件介绍 61.3  Hadoop 3新特性 71.4  虚拟机安装 91.5  安装Linux操作系统 101.6  SSH工具与使用 151.7  Linux统一设置 161.8  小结 182章  Hadoop伪分布式集群搭建 192.1  安装独立运行的Hadoop 192.2  Hadoop伪分布式环境准备 222.3  Hadoop伪分布式安装 262.4  HDFS操作命令 312.5  Java项目访问HDFS 332.5.1  创建Maven项目 342.5.2  HDFS操作示例 362.6  winutils 382.7  快速MapReduce程序示例 392.8  小结 423章  HDFS分布式存储实战 433.1  HDFS的体系结构 433.2  NameNode的工作 443.2.1  查看镜像文件 453.2.2  查看日志文件 463.2.3  日志文件和镜像文件的操作过程 473.3  SecondaryNameNode 493.4  DataNode 503.5  HDFS的命令 503.6  远程过程调用 513.7  小结 534章  MapReduce实战 554.1  MapReduce的运算过程 554.2  WordCount示例 574.3  自定义Writable 604.4  Partitioner分区编程 644.5  自定义排序 664.6  Combiner编程 674.7  默认Mapper和默认Reducer 684.8  倒排索引 694.9  Shuffle 734.10  小结 775章  ZooKeeper与高可用集群实战 795.1  ZooKeeper简介 795.1.1  Zxid 805.1.2  版本号 815.2  单一节点安装ZooKeeper 825.3  基本客户端命令 835.4  Java代码操作ZooKeeper 865.5  ZooKeeper集群安装 915.6  znode节点类型 925.7  观察节点 935.8  配置Hadoop高可用集群 935.9  用Java代码操作集群 1025.10  小结 1046章  Hive数据仓库实战 1056.1  Hive3的安装配置 1076.2  Hive的命令 1106.3  Hive内部表 1146.4  Hive外部表 1166.5  Hive表分区 1176.5.1  分区技术细节 1176.5.2  分区示例 1196.6  查询示例汇总 1216.7  Hive函数 1226.8  Hive自定义函数 1286.9  Hive视图 1326.10  hiveserver2 1326.11  使用JDBC连接hiveserver2 1346.12  小结 1357章  HBase数据库实战 1367.1  HBase的特点 1367.2  HBase安装 1397.2.1  HBase的单节点安装 1407.2.2  HBase的伪分布式安装 1427.2.3  Java客户端代码 1447.3  HBase集群安装 1507.4  HBase Shell操作 1537.4.1  数据模型定义 1547.4.2  数据基本操作 1567.5  协处理器 1607.6  Phoenix 1627.7  小结 1688章  Flume数据采集实战 1698.1  Flume的安装与配置 1708.2  快速示例 1718.3  在ZooKeeper中保存Flume的配置文件 1728.4  Flume的更多Source 1768.4.1  Avro Source 1768.4.2  Thrift Source和Thrift Sink 1808.4.3  Exec Source 1838.4.4  Spool Source 1848.4.5  HDFS Sinks 1848.5  小结 1859章  Kafka实战 1869.1  Kafka的特点 1879.2  Kafka术语 1889.3  Kafka安装与部署 1899.3.1  单机部署 1899.3.2  集群部署 1959.4  小结 19810章  影评大数据分析项目实战 19910.1  项目介绍 19910.2  项目需求分析 19910.3  项目详细实现 20310.3.1  搭建项目环境 20310.3.2  编写爬虫类 20610.3.3  编写分词类 20710.3.4  第一个job的Map阶段实现 21010.3.5  第一个job的Reducer阶段实现 21010.3.6  第二个job的Map阶段实现 21110.3.7  第二个job的自定义排序类阶段的实现 21110.3.8  第二个job的自定义分区阶段实现 21210.3.9  第二个job的Reduce阶段实现 21210.3.10  Run程序主类实现 21310.3.11  编写词云类 21410.3.12  效果测试 21511章  旅游酒店评价大数据分析项目实战 21611.1  项目介绍 21611.2  项目需求分析 21711.2.1  数据集需求 21711.2.2  功能需求 21711.3  项目详细实现 21811.3.1  数据集上传到HDFS 21911.3.2  Hadoop数据清洗 22111.3.3  构建Hive数据仓库表 22511.3.4  Sqoop数据导入与导出 23011.3.5  数据可视化开发 232

六、🛒 链接直达

在这里插入图片描述

有兴趣的朋友可以前往查看。 JD搜索关键词:

✨ Hadoop大数据分析技术,Hadoop ✨

🛒 链接直达: https://item.jd.com/13536921.html)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/689735.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

解析直播美颜SDK:计算机视觉在实时视频中的应用

今天,小编将带大家深入探讨直播美颜SDK的原理、应用及其在实时视频中的重要性。 一、直播美颜SDK的原理 直播美颜SDK的核心原理是基于计算机视觉技术,通过识别人脸、肤色、眼睛、嘴巴等关键特征点,对视频图像进行实时处理。其主要包括以下几…

C++青少年简明教程:基础知识

C青少年简明教程:基础知识 电脑程序设计(Computer programming),或称程序设计(programming),是给出解决特定问题程序的过程,程序设计往往以某种程序设计语言为工具,给出这…

使用./build.sh编译ORB_SLAM源码时出现报错:/usr/bin/ld:找不到 -lboost_serialization的解决办法

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 一、/usr/bin/ld:找不到 -lboost_serialization1.问题描述2.解决(1). 下载源码(2) . 编译安装 一、/usr/bin/ld:找不到 -lboost_serialization 1.问题描述 在安装…

基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二)

基于 LlaMA 3 LangGraph 在windows本地部署大模型 (二) #Options local_llm llama3 llm ChatOllama(modellocal_llm, format"json", temperature0) #embeddings #embeddings OllamaEmbeddings(model"nomic-embed-text") embed…

Android 13 aosp 默认关闭SELinux

通过adb修改 adb root adb shell setenforce 0 // 开SELinux,设置成模式permissive adb shell setenforce 1 // 关SELinux,设置成模式enforce adb shell getenforce // 获取当前SELinux状态源码修改 Android_source/system/core/init/selinu…

C# SolidWorks 二次开发 -从零开始创建一个插件(3) 发布插件

五一节过完了吧,该上班学习了吧? 如何把自己开发好的程序优雅的给别人使用。 今天我们来简单讲解一下,这个之前不少粉丝咨询过相关问题,自己开发好的东西,如何给同事或者其它人使用。 先列一下使用到的主要工具&am…

系分-历年论文题目

年份试题一试题二试题三试题四2023年信息系统数据转换与迁移敏捷开发方法论Devops及其应用论信息系统可行性分析2022年论原型法及其在信息系统开发中的应用论面向对象设计方法及其应用2021年论面向对象的信息系统分析方法论静态测试方法及其应用论富互联网应用的客户端开发技术…

麒麟kylin-v10系统,虚拟机kvm的使用

kvm的使用 虚拟机新建 点击选择对应的iso文件 选择相应的系统 (注意,如果这里没有相应的系统比如:windows,可以直接选择Generic default这是通用默认的意思) 选择cpu 完成即可 等待安装完毕 网络设置-ssh连接 虚拟…

美颜画面调节SDK解决方案,打造专业级美颜画质

视频与图像的质量成为了企业展示自身形象、吸引用户注意力的关键,为了满足企业对高质量美颜画面调节的需求,美摄科技精心打造了一款面向企业的美颜画面调节SDK解决方案,该方案不仅集成了LUT和调色滤镜等先进技术,更在人脸场景画面…

1分钟搞定Pandas DataFrame创建与索引

1.DataFrame介绍 DataFrame 是一个【表格型】的数据结构,可以看作是【由Series组成的字典】(共用同一个索引)。DataFrame 由按一定顺序排列的多列数据组成。设计初衷是将 Series 的使用场景从一维扩展到多维。DataFrame 既有行索引,也有列索引。 行索引:index 列索引:co…

网页转长图插件html2canvas【前端】

网页转长图插件html2canvas【前端】 前言版权开源推荐网页转长图插件html2canvas【前端】wkImageStorage流程使用后端application.propertiesWkConfigShareControllerImageCleanupTask 前端html2canvas.jsshare.htmlshare.jsgetShare.jsgetShare.html 最后 前言 2024-5-10 18:…

Web APIs - 第1天笔记

了解 DOM 的结构并掌握其基本的操作,体验 DOM 的在开发中的作用 知道 ECMAScript 与 JavaScript 的关系 了解 DOM 的相关概念及DOM 的本质是一个对象 掌握查找节点的基本方法 掌握节点属性和文本的操作 能够使用间歇函数创建定时任务 介绍 知道 ECMAScript 与…