超值优惠券
¥50
100可用 有效期2天

全场图书通用(淘书团除外)

不再提示
关闭
欢迎光临中图网 请 | 注册
> >>
Hadoop3大数据部署与数据分析实战

Hadoop3大数据部署与数据分析实战

作者:李昌庆
出版社:西安电子科技大学出版社出版时间:2024-03-01
开本: 16开 页数: 152
本类榜单:教材销量榜
中 图 价:¥27.3(7.0折) 定价  ¥39.0 登录后可看到会员价
加入购物车 收藏
运费6元,满39元免运费
?新疆、西藏除外
本类五星书更多>

Hadoop3大数据部署与数据分析实战 版权信息

Hadoop3大数据部署与数据分析实战 本书特色

本书旨在向大学生和初涉大数据领域的专业人士介绍Hadoop3的核心概念、原理、生态组件及实际应用场景。本书的目标是培养学生处理大规模数据集的能力,帮助他们在未来的职业生涯中自信地应对各种大数据挑战。
本书的主要特点如下:
(1)详尽细致。考虑到大多数初学者面临的问题,在实现步骤、命令和编程中均结合图文进行了详细演示和描述。
(2)介绍全面。介绍了Hadoop3的各个组件,包括HDFS、MapReduce等,还探讨了与Hadoop生态系统相关的其他技术,如Hive、HBase、ZooKeeper、Flume及Sqoop等,可帮助读者构建更完善的大数据解决方案。
(3)实践性强。不仅提供了理论知识,还提供了大量实际案例和操作指南,可帮助读者在实际项目中应用所学知识。

Hadoop3大数据部署与数据分析实战 内容简介

本书从初学者和开发人员的角度出发,以实战应用为原则,主要介绍了Hadoop3的组件和生态系统内的大数据应用工具。全书共7个项目、23个任务,主要内容包括搭建Hadoop开发环境、Hadoop入门及实战、Hive数据分析、HBase分布式存储数据库、ZooKeeper分布式协调服务、Flume数据采集、Sqoop数据迁移等。
本书可作为应用型本科计算机科学与技术、大数据技术和物联网工程等相关专业的教材,也可供职业本科以及高职计算机网络技术、物联网应用技术、大数据技术等相关专业的学生使用。

Hadoop3大数据部署与数据分析实战 目录

项目1 搭建 Hadoop 开发环境 1 任务1.1 了解Hadoop 2 1.1.1 Hadoop 简介 2 1.1.2 Hadoop 的诞生与发展 3 任务1.2 搭建Hadoop 完全分布式环境 4 1.2.1 搭建前的准备 4 1.2.2 模板机的搭建 5 1.2.3 部署 Hadoop 完全分布式环境 29 项目总结 39 思考与练习 40 拓展训练 40 项目2 Hadoop入门及实战 41 任务2.1 了解HDFS 42 2.1.1 HDFS概述 42 2.1.2 HDFS架构及其原理 43 任务2.2 掌握HDFS命令和编程接口 46 2.2.1 HDFS Web Console简介和使用 46 2.2.2 HDFS Shell命令 49 2.2.3 HDFS Java API的使用 57 任务2.3 MapReduce开发实战 61 2.3.1 MapReduce简介 62 2.3.2 MapReduce工作机制 62 2.3.3 MapReduce编程模型 66 2.3.4 MapReduce应用实战 66 项目总结 75 思考与练习 75 拓展训练 76 项目3 Hive数据分析 77 任务3.1 了解Hive 78 3.1.1 Hive简介 78 3.1.2 Hive架构及原理分析 78 3.1.3 Hive数据类型 79 3.1.4 Hive表类型 80 任务3.2 Hive部署与实战 81 3.2.1 Hive部署 81 3.2.2 使用Hive进行数据分析 86 项目总结 89 思考与练习 89 拓展训练 90 项目4 HBase分布式存储数据库 91 任务4.1 了解列式存储和HBase 92 4.1.1 OLTP和OLAP简介 93 4.1.2 行式存储和列式存储简介 93 4.1.3 列式存储的特点 94 4.1.4 行式存储和列式存储优缺点对比 94 4.1.5 行式存储和列式存储的适用场景 95 4.1.6 HBase简介 95 任务4.2 部署HBase集群 96 任务4.3 了解HBase的物理模型Region 100 任务4.4 了解HMaster和RegionServer的工作原理 101 4.4.1 HBase的架构 101 4.4.2 HBase的架构组件 102 4.4.3 HMaster和RegionServer简介及工作原理 102 任务4.5 掌握HBase的操作 104 4.5.1 基本操作 104 4.5.2 表操作 105 4.5.3 命名空间的基本操作 106 任务4.6 了解HBase的读写流程和数据存储过程 107 4.6.1 数据存储过程 107 4.6.2 HBase的读流程 107 4.6.3 HBase的写流程 108 任务4.7 使用Java API操作HBase 109 4.7.1 环境准备 109 4.7.2 HBase的Java API 110 项目总结 115 思考与练习 115 拓展训练 115 项目5 ZooKeeper分布式协调服务 117 任务5.1 了解ZooKeeper的原理和特性 118 任务5.2 了解ZooKeeper的设计目标 119 任务5.3 实现ZooKeeper集群搭建 121 5.3.1 集群规划 121 5.3.2 安装流程 121 任务5.4 掌握ZooKeeper的核心概念 123 任务5.5 了解ZooKeeper的典型应用场景 125 项目总结 126 思考与练习 127 拓展训练 127 项目6 Flume数据采集 128 任务6.1 了解Flume 129 6.1.1 Flume简介 129 6.1.2 Flume的运行机制 129 6.1.3 Flume的结构图 130 6.1.4 Flume的安装部署 130 任务6.2 应用Flume进行实战 131 6.2.1 Flume实战案例一 132 6.2.2 Flume实战案例二 133 项目总结 134 思考与练习 135 拓展训练 135 项目7 Sqoop数据迁移 136 任务7.1 了解Sqoop 137 任务7.2 掌握Sqoop的操作 138 7.2.1 Sqoop安装 138 7.2.2 使用Sqoop进行数据转换 139 7.2.3 导入数据:从MariaDB到HDFS 140 7.2.4 导入数据:从MariaDB到Hive 140 7.2.5 导入数据:从MariaDB到HBase 141 7.2.6 导出数据:从HDFS到MariaDB 142 项目总结 142 思考与练习 143 拓展训练 143参考文献 144
展开全部
商品评论(0条)
暂无评论……
书友推荐
本类畅销
编辑推荐
返回顶部
中图网
在线客服