扫一扫
关注中图网
官方微博
本类五星书更多>
-
>
决战行测5000题(言语理解与表达)
-
>
软件性能测试.分析与调优实践之路
-
>
第一行代码Android
-
>
深度学习
-
>
Unreal Engine 4蓝图完全学习教程
-
>
深入理解计算机系统-原书第3版
-
>
Word/Excel PPT 2013办公应用从入门到精通-(附赠1DVD.含语音视频教学+办公模板+PDF电子书)
Hadoop大数据技术应用 版权信息
- ISBN:9787512437975
- 条形码:9787512437975 ; 978-7-5124-3797-5
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 所属分类:>
Hadoop大数据技术应用 内容简介
本书主要内容包括大数据概论、初识Hadoop、Linux基础、Hadoop集群的搭建、HDFS分布式文件系统、MapReduce分布式计算框架以及项目实战——某国新冠肺炎疫情COVID-19分析。 本书将理论与实践结合,补充相关Linux基础,注重大数据技术的系统性、实用性和先进性,配有大量的应用案例,不仅能够帮助读者提高大数据技术的应用与研究水平,而且能提高综合应用创新能力。 本书可作为高职高专院校大数据技术、计算机科学与计算、物联网工程等专业的教材,并可供大数据相关技术人员参考使用。
Hadoop大数据技术应用 目录
第1章 大数据概论
1.1 大数据概述
1.2 大数据的行业应用
1.3 大数据的基本概念
1.4 本章小结
1.5 课后习题
第2章 初识Hadoop
2.1 Hadoop简介
2.2 Hadoop生态圈介绍
2.3 本章小结
2.4 课后习题
第3章 Linux基础
3.1 Linux简介
3.2 Linux文件管理常用命令、Shell编程
3.2.1 Linux文件基础知识
3.2.2 Shell编程基础
3.2.3 Shell流程控制
3.3 本章小结
3.4 课后习题
第4章 Hadoop集群的搭建
4.1 Hadoop集群搭建前的准备
4.1.1 安装虚拟机软件
4.1.2 Hadoop集群规划
4.1.3 在虚拟机软件中安装Linux操作系统
4.1.4 配置Linux系统网络
4.1.5 SSH服务设置
4.2 Hadoop集群搭建
4.2.1 JDK安装
4.2.2 Hadoop安装
4.2.3 Hadoop集群配置
4.3 Hadoop集群启动
4.3.1 文件系统格式化
4.3.2 启动和关闭Hadoop集群
4.3.3 查看Hadoop集群运行状态
4.4 Hadoop集群使用
4.5 本章小结
4.6 课后练习
第5章 HDFS分布式文件系统
5.1 HDFS简介
5.1.1 HDFS演变
5.1.2 HDFS的基本概念
5.1.3 HDFS的特点
5.2 HDFS的读写
5.2.1 HDFS存储架构
5.2.2 HDFS文件读写原理
5.3 HDFS Shell操作
5.3.1 HDFS的Shell操作
5.3.2 案例——Shell定时采集数据到HDFS
5.4 HDFS Java API操作
5.4.1 HDFS Java API介绍
5.4.2 HDFS Java API案例
5.5 本章小结
5.6 课后习题
第6章 MapReduce分布式计算框架
6.1 MapReduce概述
6.2 .MapRedlace编程模型
6.2.1 MapReduce工作流程
6.2.2 MapTask工作原理
6.2.3 ReduceTask工作原理
6.3 MapReduce案例解析
6.3.1 单词统计
6.3.2 倒排索引(InvertedIndex)
6.3.3 数据去重(dedup)
6.4 本章小结
6.5 课后习题
第7章 项目实战——某国新冠肺炎疫情COVID-19分析
7.1 项目说明
7.1.1 MapRedlice PartItiion机制
7.1.2 MapRedlice Combiner规约
7.1.3 MapReduce编程技巧
7.1.4 数据字段说明
7.2 MapReduce自定义组件
7.2.1 初始化项目
7.2.2 自定义对象序列化
7.2.3 自定义排序
7.2.4 自定义分区
7.2.5 自定义分组
7.2.6 自定义分组拓展Top N
7.3 MapReduce运行模式
7.3.1 本地运行
7.3.2 打包发布运行
参考文献
1.1 大数据概述
1.2 大数据的行业应用
1.3 大数据的基本概念
1.4 本章小结
1.5 课后习题
第2章 初识Hadoop
2.1 Hadoop简介
2.2 Hadoop生态圈介绍
2.3 本章小结
2.4 课后习题
第3章 Linux基础
3.1 Linux简介
3.2 Linux文件管理常用命令、Shell编程
3.2.1 Linux文件基础知识
3.2.2 Shell编程基础
3.2.3 Shell流程控制
3.3 本章小结
3.4 课后习题
第4章 Hadoop集群的搭建
4.1 Hadoop集群搭建前的准备
4.1.1 安装虚拟机软件
4.1.2 Hadoop集群规划
4.1.3 在虚拟机软件中安装Linux操作系统
4.1.4 配置Linux系统网络
4.1.5 SSH服务设置
4.2 Hadoop集群搭建
4.2.1 JDK安装
4.2.2 Hadoop安装
4.2.3 Hadoop集群配置
4.3 Hadoop集群启动
4.3.1 文件系统格式化
4.3.2 启动和关闭Hadoop集群
4.3.3 查看Hadoop集群运行状态
4.4 Hadoop集群使用
4.5 本章小结
4.6 课后练习
第5章 HDFS分布式文件系统
5.1 HDFS简介
5.1.1 HDFS演变
5.1.2 HDFS的基本概念
5.1.3 HDFS的特点
5.2 HDFS的读写
5.2.1 HDFS存储架构
5.2.2 HDFS文件读写原理
5.3 HDFS Shell操作
5.3.1 HDFS的Shell操作
5.3.2 案例——Shell定时采集数据到HDFS
5.4 HDFS Java API操作
5.4.1 HDFS Java API介绍
5.4.2 HDFS Java API案例
5.5 本章小结
5.6 课后习题
第6章 MapReduce分布式计算框架
6.1 MapReduce概述
6.2 .MapRedlace编程模型
6.2.1 MapReduce工作流程
6.2.2 MapTask工作原理
6.2.3 ReduceTask工作原理
6.3 MapReduce案例解析
6.3.1 单词统计
6.3.2 倒排索引(InvertedIndex)
6.3.3 数据去重(dedup)
6.4 本章小结
6.5 课后习题
第7章 项目实战——某国新冠肺炎疫情COVID-19分析
7.1 项目说明
7.1.1 MapRedlice PartItiion机制
7.1.2 MapRedlice Combiner规约
7.1.3 MapReduce编程技巧
7.1.4 数据字段说明
7.2 MapReduce自定义组件
7.2.1 初始化项目
7.2.2 自定义对象序列化
7.2.3 自定义排序
7.2.4 自定义分区
7.2.5 自定义分组
7.2.6 自定义分组拓展Top N
7.3 MapReduce运行模式
7.3.1 本地运行
7.3.2 打包发布运行
参考文献
展开全部
书友推荐
- >
唐代进士录
唐代进士录
¥15.1¥39.8 - >
罗庸西南联大授课录
罗庸西南联大授课录
¥13.8¥32.0 - >
李白与唐代文化
李白与唐代文化
¥8.9¥29.8 - >
随园食单
随园食单
¥15.4¥48.0 - >
上帝之肋:男人的真实旅程
上帝之肋:男人的真实旅程
¥19.3¥35.0 - >
大红狗在马戏团-大红狗克里弗-助人
大红狗在马戏团-大红狗克里弗-助人
¥3.5¥10.0 - >
龙榆生:词曲概论/大家小书
龙榆生:词曲概论/大家小书
¥13.0¥24.0 - >
新文学天穹两巨星--鲁迅与胡适/红烛学术丛书(红烛学术丛书)
新文学天穹两巨星--鲁迅与胡适/红烛学术丛书(红烛学术丛书)
¥9.9¥23.0
本类畅销
-
Photoshop 2022中文版案例教程
¥44.1¥59.8 -
局域网组建、管理与维护(第4版)(微课版)
¥47¥59 -
园林AUTOCAD教程
¥24¥45 -
Python实战编程:从零学Python
¥81¥108 -
Java程序设计基础
¥37¥50 -
数据备份与恢复
¥51.4¥69