中图网

>

数据库

大数据基础

作者：刘铭编著

出版社：中国石油大学出版社出版时间：2021-11-01

开本： 24cm 页数： 223页

本类榜单：计算机/网络销量榜

中图价:¥27.4(7.2折) 定价 ~~¥38.0~~ 登录后可看到会员价

加入购物车收藏

运费6元，满39元免运费

?新疆、西藏除外

本类五星书更多>

>
决战行测5000题(言语理解与表达)

决战行测5000题(言语理解与表达)

¥38.8¥88
>
软件性能测试.分析与调优实践之路

软件性能测试.分析与调优实践之路

¥49.3¥69
>
第一行代码Android

第一行代码Android

¥58.4¥99
>
深度学习

深度学习

¥92.4¥168
>
Unreal Engine 4蓝图完全学习教程

Unreal Engine 4蓝图完全学习教程

¥72.2¥168
>
深入理解计算机系统-原书第3版

深入理解计算机系统-原书第3版

¥104.3¥139
>
Word/Excel PPT 2013办公应用从入门到精通-(附赠1DVD.含语音视频教学+办公模板+PDF电子书)

Word/Excel PPT 2013办公应用从入门到精通-(附赠1DVD.含语音视频教学+办公模板+PDF电子书)

¥21¥49.9

买过本商品的人还买了

电力工程基础
单鸿涛,陈蓓,刘瑾
¥17.2~~¥40.0~~
市场营销调研
胡介埙，周国红，周丽梅编著
¥27.4~~¥38.0~~
电气测试技术
徐科军主编
¥27.1~~¥39.8~~
电磁场与电磁波
阳小明,李天倩编著
¥16.0~~¥29.0~~
测绘学概论
宁津生等编著
¥36.5~~¥58.0~~

商品详情
商品评论(0条)

中图价:¥27.4 加入购物车

版权信息
内容简介
目录

大数据基础版权信息

ISBN：9787563669158
条形码：9787563669158 ; 978-7-5636-6915-8
装帧：一般胶版纸
册数：暂无
重量：暂无
所属分类：
计算机/网络
>
数据库

大数据基础内容简介

本书在简单阐述原理的基础上，重点阐述应用的详细实现过程。全书共八章，内容包括：绪论、Linux基础、Hadoop基础、高可用Hadoop集群、Hive基础、HBase基础、Spark基础、数据采集基础。

大数据基础目录

第1章绪论 1.1 大数据概述 1.1.1 大数据技术的发展 1.1.2 大数据应用的发展 1.1.3 大数据典型的应用场景 1.2 对大数据的理解 1.2.1 大数据的定义 1.2.2 大数据的特征 1.2.3 从关系型数据库到大数据 1.2.4 大数据处理模式 1.3 大数据处理的基本流程 1.3.1 数据抽取与集成 1.3.2 数据分析 1.3.3 数据解释 1.3.4 常用大数据软件 1.4 Hadoop概述 1.4.1 HDFS 1.4.2 MapReduce 1.4.3 Yarn 1.4.4 MapReduce与Yarn的对比 1.5 Spark概述 1.5.1 Spark简介 1.5.2 Spark体系架构第2章 Linux基础 2.1 Linux简介 2.1.1 Linux的由来 2.1.2 常见的Linux系统版本 2.2 Linux系统安装 2.2.1 安装配置虚拟机 2.2.2 安装Linux系统 2.2.3 Linux文件系统 2.3 Linux命令 2.3.1 Shell简介 2.3.2 运用帮助命令 2.3.3 常用命令第3章 Hadoop基础 3.1 HDFS简介 3.2 Hadoop集群安装 3.2.1 集群规划 3.2.2 配置网络名称 3.2.3 禁用防火墙 3.2.4 设置SELinux模式 3.2.5 安装JDK 3.2.6 配置ssh免密码登录 3.2.7 安装Hadoop集群 3.3 HDFS的文件存储机制 3.3.1 文件存储机制概述 3.3.2 HDFS的命名空间 3.3.3 NameNode元数据管理要点 3.3.4 客户端 3.3.5 通信协议 3.4 HDFS的数据存储管理 3.4.1 数据冗余存储 3.4.2 数据存取策略 3.4.3 数据错误与恢复 3.5 HDFS的数据读写过程 3.5.1 读取数据过程 3.5.2 写入数据过程 3.6 HDFS常用命令第4章高可用Hadoop集群 4.1 Zookeeper基础 4.1.1 Zookeeper简介 4.1.2 Zookeeper工作流程 4.1.3 Zookeeper的用途及特点 4.1.4 Zookeeper的数据存储机制 4.1.5 Zookeeper的集群部署 4.2 高可用Hadoop集群配置 4.2.1 集群规划 4.2.2 安装配置Zookeeper集群 4.2.3 安装配置高可用Hadoop集群第5章 Hive基础 5.1 Hive概述 5.1.1 Hive简介 5.1.2 Hive的设计特点 5.1.3 Hive数据对象 5.2 元数据库基础 5.2.1 MySQL和MariaDB的关系 5.2.2 安装MariaDB数据库 5.2.3 MariaDB数据库初始化 5.2.4 给root用户授权 5.3 Hive的配置 5.3.1 准备工作 5.3.2 Hive的元数据库配置 5.4 Hive使用方式 5.4.1 本地运行方式 5.4.2 远程运行方式 5.4.3 脚本化运行方式 5.5 Hive的DDL 5.5.1 数据库相关的DDL 5.5.2 Hive数据类型 5.5.3 表相关的DDL 5.6 数据导人与导出 5.6.1 将数据文件导入Hive表 5.6.2 将Hive表中的数据导出到指定路径的文件 5.7 Hive的查询 5.7.1 基本查询 5.7.2 条件查询 5.7.3 关联查询 5.7.4 分组聚合 5.7.5 子查询第6章 HBase基础 6.1 HBase概述 6.1.1 HBase简介 6.1.2 HBase与传统数据库对比 6.2 HBase接口 6.3 HBase数据模型 6.3.1 数据模型概述 6.3.2 数据坐标 6.3.3 概念视图 6.3.4 物理视图 6.4 HBase实现原理 6.4.1 HBase功能组件 6.4.2 表和Region 6.4.3 Region的定位 6.5 HBase运行机制 6.5.1 HBase的系统架构 6.5.2 Region服务器的工作原理 6.5.3 Store工作原理 6.5.4 HLog工作原理 6.6 HBase应用 6.6.1 实际应用中HBase性能优化方法 6.6.2 在HBase之上构建SQL引擎 6.6.3 构建HBase二级索引 6.7 HBase实战 6.7.1 HBase的安装与配置 6.7.2 HBase常用的shell命令 6.7.3 HBase常用的JavaAPI及应用实例第7章 Spark基础 7.1 Spark概述 7.1.1 Spark的特点 7.1.2 Spark的产生背景 7.2 Spark集群的安装 7.2.1 Spark集群的分布式部暑 7.2.2 Spark高可用集群的介绍 7.2.3 Spark高可用集群的搭建 7.2.4 执行**个Spark程序 7.3 SparkShell 7.3.1 启动SparkShell 7.3.2 在SparkShell中编写WordCount 7.3.3 Spark任务执行流程简介 7.3.4 在IDEA中用Scala编写WordCount 7.4 Spark RDD基础 7.4.1 创建RDD的方式 7.4.2 RDD的Transformation 7.4.3 Spark RDD分区数 7.4.4 Spark RDD分区机制 7.4.5 mapPartitionWithIndex 7.4.6 aggregate 7.4.7 aggregateByKey 7.4.8 foreach和foreachPartition 7.4.9 常用Transformation与Action的总结 7.5 Spark案例实战与详解 7.5.1 样本数据 7.5.2 分析*受欢迎的老师

展开全部

商品评论(0条)

写书评赚书币

暂无评论……

书友推荐

>
烟与镜
烟与镜
[英] 尼尔·盖曼著，王爽译
¥14.4~~¥48.0~~
>
新文学天穹两巨星--鲁迅与胡适/红烛学术丛书(红烛学术丛书)
新文学天穹两巨星--鲁迅与胡适/红烛学术丛书(红烛学术丛书)
易竹贤
¥9.9~~¥23.0~~
>
回忆爱玛侬
回忆爱玛侬
[日]梶尾真治著，王玮译
¥23.0~~¥32.8~~
>
诗经-先民的歌唱
诗经-先民的歌唱
裴溥言
¥20.3~~¥39.8~~
>
山海经
山海经
林非
¥21.1~~¥68.0~~
>
中国历史的瞬间
中国历史的瞬间
李永炽
¥16.7~~¥38.0~~
>
企鹅口袋书系列·伟大的思想20:论自然选择(英汉双语)
企鹅口袋书系列·伟大的思想20:论自然选择(英汉双语)
[英] 达尔文著，朱邦芊译
¥6.3~~¥14.0~~
>
伊索寓言-世界文学名著典藏-全译本
伊索寓言-世界文学名著典藏-全译本
[古希腊] 伊索著，陈韵如译
¥9.3~~¥19.0~~