超值优惠券
¥50
100可用 有效期2天

全场图书通用(淘书团除外)

不再提示
关闭
图书盲袋,以书为“药”
欢迎光临中图网 请 | 注册
> >>
大数据存储——从SQL到NoSQL

大数据存储——从SQL到NoSQL

出版社:清华大学出版社出版时间:2021-08-01
开本: 其他 页数: 242
中 图 价:¥37.7(6.3折) 定价  ¥59.8 登录后可看到会员价
加入购物车 收藏
运费6元,满39元免运费
?新疆、西藏除外
本类五星书更多>

大数据存储——从SQL到NoSQL 版权信息

大数据存储——从SQL到NoSQL 本书特色

本书系统、全面地介绍了大数据存储与管理的基本知识和技能,介绍了大数据存储基础、数据管理技术发展、RDBMS与SQL、NoSQL数据模型、键值数据库、文档数据库、列族数据库、图数据库、数据库技术的发展(NewSQL),重点安排了熟悉MongoDB文档数据库和熟悉HBase列族数据库两个课程实践。本书理论联系实际,把大数据的相关概念、基础知识和技术技巧融入在实践当中,使学生保持浓厚的学习热情,加深对大数据存储与管理技术的兴趣、认识、理解和掌握。全书具有较强的系统性、可读性和实用性。 本书是为高等院校相关专业“大数据存储”“大数据存储与管理”“大数据管理”等课程全新设计编写的具有丰富实践特色的主教材,可供有一定实践经验的软件开发人员、管理人员参考,或作为继续教育的教材。

大数据存储——从SQL到NoSQL 内容简介

本书针对大数据、人工智能、信息管理、经济管理和其他相关专业学生的发展需求,系统、全面地介绍了大数据存储与管理的基本知识和技能,介绍了大数据存储基础、数据管理技术的发展、RDBMS与SQL、NoSQL数据模型、键值数据库、文档数据库、列族数据库、图数据库、数据库技术的发展(NewSQL),重点安排了熟悉MongoDB文档数据库和HBase列族数据库两个课程实践。全书具有较强的系统性、可读性和实用性。 本书是为高等院校相关专业“大数据存储”“大数据存储与管理”“大数据管理”等课程全新设计编写的具有丰富实践特色的主教材,也可供有一定实践经验的软件开发人员、管理人员参考,或作为继续教育的教材。

大数据存储——从SQL到NoSQL 目录

第1章大数据存储基础1

1.1什么是大数据1

1.1.1信息爆炸的社会1

1.1.2定义大数据3

1.1.3大数据的3V特征4

1.1.4广义的大数据6

1.2开源技术的商业支援7

1.3分布式系统7

1.3.1分布式系统与网络的异同7

1.3.2分布式系统的类型8

1.4Hadoop分布式处理技术9

1.4.1Hadoop的发展9

1.4.2Hadoop的优势10

1.4.3Hadoop的发行版本10

1.5大数据的数据处理基础11

1.5.1Hadoop与NoSQL11

1.5.2NoSQL的主要特征11

1.5.3NewSQL作为替代方案12

1.6大数据存储的技术路线13

1.6.1存储方式13

1.6.2MPP架构的数据库集群14

1.6.3基于Hadoop的技术扩展14

1.6.4大数据一体机15

1.6.5云数据库15

【作业】16

【实验与思考】熟悉大数据存储基础18


第2章数据管理技术的发展20

2.1早期的数据管理系统20

2.1.1文件数据管理系统20

2.1.2层次数据管理系统22

2.1.3网状数据管理系统23

2.2引发变革的关系数据库24

2.2.1RDBMS的设计25

2.2.2使用RDBMS的应用架构25

2.2.3关系数据库的局限26

2.3Web程序的4个特征26

2.3.1可伸缩性27

2.3.2成本开销27

2.3.3灵活性27

2.3.4可用性28

2.4催生NoSQL的动因分析28

【作业】29

【实验与思考】熟悉数据管理技术: SQL还是NoSQL30


第3章RDBMS与SQL32

3.1关系数据库32

3.2RDBMS的结构33

3.2.1存储介质管理程序34

3.2.2内存管理程序34

3.2.3数据字典34

3.3结构化查询语言SQL36

3.4SQL语句的结构37

3.4.1数据定义37

3.4.2数据操纵37

3.4.3数据控制38

3.4.4数据查询38

3.5关系数据库的ACID特征39

3.6关系数据库的三大范式39

3.6.1数据库范式分类39

3.6.2**范式(1NF)40

3.6.3第二范式(2NF)40

3.6.4第三范式(3NF)42

3.6.5范式的表设计42

【作业】42

【实验与思考】熟悉RDBMS与SQL44


第4章NoSQL数据模型46

4.1分布式数据管理46

4.1.1分布式数据库的任务46

4.1.2在响应、一致与持久之间求平衡48

4.1.3熟悉CAP定理49

4.2NoSQL数据库性质50

4.2.1数据库性质BASE50

4.2.2体现*终一致性50

4.3键值数据库类型51

4.3.1键51

4.3.2值52

4.4文档数据库类型53

4.4.1文档53

4.4.2查询文档53

4.4.3文档与关系数据库的区别54

4.5列族数据库类型55

4.5.1列与列族55

4.5.2列族与关系数据库的区别55

4.6图数据库类型56

4.6.1节点与关系56

4.6.2图与关系数据库的区别56

4.7选择NoSQL数据库57

4.7.1选用键值数据库58

4.7.2选用文档数据库58

4.7.3选用列族数据库59

4.7.4选用图数据库60

4.7.5SQL和NoSQL的结合60

【作业】61

【实验与思考】熟悉NoSQL数据模型63


第5章键值数据库基础65

5.1从数组到键值数据库65

5.1.1数组65

5.1.2关联数组66

5.1.3缓存66

5.1.4键值数据库67

5.2键值数据库的重要特性68

5.2.1简洁: 不需要复杂模型68

5.2.2高速: 越快越好68

5.2.3缩放: 应对访问量变化69

5.3键: 有意义的标识符69

5.3.1构造键名69

5.3.2通过键定位相关的值70

5.4值: 存放任意数据71

5.4.1值无须明确类型71

5.4.2对值搜索时的限制72

5.5键值数据库的数据建模72

5.5.1数据模型和数据结构72

5.5.2命名空间73

5.5.3分区与分区键73

5.5.4无模式的模型73

5.6键值数据库的架构74

5.6.1集群74

5.6.2环75

5.6.3复制75

5.7Redis键值数据库75

5.7.1软件定义76

5.7.2数据模型76

5.7.3存储77

【作业】77

【实验与思考】安装Redis键值数据库79


第6章键值数据库设计81

6.1键值数据库实现的概念81

6.1.1哈希函数81

6.1.2碰撞82

6.1.3压缩82

6.2键的设计与分区83

6.2.1设计好的键名83

6.2.2处理特定范围内的值83

6.2.3设计键名时考虑层的限制84

6.2.4根据键名来分区84

6.3设计结构化的值85

6.3.1结构化数据能降低延迟85

6.3.2庞大的值会降低读写性能85

6.3.3TTL键86

6.4键值数据库的局限87

6.4.1只能通过键查询数据87

6.4.2不支持指定范围查询87

6.4.3不支持SQL查询语言87

【作业】88

【实验与思考】用键值数据库管理移动应用配置89


第7章文档数据库基础93

7.1关于文档93

7.1.1文档及其格式化命令93

7.1.2按集合管理多份文档96

7.1.3集合的设计技巧96

7.2文档数据库数据结构97

7.2.1文档结构97

7.2.2嵌入式文档99

7.2.3无模式数据库100

7.2.4多态模式100

7.2.5无须定义显式模式100

7.3文档数据库基本操作101

7.3.1向集合中插入文档101

7.3.2从集合中删除文档101

7.3.3更新集合中的文档102

7.3.4从集合中获取文档102

7.4文档数据库分区架构103

7.4.1垂直分区103

7.4.2水平分区或分片103

7.4.3用分片键分隔数据104

7.4.4用分区算法分布数据104

7.5数据建模与查询处理105

7.5.1规范化105

7.5.2去规范化105

7.5.3查询处理器106

【作业】106

【实验与思考】熟悉MongoDB文档数据库108


第8章文档数据库设计110

8.1文档数据库设计思考110

8.2规范化还是去规范化110

8.2.1一对多与多对多关系110

8.2.2多张表格执行join操作111

8.2.3文档数据库的建模111

8.3应对可变文档112

8.4编制数量适中的索引112

8.4.1读操作较多的应用113

8.4.2写操作较多的应用113

8.5为文档数据库常见关系建模114

8.5.1一对多关系114

8.5.2多对多关系114

8.5.3层级关系建模115

【作业】115

【实验与思考】客户的货物清单117


第9章课程实践: MongoDB文档数据库121

9.1初识MongoDB121

9.1.1MongoDB特点121

9.1.2MongoDB应用场景122

9.2MongoDB结构123

9.2.1数据库123

9.2.2普通集合124

9.2.3固定集合125

9.2.4文档125

9.2.5数据类型125

9.2.6索引126

9.3分布式运算模型MapReduce126

9.4存储原理与大文件存储规范127

9.4.1存取工作流程127

9.4.2大文件存储规范GridFS128

9.5复制与分片129

9.5.1复制集129

9.5.2主从复制和副本集129

9.5.3分片130

9.6MongoDB版本与平台131

9.6.1版本选择131

9.6.2平台选择131

【实验与思考】MongoDB文档数据库132


第10章列族数据库基础134

10.1列族数据库谷歌BigTable134

10.1.1动态控制列族的列134

10.1.2按行ID、列名及时间戳确定数据值135

10.1.3控制数据存储位置135

10.1.4行内读取和写入都是原子操作136

10.1.5按顺序排列数据行136

10.2列族键值及文档数据库异同136

10.2.1与键值数据库异同137

10.2.2与文档数据库异同137

10.2.3与关系数据库对比138

10.3列族数据库使用架构139

10.3.1多种节点组成HBase架构139

10.3.2对等节点组成Cassandra架构140

10.3.3按Gossip协议传播服务器状态140

10.3.4分布式数据库的反熵操作141

10.3.5用提示移交保留与写入请求141

10.4列族数据库适用场合142

10.5列族数据库基本组件143

10.5.1键空间143

10.5.2行键143

10.5.3列144

10.5.4列族144

【作业】145

【实验与思考】熟悉列族数据库147


第11章列族数据库设计150

11.1列族数据库设计概述150

11.2列族数据库的结构151

11.2.1集群与分区151

11.2.2其他底层组件152

11.3处理流程及协议154

11.3.1复制154

11.3.2提示移交154

11.4设计数据表格155

11.4.1用去规范化代替连接155

11.4.2同时在列名和列值中存储数据156

11.4.3不要将大量操作分配给少数服务器156

11.4.4维护适当数量的列值版本157

11.5编制索引157

11.5.1自动管理辅助索引157

11.5.2用表格创建辅助索引158

11.6应对大数据的工具159

11.6.1萃取、转换、加载数据159

11.6.2分析大数据160

11.6.3监控大数据的工具161

【作业】162

【实验与思考】客户数据分析163


第12章课程实践: HBase列族数据库166

12.1HDFS分布式存储166

12.2初识HBase数据库167

12.2.1面向行存储的数据库167

12.2.2面向列存储的数据库168

12.2.3行与列存储方式的对比168

12.3HBase数据库的使用场景169

12.4HBase数据库模型和系统架构170

12.4.1HBase数据库的相关概念170

12.4.2HBase数据库的逻辑模型172

12.4.3HBase数据库的物理模型173

12.4.4HBase数据库的特点174

12.4.5HBase数据库的系统架构175

12.5HBase Shell176

【实验与思考】HBase列族数据库环境搭建178


第13章图数据库基础185

13.1图及其元素185

13.1.1顶点185

13.1.2边185

13.1.3路径186

13.1.4自环187

13.2关系建模与图数据库187

13.2.1什么是图数据库187

13.2.2对地理位置进行建模188

13.2.3对传染病进行建模188

13.2.4对抽象和具体的实体建模189

13.2.5对社交媒体建模190

13.3图数据库的优势190

13.3.1不执行连接操作的快速查询190

13.3.2为实体之间的多种关系建模191

13.4图的操作192

13.4.1图的并集192

13.4.2图的交集192

13.4.3图的遍历193

13.5图和节点的属性193

13.5.1同构性193

13.5.2阶与尺寸194

13.5.3度数194

13.5.4接近中心性194

13.5.5中介性194

13.6图的类型195

13.6.1无向图和有向图195

13.6.2网络流195

13.6.3二分图196

13.6.4多重图196

13.6.5加权图与Dijkstra算法196

13.7Neo4j图数据库197

13.7.1了解Cypher图查询语言197

13.7.2Neo4j的两种模式198

【作业】199

【实验与思考】安装和了解Neo4j图数据库201


第14章图数据库设计207

14.1设计图模型207

14.1.1描述社交网络的图数据库208

14.1.2用查询请求引领模型设计209

14.2Cypher: 对图的声明式查询210

14.3Gremlin: 遍历图模型查询212

14.3.1基本的图模型遍历操作212

14.3.2用优先搜索遍历图模型213

14.4图数据库设计技巧214

14.4.1用索引缩短获取数据的时间214

14.4.2使用类型适当的边215

14.4.3遍历图模型时注意循环路径215

14.4.4图数据库的扩展215

【作业】216

【实验与思考】优化运输路线217


第15章数据库技术的发展220

15.1数据库行业全景图220

15.1.1不同阶段数据库发展特点220

15.1.2SQL的问题221

15.1.3NoSQL的优势与不足222

15.2NewSQL数据库应运而生223

15.2.1NewSQL数据库分类223

15.2.2NewSQL特性224

15.2.3NewSQL架构原理224

15.3典型的NewSQL代表——NuoDB224

15.4其他数据库225

15.4.1原生数据库225

15.4.2时序数据库225

15.4.3时空数据库227

【作业】228

【实验与思考】熟悉NewSQL数据库229

附录231

附录A部分作业参考答案231

附录B课程学习与实验总结238

参考文献243

展开全部

大数据存储——从SQL到NoSQL 作者简介

1988年在天津科学技术出版社出版第一本教材《FoxBASE+及其程序设计技巧》并获1991年全国优秀科技畅销书。1992年所著教材《软件工程及其应用》(天津科技出版社) 获北方十省市科技图书二等奖。至2002年,分别在天津科技出版社、浙江科技出版社、科学出版社等累计出版计算机学术著作、教科书20余本累计千万字。 自1999年调入浙江大学城市学院任教以来,潜心钻研应用型、教学型院校新的教育教学规律,探索新的教学内容和适用的教学方法。自2002年起至今,先后在科学出版社、中国铁道出版社、清华大学出版社等出版

商品评论(0条)
暂无评论……
书友推荐
本类畅销
编辑推荐
返回顶部
中图网
在线客服