超值优惠券
¥50
100可用 有效期2天

全场图书通用(淘书团除外)

不再提示
关闭
欢迎光临中图网 请 | 注册

FLINK基础入门

出版社:清华大学出版社出版时间:2024-05-01
开本: 其他 页数: 0
本类榜单:教材销量榜
中 图 价:¥45.4(7.6折) 定价  ¥59.8 登录后可看到会员价
加入购物车 收藏
运费6元,满39元免运费
?新疆、西藏除外
本类五星书更多>

FLINK基础入门 版权信息

FLINK基础入门 本书特色

本书从Flink的概念入手,进而讲解Flink相关架构和原理,帮助读者从搭建Flink集群到使用DataStream API、DataSet API和Table API&SQL实现Flink应用程序的过程进行详细讲解,并在本书的*后一章通过一个项目案例对Flink的综合运用进行讲解。本书共分为9个章节。第1章主要介绍了Flink的理论性知识,包括数据处理架构的演变、Flink关键特性、Flink应用场景、Flink批流模型、Flink集群运行架构等。第2章主要讲解了Flink的部署,包括虚拟机的安装、Linux操作系统的配置、JDK部署、集群部署之Flink on YARN、集群部署之Standalone、本地模式部署,以及介绍了如何了Flink命令行界面和SQL Client的使用。第3章主要讲解了如何使用DataStream API实现Flink应用程序,包括DataStream程序结构、DataStream数据类型、创建执行环境、创建数据源、创建接收器、转换操作以及涵盖本章整体知识体系的案例。第4章主要讲解了如何使用DataSet API实现Flink应用程序,包括DataSet程序结构、创建执行环境、创建数据源、创建接收器、转换操作以及涵盖本章整体知识体系的案例。第5章主要讲解了Flink的时间和窗口,包括时间概念、窗口分配器、Watermark、窗口函数、窗口触发器等。第6章主要讲解了Flink的状态和容错机制,包括状态概述、Checkpoint、State Backend、状态编程等。第7章主要讲解了如何使用Table API&SQL实现Flink应用程序,包括Table程序结构、数据类型、Catalog操作、数据库管理、表操作以及查询操作等。第8章内容对使用Table API&SQL实现Flink应用程序的内容进行深入讲解,包括内置函数和自定义函数的使用、DataStream与表的转换、时间属性以及窗口操作等。第9章通过综合项目-电商用户行为分析对Flink的综合运用进行操作和讲解,包括项目概述、需求分析、项目架构、以及实时统计不同需求等。
本书附有配套视频、教学PPT、教学设计、测试题等资源,同时,为了帮助初学者更好地学习本书中的内容,还提供了在线答疑,欢迎读者关注。

FLINK基础入门 内容简介

本书以Flink 1.16.0为主线,全面介绍了Flink的核心概念和常用功能。全书共9章,分别讲解了Flink概述,Flink部署与应用,DataStream API,DataSet API,时间与窗口,状态和容错机制,Table API&SQL和Flink CEP。 本书附有配套视频、教学课件、教学设计、测试题等资源,同时,为了帮助初学者更好地学习本书内容,还提供了在线答疑,欢迎读者关注。 本书可作为高等教育本、专科院校数据科学与大数据技术及相关专业的教材,还适合大数据开发初学者、大数据运维人员以及大数据分析与挖掘的从业者阅读。

FLINK基础入门 目录

第1章Flink概述1
1.1数据处理架构的演变1
1.1.1传统数据处理架构1
1.1.2有状态流处理架构3
1.1.3Lambda架构3
1.1.4新一代流处理架构4
1.2初识Flink5
1.3Flink的关键特性6
1.4Flink的应用场景7
1.5Flink运行时架构8
1.5.1整体架构8
1.5.2作业管理器9
1.5.3任务管理器10
1.6Flink分层API11
1.7Flink程序结构12
1.8本章小结12
1.9课后习题12
第2章Flink部署与应用14
2.1基础环境搭建14
2.2Flink部署模式15
2.3Standalone模式之伪分布式17
2.4Standalone模式之完全分
布式18
2.5Standalone模式之高可用
完全分布式20
2.6Flink On YARN模式27
2.7启动Flink33
2.7.1Session模式33
2.7.2Application模式37
2.8flink命令39
2.8.1flink命令的使用39
2.8.2提交作业39
2.8.3查看作业44
2.8.4停止和取消作业50
2.9Flink Web UI54
2.9.1Flink Web UI的访问 … 54
2.9.2使用Flink Web UI
操作作业57
2.10本章小结61
2.11课后习题61
目录Flink基础入门第3章DataStream API63
3.1DataStream程序的开发流程 … 63
3.2DataStream的数据类型64
3.3执行环境65
3.4数据输入67
3.4.1从集合读取数据67
3.4.2从文件读取数据70
3.4.3从Socket读取数据72
3.4.4从Kafka读取数据73
3.4.5自定义Source78
3.5数据转换80
3.5.1map80
3.5.2flatMap82
3.5.3filter83
3.5.4keyBy85
3.5.5reduce88
3.5.6union90
3.6数据输出92
3.6.1输出到文件92
3.6.2输出到Socket96
3.6.3输出到Kafka97
3.7应用案例——词频统计99
3.8本章小结100
3.9课后习题100
第4章DataSet API 102
4.1DataSet程序的开发流程102
4.2执行环境103
4.3数据输入105
4.3.1从文件读取数据105
4.3.2从集合读取数据109
4.3.3从MySQL读取数据 … 111
4.4数据转换118
4.4.1去重118
4.4.2连接119
4.4.3聚合124
4.4.4分组125
4.4.5分区128
4.5数据输出130
4.5.1输出到文件130
4.5.2输出到MySQL132
4.6应用案例——统计热门
品牌Top10134
4.7本章小结134
4.8课后习题134
第5章时间与窗口136
5.1时间概念136
5.2窗口分类138
5.3键控和非键控窗口142
5.4窗口分配器144
5.5窗口函数146
5.5.1ReduceFunction146
5.5.2AggregateFunction147
5.5.3ProcessFunction152
5.5.4窗口函数结合使用154
5.6水位线157
5.6.1什么是水位线157
5.6.2使用水位线159
5.6.3应用案例——统计电商
网站交易数据162
5.7窗口触发器162
5.8窗口驱逐器166
5.8.1内置驱逐器166
5.8.2自定义驱逐器168
5.9处理延迟数据171
5.9.1通过Allowed Lateness
处理延迟数据171
5.9.2通过Side Outputs处理
延迟数据173
5.10本章小结175
5.11课后习题176
第6章状态和容错机制177
6.1状态概述177
6.2状态管理179
6.2.1声明状态179
6.2.2定义状态描述器180
6.2.3操作状态182
6.3使用状态183
6.3.1使用键控状态183
6.3.2使用算子状态188
6.4Checkpoint190
6.4.1Checkpoint概述190
6.4.2配置Checkpoint192
6.5State Backend196
6.6故障恢复198
6.7本章小结200
6.8课后习题200
第7章Table API & SQL(一)202
7.1Table程序结构202
7.2数据类型203
7.3执行环境205
7.4Catalog操作206
7.4.1注册Catalog206
7.4.2查看Catalog210
7.4.3使用Catalog212
7.5数据库操作213
7.5.1创建数据库213
7.5.2查看数据库215
7.5.3使用数据库217
7.5.4修改数据库218
7.5.5删除数据库219
7.6表操作220
7.6.1创建表220
7.6.2创建Table对象227
7.6.3查看表228
7.6.4修改表230
7.6.5修改Table对象232
7.6.6删除表234
7.6.7输出表236
7.7查询操作239
7.7.1基本查询239
7.7.2条件查询241
7.7.3去重查询243
7.7.4连接查询244
7.7.5集合查询251
7.7.6排序查询259
7.7.7分组查询262
7.8本章小结265
7.9课后习题265
第8章Table API & SQL(二)266
8.1函数266
8.1.1内置函数266
8.1.2自定义函数273
8.1.3注册自定义函数276
8.1.4使用自定义函数278
8.2DataStream与Table对象的
转换282
8.3时间属性285
8.4窗口操作287
8.4.1Group Window287
8.4.2Over Window293
8.5本章小结298
8.6课后习题298
第9章Flink CEP300
9.1Flink CEP基本概述300
9.2模式301
9.2.1个体模式301
9.2.2组合模式303
9.3模式的定义305
9.3.1定义个体模式305
9.3.2定义个体模式的条件 … 309
9.3.3定义组合模式313
9.3.4模式组314
9.3.5匹配后跳过策略315
9.4使用模式检测数据流317
9.5处理超时事件328
9.6处理延迟事件332
9.7应用案例——直播平台检测
刷屏用户333
9.8本章小结333
9.9课后习题334
展开全部
商品评论(0条)
暂无评论……
书友推荐
本类畅销
浏览历史
编辑推荐
返回顶部
中图网
在线客服