-
>
决战行测5000题(言语理解与表达)
-
>
软件性能测试.分析与调优实践之路
-
>
第一行代码Android
-
>
深度学习
-
>
Unreal Engine 4蓝图完全学习教程
-
>
深入理解计算机系统-原书第3版
-
>
Word/Excel PPT 2013办公应用从入门到精通-(附赠1DVD.含语音视频教学+办公模板+PDF电子书)
Hadoop生态系统 版权信息
- ISBN:9787512395985
- 条形码:9787512395985 ; 978-7-5123-9598-5
- 装帧:暂无
- 册数:暂无
- 重量:暂无
- 所属分类:>
Hadoop生态系统 本书特色
本书每一章都介绍了不同的主题(例如核心技术或数据传输),并且解释了为什么特定组件适用或不适用特定的需求。对于数据处理来说,使用Hadoop是一个全新的挑战,但如果有了这本便利的参考书,你将很容易领会使用Hadoop的精妙所在。
主要包括如下主题:
核心技术。Hadoop分布式文件系统(HDFS)、MapReduce、YARN和Spark。
数据库和数据管理。Cassandra、HBase、MongoDB和Hive。
序列化。Avro、JSON和Parquet。
管理和监视。Puppet、Chef、Zookeeper和Oozie。
分析辅助。Pig、Mahout和MLLib。
数据传输。Scoop、Flume、distcp和Storm。本书每一章都介绍了不同的主题(例如核心技术或数据传输),并且解释了为什么特定组件适用或不适用特定的需求。对于数据处理来说,使用Hadoop是一个全新的挑战,但如果有了这本便利的参考书,你将很容易领会使用Hadoop的精妙所在。
主要包括如下主题:
核心技术。Hadoop分布式文件系统(HDFS)、MapReduce、YARN和Spark。
数据库和数据管理。Cassandra、HBase、MongoDB和Hive。
序列化。Avro、JSON和Parquet。
管理和监视。Puppet、Chef、Zookeeper和Oozie。
分析辅助。Pig、Mahout和MLLib。
数据传输。Scoop、Flume、distcp和Storm。
安全、访问控制和审计。Sentry、Kerberos和Knox。
云计算和虚拟化。Serengeti、Docker和Whirr。信息
Hadoop生态系统 内容简介
如果你的组织即将开始进入大数据的世界,那么可能不仅需要决定Apache Hadoop这个平台是否适合使用,还需要决定Hadoop中哪些组件*适合完成你的任务。本书将帮助你更容易地完成这项工作。本书将Hadoop的生态系统分解为一个个简略的、容易理解的小段内容,以便读者可以快速理解Hadoop项目、子项目及其相关技术是如何一起工作的。
Hadoop生态系统 目录
第1章关键技术 7
11 Hadoop分布式文件系统(HDFS) 8
12 MapReduce 11
13 YARN 13
14 Spark 15
第2章数据库及数据管理 17
21 Cassandra 19
22 HBase 21
前言 1 第1章关键技术 7 11 Hadoop分布式文件系统(HDFS) 8 12 MapReduce 11 13 YARN 13 14 Spark 15 第2章数据库及数据管理 17 21 Cassandra 19 22 HBase 21 23 Accumulo 24 24 Memcached 26 25 Blur 28 26 Solr 30 27 MongoDB 32 28 Hive 34 29 Spark SQL ( 前身是 Shark) 36 210 Giraph 38 第3章序列化 41 31 Avro 43 32 JSON 46 33 Protocol Buffers (protobuf) 48 34 Parquet 50 第4章管理与监控 53 41 Ambari 54 42 HCatalog 56 43 Nagios 58 44 Puppet 59 45 Chef 61 46 ZooKeeper 63 47 Oozie 66 48 Ganglia 68 第5章分析辅助 69 51 MapReduce 接口69 52 分析库 70 53 Pig 72 54 Hadoop Streaming 74 55 Mahout 76 56 MLLib 78 57 Hadoop 图像处理接口(HIPI) 80 58 SpatialHadoop 81 第6章数据传输 83 61 Sqoop 85 62 Flume 87 63 DistCp 89 64 Storm 90 第7章安全、访问控制和审计 93 71 Sentry 95 72 Kerberos 97 73 Knox 99 第8章云计算和虚拟化 101 81 Serengeti 103 82 Docker105 83 Whirr 107信息
Hadoop生态系统 作者简介
Kevin Sitto是Pivotal Software公司的领域解决方案工程师,主要为客户提供咨询服务,帮助客户理解和描述大数据需求。 Marshall Presser是Pivotal Data Engineering集团的成员。他帮助客户使用Hadoop、关系数据库和内存数据网格来解决复杂的分析问题。
- >
中国人在乌苏里边疆区:历史与人类学概述
中国人在乌苏里边疆区:历史与人类学概述
¥26.4¥48.0 - >
新文学天穹两巨星--鲁迅与胡适/红烛学术丛书(红烛学术丛书)
新文学天穹两巨星--鲁迅与胡适/红烛学术丛书(红烛学术丛书)
¥9.9¥23.0 - >
企鹅口袋书系列·伟大的思想20:论自然选择(英汉双语)
企鹅口袋书系列·伟大的思想20:论自然选择(英汉双语)
¥6.3¥14.0 - >
我与地坛
我与地坛
¥15.4¥28.0 - >
唐代进士录
唐代进士录
¥19.5¥39.8 - >
伯纳黛特,你要去哪(2021新版)
伯纳黛特,你要去哪(2021新版)
¥15.9¥49.8 - >
人文阅读与收藏·良友文学丛书:一天的工作
人文阅读与收藏·良友文学丛书:一天的工作
¥17.9¥45.8 - >
烟与镜
烟与镜
¥15.8¥48.0
-
详解Spring Boot(从入门到企业级开发实战)/孙鑫精品图书系列
¥64.2¥129 -
PYTHON应用与实战
¥52.9¥79.8 -
Python编程与数值方法
¥79.6¥109 -
Go语言从入门到项目实战(视频版)
¥60.4¥108 -
软件设计师
¥14.2¥38 -
GO语言编程从入门到实践
¥75.6¥108