-
>
决战行测5000题(言语理解与表达)
-
>
软件性能测试.分析与调优实践之路
-
>
第一行代码Android
-
>
深度学习
-
>
Unreal Engine 4蓝图完全学习教程
-
>
深入理解计算机系统-原书第3版
-
>
Word/Excel PPT 2013办公应用从入门到精通-(附赠1DVD.含语音视频教学+办公模板+PDF电子书)
基于PYSPARK的高级数据分析 版权信息
- ISBN:9787519891862
- 条形码:9787519891862 ; 978-7-5198-9186-2
- 装帧:平装-胶订
- 册数:暂无
- 重量:暂无
- 所属分类:>>
基于PYSPARK的高级数据分析 本书特色
编辑推荐
时至今日产生的数据量已经达到令人惊人的地步,而且还在不断增长。Apache Spark已经成为分析大数据的实际工具,并且也是数据科学工具箱的关键部分。本书针对Spark*z新版本进行了更新,将Spark、统计方法和真实数据集结合在一起,教你如何运用 PySpark、Spark Python API和Spark编程中的其他*z佳实践来解决分析问题。
数据科学家Akash Tandon、Sandy Ryza、Uri Laserson、Sean Owen和Josh Wills介绍了Spark生态系统,然后深入研究将常用技术(包括分类、聚类、协同过滤和异常检测)应用于以下的领域:基因组学、安全工作和金融。此更新版本还涵盖图像处理和Spark NLP库。
如果你对机器学习和统计学有基本的了解,并且能够使用Python进行编程,那么本书将帮助你开始进行大规模的数据分析。
基于PYSPARK的高级数据分析 内容简介
本书的主要内容有:熟悉Spark的编程模型和生态系统。学习数据科学的一般方法。检查分析大型公共数据集执行步骤的完整性。发现哪些机器学习工具对特定问题有帮助。探索可适应多种用途的代码。
基于PYSPARK的高级数据分析 目录
基于PYSPARK的高级数据分析 作者简介
Akash Tandon是Looppanel的联合创始人兼首席技术官。曾在Atlan担任高级数据工程师。Sandy Ryza是Apache Spark的核心贡献人,领导了Dagster项目的开发。Uri Laserson是Patch Biosciences 的创始人兼首席技术官。曾在Cloudera从事大数据和基因组学的研究。Sean Owen是Apache Spark的核心贡献人和PMC(项目管理委员会)的成员,同时也是Databricks专注于机器学习和数据科学的首席解决方案架构师。Josh Wills是WeaveGrid的软件工程师,也是Slack的前数据工程主管。
- >
月亮与六便士
月亮与六便士
¥15.1¥42.0 - >
唐代进士录
唐代进士录
¥15.1¥39.8 - >
随园食单
随园食单
¥15.4¥48.0 - >
新文学天穹两巨星--鲁迅与胡适/红烛学术丛书(红烛学术丛书)
新文学天穹两巨星--鲁迅与胡适/红烛学术丛书(红烛学术丛书)
¥9.9¥23.0 - >
姑妈的宝刀
姑妈的宝刀
¥10.5¥30.0 - >
罗庸西南联大授课录
罗庸西南联大授课录
¥13.8¥32.0 - >
自卑与超越
自卑与超越
¥14.7¥39.8 - >
伊索寓言-世界文学名著典藏-全译本
伊索寓言-世界文学名著典藏-全译本
¥9.3¥19.0
-
一本书读懂大数据
¥13.5¥36 -
4.23文创礼盒A款--“作家言我精神状态”
¥42.3¥206 -
4.23文创礼盒B款--“作家言我精神状态”
¥42.3¥206 -
一句顶一万句 (印签版)
¥40.4¥68 -
百年书评史散论
¥14.9¥38 -
1980年代:小说六记
¥52.8¥69