-
>
决战行测5000题(言语理解与表达)
-
>
软件性能测试.分析与调优实践之路
-
>
第一行代码Android
-
>
深度学习
-
>
Unreal Engine 4蓝图完全学习教程
-
>
深入理解计算机系统-原书第3版
-
>
Word/Excel PPT 2013办公应用从入门到精通-(附赠1DVD.含语音视频教学+办公模板+PDF电子书)
深入浅出Python数据分析 版权信息
- ISBN:9787302574538
- 条形码:9787302574538 ; 978-7-302-57453-8
- 装帧:80g胶版纸
- 册数:暂无
- 重量:暂无
- 所属分类:>
深入浅出Python数据分析 本书特色
实战:大量的案例实操及程序实例高效:一本书解决常见数据分析问题完整:涵盖业界主流套件,提供完整的工具链零基础实操入门**,助你成为Python数据分析高手,免费提供配套源程序下载
深入浅出Python数据分析 内容简介
数据时代的来临带动了新一波的智能革命,数据与算法驱动了各个领域的改变。在几个市场热门的讨论议题中,都可以看到数据应用扮演的角色。在面对真实世界的数据时,有许许多多的事情需要考虑。本书试图从*务实的角度开始,结合理论与实践去探索数据科学的真实世界,帮助读者一步一步地培养数据时代下的思维与技术。本书将从基础的 Python 编程开始,以数据分析的流程为主轴一步一步地解析,然后展开介绍数据收集、数据前处理、特征工程、探索式分析等。本书系统性地从函数库开始学习,并拓展到不同的应用场景。 本书实用性强,提供数据分析所必需的编程技能的培训,以及常见第三方软件和库的使用方法;以数据科学家、数据分析师等数据应用工作的实践经验作为培养目标,适合对 Python与数据分析有兴趣的人阅读。
深入浅出Python数据分析 目录
第1章 数据分析与Python
1.1 数据分析概述 002
1.1.1 数据分析兴起与发展的时代背景 002
1.1.2 什么是数据分析 003
1.1.3 数据分析的发展方向 003
1.1.4 大数据与厚数据 005
1.1.5 数据挖掘、机器学习与深度学习 006
1.2 数据项目 007
1.2.1 定义数据项目 008
1.2.2 数据项目团队的组成 008
1.2.3 数据项目的分析流程 009
1.3 Python与数据分析的关系 011
1.3.1 为什么要用Python进行数据分析 011
1.3.2 Python的数据分析系统 011
1.4 数据分析人员的学习地图 012
1.4.1 怎样成为数据分析人员 012
1.4.2 技能树养成之路 013
第2章 Python基础
2.1 Python简介 016
2.1.1 执行Python程序的主要方式 017
2.1.2 编写Python程序 017
2.1.3 相关的开发管理工具 018
2.2 开发环境准备 020
2.2.1 Anaconda 020
2.2.2 Jupyter Notebook 020
2.3 一个简单的范例 022
2.4 数据类型 025
2.4.1 数值 025
2.4.2 字符串 027
2.4.3 容器 029
2.5 数据运算 034
2.6 流程控制 035
2.6.1 条件判断 035
2.6.2 while循环 035
2.6.3 for循环 035
2.6.4 循环中断 036
2.7 函数与类 037
2.7.1 函数 037
2.7.2 类 039
2.8 错误处理 040
第3章 数据来源与获取
3.1 数据来源与数据格式 044
3.1.1 数据来源 044
3.1.2 数据格式 045
3.2 开放数据及其来源 045
3.2.1 什么是开放数据 046
3.2.2 常见的开放数据来源 046
3.3 如何使用Python存取数据 047
3.3.1 下载文件 047
3.3.2 读写文件 048
3.3.3 自动读写文件 049
3.3.4 读文件范例 049
3.4 API数据来源与请求串接存取 054
3.4.1 Requests库 054
3.4.2 常见的API串接手法 056
第4章 网络爬虫的技术和实战
4.1 认识HTTP网站架构与数据沟通方式 062
4.1.1 网站前后端运作架构 062
4.1.2 网页结构解析 063
4.1.3 静态网页与动态网页 066
4.2 网页爬虫之静态网页篇 067
4.2.1 静态网页概述 067
4.2.2 使用Requests取得网页数据 068
4.2.3 使用BeautifulSoup解析网页 070
4.2.4 静态网页爬虫的实际案例 072
4.3 网页爬虫之动态网页篇 073
4.3.1 动态网页概述 073
4.3.2 自动化浏览器交互 074
4.3.3 模拟调用API 075
4.3.4 动态网页爬虫的实际案例 075
4.4 实践中的爬虫应用 077
4.4.1 其他Python爬虫工具 077
4.4.2 防爬虫机制与处理策略 077
4.4.3 自动持续更新的爬虫程序 079
第5章 常见的数据分析工具
5.1 高效能的数学运算工具NumPy 082
5.1.1 贴近数学向量的数据结构NdArray 082
5.1.2 从一个简单的例子出发 084
5.1.3 数组的建立 084
5.1.4 数据选取 086
5.1.5 基本操作与运算 087
5.1.6 自带函数与通用函数 089
5.1.7 迭代与循环 091
5.1.8 利用数组进行数据处理 093
5.2 串起数据与程序分析工具Pandas 093
5.2.1 面向数据集的数据结构:Series与DataFrame 094
5.2.2 建立对象 094
5.2.3 数据选取 097
5.2.4 插入与丢弃数据 099
5.2.5 算术运算和数据对齐 101
5.2.6 排序 102
5.2.7 迭代与重复操作 103
5.2.8 数据合并与重组 104
5.2.9 存取外部数据 107
5.3 可视化呈现数据工具Matplotlib 107
5.3.1 Matplotlib与pyplot 108
5.3.2 图表信息 110
5.3.3 处理多个图形 112
5.3.4 完整的Matplotmap图 113
5.3.5 其他图表 115
第6章 定义问题与观察数据
6.1 如何定义一个数据项目 122
6.2 如何学习并开始一个数据项目 123
6.2.1 如何学习数据分析 123
6.2.2 如何开始一个数据项目 124
6.3 观察数据的N件事 125
6.3.1 准备数据 125
6.3.2 明确数据的关注点 125
6.3.3 观察数据的步骤 126
6.4 示范如何观察数据 128
6.4.1 房屋数据集 128
6.4.2 犯罪数据集 132
第7章 数据清理与类型转换
7.1 清理缺失或错误数据 138
7.1.1 可以学习的数据 138
7.1.2 从外部数据到程序 138
7.1.3 哪些是需要被处理的数据 139
7.2 选取和筛选数据 139
7.2.1 DataFrame的基本操作 139
7.2.2 选取和筛选数据的方式 140
7.3 定义缺失值与查阅数据 145
7.3.1 定义缺失值 146
7.3.2 查阅栏位是否有缺失值 146
7.4 缺失值处理策略 147
7.4.1 用内建函数处理缺失值 147
7.4.2 缺失值处理策略实例 147
7.5 数据类型及其转换 149
7.5.1 数据类型 149
7.5.2 数据类型转换 149
第8章 数据探索与可视化
8.1 数据探索概述 154
8.1.1 什么是数据探索 154
8.1.2 身为数据分析者的敏锐 154
8.1.3 常见的数据探索方法 154
8.1.4 进行数据探索的目的 155
8.2 统合性数据描述 155
8.3 利用描述统计认识数据 156
8.3.1 描述统计 156
8.3.2 统计量分析 157
8.3.3 相关性分析 158
8.3.4 数据聚合 159
8.3.5 数据透视表与交叉统计表 160
8.4 利用可视化图表探索数据 162
8.4.1 数据可视化与探索图 162
8.4.2 常见的图表实例 162
8.5 数据探索实战分享 165
8.5.1 2013年美国社区调查 165
8.5.2 波士顿房屋数据集 165
第9章 特征工程
9.1 特征工程概述 170
9.1.1 特征工程是什么 170
9.1.2 为什么要做特征工程 170
9.1.3 如何做特征工程 171
9.2 异常值处理 171
9.2.1 异常值检查 171
9.2.2 处置异常值的方式 173
9.3 特征缩放 173
9.3.1 正规化 173
9.3.2 标准化 174
9.4 数据转换 174
9.4.1 将连续数据转换为离散数据 175
9.4.2 将类别数据转换为数值数据 175
9.5 特征操作 178
9.5.1 特征重建 178
9.5.2 连续特征组合 178
9.5.3 离散特征组合 178
9.6 特征选择 179
9.6.1 过滤式 179
9.6.2 包裹式 180
9.6.3 嵌入式 181
9.7 特征提取与降维 182
9.7.1 维度灾难 182
9.7.2 主成分分析 182
9.7.3 线性判别分析 183
第10章 示例应用
10.1 示例应用1:泰坦尼克号 186
10.1.1 使用数据集与背景 186
10.1.2 定义问题与观察数据 186
10.1.3 数据清理与类型转换 189
10.1.4 数据探索与可视化 193
10.1.5 特征工程 198
10.1.6 机器学习 200
10.2 示例应用2:房价预测 202
10.2.1 使用数据集与背景 202
10.2.2 定义问题与观察数据 203
10.2.3 数据清理与类型转换 203
10.2.4 数据探索与可视化 206
10.2.5 特征工程 207
10.2.6 机器学习 207
10.3 示例应用3:Quora 208
10.3.1 使用数据集与背景 208
10.3.2 定义问题与观察数据 209
10.3.3 特征工程与数据探索 209
深入浅出Python数据分析 作者简介
张维元,毕业于中国台湾清华大学,主要研究领域为大数据应用。目前在多家初创公司担任工程师及技术顾问,曾担任大型技术会议的演讲嘉宾与软件课程讲师。擅长网站开发及数据科学,精通Python与JavaScript语言。
- >
新文学天穹两巨星--鲁迅与胡适/红烛学术丛书(红烛学术丛书)
新文学天穹两巨星--鲁迅与胡适/红烛学术丛书(红烛学术丛书)
¥9.9¥23.0 - >
经典常谈
经典常谈
¥12.7¥39.8 - >
人文阅读与收藏·良友文学丛书:一天的工作
人文阅读与收藏·良友文学丛书:一天的工作
¥14.7¥45.8 - >
我与地坛
我与地坛
¥27.2¥28.0 - >
月亮与六便士
月亮与六便士
¥18.1¥42.0 - >
巴金-再思录
巴金-再思录
¥14.7¥46.0 - >
伊索寓言-世界文学名著典藏-全译本
伊索寓言-世界文学名著典藏-全译本
¥9.3¥19.0 - >
龙榆生:词曲概论/大家小书
龙榆生:词曲概论/大家小书
¥13.0¥24.0
-
详解Spring Boot(从入门到企业级开发实战)/孙鑫精品图书系列
¥64.2¥129 -
PYTHON应用与实战
¥52.9¥79.8 -
Python编程与数值方法
¥79.6¥109 -
Go语言从入门到项目实战(视频版)
¥60.4¥108 -
软件设计师
¥14.2¥38 -
GO语言编程从入门到实践
¥75.6¥108