-
>
决战行测5000题(言语理解与表达)
-
>
软件性能测试.分析与调优实践之路
-
>
第一行代码Android
-
>
深度学习
-
>
Unreal Engine 4蓝图完全学习教程
-
>
深入理解计算机系统-原书第3版
-
>
Word/Excel PPT 2013办公应用从入门到精通-(附赠1DVD.含语音视频教学+办公模板+PDF电子书)
数据清洗-微课视频版 版权信息
- ISBN:9787302577478
- 条形码:9787302577478 ; 978-7-302-57747-8
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 所属分类:>
数据清洗-微课视频版 本书特色
本书可作为高等学校大数据、人工智能、云计算等专业的教材,可也作为大数据爱好者的参考书。 本书配套资源丰富,包括教学大纲、教学课件、电子教案、程序源码、习题答案、期末试卷和在线作业,作者还为本书精心录制了微课视频。 (1) 采用“理实一体化”教学方式,课堂上既有老师的讲述,又有学生独立思考、上机操作的内容。 (2) 配套资源丰富,包括教学大纲、教学课件、电子教案、习题答案、程序源码、期末试卷和在线作业。 (3) 紧跟时代潮流,注重技术变化,书中既包含了使用Python进行数据清洗,也包含了*新的数据清洗的开源工具的使用。 (4) 本书的编者都具有多年的教学经验,重点和难点突出,能够激发学生的学习热情。 (5) 对本书中的重点和难点配有微课视频,方便学生课后学习。
数据清洗-微课视频版 内容简介
本书的编写目的是向读者介绍数据清洗技术的基本概念与应用。全书共10章,分别为数据清洗概述、文件格式、Web数据抽取、网络爬虫、Kettle数据清洗、数据迁移、文本数据处理、Python数据清洗、DataCleaner数据分析与清洗以及数据清洗综合实训。本书将理论与实践操作相结合,通过大量的案例帮助读者快速了解和应用数据清洗相关技术,并对书中重要的、核心的知识点加大练习力度,以达到熟练应用的目的。 本书可作为高等学校大数据、人工智能、云计算等专业的教材,可也作为大数据爱好者的参考书。
数据清洗-微课视频版 目录
目录
源码下载
第1章数据清洗概述
1.1数据清洗基础
1.1.1数据清洗的定义
1.1.2数据清洗的原理
1.1.3数据清洗的流程
1.1.4数据清洗的常用方法
1.1.5数据清洗的评估描述
1.1.6数据清洗中的常用评测数据集
1.2数据质量与数据仓库
1.2.1数据质量的定义
1.2.2常见的数据质量问题
1.2.3数据质量与数据清洗
1.2.4数据仓库与ETL
1.2.5数据映射
1.2.6主数据与元数据
1.3数据清洗中的统计基础
1.3.1描述性统计
1.3.2推论统计
1.3.3随机变量
1.4数据清洗环境与常用工具
1.4.1数据清洗环境介绍
1.4.2数据清洗常用工具
1.5本章小结
1.6实训
习题1
第2章文件格式
2.1文件格式概述
2.2Kettle中文件格式的转换
2.2.1文本文件转换
2.2.2CSV文件转换
2.2.3XML文件转换
2.2.4JSON文件转换
2.2.5Excel文件转换
2.2.6生成记录转换
2.3本章小结
2.4实训
习题2
第3章Web数据抽取
3.1Web数据抽取基础
3.2Web数据抽取的实现
3.2.1Kettle数据抽取原理
3.2.2Kettle数据抽取实现
3.3本章小结
3.4实训
习题3
第4章网络爬虫
4.1网络爬虫基础
4.2Python3网络爬虫实现
4.2.1urllib模块
4.2.2Requests库
4.2.3BeautifulSoup库
4.3Python3网络爬虫实例
4.3.1urllib实例
4.3.2requests实例
4.4本章小结
4.5实训
习题4
第5章Kettle数据清洗
5.1Kettle数据清洗概述
5.2Kettle数据清洗实现
5.2.1清洗简单数据
5.2.2清洗复杂数据
5.3本章小结
5.4实训
习题5
第6章数据迁移
6.1数据迁移概述
6.2数据迁移实现技术
6.2.1基于主机的迁移方式
6.2.2备份恢复的迁移方式
6.2.3基于存储的迁移方式
6.2.4基于文件系统的迁移方式
6.2.5基于数据库的迁移方式
6.3数据迁移实现
6.3.1数据库安装与使用
6.3.2Kettle数据迁移
6.4本章小结
6.5实训
习题6
第7章文本数据处理
7.1文本分词
7.2文本数据处理方法
7.3jieba分词的应用
7.3.1jieba概述
7.3.2jieba应用实例
7.4本章小结
7.5实训
习题7
第8章Python数据清洗
8.1Python数据清洗概述
8.1.1Python数据清洗相关库
8.1.2Python数据清洗库的安装
8.2NumPy使用
8.2.1数组的创建与使用
8.2.2计算模块与随机模块的使用
8.2.3NumPy数据清洗实例
8.3Pandas使用
8.3.1Pandas数据类型概述
8.3.2Pandas数据类型应用
8.3.3Pandas数据清洗
8.4matplotlib使用
8.4.1matplotlib的介绍
8.4.2matplotlib的应用
8.5Python数据清洗实例
8.5.1清洗内部数据
8.5.2清洗外部数据
8.6本章小结
8.7实训
习题8
第9章DataCleaner数据分析与清洗
9.1DataCleaner简介
9.1.1DataCleaner概述
9.1.2DataCleaner界面认识
9.2DataCleaner应用
9.2.1认识DataCleaner
9.2.2DataCleaner数据分析实例
9.3本章小结
9.4实训
习题9
第10章数据清洗综合实训
10.1Python数据分组与显示
10.2Python数据清洗与显示
10.3Kettle分组排序
10.4Kettle模糊匹配
参考文献
数据清洗-微课视频版 作者简介
黄源,男,计算机专业研究生,研究方向为计算机软件与理论,2003年至今在重庆航天职业技术学院计算机系担任专职教师,副教授,主要教授计算机网络、计算机软件等专业的专业课程。
- >
苦雨斋序跋文-周作人自编集
苦雨斋序跋文-周作人自编集
¥6.9¥16.0 - >
大红狗在马戏团-大红狗克里弗-助人
大红狗在马戏团-大红狗克里弗-助人
¥3.5¥10.0 - >
中国历史的瞬间
中国历史的瞬间
¥16.7¥38.0 - >
龙榆生:词曲概论/大家小书
龙榆生:词曲概论/大家小书
¥7.7¥24.0 - >
罗庸西南联大授课录
罗庸西南联大授课录
¥13.8¥32.0 - >
回忆爱玛侬
回忆爱玛侬
¥9.8¥32.8 - >
月亮虎
月亮虎
¥20.2¥48.0 - >
伯纳黛特,你要去哪(2021新版)
伯纳黛特,你要去哪(2021新版)
¥15.9¥49.8
-
”互联网+“时代计算机算法的应用及其实践研究
¥19.9¥59 -
微服务设计
¥52.8¥69 -
图说深度学习:用可视化方法理解复杂概念
¥109¥188 -
计算机基础
¥17.2¥31 -
改变未来的九大算法
¥50¥68 -
生成式AI入门与AWS实战
¥77.8¥99.8