-
>
决战行测5000题(言语理解与表达)
-
>
软件性能测试.分析与调优实践之路
-
>
第一行代码Android
-
>
深度学习
-
>
Unreal Engine 4蓝图完全学习教程
-
>
深入理解计算机系统-原书第3版
-
>
Word/Excel PPT 2013办公应用从入门到精通-(附赠1DVD.含语音视频教学+办公模板+PDF电子书)
高等学校信息管理学专业系列教材大数据处理:从采集到可视化 版权信息
- ISBN:9787307215146
- 条形码:9787307215146 ; 978-7-307-21514-6
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 所属分类:>
高等学校信息管理学专业系列教材大数据处理:从采集到可视化 内容简介
本书共分为9章,章数据采集,主要介绍了大数据的概念、类型及其特征,常见的数据采集方法;第2章数据清洗,主要讨论数据质量的维度,数据可能存在的质量问题,常见的数据清洗方法;第3章数据ETL,重点介绍了MGO方法;第4章数据存储,主要介绍了大数据时代的一些主流数据存储平台和相关技术;第5章回归算法,主要介绍了线性回归、决策树回归、随机森林回归等,并介绍了其实现的主要步骤以及相应的Python语言实现代码;第6章分类算法,主要介绍了逻辑回归二分类和多分类、度提升分类树等;第7章聚类算法,主要介绍了分割聚类、层次聚类、基于密度的聚类;第8章推荐算法,主要介绍了基于关联规则的推荐、基于内容过滤的推荐等主流方法;第9章数据可视化的关键技术,主要介绍了数据的降维、可视化隐喻及相关的交互技术。
高等学校信息管理学专业系列教材大数据处理:从采集到可视化 目录
1.1 大数据概念
1.2 大数据类型及特征
1.3 数据采集方法
1.3.1 问卷调查方法
1.3.2 网络用户数据收集方法
1.3.3 系统曰志采集方法
1.3.4 网络数据采集方法
第2章 数据清洗
2.1 数据质量维度
2.2 数据预处理之数据可能存在的问题
2.3 数据质量问题的原因分析
2.3.1 数据源数据质量问题的原因分析
2.3.2 数据分析阶段数据质量问题的原因分析
2.4 数据预处理之数据问题处理方法
2.4.1 变化量识别
2.4.2 错误拒绝
2.4.3 列清洗
2.4.4 行过滤
2.5 记录匹配算法
……
高等学校信息管理学专业系列教材大数据处理:从采集到可视化 作者简介
余肖生,博士,教授,三峡大学计算机学院教授,计算机学系书记,毕业于武汉大学信息管理学院。近年来发表各类学术论文30余篇,其中CSSCI源刊论文10余篇,多篇论文被EI、CPCI收录。
- >
史学评论
史学评论
¥22.7¥42.0 - >
自卑与超越
自卑与超越
¥15.5¥39.8 - >
上帝之肋:男人的真实旅程
上帝之肋:男人的真实旅程
¥19.3¥35.0 - >
人文阅读与收藏·良友文学丛书:一天的工作
人文阅读与收藏·良友文学丛书:一天的工作
¥17.1¥45.8 - >
新文学天穹两巨星--鲁迅与胡适/红烛学术丛书(红烛学术丛书)
新文学天穹两巨星--鲁迅与胡适/红烛学术丛书(红烛学术丛书)
¥12.9¥23.0 - >
伊索寓言-世界文学名著典藏-全译本
伊索寓言-世界文学名著典藏-全译本
¥9.1¥19.0 - >
朝闻道
朝闻道
¥13.7¥23.8 - >
龙榆生:词曲概论/大家小书
龙榆生:词曲概论/大家小书
¥12.1¥24.0
-
Photoshop 2022中文版案例教程
¥44.1¥59.8 -
局域网组建、管理与维护(第4版)(微课版)
¥47¥59 -
园林AUTOCAD教程
¥24¥45 -
Python实战编程:从零学Python
¥81¥108 -
Java程序设计基础
¥37¥50 -
数据备份与恢复
¥51.4¥69