-
>
决战行测5000题(言语理解与表达)
-
>
软件性能测试.分析与调优实践之路
-
>
第一行代码Android
-
>
深度学习
-
>
Unreal Engine 4蓝图完全学习教程
-
>
深入理解计算机系统-原书第3版
-
>
Word/Excel PPT 2013办公应用从入门到精通-(附赠1DVD.含语音视频教学+办公模板+PDF电子书)
数据科学概论(数字教材版) 版权信息
- ISBN:9787300290607
- 条形码:9787300290607 ; 978-7-300-29060-7
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 所属分类:>
数据科学概论(数字教材版) 内容简介
本书是一本数据科学与大数据技术专业的入门书籍。每个知识点尽量从实际的应用案例出发,从数据出发,以问题为导向,在解决问题中学习数据挖掘、机器学习等数据科学相关方法。本书将数据读写、数据清洗和预处理作为开端,逐渐深入到和数据科学相关的决策树、支持向量机、神经网络、无监督学习等知识。此外,结合数据科学的实际应用,书中还讲解了推荐算法、文本挖掘和社交网络分析等热门实用技术。
数据科学概论(数字教材版) 目录
1.1 数据科学的概念
1.1.1 数据科学的研究对象
1.1.2 常见的数据科学方法
1.2 数据科学的发展变迁
1.2.1 数据科学的前身:统计学
1.2.2 当代统计学:数据科学
1.3 数据科学的应用领域
1.3.1 互联网行业
1.3.2 零售行业
1.3.3 金融行业
1.3.4 医疗健康行业
第2章 数据科学的编程工具
2.1 R简介
2.1.1 安装和设置
2.1.2 基础操作
2.1.3 数据结构
2.1.4 基础语法
2.2 Python和数据科学
2.2.1 安装和使用
2.2.2 数据结构
2.2.3 基础语法
2.3 Julia简介
2.3.1 安装和使用
2.3.2 编程基础
第3章 数据科学的数学基础
3.1 线性代数
3.1.1 向量基础
3.1.2 矩阵运算
3.2 概率论和数理统计
3.2.1 随机变量和分布
3.2.2 数理统计简介
3.3 *优化方法
3.3.1 非线性规划
3.3.2 线性规划
第4章 数据科学的统计原则
4.1 可重复原则
4.1.1 数据的扰动
4.1.2 模型的扰动
4.2 可预测原则
4.2.1 可预测性
4.2.2 交叉验证
4.3 可计算原则
4.3.1 大数据时代的数据特征
4.3.2 大规模数据的处理方法
4.3.3 高维/超高维数据的处理方法
第5章 数据可视化
5.1 基础统计图形
5.1.1 图形设备
5.1.2 基础作图
5.1.3 ggplot绘图语言
5.2 可视化与数据分析
5.2.1 单变量的分布
5.2.2 两变量的关系
5.2.3 多变量的关系
5.3 现代数据可视化方法
5.3.1 动态统计图形
5.3.2 交互式工具
第6章 数据挖掘和机器学习
6.1 从海量数据到大数据
6.1.1 海量数据与数据挖掘
6.1.2 大数据与机器学习
6.2 无监督学习
6.2.1 主成分分析
6.2.2 聚类分析
6.3 有监督学习
6.3.1 回归分析
6.3.2 分类问题和分类性能评估
6.3.3 常用分类模型
第7章 人工智能
7.1 人工智能简史
7.1.1 人工智能的发展历史
7.1.2 从神经网络到深度学习
7.2 神经网络简介
7.2.1 神经网络模型
7.2.2 感知机的学习
7.2.3 BP算法
7.3 深度学习基础
7.3.1 常见深度学习框架
7.3.2 MXNet简介
7.3.3 深度学习实战
第8章 非结构化数据分析
8.1 图像分析
8.1.1 图像处理基础
8.1.2 卷积神经网络
8.1.3 图像分类示例
8.2 文本分析
8.2.1 文本数据的处理
8.2.2 文本分类示例
8.2.3 句法分析
8.3 音频分析
8.3.1 音频数据的处理
8.3.2 音频特征的提取
第9章 数据库和数据仓库
9.1 数据结构简介
9.1.1 数据的测量尺度
9.1.2 数据的基础类型
9.1.3 数据的逻辑结构
9.2 数据库和SQL
9.2.1 数据库基础介绍
9.2.2 常见的数据库产品
9.2.3 SQL语句简介
9.3 数据仓库和商业智能
9.3.1 数据仓库基础介绍
9.3.2 数据仓库的多维模型
9.3.3 BI分析简介
第10章 大数据平台
10.1 大数据和云计算
10.1.1 大数据技术的发展变迁
10.1.2 云计算简介
10.2 并行计算框架
10.2.1 并行计算简介
10.2.2 共享内存和GPU计算
10.2.3 MPI并行
10.3 分布式存储与Hadoop
10.3.1 容器和Docker
10.3.2 Hadoop和MapReduce
10.3.3 Spark简介
……
第11章 可重复研究与产品化
第12章 数据科学的行业应用
参考文献
数据科学概论(数字教材版) 作者简介
李扬,中国人民大学统计学院教授、博士生导师、副院长,统计咨询研究中心主任;国际统计学会推选会员、中国商业统计学会副会长、北京生物医学统计与数据管理研究会监事长、北京大数据协会综合评价专业委员会主任委员。主要从事相关型数据分析、模型选择与不确定性评价、潜变量建模、临床试验设计等领域研究,承担国家自然科学基金面上项目、全国统计科学研究重大项目等科研项目二十余项,在《统计研究》、JASA、JAMA IM、Biometrics、Biostatistics等国内外期刊发表论文五十余篇。 李舰,统计学本科、软件工程硕士、商学博士,数据科学领域的多年从业者,见证并参与了统计学从冷门专业到显学的过程。是“统计之都”社区的核心成员之一、一些开源社区的活跃贡献者,致力于数据科学在实体行业的应用。著有《统计之美》《数据科学中的R语言》。
- >
李白与唐代文化
李白与唐代文化
¥12.5¥29.8 - >
中国人在乌苏里边疆区:历史与人类学概述
中国人在乌苏里边疆区:历史与人类学概述
¥20.6¥48.0 - >
诗经-先民的歌唱
诗经-先民的歌唱
¥18.7¥39.8 - >
人文阅读与收藏·良友文学丛书:一天的工作
人文阅读与收藏·良友文学丛书:一天的工作
¥14.7¥45.8 - >
龙榆生:词曲概论/大家小书
龙榆生:词曲概论/大家小书
¥7.7¥24.0 - >
随园食单
随园食单
¥21.6¥48.0 - >
小考拉的故事-套装共3册
小考拉的故事-套装共3册
¥36.7¥68.0 - >
烟与镜
烟与镜
¥15.4¥48.0
-
”互联网+“时代计算机算法的应用及其实践研究
¥19.9¥59 -
微服务设计
¥52.8¥69 -
图说深度学习:用可视化方法理解复杂概念
¥109¥188 -
计算机基础
¥17.2¥31 -
改变未来的九大算法
¥50¥68 -
生成式AI入门与AWS实战
¥77.8¥99.8