超值优惠券
¥50
100可用 有效期2天

全场图书通用(淘书团除外)

不再提示
关闭
图书盲袋,以书为“药”
欢迎光临中图网 请 | 注册
> >
数据科学概论(数字教材版)

数据科学概论(数字教材版)

作者:李扬
出版社:中国人民大学出版社出版时间:2021-03-01
开本: 其他 页数: 264
中 图 价:¥31.4(6.4折) 定价  ¥49.0 登录后可看到会员价
加入购物车 收藏
运费6元,满39元免运费
?新疆、西藏除外
本类五星书更多>

数据科学概论(数字教材版) 版权信息

  • ISBN:9787300290607
  • 条形码:9787300290607 ; 978-7-300-29060-7
  • 装帧:一般胶版纸
  • 册数:暂无
  • 重量:暂无
  • 所属分类:>

数据科学概论(数字教材版) 内容简介

本书是一本数据科学与大数据技术专业的入门书籍。每个知识点尽量从实际的应用案例出发,从数据出发,以问题为导向,在解决问题中学习数据挖掘、机器学习等数据科学相关方法。本书将数据读写、数据清洗和预处理作为开端,逐渐深入到和数据科学相关的决策树、支持向量机、神经网络、无监督学习等知识。此外,结合数据科学的实际应用,书中还讲解了推荐算法、文本挖掘和社交网络分析等热门实用技术。

数据科学概论(数字教材版) 目录

第1章 绪论
1.1 数据科学的概念
1.1.1 数据科学的研究对象
1.1.2 常见的数据科学方法
1.2 数据科学的发展变迁
1.2.1 数据科学的前身:统计学
1.2.2 当代统计学:数据科学
1.3 数据科学的应用领域
1.3.1 互联网行业
1.3.2 零售行业
1.3.3 金融行业
1.3.4 医疗健康行业

第2章 数据科学的编程工具
2.1 R简介
2.1.1 安装和设置
2.1.2 基础操作
2.1.3 数据结构
2.1.4 基础语法
2.2 Python和数据科学
2.2.1 安装和使用
2.2.2 数据结构
2.2.3 基础语法
2.3 Julia简介
2.3.1 安装和使用
2.3.2 编程基础

第3章 数据科学的数学基础
3.1 线性代数
3.1.1 向量基础
3.1.2 矩阵运算
3.2 概率论和数理统计
3.2.1 随机变量和分布
3.2.2 数理统计简介
3.3 *优化方法
3.3.1 非线性规划
3.3.2 线性规划

第4章 数据科学的统计原则
4.1 可重复原则
4.1.1 数据的扰动
4.1.2 模型的扰动
4.2 可预测原则
4.2.1 可预测性
4.2.2 交叉验证
4.3 可计算原则
4.3.1 大数据时代的数据特征
4.3.2 大规模数据的处理方法
4.3.3 高维/超高维数据的处理方法

第5章 数据可视化
5.1 基础统计图形
5.1.1 图形设备
5.1.2 基础作图
5.1.3 ggplot绘图语言
5.2 可视化与数据分析
5.2.1 单变量的分布
5.2.2 两变量的关系
5.2.3 多变量的关系
5.3 现代数据可视化方法
5.3.1 动态统计图形
5.3.2 交互式工具

第6章 数据挖掘和机器学习
6.1 从海量数据到大数据
6.1.1 海量数据与数据挖掘
6.1.2 大数据与机器学习
6.2 无监督学习
6.2.1 主成分分析
6.2.2 聚类分析
6.3 有监督学习
6.3.1 回归分析
6.3.2 分类问题和分类性能评估
6.3.3 常用分类模型

第7章 人工智能
7.1 人工智能简史
7.1.1 人工智能的发展历史
7.1.2 从神经网络到深度学习
7.2 神经网络简介
7.2.1 神经网络模型
7.2.2 感知机的学习
7.2.3 BP算法
7.3 深度学习基础
7.3.1 常见深度学习框架
7.3.2 MXNet简介
7.3.3 深度学习实战

第8章 非结构化数据分析
8.1 图像分析
8.1.1 图像处理基础
8.1.2 卷积神经网络
8.1.3 图像分类示例
8.2 文本分析
8.2.1 文本数据的处理
8.2.2 文本分类示例
8.2.3 句法分析
8.3 音频分析
8.3.1 音频数据的处理
8.3.2 音频特征的提取

第9章 数据库和数据仓库
9.1 数据结构简介
9.1.1 数据的测量尺度
9.1.2 数据的基础类型
9.1.3 数据的逻辑结构
9.2 数据库和SQL
9.2.1 数据库基础介绍
9.2.2 常见的数据库产品
9.2.3 SQL语句简介
9.3 数据仓库和商业智能
9.3.1 数据仓库基础介绍
9.3.2 数据仓库的多维模型
9.3.3 BI分析简介

第10章 大数据平台
10.1 大数据和云计算
10.1.1 大数据技术的发展变迁
10.1.2 云计算简介
10.2 并行计算框架
10.2.1 并行计算简介
10.2.2 共享内存和GPU计算
10.2.3 MPI并行
10.3 分布式存储与Hadoop
10.3.1 容器和Docker
10.3.2 Hadoop和MapReduce
10.3.3 Spark简介
……

第11章 可重复研究与产品化
第12章 数据科学的行业应用

参考文献
展开全部

数据科学概论(数字教材版) 作者简介

  李扬,中国人民大学统计学院教授、博士生导师、副院长,统计咨询研究中心主任;国际统计学会推选会员、中国商业统计学会副会长、北京生物医学统计与数据管理研究会监事长、北京大数据协会综合评价专业委员会主任委员。主要从事相关型数据分析、模型选择与不确定性评价、潜变量建模、临床试验设计等领域研究,承担国家自然科学基金面上项目、全国统计科学研究重大项目等科研项目二十余项,在《统计研究》、JASA、JAMA IM、Biometrics、Biostatistics等国内外期刊发表论文五十余篇。    李舰,统计学本科、软件工程硕士、商学博士,数据科学领域的多年从业者,见证并参与了统计学从冷门专业到显学的过程。是“统计之都”社区的核心成员之一、一些开源社区的活跃贡献者,致力于数据科学在实体行业的应用。著有《统计之美》《数据科学中的R语言》。

商品评论(0条)
暂无评论……
书友推荐
本类畅销
编辑推荐
返回顶部
中图网
在线客服