中图网

>

数据库

>

数据仓库与数据挖掘

Web大数据处理与分析

作者：夏换，杨秀璋，于小民

出版社：科学出版社出版时间：2019-03-01

开本： 24cm 页数： 282页

本类榜单：计算机/网络销量榜

中图价:¥120.1(7.9折) 定价 ~~¥152.0~~ 登录后可看到会员价

加入购物车收藏

运费6元，满39元免运费

?新疆、西藏除外

本类五星书更多>

>
决战行测5000题(言语理解与表达)

决战行测5000题(言语理解与表达)

¥38.8¥88
>
软件性能测试.分析与调优实践之路

软件性能测试.分析与调优实践之路

¥49.3¥69
>
第一行代码Android

第一行代码Android

¥58.4¥99
>
深度学习

深度学习

¥92.4¥168
>
Unreal Engine 4蓝图完全学习教程

Unreal Engine 4蓝图完全学习教程

¥72.2¥168
>
深入理解计算机系统-原书第3版

深入理解计算机系统-原书第3版

¥104.3¥139
>
Word/Excel PPT 2013办公应用从入门到精通-(附赠1DVD.含语音视频教学+办公模板+PDF电子书)

Word/Excel PPT 2013办公应用从入门到精通-(附赠1DVD.含语音视频教学+办公模板+PDF电子书)

¥21¥49.9

商品详情
商品评论(0条)

中图价:¥120.1 加入购物车

版权信息
本书特色
内容简介
目录

Web大数据处理与分析版权信息

ISBN：9787030606365
条形码：9787030606365 ; 978-7-03-060636-5
装帧：暂无
册数：暂无
重量：暂无
所属分类：
计算机/网络
>
数据库
>
数据仓库与数据挖掘

Web大数据处理与分析本书特色

随着计算机和互联网技术的飞速发展和广泛普及，互联网已经成为人类获取知识的*平台。在爬取了Web网页语料后，需要通过数据预处理和数据分析来获取数据的价值，从而造福人类，推动社会发展。本书主要是Web大数据预处理和数据分析的实战指南，内容包括三部分：基础知识、基于Python的数据预处理、基于Python的数据分析

Web大数据处理与分析内容简介

随着计算机和互联网技术的飞速发展和广泛普及, 互联网已经成为人类获取知识的*大平台。在爬取了Web网页语料后, 需要通过数据预处理和数据分析来获取数据的价值, 从而造福人类, 推动社会发展。本书主要是Web大数据预处理和数据分析的实战指南, 内容包括三部分: 基础知识、基于Python的大数据预处理、基于Python的大数据分析。

Web大数据处理与分析目录

目录**部分基础知识第1章概述 31.1 大数据预处理和分析 31.2 各章概要 81.3 如何阅读本书 12第2章数据挖掘基础知识 142.1 数据挖掘 142.2 有监督学习 162.3 无监督学习 172.4 部分监督学习 19第3章关系型数据库和语料知识库 213.1 关系型数据库 213.2 SQL基础知识 233.3 Python调用数据库 323.4 常见的语料知识库 39第4章正则表达式和基本字符串函数 484.1 正则表达式 484.2 基本字符串函数 584.3 字符编码简介 64第二部分基于Python的大数据预处理第5章数据预处理相关介绍 715.1 预处理概述 715.2 中文分词 725.3 数据清洗 745.4 词性标注基础 755.5 向量空间模型及特征提取 765.6 权重计算 76第6章中文分词技术及Jieba工具 776.1 中文分词技术介绍 776.2 常用中文分词工具 806.3 Jieba中文分词工具 816.4 案例分析：使用Jieba对百度百科摘要信息进行中文分词 91第7章数据清洗及停用词过滤 947.1 数据清洗的概念 947.2 数据清洗常见方法 977.3 停用词过滤 98第8章词性标注 1068.1 词性标注概述 1068.2 BosonNLP词性标注 1098.3 Jieba工具词性标注 1158.4 案例分析：基于Jieba工具的词性标注 120第9章向量空间模型及特征提取 1249.1 向量空间模型 1249.2 特征提取 1269.3 余弦相似性 1299.4 案例分析：基于向量空间模型的余弦相似度计算 131第10章权重计算及TF-IDF 13910.1 权重计算 13910.2 TF-IDF 14110.3 Scikit-Learn中的TF-IDF使用方法 14310.4 案例分析：TF-IDF计算中文语料权重 146第三部分基于Python的大数据分析第11章 Python大数据分析的常用库介绍 15711.1 数据挖掘概述 15711.2 开发软件安装过程 15911.3 Scikit-Learn库 16511.4 NumPy、SciPy、Matplotlib库 169第12章基于Python的聚类数据分析 17512.1 聚类概述 17512.2 聚类算法基本用法 17812.3 案例分析：基于Birch层次聚类算法及PAC降维显示聚类图像 190第13章基于Python的分类算法分析 20613.1 分类概述 20613.2 Python分类算法基本用法 21413.3 案例分析：基于新闻数据分类算法的示例 229第14章基于Python的LDA主题模型 24214.1 LDA主题模型 24214.2 LDA安装过程 24414.3 LDA基本用法 24514.4 案例分析：LDA主题模型分布计算 254第15章基于Python的神经网络分析 26515.1 神经网络的基础知识 26515.2 神经网络的Python简单实现 27115.3 Python神经网络工具包 27515.4 案例分析：使用神经网络训练 280参考文献 283

展开全部

商品评论(0条)

写书评赚书币

暂无评论……

书友推荐