中图网

>

程序设计

数据科学与工程技术丛书数据科学实战之网络爬取:PYTHON实践和示例

作者：[比]希普·万登·布鲁克（Seppe

出版社：机械工业出版社出版时间：2018-12-01

开本： 16开 页数： 220

本类榜单：计算机/网络销量榜

中图价:¥50.4(7.3折) 定价 ~~¥69.0~~ 登录后可看到会员价

加入购物车收藏

运费6元，满39元免运费

?新疆、西藏除外

本类五星书更多>

>
决战行测5000题(言语理解与表达)

决战行测5000题(言语理解与表达)

¥38.8¥88
>
软件性能测试.分析与调优实践之路

软件性能测试.分析与调优实践之路

¥49.3¥69
>
第一行代码Android

第一行代码Android

¥58.4¥99
>
深度学习

深度学习

¥92.4¥168
>
Unreal Engine 4蓝图完全学习教程

Unreal Engine 4蓝图完全学习教程

¥72.2¥168
>
深入理解计算机系统-原书第3版

深入理解计算机系统-原书第3版

¥104.3¥139
>
Word/Excel PPT 2013办公应用从入门到精通-(附赠1DVD.含语音视频教学+办公模板+PDF电子书)

Word/Excel PPT 2013办公应用从入门到精通-(附赠1DVD.含语音视频教学+办公模板+PDF电子书)

¥21¥49.9

买过本商品的人还买了

机械工业出版社Web开发技术丛书FLASK WEB开发实战:入门进阶与原理解析
李辉
¥94.2~~¥129.0~~
后浪出版公司制片人的钱包融资和节约的艺术(第2版)
［美］卡萝尔·李·迪恩
¥36.5~~¥58.0~~
世界丑闻史
(日)海野弘著
¥37.4~~¥52.0~~
极简区块链:你一定爱读的有趣通识书
（印）SrinivasMahankal
¥27.8~~¥58.0~~

商品详情
商品评论(0条)

中图价:¥50.4 加入购物车

版权信息
本书特色
内容简介
目录
作者简介

数据科学与工程技术丛书数据科学实战之网络爬取:PYTHON实践和示例版权信息

ISBN：9787111614043
条形码：9787111614043 ; 978-7-111-61404-3
装帧：简裝本
册数：暂无
重量：暂无
所属分类：
计算机/网络
>
程序设计

数据科学与工程技术丛书数据科学实战之网络爬取:PYTHON实践和示例本书特色

本书提供了一个完整的、现代的Web抓取指南，使用Python作为编程语言，专为数据科学的读者编写，探讨了Web抓取和以及其背后的大量Web技术。书中首先简要概述抓取和现实生活中的用例,解释了HTTP、HTML和CSS的核心概念作为基础。*后总结了一些*佳实践和一系列的例子，这些数据科学用例汇集了你学到的所有知识。读者将学习到如何利用已建立的*佳实践和常用的Python包，处理包括JavaScript、Cookie和常见的web抓取技术。

数据科学与工程技术丛书数据科学实战之网络爬取:PYTHON实践和示例内容简介

本书提供了一个完整的、现代的Web抓取指南，使用Python作为编程语言，专为数据科学的读者编写，探讨了Web抓取和以及其背后的大量Web技术。书中首先简要概述抓取和现实生活中的用例,解释了HTTP、HTML和CSS的核心概念作为基础。*后总结了一些*佳实践和一系列的例子，这些数据科学用例汇集了你学到的所有知识。读者将学习到如何利用已建立的*佳实践和常用的Python包，处理包括JavaScript、Cookie和常见的web抓取技术。

数据科学与工程技术丛书数据科学实战之网络爬取:PYTHON实践和示例目录

译者序
作者简介
技术审校者简介
前言
**部分　网络爬取基础
第1章　简介2
1.1　什么是网络爬取2
1.1.1　网络爬取为什么用于数据科学2
1.1.2　谁在使用网络爬取4
1.2　准备工作6
1.2.1　设置6
1.2.2　Python 快速入门7
第2章　网络传输协议HTTP18
2.1　网络的魔力18
2.2　超文本传输协议20
2.3　Python中的HTTP—Requests库25
2.4　带参数的URL查询字符串28
第3章　HTML和CSS36
3.1　超文本标记语言HTML36
3.2　将浏览器用作开发工具38
3.3　层叠样式表CSS42
3.4　Beautiful Soup库45
3.5　有关Beautiful Soup的更多内容53
第二部分　高级网络爬取
第4章　深入挖掘HTTP60
4.1　使用表单和POST请求60
4.2　其他HTTP请求方法71
4.3　关于头的更多信息73
4.4　使用Cookie79
4.5　requests库的session对象87
4.6　二进制、JSON和其他形式的内容89
第5章　处理JavaScript93
5.1　什么是JavaScript93
5.2　爬取JavaScript94
5.3　使用Selenium爬取网页98
5.4　Selenium的更多信息109
第6章　从网络爬取到网络爬虫115
6.1　什么是网络爬虫115
6.2　使用Python实现网络爬虫117
6.3　数据库存储120
第三部分　相关管理问题及*佳实践
第7章　网络爬取涉及的管理和法律问题130
7.1　数据科学过程130
7.2　网络爬取适合用于哪里133
7.3　法律问题134
第8章　结语139
8.1　其他工具139
8.1.1　其他Python库139
8.1.2　Scrapy库140
8.1.3　缓存140
8.1.4　代理服务器141
8.1.5　基于其他编程语言的爬取141
8.1.6　命令行工具142
8.1.7　图形化的爬取工具142
8.2　*佳实践和技巧143
第9章　示例147
9.1　爬取Hacker News网页148
9.2　使用Hacker News API150
9.3　爬取引用信息 150
9.4　爬取书籍信息154
9.5　爬取GitHub上项目被收藏的次数156
9.6　爬取抵押贷款利率160
9.7　爬取和可视化IMDB评级165
9.8　爬取IATA航空公司信息166
9.9　爬取和分析网络论坛的互动171
9.10　收集和聚类时尚数据集177
9.11　Amazon评论的情感分析180
9.12　爬取和分析维基百科关联图188
9.13　爬取和可视化董事会成员图194
9.14　使用深度学习破解验证码图片197

展开全部

数据科学与工程技术丛书数据科学实战之网络爬取:PYTHON实践和示例作者简介

Seppe vanden Broucke是比利时鲁汶大学经济与商务学院数据科学方面的助理教授。他的研究兴趣包括商务数据挖掘和分析、机器学习、流程管理和流程挖掘，相关论文发表在知名国际期刊和顶级会议上。 Seppe从事包括高级分析、大数据和信息管理课程方面的教学工作，也经常提供工业和商业用户的培训。除了工作，Seppe喜欢旅行、阅读（从Murakami到Bukowski到Asimov）、听音乐（从Booka Shade到Miles Davis到Claude Debussy）、看电影和连续剧（由于没时间现在看得少多了）、玩游戏和关注新闻事件。
Bart Baesens是比利时鲁汶大学大数据和数据分析方面的教授，也是英国南安普顿大学的讲师。他对大数据及分析、信用风险建模、欺诈检测和营销分析进行了广泛的研究。Bart撰写了200多篇学术论文和若干本书。除了与家人共度时光外，他还是一名布鲁日足球俱乐部的铁杆球迷。Bart是美食家和业余厨师，他喜欢在他的酒窖里或者在花园里俯瞰红色英式电话亭时喝一杯好酒（他*喜欢的是白维欧尼或红赤霞珠）。Bart热爱旅行，对第一次世界大战着迷，并阅读了很多关于这个主题的书籍。

商品评论(0条)

写书评赚书币

暂无评论……

书友推荐

>
烟与镜
烟与镜
[英] 尼尔·盖曼著，王爽译
¥14.4~~¥48.0~~
>
朝闻道
朝闻道
刘慈欣
¥8.8~~¥23.8~~
>
我与地坛
我与地坛
史铁生
¥27.2~~¥28.0~~
>
月亮虎
月亮虎
[英] 佩内洛普·莱夫利著，郭国良译
¥14.4~~¥48.0~~
>
中国历史的瞬间
中国历史的瞬间
李永炽
¥16.7~~¥38.0~~
>
巴金－再思录
巴金－再思录
巴金
¥14.7~~¥46.0~~
>
二体千字文
二体千字文
本书编委会
¥14.0~~¥40.0~~
>
回忆爱玛侬
回忆爱玛侬
[日]梶尾真治著，王玮译
¥23.0~~¥32.8~~

本类畅销

C专家编程

[美] 彼得·范德林登（Peter Va

¥41~~¥69~~
UG NX 11.0工程图教程-(含1DVD)

本书编委会

¥30.4~~¥59.9~~
网络爬虫进化论——从Excel爬虫到Python爬虫

曹鉴华

¥55.5~~¥79~~
Python 数据分析基础

克林顿.布朗利

¥41~~¥69~~
Python 3.5从零开始学

刘宇宙

¥26.4~~¥59~~
湖北交通文化

尤习贵

¥21.8~~¥46~~

数据科学与工程技术丛书数据科学实战之网络爬取:PYTHON实践和示例

机械工业出版社Web开发技术丛书FLASK WEB开发实战:入门进阶与原理解析

后浪出版公司制片人的钱包融资和节约的艺术(第2版)

世界丑闻史

极简区块链:你一定爱读的有趣通识书

数据科学与工程技术丛书数据科学实战之网络爬取:PYTHON实践和示例版权信息

数据科学与工程技术丛书数据科学实战之网络爬取:PYTHON实践和示例本书特色

数据科学与工程技术丛书数据科学实战之网络爬取:PYTHON实践和示例内容简介

数据科学与工程技术丛书数据科学实战之网络爬取:PYTHON实践和示例目录

数据科学与工程技术丛书数据科学实战之网络爬取:PYTHON实践和示例作者简介

烟与镜

朝闻道

我与地坛

月亮虎

中国历史的瞬间

巴金－再思录

二体千字文

回忆爱玛侬

C专家编程

UG NX 11.0工程图教程-(含1DVD)

网络爬虫进化论——从Excel爬虫到Python爬虫

Python 数据分析基础

Python 3.5从零开始学

湖北交通文化

女孩们

俄罗斯书简

人间草木

百年梦忆:梁实秋人生自述

时间停止的那一天

陶潜和樱子

数据科学与工程技术丛书数据科学实战之网络爬取:PYTHON实践和示例

数据科学与工程技术丛书数据科学实战之网络爬取:PYTHON实践和示例 版权信息

数据科学与工程技术丛书数据科学实战之网络爬取:PYTHON实践和示例 本书特色

数据科学与工程技术丛书数据科学实战之网络爬取:PYTHON实践和示例 内容简介

数据科学与工程技术丛书数据科学实战之网络爬取:PYTHON实践和示例 目录

数据科学与工程技术丛书数据科学实战之网络爬取:PYTHON实践和示例 作者简介

数据科学与工程技术丛书数据科学实战之网络爬取:PYTHON实践和示例版权信息

数据科学与工程技术丛书数据科学实战之网络爬取:PYTHON实践和示例本书特色

数据科学与工程技术丛书数据科学实战之网络爬取:PYTHON实践和示例内容简介

数据科学与工程技术丛书数据科学实战之网络爬取:PYTHON实践和示例目录

数据科学与工程技术丛书数据科学实战之网络爬取:PYTHON实践和示例作者简介