扫一扫
关注中图网
官方微博
本类五星书更多>
-
>
决战行测5000题(言语理解与表达)
-
>
软件性能测试.分析与调优实践之路
-
>
第一行代码Android
-
>
深度学习
-
>
Unreal Engine 4蓝图完全学习教程
-
>
深入理解计算机系统-原书第3版
-
>
Word/Excel PPT 2013办公应用从入门到精通-(附赠1DVD.含语音视频教学+办公模板+PDF电子书)
大数据采集与爬虫 版权信息
- ISBN:9787576325201
- 条形码:9787576325201 ; 978-7-5763-2520-1
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 所属分类:>
大数据采集与爬虫 内容简介
本书收集了大数据采集与爬虫相关的编程案例,分4个单元进行讲解,包括单元一爬虫与网页、单元二文本类网站的爬虫、单元三图片资源的爬虫、单元四JupyterNotebook(anaconda3)爬虫编程基础,共讲解了28个编程案例。本书案例内容包括爬虫程序的工作原理,从网站爬取收集有需要的代码、文字、图片等资源的技能,讲解以案例应用的形式呈现,并把技能应用结合案例实现过程,以效果目标引领编程,同时,注重理论知识贯穿于案例中。
大数据采集与爬虫 目录
项目一 爬虫与网页
任务一 使用requests模块爬取网页状态
任务二 在浏览器中查看网页状态
任务三 爬取在IIS中发布的网页内容
任务四 爬取网页标签的内容
任务五 爬取网页多个
标签的内容
任务五 爬取网页多个标签的所有文本
任务六 根据标签类名爬取网页标签内容
任务七 用getall()方法爬取网页标签内容
任务八 爬取网页中所有超链接的网址
任务九 爬取网页中超链接目标的标题
任务十 爬取网页中所有标签
项目二 文本类网站的爬虫
任务一 爬取网页特定区域的内容
任务二 爬取网页两个特定区域的内容并分别保存于两个文件中
任务三 爬取网页招聘信息
任务四 爬取两个网页内容合并保存
任务五 从网页爬取商品销售信息并排序保存
任务六 爬取网站的小说文本
展开全部
大数据采集与爬虫 作者简介
孔令勇,男,2014.9―2020.10重庆市永川职业教育中心党委委员、副校长;2020.10―重庆市永川职业教育中心党委书记、校长。参加了重庆市教委的重点课题《职业教育产教融合研究》;牵头开展了重庆市科协组织的《中职教师发展现状与需求研究》。曾在《科学咨询》《重庆文理学院校报》《永川观察》上发表了论文;参与《中职计算机应用专业》教材编写;参与重庆市职业教育有关政策、规划的起草等。
书友推荐
- >
小考拉的故事-套装共3册
小考拉的故事-套装共3册
¥36.7¥68.0 - >
回忆爱玛侬
回忆爱玛侬
¥23.0¥32.8 - >
中国历史的瞬间
中国历史的瞬间
¥16.7¥38.0 - >
自卑与超越
自卑与超越
¥12.7¥39.8 - >
企鹅口袋书系列·伟大的思想20:论自然选择(英汉双语)
企鹅口袋书系列·伟大的思想20:论自然选择(英汉双语)
¥6.3¥14.0 - >
月亮虎
月亮虎
¥14.4¥48.0 - >
经典常谈
经典常谈
¥12.7¥39.8 - >
人文阅读与收藏·良友文学丛书:一天的工作
人文阅读与收藏·良友文学丛书:一天的工作
¥14.7¥45.8
本类畅销
-
Photoshop 2022中文版案例教程
¥44.1¥59.8 -
局域网组建、管理与维护(第4版)(微课版)
¥47¥59 -
园林AUTOCAD教程
¥24¥45 -
Python实战编程:从零学Python
¥81¥108 -
Java程序设计基础
¥37¥50 -
数据备份与恢复
¥51.4¥69