-
>
决战行测5000题(言语理解与表达)
-
>
软件性能测试.分析与调优实践之路
-
>
第一行代码Android
-
>
深度学习
-
>
Unreal Engine 4蓝图完全学习教程
-
>
深入理解计算机系统-原书第3版
-
>
Word/Excel PPT 2013办公应用从入门到精通-(附赠1DVD.含语音视频教学+办公模板+PDF电子书)
大数据采集与爬虫 版权信息
- ISBN:9787576325201
- 条形码:9787576325201 ; 978-7-5763-2520-1
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 所属分类:>
大数据采集与爬虫 内容简介
本书收集了大数据采集与爬虫相关的编程案例,分4个单元进行讲解,包括单元一爬虫与网页、单元二文本类网站的爬虫、单元三图片资源的爬虫、单元四JupyterNotebook(anaconda3)爬虫编程基础,共讲解了28个编程案例。本书案例内容包括爬虫程序的工作原理,从网站爬取收集有需要的代码、文字、图片等资源的技能,讲解以案例应用的形式呈现,并把技能应用结合案例实现过程,以效果目标引领编程,同时,注重理论知识贯穿于案例中。
大数据采集与爬虫 目录
标签的内容
任务五 爬取网页多个标签的所有文本
任务六 根据标签类名爬取网页标签内容
任务七 用getall()方法爬取网页标签内容
任务八 爬取网页中所有超链接的网址
任务九 爬取网页中超链接目标的标题
任务十 爬取网页中所有标签
项目二 文本类网站的爬虫
任务一 爬取网页特定区域的内容
任务二 爬取网页两个特定区域的内容并分别保存于两个文件中
任务三 爬取网页招聘信息
任务四 爬取两个网页内容合并保存
任务五 从网页爬取商品销售信息并排序保存
任务六 爬取网站的小说文本
大数据采集与爬虫 作者简介
孔令勇,男,2014.9―2020.10重庆市永川职业教育中心党委委员、副校长;2020.10―重庆市永川职业教育中心党委书记、校长。参加了重庆市教委的重点课题《职业教育产教融合研究》;牵头开展了重庆市科协组织的《中职教师发展现状与需求研究》。曾在《科学咨询》《重庆文理学院校报》《永川观察》上发表了论文;参与《中职计算机应用专业》教材编写;参与重庆市职业教育有关政策、规划的起草等。
- >
中国人在乌苏里边疆区:历史与人类学概述
中国人在乌苏里边疆区:历史与人类学概述
¥20.6¥48.0 - >
李白与唐代文化
李白与唐代文化
¥12.5¥29.8 - >
姑妈的宝刀
姑妈的宝刀
¥9.0¥30.0 - >
月亮虎
月亮虎
¥20.2¥48.0 - >
二体千字文
二体千字文
¥21.6¥40.0 - >
回忆爱玛侬
回忆爱玛侬
¥9.8¥32.8 - >
山海经
山海经
¥20.4¥68.0 - >
伯纳黛特,你要去哪(2021新版)
伯纳黛特,你要去哪(2021新版)
¥15.9¥49.8
-
Photoshop 2022中文版案例教程
¥44.1¥59.8 -
局域网组建、管理与维护(第4版)(微课版)
¥47¥59 -
园林AUTOCAD教程
¥24¥45 -
Python实战编程:从零学Python
¥81¥108 -
Java程序设计基础
¥37¥50 -
数据备份与恢复
¥51.4¥69