-
内容大纲
本书围绕Python网络爬虫技术及相关框架,主要参照1+X数据采集职业技能等级要求,以学习情境方式介绍了基于静态网页的爬虫技术及相关框架,如Requests、BeautifulSoup4、XPath、CSV和PyMySQL;基于动态网页的爬虫技术及框架,如Scrapy、Selenium、JSON、PhantomJS和Pillow;基于App应用的爬虫技术与应用软件,如Fiddler;反爬虫策略,如用Headers模拟浏览器,用Cookies记录身份信息;通过结合Scrapy和Redis提高网络爬虫的效率、安全性及数据一致性。
本书理论分析相对较少,偏重动手实践,适用于应用型本科、高职高专院校大数据技术、人工智能技术应用专业学生和希望快速进入大数据、人工智能领域的读者。 -
作者介绍
-
目录
导言
单元1 爬取静态网页
学习情境1.1 使用Requests+BeautifulSoup4+CSV爬取天气预报数据
学习情境描述
学习目标
任务书
获取信息
工作计划
进行决策
知识准备
相关案例
工作实施
评价反馈
拓展思考
学习情境1.2 使用Mechanize+BeautifulSoup4+CSV爬取百度搜索结果数据
学习情境描述
学习目标
任务书
获取信息
工作计划
进行决策
知识准备
相关案例
工作实施
评价反馈
拓展思考
学习情境1.3 使用Scrapy+XPath+PyMySQL爬取汽车销售分页数据
学习情境描述
学习目标
任务书
获取信息
工作计划
进行决策
知识准备
相关案例
工作实施
评价反馈
拓展思考
单元2 爬取动态网页
学习情境2.1 使用Scrapy+JSON+PyMySQL爬取百度图片数据
学习情境描述
学习目标
任务书
获取信息
工作计划
进行决策
知识准备
相关案例
工作实施
评价反馈
拓展思考
学习情境2.2 使用Selenium+PhantomJS爬取漫画数据
学习情境描述
学习目标
任务书
获取信息
工作计划
进行决策
知识准备
相关案例
工作实施
评价反馈
拓展思考
单元3 爬取App数据
学习情境3.1 使用Fiddler+Requests爬取新闻类App接口数据
学习情境描述
学习目标
任务书
获取信息
工作计划
进行决策
知识准备
相关案例
工作实施
评价反馈
拓展思考
单元4 反爬虫策略及解决办法
学习情境4.1 常见反爬虫策略及解决办法
学习情境描述
学习目标
教学引导
知识准备
拓展思考
学习情境4.2 处理输入式验证码校验
学习情境描述
学习目标
任务书
获取信息
进行决策
知识准备
相关案例
工作实施
评价反馈
拓展思考
单元5 爬虫优化策略
学习情境 Scrapy+Redis分布式爬取电影数据
学习情境描述
学习目标
任务书
获取信息
工作计划
进行决策
知识准备
相关案例
工作实施
评价反馈
拓展思考
附录A 《Python网络爬虫》1+X对照表
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...