-
内容大纲
本书紧紧围绕“以行业及市场需求为导向,以职业专业能力为核心”的编写理念,融入符合新时代中国特色社会主义发展要求的新政策、新需求、新信息、新方法,以课程思政主线和实践教学主线贯穿全书,突出职业特点,落地岗位工作动线和过程。
本书采用以项目驱动为主的编写模式,通过实战项目驱动,实现知识传授与技能培养并重,以便新入职员工更好地适应数据采集岗位。本书体现了“做中学”“学中做”,通过分析对应知识、技能与素质要求,确立每个模块的知识与技能组成,并对内容进行甄选与整合。每个项目被分为多个任务,包含项目导言、任务描述、任务技能、任务实施、项目总结、英语角和课后习题等,结构条理清晰、内容详细。任务实施是整本书的精髓部分,能够有效考查学习者对知识和技能的掌握程度和拓展应用能力。这部分内容以真实生产项目为载体组织教学单元,脱离传统教材繁杂的理论知识讲解,以项目任务为驱动,基于数据采集岗位的实际工作流程,将项目学习与知识和技能的掌握有机融合,使学生在完成项目的过程中不仅掌握了知识技能,还培养了相应的职业技能。本书支持工学结合的一体化教学。 -
作者介绍
-
目录
项目一 初识网络爬虫
项目导言
任务一 网络爬虫概述
任务描述
任务技能
任务实施
任务二 网络爬虫技术及平台
任务描述
任务技能
任务实施
项目总结
英语角
课后习题
项目二 基于Python库实现静态数据采集
项目导言
任务一 使用Requests库发起HTTP请求
任务描述
任务技能
任务实施
任务二 使用BeautifulSoup库提取新闻数据
任务描述
任务技能
任务实施
任务三 使用LXML解析器提取新闻数据
任务描述
任务技能
任务实施
项目总结
英语角
课后习题
项目三 基于urllib实现客户端数据采集
项目导言
任务一 安装Fiddler并对APP抓包
任务描述
任务技能
任务实施
任务二 使用urllib采集APP数据
任务描述
任务技能
任务实施
项目总结
英语角
课后习题
项目四 基于Requests-HTML实现动态数据采集
项目导言
任务一 使用Requests-HTML库爬取静态网站
任务描述
任务技能
任务实施
任务二 使用Requests-HTML库清洗数据
任务描述
任务技能
任务实施
任务三 使用Requests-HTML库爬取动态数据
任务描述
任务技能
任务实施
项目总结
英语角
课后习题
项目五 基于Scrapy框架实现网页数据采集
项目导言
任务一 安装Scrapy框架
任务描述
任务技能
任务实施
任务二 使用Scrapy采集网页数据
任务描述
任务技能
任务实施
项目总纳
英语角
课后习题
项目六 基于Scrapy-Redis分布式实现网页数据采集
项目导言
任务一 安装Redis
任务描述
任务技能
任务实施
任务二 使用Scrapy-Redis分布式采集网页数据
任务描述
任务技能
任务实施
项目总结
英语角
课后习题
项目七 基于自动化测试工具实现网页数据采集
项目导言
任务一 使用Selenium获取页面数据
任务描述
任务技能
任务实施
任务二 使用Selenium完成滑动条验证并获取数据
任务描述
任务技能
任务实施
任务三 使用Splash获取页面数据并保存页面截图
任务描述
任务技能
任务实施
项目总结
英语角
课后习题
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...