欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • 网络爬虫与数据采集(面向高等职业院校基于工作过程项目式系列教程)
      • 作者:编者:陈静|责编:油俊伟
      • 出版社:天津大学
      • ISBN:9787561876770
      • 出版日期:2024/02/01
      • 页数:200
    • 售价:23.6
  • 内容大纲

        本书紧紧围绕“以行业及市场需求为导向,以职业专业能力为核心”的编写理念,融入符合新时代中国特色社会主义发展要求的新政策、新需求、新信息、新方法,以课程思政主线和实践教学主线贯穿全书,突出职业特点,落地岗位工作动线和过程。
        本书采用以项目驱动为主的编写模式,通过实战项目驱动,实现知识传授与技能培养并重,以便新入职员工更好地适应数据采集岗位。本书体现了“做中学”“学中做”,通过分析对应知识、技能与素质要求,确立每个模块的知识与技能组成,并对内容进行甄选与整合。每个项目被分为多个任务,包含项目导言、任务描述、任务技能、任务实施、项目总结、英语角和课后习题等,结构条理清晰、内容详细。任务实施是整本书的精髓部分,能够有效考查学习者对知识和技能的掌握程度和拓展应用能力。这部分内容以真实生产项目为载体组织教学单元,脱离传统教材繁杂的理论知识讲解,以项目任务为驱动,基于数据采集岗位的实际工作流程,将项目学习与知识和技能的掌握有机融合,使学生在完成项目的过程中不仅掌握了知识技能,还培养了相应的职业技能。本书支持工学结合的一体化教学。
  • 作者介绍

  • 目录

    项目一  初识网络爬虫
      项目导言
      任务一  网络爬虫概述
        任务描述
        任务技能
        任务实施
      任务二  网络爬虫技术及平台
        任务描述
        任务技能
        任务实施
      项目总结
      英语角
      课后习题
    项目二  基于Python库实现静态数据采集
      项目导言
      任务一  使用Requests库发起HTTP请求
        任务描述
        任务技能
        任务实施
      任务二  使用BeautifulSoup库提取新闻数据
        任务描述
        任务技能
        任务实施
      任务三  使用LXML解析器提取新闻数据
        任务描述
        任务技能
        任务实施
      项目总结
      英语角
      课后习题
    项目三  基于urllib实现客户端数据采集
      项目导言
      任务一  安装Fiddler并对APP抓包
        任务描述
        任务技能
        任务实施
      任务二  使用urllib采集APP数据
        任务描述
        任务技能
        任务实施
      项目总结
      英语角
      课后习题
    项目四  基于Requests-HTML实现动态数据采集
      项目导言
      任务一  使用Requests-HTML库爬取静态网站
        任务描述
        任务技能
        任务实施
      任务二  使用Requests-HTML库清洗数据

        任务描述
        任务技能
        任务实施
      任务三  使用Requests-HTML库爬取动态数据
        任务描述
        任务技能
        任务实施
      项目总结
      英语角
      课后习题
    项目五  基于Scrapy框架实现网页数据采集
      项目导言
      任务一  安装Scrapy框架
        任务描述
        任务技能
        任务实施
      任务二  使用Scrapy采集网页数据
        任务描述
        任务技能
        任务实施
      项目总纳
      英语角
      课后习题
    项目六  基于Scrapy-Redis分布式实现网页数据采集
      项目导言
      任务一  安装Redis
        任务描述
        任务技能
        任务实施
      任务二  使用Scrapy-Redis分布式采集网页数据
        任务描述
        任务技能
        任务实施
      项目总结
      英语角
      课后习题
    项目七  基于自动化测试工具实现网页数据采集
      项目导言
      任务一  使用Selenium获取页面数据
        任务描述
        任务技能
        任务实施
      任务二  使用Selenium完成滑动条验证并获取数据
        任务描述
        任务技能
        任务实施
      任务三  使用Splash获取页面数据并保存页面截图
        任务描述
        任务技能
        任务实施

      项目总结
      英语角
      课后习题