欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • 数据采集与预处理(职业教育大数据技术专业系列教材)
      • 作者:编者:刘少坤//左晓英|责编:李绍坤//张星瑶
      • 出版社:机械工业
      • ISBN:9787111738909
      • 出版日期:2023/12/01
      • 页数:181
    • 售价:15.6
  • 内容大纲

        考虑到目前大数据产业的发展趋势,本书综合了现有的数据采集和预处理技术,按照实际工作中的顺序,先介绍了大数据及数据采集的基础知识,然后介绍了使用爬虫技术进行数据采集、使用传感器进行数据采集、使用Kettle进行数据迁移和采集以及使用Python进行数据存储和处理,并以实训项目的形式,将技术与理论有机融为一体。本书内容详实、通俗易懂,贴近实用,同时配以课后习题加强学习效果。
        本书适合作为职业院校大数据技术、软件技术、物联网应用技术等相关专业的教材,也可作为大数据技术培训以及自学大数据技术的相关人员的参考用书。
  • 作者介绍

  • 目录

    前言
    基础知识
      一、大数据概念
      二、数据采集技术
      三、数据预处理技术
      习题
    项目1  使用爬虫技术进行数据采集
      任务1  爬取静态页面数据
      任务2  使用Scrapy框架爬取动态数据
      任务3  使用Nutch爬取数据
      小结
      习题
    项目2  使用传感器进行数据采集
      任务1  利用传感器采集农业数据
      任务2  利用传感器智能生产
      小结
      习题
    项目3  使用Kettle进行数据迁移和采集
      任务1  使用Kettle工具进行数据迁移
      任务2  利用Kettle建立作业,定时执行转换
      小结
      习题
    项目4  使用Python进行数据存储
      任务1  利用列表、元组、集合与字典进行数据存储
      任务2  利用Numpy数组对象进行数据存储
      任务3  利用Series与DataFrame进行数据存储
      任务4  读写不同数据源数据
      任务5  合并数据
      小结
      习题
    项目5  使用Python进行数据处理
      任务1  数据清洗
      任务2  数据标准化
      任务3  分组与聚合
      任务4  透视表与交叉表
      任务5  哑变量
      小结
      习题
    参考文献