欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • 大数据预处理技术(高等职业教育新目录新专标电子与信息大类教材)
      • 作者:编者:蔡茜//陈觎|责编:魏建波
      • 出版社:电子工业
      • ISBN:9787121454196
      • 出版日期:2023/11/01
      • 页数:204
    • 售价:16.8
  • 内容大纲

        本书围绕大数据预处理业务背景及相关技术,以学习情境的方式,首先介绍了使用Python、Pandas对各种数据源的读写,然后介绍了数据的清洗、集成、规约、变换四个处理数据方式,最后介绍了使用Kettle工具和MapReduce编程对数据进行处理的技术,通过理论结合实际、循序渐进的学习方式,让读者学习并掌握大数据预处理技术及应用。
        本书理论分析相对较少,侧重动手实践,适合应用型本科、高职高专大数据技术专业学生和希望快速进入大数据领域的读者参考使用。
  • 作者介绍

  • 目录

    导言
    单元1  数据读写
      学习情境1  使用Python读写职业能力大数据分析平台【岗位】数据
        学习情境描述
        学习目标
        任务书
        获取信息
        工作计划
        进行决策
        知识准备
        相关案例
        工作实施
        评价反馈
        拓展思考
      学习情境2  使用Pandas读写职业能力大数据分析平台【技能】数据
        学习情境描述
        学习目标
        任务书
        获取信息
        工作计划
        进行决策
        知识准备
        相关案例
        工作实施
        评价反馈
        拓展思考
    单元2  数据清洗
      学习情境3  使用正则表达式从网页中提取招聘联系人的邮箱地址
        学习情境描述
        学习目标
        任务书
        获取信息
        工作计划
        进行决策
        知识准备
        相关案例
        工作实施
        评价反馈
        拓展思考
      学习情境4  使用Pandas对职业能力大数据分析平台【工资】表进行清洗
        学习情境描述
        学习目标
        任务书
        获取信息
        工作计划
        进行决策
        知识准备
        相关案例
        工作实施
        评价反馈

        拓展思考
    单元3  数据集成
      学习情境5  使用Pandas实现对职业能力大数据分析平台多个学生信息数据源进行集成
        学习情境描述
        学习目标
        任务书
        获取信息
        工作计划
        进行决策
        知识准备
        相关案例
        工作实施
        评价反馈
        拓展思考
    单元4  数据规约
      学习情境6  使用NumPy+Pandas实现对工资数据进行数量规约
        学习情境描述
        学习目标
        任务书
        获取信息
        工作计划
        进行决策
        知识准备
        相关案例
        工作实施
        评价反馈
        拓展思考
    单元5  数据变换
      学习情境7  使用Pandas+Sklearn对学生成绩实现数据规范化
        学习情境描述
        学习目标
        任务书
        获取信息
        工作计划
        进行决策
        知识准备
        相关案例
        工作实施
        评价反馈
        拓展思考
    单元6  Kettle工具使用
      学习情境8  使用ETL工具Kettle对职业能力大数据分析平台学生信息数据进行清洗
        学习情境描述
        学习目标
        任务书
        获取信息
        工作计划
        进行决策
        知识准备
        相关案例

        工作实施
        评价反馈
        拓展思考
    单元7  MapReduce数据处理
      学习情境9  使用MapReduce合并职业能力大数据分析平台【技能】数据
        学习情境描述
        学习目标
        任务书
        获取信息
        工作计划
        进行决策
        知识准备
        相关案例
        工作实施
        评价反馈
        拓展思考
    参考文献