-
内容大纲
本书围绕大数据预处理业务背景及相关技术,以学习情境的方式,首先介绍了使用Python、Pandas对各种数据源的读写,然后介绍了数据的清洗、集成、规约、变换四个处理数据方式,最后介绍了使用Kettle工具和MapReduce编程对数据进行处理的技术,通过理论结合实际、循序渐进的学习方式,让读者学习并掌握大数据预处理技术及应用。
本书理论分析相对较少,侧重动手实践,适合应用型本科、高职高专大数据技术专业学生和希望快速进入大数据领域的读者参考使用。 -
作者介绍
-
目录
导言
单元1 数据读写
学习情境1 使用Python读写职业能力大数据分析平台【岗位】数据
学习情境描述
学习目标
任务书
获取信息
工作计划
进行决策
知识准备
相关案例
工作实施
评价反馈
拓展思考
学习情境2 使用Pandas读写职业能力大数据分析平台【技能】数据
学习情境描述
学习目标
任务书
获取信息
工作计划
进行决策
知识准备
相关案例
工作实施
评价反馈
拓展思考
单元2 数据清洗
学习情境3 使用正则表达式从网页中提取招聘联系人的邮箱地址
学习情境描述
学习目标
任务书
获取信息
工作计划
进行决策
知识准备
相关案例
工作实施
评价反馈
拓展思考
学习情境4 使用Pandas对职业能力大数据分析平台【工资】表进行清洗
学习情境描述
学习目标
任务书
获取信息
工作计划
进行决策
知识准备
相关案例
工作实施
评价反馈
拓展思考
单元3 数据集成
学习情境5 使用Pandas实现对职业能力大数据分析平台多个学生信息数据源进行集成
学习情境描述
学习目标
任务书
获取信息
工作计划
进行决策
知识准备
相关案例
工作实施
评价反馈
拓展思考
单元4 数据规约
学习情境6 使用NumPy+Pandas实现对工资数据进行数量规约
学习情境描述
学习目标
任务书
获取信息
工作计划
进行决策
知识准备
相关案例
工作实施
评价反馈
拓展思考
单元5 数据变换
学习情境7 使用Pandas+Sklearn对学生成绩实现数据规范化
学习情境描述
学习目标
任务书
获取信息
工作计划
进行决策
知识准备
相关案例
工作实施
评价反馈
拓展思考
单元6 Kettle工具使用
学习情境8 使用ETL工具Kettle对职业能力大数据分析平台学生信息数据进行清洗
学习情境描述
学习目标
任务书
获取信息
工作计划
进行决策
知识准备
相关案例
工作实施
评价反馈
拓展思考
单元7 MapReduce数据处理
学习情境9 使用MapReduce合并职业能力大数据分析平台【技能】数据
学习情境描述
学习目标
任务书
获取信息
工作计划
进行决策
知识准备
相关案例
工作实施
评价反馈
拓展思考
参考文献
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-

孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-

时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-

本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...
[
