-
内容大纲
本书采用理论知识与任务案例相结合的形式,系统地阐述大数据分析处理工作流程中的重要步骤介绍大数据分析处理过程中常用的第三方库。全书共13个单元,单元1介绍大数据分析的概念等内容;单元2和单元3介绍使用numpy与pandas实现科学计算与统计分析的相关知识;单元4~单元7介绍使用pandas实现数据预处理的方法;单元8介绍使用scikit-learn构建简单的机器学习模型的方法;单元9介绍使用matplotlib、seaborm等绘制图表的方法;单元10~单元13介绍4个大数据分析处理的综合案例。单元1~单元9中,每个单元都包含相关知识部分和任务实现部分,任务实现部分一般包含多个任务的具体实现过程,每个任务后都有课堂实践,通过完成实践操作,读者可以进一步巩固所学知识。
本书既可作为高等院校大数据技术专业学生的教材,也可作为大数据技术爱好者的自学用书。 -
作者介绍
-
目录
单元1 大数据分析概述
学习目标
相关知识
1.大数据分析的概念
2.大数据分析的产生与发展过程
3.大数据分析的应用场景
4.大数据分析流程
5.传统的分析统计工具
6.大数据处理编程语言
7.大数据分析实用工具
任务实现
任务1.1 根据业务需求选择合适的大数据分析技术
1.1.1 业务需求分析
1.1.2 选择大数据分析技术
任务1.2 使用pip和Pycharm完成Python库的管理
1.2.1 了解Python常用库
1.2.2 使用pip命令安装、卸载Python库
1.2.3 使用Pycharm平台安装、卸载Python库
素养拓展
单元小结
课后习题
单元2 numpy科学计算基础
学习目标
相关知识
1.numpy与ndarray对象
2.创建ndarray数组的函数
3.ndarray对象的数据类型
4.数组的矢量化运算
5.广播机制
6.数组与标量的运算
7.numpy通用函数
8.numpy的统计与排序方法
9.numpy的numpy.linalg模块
任务实现
任务2.1 保存考试成绩——创建一个数组
2.1.1 使用函数创建数组
2.1.2 掌握随机数模块的使用
任务2.2 查看考试成绩数据类型——查看数组的数据类型
2.2.1 查看数据类型
2.2.2 实现数据类型转换
任务2.3 对两门课成绩进行相加——实现数组运算
2.3.1 实现矢量化运算
2.3.2 实现数组广播
2.3.3 实现数组与标量间的运算
任务2.4 对考试成绩进行计算——使用numpy通用函数实现数组计算
2.4.1 一元通用函数的使用
2.4.2 二元通用函数的使用
任务2.5 对考试成绩进行统计排序——利用numpy数组进行数据处理
2.5.1 变换数组的形态
2.5.2 实现数组统计
2.5.3 实现数组排序
任务2.6 对多门课成绩进行计算——使用numpy的线性代数模块处理矩阵
2.6.1 计算对角线元素和
2.6.2 实现矩阵乘法
素养拓展
单元小结
课后习题
单元3 Pandas统计分析基础
单元4 数据加载与存储
单元5 数据质量与数据清洗
单元6 数据合并与转换
单元7 数据分组与聚合
单元8 Scikit-learn机器学习
单元9 使用统计图表展示数据
单元10 某地区电力公司用户付费行为预测
单元11 《你好,旧时光》文本挖掘分析
单元12 基于大数据可视化的城市通勤特征分析研究
单元13 上市公司新闻情感与股票价格的关系
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...