-
内容大纲
本书是为配合“大数据工具应用”在线开放课程而编写的新形态大数据入门教材,以讲授大数据基础知识和工具应用为目标,立足应用入门,强调工具操作,突出案例教学,力图将理论与实践相结合,讲解和演示如何基于所学理论选择大数据工具去解决实际问题。
全书共7章。内容包括:大数据基本概念及其应用;数据获取;数据分析入门;数据分析进阶;Tableau数据可视化;数据分析拓展;数据思维。
在掌握Word和Excel基本操作的前提下,就可以使用本书学习,学习过程中无须编程。本书可作为推进新工科、新医科、新农科、新文科建设中普及大数据基础知识和工具应用的教材,也可以作为各类人士踏人大数据之门和揭开大数据神秘面纱的参考书。 -
作者介绍
钟雪灵,博士,广东金融学院互联网金融与信息工程学院教授,广东省本科高校计算机类专业教学指导委员会委员。主持和参与多项国家自然科学基金项目和国家社会科学基金项目。在Naval Research Logistics, European Journal of Operational Research, Annals of Operations Research等期刊发表论文数十篇。入选广东省高等学校优秀青年教师培养计划项目。主编《Python程序设计基础》和《算法基础与实验》两部教材。主持和参与建设的慕课“大数据工具应用”已在“智慧树”正式上线。 -
目录
第1章 大数据基本概念及其应用
1.1 大数据应用概况
1.1.1 大数据的定义
1.1.2 大数据的特点
1.1.3 大数据的结构
1.1.4 相关技术
1.1.5 现状与趋势
1.2 大数据处理步骤
1.2.1 数据获取
1.2.2 数据存储
1.2.3 数据管理
1.2.4 数据分析
1.3 应用案例
1.3.1 商品推荐服务
1.3.2 公共信息服务
1.3.3 数据呈现服务
第2章 数据获取
2.1 格式转换与数据清洗整理
2.2 网页数据获取
2.2.1 八爪鱼采集原理与安装
2.2.2 模板采集任务
2.2.3 自定义采集模式
第3章 数据分析入门
3.1 Weka简介与数据预处理
3.1.1 软件下载
3.1.2 文件与数据格式
3.1.3 Weka程序界面
3.1.4 数据预处理
3.2 数据分类
3.2.1 J48决策树分类器
3.2.2 LinearRegression分类器
3.2.3 M5P分类器
3.3 数据聚类
3.3.1 SimpleKMeans聚类器
3.3.2 EM聚类器
3.3.3 DBSCAN聚类器
3.4 数据关联
3.4.1 关联规则相关概念
3.4.2 Apriori算法介绍
3.4.3 Weka中Apriori关联规则挖掘
3.5 选择属性
3.5.1 属性选择概述
3.5.2 Weka中Select attributes标签页
3.5.3 选择属性模式介绍
3.5.4 Weka中选择属性操作示例
3.6 数据可视化
3.6.1 Visualize标签页
3.6.2 数值型类别属性可视化
第4章 数据分析进阶
4.1 贝叶斯网络
4.1.1 贝叶斯公式简介
4.1.2 贝叶斯网络简介
4.1.3 创建贝叶斯网络
4.1.4 使用贝叶斯网络进行推理
4.2 神经网络
4.2.1 神经网络介绍
4.2.2 Weka神经网络选项设置
4.2.3 编辑神经网络
4.2.4 神经网络参数调整
4.3 时间序列分析及预测
第5章 Tableau数据可视化
5.1 Tableau概述与入门
5.1.1 概述
5.1.2 下载与安装
5.1.3 数据类型
5.1.4 Tableau Desktop软件界面
5.1.5 文件类型
5.2 初级可视化分析
5.2.1 条形图
5.2.2 直方图
5.2.3 饼图
5.2.4 折线图
5.2.5 压力图
5.2.6 树地图
5.2.7 气泡图
5.3 地图分析
5.3.1 认识地图
5.3.2 创建地图
5.4 高级数据操作
5.4.1 分层结构
5.4.2 组
5.4.3 集
5.4.4 参数
5.4.5 计算字段
5.5 分析图表整合
5.6 案例一:无锡市宜居时间分析
5.6.1 创建计算字段
5.6.2 空气质量
5.6.3 气温
5.6.4 宜居时间
5.6.5 制作仪表板
5.7 案例二:佛山市纳税企业增长情况分析
5.7.1 创建字段
5.7.2 预测
5.7.3 剖析-行业
5.7.4 剖析-区域
5.7.5 制作仪表板
5.7.6 分析
第6章 数据分析拓展
6.1 数据分析拓展引言
6.1.1 研究背景及实验数据
6.1.2 研究方法
6.2 k-最近邻算法
6.2.1 k-最近邻算法的基本原理
6.2.2 Weka中k-最近邻算法(k-NN)应用实践
6.3 支持向量机
6.3.1 支持向量机算法基本原理
6.3.2 Weka中SVM算法应用实践
6.4 逻辑回归算法
6.4.1 逻辑回归算法基本原理
6.4.2 Weka中的逻辑回归算法应用实践
6.5 随机森林算法
6.5.1 随机森林算法基本原理
6.5.2 Weka中的随机森林算法应用实践
6.6 模型性能评估(一)
6.7 模型性能评估(二)
第7章 数据思维
7.1 数据分析基础
7.1.1 相关概念
7.1.2 数据分析可以帮用户做什么
7.1.3 如何做有效的数据分析
7.2 数据分析思维、过程和方法
7.2.1 数据分析思维
7.2.2 数据分析过程
7.2.3 数据分析方法
7.2.4 数据分析结果展示
参考文献
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...