-
内容大纲
《数据挖掘与预测分析(第2版)》提供了从数据准备到探索性数据分析、数据建模及模型评估等整个数据分析过程的内容。《数据挖掘与预测分析(第2版)》不仅提供了理解软件底层算法的“白盒”方法,而且提供了能够使读者利用现实世界数据集开展数据挖掘与预测分析的应用方法。
第2版的新内容:
◆添加了500多页的新内容,包括20个新章节,例如,数据建模准备、成本一效益分析、缺失数据填补、聚类优劣度量以及细分模型等。
◆针对前沿主题的新章节,例如,多元分类模型、BIRCH聚类、集成学习(bagging及boosting)、模型投票与趋向平均等。
◆每章节后均附有R语言开发园地,读者可以获得完成书中分析所需的R语言源代码,以及通过R代码生成的图、表和结果。
◆书中的附录为那些对统计基础生疏的读者提供了了解基本概念的材料。
◆超过750个章节练习,使读者能够自己测试对所学知识的掌握程度,并着手开展数据挖掘与预测分析工作。
《数据挖掘与预测分析(第2版)》将对数据分析人员、数据库分析人员以及CIO具有极大的吸引力,通过学习将使他们知道何种类型的分析将会增加其投资回报。 -
作者介绍
-
目录
第Ⅰ部分 数据准备
第1章 数据挖掘与预测分析概述
1.1 什么是数据挖掘和预测分析
1.2 需求:数据挖掘技术人员
1.3 数据挖掘离不开人的参与
1.4 跨行业数据挖掘标准过程:CRISP-DM
1.5 数据挖掘的谬误
1.6 数据挖掘能够完成的任务
1.6.1 描述
1.6.2 评估
1.6.3 预测
1.6.4 分类
1.6.5 聚类
1.6.6 关联
R语言开发园地
R参考文献
练习
第2章 数据预处理
2.1 需要预处理数据的原因
2.2 数据清理
2.3 处理缺失数据
2.4 识别错误分类
2.5 识别离群值的图形方法
2.6 中心和散布度量
2.7 数据变换
2.8 min-max规范化
2.9 Z-score标准化
2.10 小数定标规范化
2.11 变换为正态数据
2.12 识别离群值的数值方法
2.13 标志变量
2.14 将分类变量转换为数值变量
2.15 数值变量分箱
2.16 对分类变量重新划分类别
2.17 添加索引字段
2.18 删除无用变量
2.19 可能不应该删除的变量
2.20 删除重复记录
2.21 ID字段简述
R语言开发园地
R参考文献
练习
第3章 探索性数据分析
3.1 假设检验与探索性数据分析
3.2 了解数据集
3.3 探索分类变量
3.4 探索数值变量
3.5 探索多元关系
3.6 选择感兴趣的数据子集作进一步研究
3.7 使用EDA发现异常字段
3.8 基于预测值分级
3.9 派生新变量:标志变量
3.10 派生新变量:数值变量
3.11 使用EDA探测相关联的预测变量
第Ⅱ部分 统计分析
第Ⅲ部分 分类
第Ⅳ部分 聚类
第Ⅴ部分 关联规则
第Ⅵ部分 增强模型性能
第Ⅶ部分 更多主题
第Ⅷ部分 案例分析:对直邮营销的响应预测
附录A 数据汇总与可视化
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...