-
内容大纲
本书是一本优秀的统计学入门读物,首先介绍了统计学理论知识,激发读者对统计分析的兴趣,帮助读者完成理论准备。之后通过近 30 个商业案例深入地介绍了每种分析方法背后的原理、优缺点、适用范围等,使读者不仅知其然,更知其所以然。
本书注重实际应用,帮助读者在短时间内了解统计学的知识体系,体会到统计学在各行各业中是如何发挥强大作用的;使读者具备一定的统计分析能力,并将这些知识应用到实际工作中。 -
作者介绍
-
目录
第1章 为什么要懂点统计学
1.1 这些统计问题,你会做吗
1.1.1 三门问题
1.1.2 “可靠”的医疗报告单
1.1.3 波斯公主选驸马
1.2 统计学可以帮到你
1.2.1 设计抽样调查
1.2.2 如何确定保险费用
1.2.3 从统计学的角度看博彩
1.2.4 更多现代行业应用
1.3 到底什么是统计学
1.3.1 统计学的起源
1.3.2 开启推断统计之门
1.3.3 与计算机科学的交叉和结合
第2章 描述统计基础
2.1 基本概念
2.1.1 不同的数据类型
2.1.2 常用统计量
2.2 数据预处理
2.2.1 补全缺失数据
2.2.2 剔除异常值
2.2.3 数据的归~化
2.3 绘制统计图表
2.3.1 多种基本图形
2.3.2 绘制高维图形
第3章 推断统计基础
3.1 常见的几种概率分布
3.1.1 二项分布和泊松分布
3.1.2 正态分布
3.1.3 指数分布
3.2 相关分析与回归分析基础
3.2.1 连续型和离散型相关系数
3.2.2 一元回归和多元回归
3.2.3 广义线性回归
第4章 描述性统计分析
4.1 描述性统计分析基础
4.2 频数分布分析:用统计图解决伦敦霍乱
4.2.1 可怕的英国霍乱
4.2.2 约翰·斯诺医生的实地调查
4.2.3 对伦敦霍乱平息过程的分析
4.2.4 频数分布分析小结
4.3 关注数据代表性:统计学家改良轰炸机
4.3.1 “二战”盟国轰炸德国损伤惨重
4.3.2 轰炸机的返航率得到提高
4.3.3 对轰炸机改进过程的分析
4.3.4 数据代表性小结
4.4 异常值分析:1号店提升营销精准率
4.4.1 1号店的数据分析案例
4.4.2 1号店数据分析过程
4.4.3 异常值分析小结
4.5 对比分析:折线图指导购房者寻找合算房价
4.5.1 流行于购房网站的对比分析
4.5.2 数据对比展示房价波动
4.5.3 对比分析小结
4.6 描述性统计分析概述:泰坦尼克号生还数据
4.6.1 泰坦尼克号沉船始末
4.6.2 探索生还者相关信息
4.6.3 描述性统计分析小结
第5章 相关分析与回归分析
5.1 相关分析与回归分析概述
5.2 矩阵分解:价值百万美元的Netflix推荐系统
5.2.1 Netflix为推荐系统悬赏百万美元
5.2.2 构建一个推荐系统
5.2.3 矩阵分解小结
5.3 一元线性回归:引发金融危机的风险价值模型
5.3.1 广受欢迎的风险价值模型
5.3.2 评估一个理财产品的风险
5.3.3 一元线性回归小结
5.4 评分系统:星巴克选址借力大数据
5.4.1 越来越难以选择的快餐店地址
5.4.2 多元线性回归与评分系统
5.4.3 评分系统小结
5.5 相关与回归概述:航空乘客数量预测
5.5.1 随季节波动的航空乘客数量
5.5.2 探究时间序列的相关性和回归模型
5.5.3 相关与回归分析小结
第6章 关联分析与聚类分析
6.1 关联分析与聚类分析概述
6.2 购物篮分析:啤酒与尿布的经典案例
6.2.1 沃尔玛超市中的啤酒与尿布
6.2.2 购物篮分析案例实解
6.2.3 购物篮分析小结
6.3 序列模式挖掘:Web访问模式帮助电商优化网站
6.3.1 序列模式挖掘存在的意义
6.3.2 Web访问模式与优化网站
6.3.3 序列模式挖掘小结
6.4 快速聚类:通过分类降低客户退货率
6.4.1 日益兴旺的在线销售和退货问题
6.4.2 用聚类分析降低退货率
6.4.3 快速聚类小结
6.5 层次聚类:为鸢尾花分类
6.5.1 更多的聚类分析应用场景
6.5.2 使用花瓣长宽、花萼长宽为鸢尾花分类
6.5.3 层次聚类小结
6.6 关联与聚类综述:加州极客的聚类分析把妹法
6.6.1 使用大数据寻找另一半
6.6.2 分成7类的潜在女朋友
6.6.3 关联分析与聚类分析小结
第7章 决策树与模式识别
7.1 C4.5算法:电信客户流失预测
7.1.1 电信客户的流失与预测
7.1.2 使用信息熵建立决策树模型
7.1.3 为一个决策树剪枝并解释其规则
7.1.4 决策树小结
7.2 自组织神经网络:最优路径和旅行商问题
7.2.1 旅行商问题的定义
7.2.2 构建自组织神经网络并加以调整
7.2.3 两类神经网络小结
7.3 贝叶斯决策:神奇的谷歌智能翻译
7.3.1 谷歌翻译
7.3.2 贝叶斯方法和智能翻译应用
7.3.3 贝叶斯决策小结
7.4 支持向量机:应用广泛的手写识别与语音识别
7.4.1 从阿里巴巴说起的模式识别
7.4.2 解决了高维诅咒的支持向量机
7.4.3 支持向量机小结
7.5 判别分析:电信行业构建客户流失模型
7.5.1 激烈竞争引起客户流失率升高
7.5.2 用于分类的线性判别分析
7.2.3 判别分析小结
7.6 模式识别综述:日趋成熟的信用评分模型
7.6.1 美国为限制信用评分模型立法
7.6.2 用多种算法实现信用评分模型
7.6.3 模式识别小结
第8章 更多的数据挖掘算法
8.1 核密度估计法:警务大数据预测犯罪
8.1.1 《少数派报告》的现实版
8.1.2 核密度估计法和圣克鲁兹市的犯罪地图
8.1.3 核密度估计法小结
8.2 Flu Trends:“谷歌流感趋势”帮助控制疫情
8.2.1 谷歌流感趋势的成与败
8.2.2 谷歌流感趋势与流感关联词
8.2.3 以Flu Trends为代表的预测算法小结
8.3 Apriori算法:透视美国国会投票模式
8.3.1 以立法者自居的美国国会议员
8.3.2 Apriori算法和关联分析
8.3.3 国会投票模式小结
8.4 SVD简化数据:IBM软件自动生成新菜谱
8.4.1 IBM推出可生成无限食谱的APP
8.4.2 SVD简化数据与综合计算
8.4.3 创新菜谱软件小结
8.5 文本分析:垃圾邮件过滤系统
8.5.1 回顾机械分词法和贝叶斯决策
8.5.2 词频统计在垃圾邮件过滤中的作用
8.5.3 文本分析小结
8.6 AdaBoost元算法:侦测欺诈交易
8.6.1 使用异常值侦测欺诈交易
8.6.2 AdaBoost元算法的分类器构建方法
8.6.3 AdaBoost元算法小结
同类热销排行榜
- 向着光亮那方/谁的青春不迷茫系列16.8
- 你所谓的稳定不过是在浪费生命15.2
- 全球通史(从史前史到21世纪第7版修订版下)/培文书系21.6
- 答案之书(精)15.2
- 八万四千问18
- 万历十五年/黄仁宇作品系列10.4
- 耶路撒冷三千年(精)31.2
- 中国大历史/黄仁宇作品系列11.2
- 梦的解析15.92
- 鱼羊野史(第6卷11-12月晓松说历史上的今天)18
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...