-
内容大纲
数据科学和机器学习已经深度融合到我们生活的方方面面,而数学正是开启未来大门的钥匙。不是所有人生来都握有一副好牌,但是掌握“数学+编程+机器学习”的知识绝对是王牌。这一次,学习数学不再是为了考试、分数、升学,而是投资时间、自我实现、面向未来。为了让大家学数学、用数学,甚至爱上数学,在创作时,作者尽量克服传统数学教材的各种弊端,让大家学习时有兴趣、看得懂、有思考、更自信、用得着。
本书是“鸢尾花数学大系——从加减乘除到机器学习”丛书中数学版块——“数学三剑客”的第三册,也是最后一本。“数学”板块的第一本《数学要素》是各种数学工具的“大杂烩”,可谓数学基础;《矩阵力量》专门讲解机器学习中常用的线性代数工具;本册《统计至简》则介绍机器学习和数据分析中常用的概率统计工具。本书的核心是“多元统计”,离不开第二册《矩阵力量》中介绍的线性代数工具。本书内容又可以归纳为7大板块——统计、概率、高斯、随机、频率派、贝叶斯派、椭圆。本书在讲解概率统计工具时,会穿插介绍其在数据科学和机器学习领域的应用场景,让大家学以致用。
本书读者群包括所有在工作中应用概率统计的朋友,尤其适用于初级程序员进阶、大学本科数学开窍、高级数据分析师、机器学习开发者。 -
作者介绍
姜伟生,博士,勤奋的小镇做题家,热爱知识可视化和开源分享。自2022年8月开始,在GitHub上开源“鸢尾花书”学习资源,截至2023年5月,已经分享3000多页PDF、3000多幅矢量图、约1000个代码文件,全球读者数以万计。 -
目录
绪论
第1板块 统计
第1章 概率统计全景
1.1 必备数学工具:一个线性代数小测验
1.2 统计描述
1.3 概率
1.4 高斯
1.5 随机
1.6 频率派
1.7 贝叶斯派
1.8 椭圆三部曲
第2章 统计描述
2.1 统计两大工具:描述、推断
2.2 直方图:单特征数据分布
2.3 散点图:两特征数据分布
2.4 有标签数据的统计可视化
2.5 集中度:均值、质心
2.6 分散度:极差、方差、标准差
2.7 分位:四分位、百分位等
2.8 箱型图:小提琴图、分布散点图
2.9 中心距:均值、方差、偏度、峰度
2.10 多元随机变量关系:协方差矩阵、相关性系数矩阵
第2板块 概率
第3章 古典概率模型
3.1 无处不在的概率
3.2 古典概率:离散均匀概率律
3.3 回顾:杨辉三角和概率
3.4 事件之间的关系:集合运算
3.5 条件概率:给定部分信息做推断
3.6 贝叶斯定理:条件概率、边缘概率、联合概率关系
3.7 全概率定理:穷举法
3.8 独立、互斥、条件独立
第4章 离散随机变量
4.1 随机:天地不仁,以万物为刍狗
4.2 期望值:随机变量的可能取值加权平均
4.3 方差:随机变量离期望距离平方的平均值
4.4 累积分布函数(CDF):累加
4.5 二元离散随机变量
4.6 协方差、相关性系数
4.7 边缘概率:偏求和,相当于降维
4.8 条件概率:引入贝叶斯定理
4.9 独立性:条件概率等于边缘概率
4.10 以鸢尾花数据为例:不考虑分类标签
4.11 以鸢尾花数据为例:考虑分类标签
4.12 再谈概率1:展开、折叠
第5章 离散分布
5.1 概率分布:高度理想化的数学模型
5.2 离散均匀分布:不分厚薄
5.3 伯努利分布:非黑即白
5.4 二项分布:杨辉三角
5.5 多项分布:二项分布推广
5.6 泊松分布:建模随机事件的发生次数
5.7 几何分布:滴水穿石
5.8 超几何分布:不放回
第6章 连续随机变量
6.1 一元连续随机变量
6.2 期望、方差和标准差
……
第3板块 高斯
第4板块 随机
第5板块 频率派
第6板块 贝叶斯派
第7板块 椭圆
同类热销排行榜
- 目送/人生三书
- 21世纪的《背影》 + 感人至深的“生死笔记”+ 龙应台亲手摄影 + 跨三代共读的人生之书! 华人世界率性犀利的一枝笔,龙应台独家...
- 顾城的诗(金版)(精)/蓝星诗库
- 人类群星闪耀时(插图本)/译林名著精选
- 牛津高阶英汉双解词典(附光盘第8版)(精)
- 文化苦旅(新版)
- 摆渡人
- 解忧杂货店(精)
- 骆驼祥子
- 曾国藩(又笨又慢平天下)
- 查令十字街84号(珍藏版)(精)
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...