-
内容大纲
统计学习方法即机器学习方法,是计算机及其应用领域的一门重要学科。本书分为监督学习和无监督学习两篇,全面系统地介绍了统计学习的主要方法。包括感知机、k近邻法、朴素贝叶斯法、决策树、逻辑斯谛回归与最大熵模型、支持向量机、提升方法、EM算法、隐马尔可夫模型和条件随机场,以及聚类方法、奇异值分解、主成分分析、潜在语义分析、概率潜在语义分析、马尔可夫链蒙特卡罗法、潜在狄利克雷分配和PageRank算法等。
本书是统计机器学习及相关课程的教学参考书,适用于高等院校文本数据挖掘、信息检索及自然语言处理等专业的大学生、研究生,也可供计算机应用等专业的研发人员参考。 -
作者介绍
李航 日本京都大学电气工程系毕业,日本东京大学计算机科学博士。曾任日本NEC公司中央研究所研究员,微软亚洲研究院高级研究员及主任研究员,华为诺亚方舟实验室主任、首席科学家,现任字节跳动人工智能实验室总监。北京大学、南京大学客座教授。研究方向为信息检索、自然语言处理、统计机器学习及数据挖掘等。 -
目录
第1篇 监督学习
第1章 统计学习及监督学习概论
1.1 统计学习
1.2 统计学习的分类
1.2.1 基本分类
1.2.2 按模型分类
1.2.3 按算法分类
1.2.4 按技巧分类
1.3 统计学习方法三要素
1.3.1 模型
1.3.2 策略
1.3.3 算法
1.4 模型评估与模型选择
1.4.1 训练误差与测试误差
1.4.2 过拟合与模型选择
1.5 正则化与交叉验证
1.5.1 正则化
1.5.2 交叉验证
1.6 泛化能力
1.6.1 泛化误差
1.6.2 泛化误差上界
1.7 生成模型与判别模型
1.8 监督学习应用
1.8.1 分类问题
1.8.2 标注问题
1.8.3 回归问题
本章概要
继续阅读
习题
参考文献
第2章 感知机
2.1 感知机模型
2.2 感知机学习策略
2.2.1 数据集的线性可分性
2.2.2 感知机学习策略
2.3 感知机学习算法
2.3.1 感知机学习算法的原始形式
2.3.2 算法的收敛性
2.3.3 感知机学习算法的对偶形式
本章概要
继续阅读
习题
参考文献
第3章 k近邻法
3.1 k近邻算法
3.2 k近邻模型
3.2.1 模型
3.2.2 距离度量
3.2.3 k值的选择
3.2.4 分类决策规则
3.3 k近邻法的实现:kd树
3.3.1 构造kd树
3.3.2 搜索kd树
本章概要
继续阅读
……
第2篇 无监督学习
附录A 梯度下降法
附录B 牛顿法和拟牛顿法
附录C 拉格朗日对偶性
附录D 矩阵的基本子空间
附录 EKL散度的定义和狄利克雷分布的性质
索引
同类热销排行榜
- 向着光亮那方/谁的青春不迷茫系列16.8
- 你所谓的稳定不过是在浪费生命15.2
- 全球通史(从史前史到21世纪第7版修订版下)/培文书系21.6
- 答案之书(精)15.2
- 八万四千问18
- 万历十五年/黄仁宇作品系列10.4
- 耶路撒冷三千年(精)31.2
- 中国大历史/黄仁宇作品系列11.2
- 梦的解析15.92
- 鱼羊野史(第6卷11-12月晓松说历史上的今天)18
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...