-
内容大纲
《集成学习入门与实战:原理、算法与应用》通过6章内容全面地解读了集成学习的基础知识、集成学习技术、集成学习库和实践应用。其中集成学习技术包括采样、Bagging、投票集成、Boosting、AdaBoost、梯度提升、XGBoost、Stacking、随机森林、决策树等,从混合训练数据到混合模型,再到混合组合,逻辑严谨、逐步讲解;同时也对ML-集成学习、Dask、LightGBM、AdaNet等集成学习库相关技术进行了详细解读;最后通过相关实践对集成学习进行综合性应用。本书配有逻辑框图、关键代码及代码分析,使读者在阅读中能够及时掌握算法含义和对应代码。
本书适合集成学习的初学者和机器学习方向的从业者和技术人员阅读学习,也适合开设机器学习等算法课程的高等院校师生使用。 -
作者介绍
-
目录
第1章 为什么需要集成学习
1.1 混合训练数据
1.2 混合模型
1.3 混合组合
1.4 本章小结
第2章 混合训练数据
2.1 决策树
2.2 数据集采样
2.2.1 不替换采样(WOR)
2.2.2 替换采样(WR)
2.3 Bagging(装袋算法)
2.3.1 k重交叉验证
2.3.2 分层的k重交叉验证
2.4 本章小结
第3章 混合模型
3.1 投票集成
3.2 硬投票
3.3 均值法/软投票
3.4 超参数调试集成
3.5 水平投票集成
3.6 快照集成
3.7 本章小结
第4章 混合组合
4.1 Boosting(提升算法)
4.1.1 AdaBoost(自适应提升算法)
4.1.2 Gradient Boosting(梯度提升算法)
4.1.3 XGBoost(极端梯度提升算法)
4.2 Stacking(堆叠算法)
4.3 本章小结
第5章 集成学习库
5.1 ML-集成学习
5.1.1 多层集成
5.1.2 集成模型的选择
5.2 通过Dask扩展XGBoost
5.2.1 Dask数组与数据结构
5.2.2 Dask-ML
5.2.3 扩展XGBoost
5.2.4 微软LightGBM
5.2.5 AdaNet
5.3 本章小结
第6章 实践指南
6.1 基于随机森林的特征选择
6.2 基于集成树的特征转换
6.3 构建随机森林分类器预处理程序
6.4 孤立森林进行异常点检测
6.5 使用Dask库进行集成学习处理
6.5.1 预处理
6.5.2 超参数搜索
6.6 本章小结
致谢
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...