-
内容大纲
阅读本书,即使读者仅掌握高中数学知识,也能理解和应用强大的机器学习技术!简单来讲,机器学习是一套以算法为基础的数据分析技术,当你提供更多数据时,算法可反馈更好的结果。ML支持许多尖端技术,如推荐系统、面部识别软件、智能扬声器,甚至包括自动驾驶汽车。本书不落窠臼,示例丰富,精选的练习十分有趣,插图清晰,讲解机器学习的核心概念。
《机器学习图解》以简明易懂的方式介绍机器学习的算法和技术。本书不谈深奥的术语,只通过基本代数知识提供清晰的解释。你将使用Python构建有趣的项目,包括垃圾邮件检测和图像识别模型;还将学习一些实用技能,以清理和准备数据。 -
作者介绍
路易斯·G.塞拉诺(Luis G.Serrano)是Zapata Computing公司的量子人工智能研究科学家。Luis曾在谷歌担任机器学习工程师,在苹果担任首席人工智能教育家,并在优达学城担任人工智能和数据科学内容负责人。Luis拥有密歇根大学数学博士学位、滑铁卢大学数学学士和硕士学位,并在蒙特利尔魁北克大学Combinatoireet d'Informatique Mathématique实验室担任博士后研究员。Luis拥有一个关于机器学习的热门YouTube频道,订阅者超过85000名,视频总观看数量超过400万次。此外,Luis也经常在人工智能和数据科学会议上发表演讲。 -
目录
第1章 什么是机器学习?这是一种常识,唯一特别之处在于由计算机完成
1.1 我是否需要掌握大量的数学和编程背景知识才能理解机器学习
1.2 机器学习究竟是什么
1.3 如何让机器根据数据做出决策?记忆-制定-预测框架
1.4 本章小结
第2章 机器学习类型
2.1 标签数据和无标签数据的区别
2.2 监督学习:处理标签数据的机器学习分支
2.3 无监督学习:处理无标签数据的机器学习分支
2.4 什么是强化学习
2.5 本章小结
2.6 练习
第3章 在点附近画一条线:线性回归
3.1 问题:预测房屋的价格
3.2 解决方案:建立房价回归模型
3.3 如何让计算机绘制出这条线:线性回归算法
3.4 如何衡量结果?误差函数
3.5 实际应用:使用TuriCreate预测房价
3.6 如果数据不在一行怎么办?多项式回归
3.7 参数和超参数
3.8 回归应用
3.9 本章小结
3.10 练习
第4章 优化训练过程:欠拟合、过拟合、测试和正则化
4.1 使用多项式回归的欠拟合和过拟合示例
4.2 如何让计算机选择正确的模型?测试
4.3 我们在哪里打破了黄金法则,如何解决呢?验证集
4.4 一种决定模型复杂度的数值方法:模型复杂度图
4.5 避免过拟合的另一种选择:正则化
4.6 使用Turi Create进行多项式回归、测试和正则化
4.7 本章小结
4.8 练习
第5章 使用线来划分点:感知器算法
5.1 问题:我们在一个外星球上,听不懂外星人的语言
5.2 如何确定分类器的好坏?误差函数
5.3 如何找到一个好的分类器?感知器算法
5.4 感知器算法编程实现
5.5 感知器算法的应用
5.6 本章小结
5.7 练习
第6章 划分点的连续方法:逻辑分类器
6.1 逻辑分类器:连续版感知器分类器
6.2 如何找到一个好的逻辑分类器?逻辑回归算法
6.3 对逻辑回归算法进行编程
6.4 实际应用:使用Turi Create对IMDB评论进行分类
6.5 多分类:softmax函数
6.6 本章小结
6.7 练习
第7章 如何衡量分类模型?准确率和其他相关概念
7.1 准确率:模型的正确频率是多少
7.2 如何解决准确率问题?定义不同类型的误差以及如何进行衡量
7.3 一个有用的模型评价工具ROC曲线
7.4 本章小结
7.5 练习
第8章 使用概率最大化朴素贝叶斯模型
8.1 生病还是健康?以贝叶斯定理为主角的故事
8.2 用例:垃圾邮件检测模型
8.3 使用真实数据构建垃圾邮件检测模型
8.4 本章小结
8.5 练习
第9章 通过提问划分数据:决策树
9.1 问题:需要根据用户可能下载的内容向用户推荐应用
9.2 解决方案:构建应用推荐系统
9.3 超出“是”或“否”之类的问题
9.4 决策树的图形边界
9.5 实际应用:使用Scikit-Learn构建招生模型
9.6 用于回归的决策树
9.7 应用
9.8 本章小结
9.9 练习
第10章 组合积木以获得更多力量神经网络
10.1 以更复杂的外星球为例,开启神经网络学习
10.2 训练神经网络
10.3 Keras中的神经网络编程
10.4 用于回归的神经网络
10.5 用于更复杂数据集的其他架构
10.6 本章小结
10.7 练习
第11章 用风格寻找界限:支持向量机和内核方法
11.1 使用新的误差函数构建更好的分类器
11.2 Scikit-Learn中的SVM编程
11.3 训练非线性边界的SVM
内核方法
11.4 本章小结
11.5 练习
第12章 组合模型以最大化结果集成学习
12.1 获取朋友的帮助
12.2 bagging:随机组合弱学习器以构建强学习器
12.3 AdaBoost:以智能方式组合弱学习器以构建强学习器
12.4 梯度提升:使用决策树构建强学习器
12.5 XGBoost:一种梯度提升的极端方法
12.6 集成方法的应用
12.7 本章小结
12.8 练习
第13章 理论付诸实践:数据工程和机器学习真实示例
13.1 泰坦尼克号数据集
13.2 清洗数据集:缺失值及其处理方法
13.3 特征工程:在训练模型之前转换数据集中的特征
13.4 训练模型
13.5 调整超参数以找到最佳模型:网格搜索
13.6 使用k折交叉验证来重用训练和验证数据
13.7 本章小结
13.8 练习
以下内容可扫封底二维码下载
附录A 习题解答
附录B 梯度下降背后的数学原理使用导数和斜率下山
附录C 参考资料
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...