-
内容大纲
本书是一本面向多领域读者的基础通识教材,旨在以通俗易懂的方式揭开机器学习的神秘面纱,帮助读者理解机器学习算法本质,并具备实际应用能力。本书以“从生活到算法”为核心理念,引导读者轻松跨越理论与实践的鸿沟,兼顾学术性与实用性:一方面,以人类解决问题的思路理解算法逻辑,降低算法理解门槛;另一方面,提供丰富的实践案例与配套代码,培养读者的工程化思维。
本书系统讲解了机器学习的基础知识体系与实践框架,共8章。首先介绍机器学习的基本概念、发展历程及分类(监督学习、无监督学习等),接着深入讲解相似度计算、模型性能评估、数据收集、特征工程等核心环节,并针对常见算法(如线性回归、决策树、支持向量机、集成学习等),结合生活化案例剖析其设计思想与实现逻辑。最后,本书专设Python编程基础与经典算法实践章节,通过完整案例演示数据准备、模型训练到评估优化的全过程,并辅以代码示例与单元测试指导,助力读者提升机器学习算法的代码实践能力。
本书适合作为普通高等院校人工智能相关专业本科生、研究生的教材,也可供相关技术人员阅读参考。 -
作者介绍
-
目录
第1章 绪论
1.1 机器学习的定义
1.2 机器学习的历史背景
1.2.1 早期探索阶段(20世纪50年代至20世纪70年代)
1.2.2 统计学习理论的崛起(20世纪80年代)
1.2.3 数据驱动的方法(20世纪90年代至21世纪初)
1.2.4 深度学习时代(21世纪10年代至今)
1.3 机器学习的基本概念
1.3.1 机器学习的分类
1.3.2 基本术语
1.4 机器学习的工作流程
1.4.1 数据收集和准备
1.4.2 模型训练和评估
1.4.3 模型选择和调优
1.4.4 机器学习工作流程的其他关键步骤
1.5 机器学习的工具和框架
1.5.1 编程语言和库
1.5.2 开发环境
1.6 机器学习的挑战和未来发展
1.6.1 当前的挑战
1.6.2 未来的发展方向
小结
习题
第2章 相似度计算
2.1 距离测度
2.1.1 闵氏距离
2.1.2 Hausdorff距离
2.1.3 巴氏距离
2.2 相似测度
2.2.1 余弦相似度
2.2.2 皮尔逊相关系数
2.2.3 斯皮尔曼等级相关系数
2.2.4 肯德尔相关系数
2.2.5 Tanimoto系数
2.2.6 Jaccard系数
2.2.7 Dice系数
2.3 匹配测度
2.3.1 RAO测度
2.3.2 简单匹配系数
2.3.3 Kulczynsky系数
小结
习题
第3章 性能度量
3.1 分类的性能度量
3.1.1 准确率
3.1.2 分类性能度量——P-R曲线
3.1.3 分类性能度量——F值(Fβ-score)
3.1.4 分类性能度量——ROC及ROC-AUC
3.2 回归的性能度量
3.2.1 平均绝对误差
3.2.2 均方误差
3.2.3 均方根误差
3.2.4 R值
3.2.5 logistic回归损失
小结
习题
第4章 数据收集
4.1 数据收集常见方法
4.1.1 问题定义
4.1.2 针对不同数据源的数据收集
4.2 数据采集质量分析
4.2.1 异常数据检测
4.2.2 数据均衡性评估与处理
4.2.3 数据质量检验
4.3 数据分布
4.4 训练集和测试集的拆分
小结
习题
第5章 特征工程
5.1 特征工程的任务
5.2 数据预处理
5.2.1 数据清洗
5.2.2 数据集成
5.2.3 数据变换
5.2.4 数据归约
5.3 特征选择
5.3.1 特征评价
5.3.2 特征子集搜索
5.3.3 特征选择方法
5.4 特征降维
小结
习题
第6章 机器学习算法思想
6.1 机器学习算法分类及常见机器学习算法
6.1.1 机器学习算法分类
6.1.2 常见机器学习算法
6.2 聚类分析
6.2.1 基于距离的聚类
6.2.2 基于密度的聚类
6.2.3 层次聚类
6.3 回归分析算法
6.3.1 线性回归分析
6.3.2 岭回归
6.3.3 多项式回归
6.3.4 逻辑回归
6.3.5 逐步回归
6.4 决策树学习
6.5 支持向量机
6.6 贝叶斯学习
6.7 k近邻学习
6.8 集成学习
6.8.1 集成学习概述
6.8.2 Boosting算法
6.8.3 Bagging算法
6.8.4 Stacking算法
6.9 其他机器学习算法
6.9.1 强化学习及分类
6.9.2 演化学习及遗传算法
小结
习题
第7章 Python基础
7.1 系统安装
7.1.1 安装Python
7.1.2 安装PyCharm
7.1.3 安装库
7.2 Python简介
7.2.1 Python基本语句
7.2.2 文件处理
7.2.3 Python常用模块
7.2.4 迭代器、生成器、装饰器
7.3 numpy简介
7.4 pandas简介
7.4.1 基本结构之Series
7.4.2 基本结构之DataFrame
7.5 数据分析与可视化
7.5.1 画图流程
7.5.2 用plot画折线图
7.5.3 用scatter()画散点图
7.5.4 用bar()画柱状图
7.5.5 使用pie()画饼图
7.5.6 使用scatter()画泡泡图
7.5.7 使用contour()与contourf()方法画等高线
小结
习题
第8章 经典机器学习算法实践
8.1 实验准备
8.2 线性回归算法
8.2.1 一个特征的线性回归
8.2.2 两个(多个)特征的线性回归
8.3 逻辑回归算法
8.3.1 一个特征的逻辑回归
8.3.2 两个特征的逻辑回归
8.4 决策树算法
8.4.1 不带参数调优的决策树算法
8.4.2 带参数调优的模型训练
8.5 支持向量机算法
8.5.1 两个特征二分类的支持向量机
8.5.2 三个特征二分类的支持向量机
8.5.3 四个特征三分类的支持向量机
8.6 k近邻算法
8.6.1 两个特征二分类的k近邻算法
8.6.2 四个特征三分类的k近邻算法
8.7 K-means算法
8.7.1 两个特征的K-means聚类算法
8.7.2 四个特征的K-means聚类算法
8.8 朴素贝叶斯
8.8.1 不带参数调优的朴素贝叶斯算法
8.8.2 带参数调优的朴素贝叶斯算法
小结
习题
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-

孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-

时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-

本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...
[
