-
内容大纲
本书详细阐述了与机器学习成功交付相关的基本知识,主要包括项目前期,开始工作,深入研究问题,探索性数据分析、道德和基线评估,使用机器学习技术制作实用模型,测试和选择模型,系统构建和生产,发布项目等内容。此外,本书还提供了相应的示例、代码,以帮助读者进一步理解相关方案的实现过程。
本书适合作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学用书和参考手册。 -
作者介绍
西蒙·汤普森(Simon Thompson),拥有25年的开发人工智能系统的经验(虽然使用的并不都是机器学习技术)。他领导了英国电信(BT)实验室的人工智能研究项目,帮助该公司开拓了大数据技术,并管理了近十年的应用研究实践。其团队交付的项目使用了贝叶斯机器学习、深度网络以及运行良好的早期风格决策树和关联规则挖掘技术,以提供对大型公司的电信网络、客户服务和业务流程的深入见解。 -
目录
第1章 引言:交付机器学习项目很困难,让我们做得更好
1.1 机器学习的定义
1.2 机器学习很重要
1.3 其他机器学习方法
1.4 理解本书内容
1.5 案例研究:The Bike Shop
1.6 小结
第2章 项目前期:从机会到需求
2.1 项目前期待办事项
2.2 项目管理基础设施
2.3 项目需求
2.3.1 投资模式
2.3.2 业务需求
2.4 数据
2.5 安全与隐私
2.6 企业责任、监管和道德考虑
2.7 开发架构及流程
2.7.1 开发环境
2.7.2 生产架构
2.8 小结
第3章 项目前期:从需求到提案
3.1 建立项目假设
3.2 创建项目估计
3.2.1 时间和精力估计
3.2.2 机器学习项目的团队设计
3.2.3 项目风险
3.3 售前/项目前期管理
3.4 项目前期/售前清单
3.5 The Bike Shop预售
3.6 有关项目前期的后记
3.7 小结
第4章 开始工作
4.1 Sprint 0待办事项
4.2 最终确定团队设计和资源配置
4.3 工作方式
4.3.1 流程与结构
4.3.2 心跳和沟通方案
4.3.3 工具
4.3.4 标准和实践
4.3.5 文档
4.4 基础设施计划
4.4.1 系统访问
4.4.2 技术基础设施评估
4.5 数据故事
4.5.1 数据收集动机
4.5.2 数据收集机制
4.5.3 数据沿袭
4.5.4 事件
4.6 隐私、安全和道德计划
4.7 项目路线图
4.8 Sprint 0清单
4.9 The Bike Shop:项目设置
4.10 小结
第5章 深入研究问题
5.1 Sprint1待办事项
5.2 理解数据
5.2.1 数据调查
5.2.2 调查数值数据
5.2.3 调查分类数据
5.2.4 调查非结构化数据
5.2.5 报告和使用调查结果
5.3 业务问题细化、用户体验和应用程序设计
5.4 构建数据管道
5.4.1 数据融合问题
5.4.2 管道丛林
5.4.3 数据测试
5.5 模型存储库和模型版本控制
5.5.1 特征、基础模型和训练机制
5.5.2 版本控制概述
5.6 小结
第6章 探索性数据分析、道德和基线评估
6.1 探索性数据分析
6.1.1 探索性数据分析的目标
6.1.2 汇总和描述数据
6.1.3 绘图和可视化
6.1.4 非结构化数据
6.2 道德检查点
6.3 基线模型和性能
6.4 出现问题时的解决方案
6.5 预建模检查表
6.6 The Bike Shop:预建模
6.6.1 数据调查结束后
6.6.2 探索性数据分析实现
6.7 小结
第7章 使用机器学习技术制作实用模型
7.1 Sprint 2待办事项
7.2 特征工程和数据增强
7.2.1 特征工程的基础概念
7.2.2 创建新特征
7.2.3 数据增强
7.3 模型设计
7.3.1 设计的外力
7.3.2 总体设计
7.3.3 选择组件模型
7.3.4 归纳偏差
7.3.5 多个不相交模型
7.3.6 模型组合
7.4 使用机器学习技术制作模型
7.4.1 建模过程
7.4.2 实验跟踪和模型存储库
7.4.3 AutoML和模型搜索
7.5 警惕“臭”模型
7.6 小结
第8章 测试和选择模型
8.1 测试和选择模型的原因
8.2 测试流程
8.2.1 离线测试
8.2.2 离线测试环境
8.2.3 在线测试
8.2.4 现场试验
8.2.5 A/B测试
8.2.6 多臂老虎机
8.2.7 非功能测试
8.3 选择模型
8.3.1 定量选择
8.3.2 通过可比测试进行选择
8.3.3 通过多次测试进行选择
8.3.4 定性选择指标
8.4 建模后检查表
8.5 The Bike Shop:Sprint 2
8.6 小结
第9章 Sprint 3:系统构建和生产
9.1 Sprint 3待办事项
9.2 机器学习实现的类型
9.2.1 辅助系统
9.2.2 委托系统
9.2.3 自治系统
9.3 非功能审查
9.4 实现生产系统
9.4.1 生产数据基础设施
9.4.2 模型服务器和推理服务
9.4.3 用户接口设计
9.5 记录、监控、管理、反馈和文档
9.5.1 模型治理
9.5.2 文档
9.6 发布前测试
9.7 道德审查
9.8 投入生产
9.9 曲终人不散
9.10 The Bike Shop Sprint 3
9.11 小结
第10章 发布项目
10.1 SprintΩ待办事项
10.2 投入生产并不意味着万事大吉
10.2.1 直面问题和厘清责任
10.2.2 机器学习的技术债务
10.2.3 模型漂移
10.2.4 再训练
10.2.5 紧急情况
10.2.6 问题调查
10.3 团队项目后评审
10.4 改进实践
10.5 新技术的采用
10.6 案例研究
10.7 再见,祝你好运
10.8 小结
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...