- 机器学习系统设计
- - 作者：(越)奇普·胡岩|责编:刘炽|译者:韩慧昌//李辉
  - 出版社：中国电力
  - ISBN：9787519886288
  - 出版日期：2024/03/01
  - 页数：361
- 售价：51.2

内容大纲
    机器学习系统既复杂又独特。复杂是因为它们由许多不同的部分组成且涉及很多不同的利益相关者。独特是因为机器学习系统依赖于数据，不同应用场景的数据差异很大。在这本书中，你将学习一种整体方法来设计可靠、可扩展、可维护，并且能适应不断变化的环境和业务需求的机器学习系统。
    本书作者Chip Huyen（Claypot AI的联合创始人）从达成系统整体目标的角度出发，考虑了包括处理和创建训练数据、特征选择、重新训练模型的频率以及监控哪些指标在内的每一个设计决策。本书中的迭代框架是在拥有大量文献支持的真实案例之上构建的。
    本书可以在以下场景中为你提供帮助：
    数据工程及选择正确的指标来解决业务问题。
    自动化持续开发、评估、部署和更新模型的过程。
    开发用于快速检测和解决模型在生产中问题的监控系统。
    构建支持多应用场景的机器学习平台。
    开发负责任的机器学习系统。
作者介绍
奇普·胡岩（Chip Huyen）是实时机器学习平台Claypot AI的联合创始人。在NVIDIA、Netflix和Snorkel AI工作期间，她帮助多家大型机构开发和部署了机器学习系统。这本书是基于她在斯坦福大学教授的机器学习系统设计课程（CS 239S）撰写的。
目录
前言
第1章  机器学习系统概述
  1.1  何时使用机器学习
  1.2  理解机器学习系统
    1.2.1  科研中的机器学习与生产中的机器学习
    1.2.2  机器学习系统与传统软件
  1.3  本章小结
第2章  机器学习系统设计简介
  2.1  业务目标和机器学习目标
  2.2  机器学习系统需要满足的要求
    2.2.1  可靠性
    2.2.2  可扩展性
    2.2.3  可维护性
    2.2.4  适应性
  2.3  迭代过程
  2.4  构造机器学习问题
    2.4.1  机器学习任务分类
    2.4.2  目标函数
  2.5  思维与数据
  2.6  本章小结
第3章  数据工程基础
  3.1  数据源
  3.2  数据格式
    3.2.1  JSON
    3.2.2  行优先格式与列优先格式
    3.2.3  文本格式与二进制格式
  3.3  数据模型
    3.3.1  关系模型
    3.3.2  NoSQL
    3.3.3  结构化数据和非结构化数据
  3.4  数据存储引擎和处理方式
    3.4.1  事务处理和分析处理
    3.4.2  ETL：数据的提取、转换和加载
  3.5  数据流的模式
    3.5.1  通过数据库传递数据
    3.5.2  通过服务传递数据
    3.5.3  通过实时传输服务传递数据
  3.6  批处理与流处理
  3.7  本章小结
第4章  训练数据
  4.1  数据抽样
    4.1.1  非概率抽样
    4.1.2  简单随机抽样
    4.1.3  分层抽样
    4.1.4  加权抽样
    4.1.5  蓄水池抽样
    4.1.6  重要性抽样
  4.2  数据标注
    4.2.1  人工标注
    4.2.2  自然标签

    4.2.3  处理标签缺失
  4.3  类别不均衡
    4.3.1  类别不均衡带来的挑战
    4.3.2  处理类别不均衡问题
  4.4  数据增强
    4.4.1  简单的标签保留变换
    4.4.2  扰动
    4.4.3  数据合成
  4.5  本章小结
第5章  特征工程
  5.1  学习得到的特征与特征工程得到的特征
  5.2  常见特征工程操作
    5.2.1  缺失值处理
    5.2.2  特征缩放
    5.2.3  特征离散化
    5.2.4  编码分类特征
    5.2.5  特征交叉
    5.2.6  离散位置嵌入和连续位置嵌入
  5.3  数据泄漏
    5.3.1  数据泄漏的常见原因
    5.3.2  数据泄漏的检测
  5.4  构建好的特征
    5.4.1  特征的重要性
    5.4.2  特征泛化
  5.5  本章小结
第6章  模型开发和离线评估
  6.1  模型开发与训练
    6.1.1  评估机器学习模型
    6.1.2  模型集成
    6.1.3  实验跟踪和版本控制
    6.1.4  分布式训练
    6.1.5  自动机器学习
  6.2  模型离线评估
    6.2.1  基线
    6.2.2  评估方法
  6.3  本章小结
第7章  模型部署和预测服务
  7.1  机器学习部署误区
    7.1.1  误区1：一次只部署一个或两个机器学习模型
    7.1.2  误区2：如果什么都不做，模型性能会保持不变
    7.1.3  误区3：不需要过多地对模型进行更新
    7.1.4  误区4：大多数机器学习工程师不需要担心规模化
  7.2  批量预测与在线预测
    7.2.1  从批量预测到在线预测
    7.2.2  统一批处理流水线和流处理流水线
  7.3  模型压缩
    7.3.1  低秩分解
    7.3.2  知识蒸馏
    7.3.3  剪枝
    7.3.4  量化

  7.4  云端机器学习和边缘设备机器学习
    7.4.1  为边缘设备编译和优化模型
    7.4.2  浏览器中的机器学习
  7.5  本章小结
第8章  数据分布偏移和监控
  8.1  机器学习系统故障的原因
    8.1.1  软件系统故障
    8.1.2  机器学习特有的故障
  8.2  数据分布偏移
    8.2.1  不同类型的数据分布偏移
    8.2.2  其他数据分布偏移
    8.2.3  检测数据分布偏移
    8.2.4  解决数据分布偏移
  8.3  监控和可观察性
    8.3.1  机器学习特有指标
    8.3.2  监控工具箱
    8.3.3  可观察性
  8.4  本章小结
第9章  在生产环境中的持续学习和测试
  9.1  持续学习
    9.1.1  无状态重训练与有状态训练
    9.1.2  为什么要持续学习？
    9.1.3  持续学习的挑战
    9.1.4  持续学习的四个阶段
    9.1.5  模型的更新频率
  9.2  生产环境中的测试
    9.2.1  影子部署
    9.2.2  A/B测试
    9.2.3  金丝雀发布
    9.2.4  交错实验
    9.2.5  多臂老虎机
  9.3  本章小结
第10章  MLOps的基础设施和工具
  10.1  存储和计算
  10.2  开发环境
    10.2.1  设置开发环境
    10.2.2  开发环境标准化
    10.2.3  从开发环境到生产环境：容器技术
  10.3  资源管理
    10.3.1  定时任务（Cron）、调度器和编排器
    10.3.2  数据科学工作流程管理
  10.4  机器学习平台
    10.4.1  模型部署
    10.4.2  模型存储
    10.4.3  特征存储
  10.5  自建或外购
  10.6  本章小结
第11章  人与机器学习
  11.1  用户体验
    11.1.1  确保用户体验一致性

    11.1.2  对抗“通常正确”的预测
    11.1.3  平稳失败
  11.2  团队结构
    11.2.1  跨职能团队合作
    11.2.2  端到端数据科学家
  811.3  负责任的人工智能
    11.3.1  不负责任的人工智能：案例研究
    11.3.2  负责任人工智能的框架
  11.4  本章小结
后记

内容大纲

作者介绍

目录

同类热销排行榜

推荐书目