- Python机器学习工程实战(第2版)/人工智能与大数据系列
- - 作者：(美)彼得·麦克马洪|责编:刘志红|译者:殷海英//刘志红//黄继敏
  - 出版社：电子工业
  - ISBN：9787121500169
  - 出版日期：2025/04/01
  - 页数：404
- 售价：79.2

内容大纲
本书是一本面向机器学习实务的专业指南，通过系统化的工程学视角帮助读者将机器学习理论转化为实际应用。全书共九章。内容从基础知识到模型标准化、部署模式、扩展规模及深度学习应用，层层深入，逐步构建机器学习工程的完整知识体系。书中特别强调如何在Python中高效编码与设计，如何在大规模数据集上开发，以及当下热门的大型语言模型（LLM）构建与运营方法。本书不仅传播技术，更传递了工程学的严谨与实践精神，旨在培养能够解决复杂技术问题并引领数据科学发展的专业人才。无论是初学者，还是行业从业者，本书对读者来说都是一次深入机器学习工程的宝贵探索。
作者介绍
目录
第1章  机器学习工程简介
  技术要求
定义数据学科的分类
    数据科学家
    机器学习工程师
    机器学习运维工程师
    数据工程师
  作为一个高效的团队进行协作
  在现实世界中的机器学习工程
  什么是机器学习解决方案？
    为什么使用Python？
  机器学习系统的高层设计
    示例1：批量异常检测服务
    示例2：预测API
    示例3：分类流程
  本章小结
第2章  机器学习开发流程
  技术要求
  配置我们的工具
    设置AWS账户
  从概念到解决方案的四个步骤
    将这与CRISP-DM进行比较
    发现
    使用用户故事
    运行
    开发
  部署
    了解你的部署选项
    理解DevOps和MLOps
    使用GitHub Actions构建第一个CI/CD示例
    持续模型性能测试
    持续模型训练
  本章小结
第3章  从模型到模型工厂
  技术要求
  定义模型工厂
  掌握学习的方法
    定义目标
    减小损失
    准备数据
    为机器学习设计特征工程
    设计分类特征工程
    设计数值特征工程
  设计训练系统
    训练-系统设计选项
    训练-运行模式
    训练-持久化
  模型重训练
    检测数据漂移
    检测概念漂移

    设置限制
    诊断漂移
    修正数据漂移
    其他监控工具
  自动训练
    自动化的层次结构
    优化超参数
    AutoML
  持久化你的模型
  构建模型工厂与管道
    Scikit-learn管道
    Spark ML管道
  本章小结
第4章  打包封装
  技术要求
  编写优秀的Python代码
    回顾基础知识
    诀窍与技巧
    坚持标准
    编写高质量的PySpark代码
  选择风格
    面向对象编程
    函数式编程
  打包你的代码
    为什么要打包？
    选择打包的用例
    设计你的包
  构建你自己的包
    使用Makefile管理你的环境
    使用Poetry进行打包
  测试、日志记录、安全性和错误处理
    测试
    保护你的解决方案
    分析自己的代码以发现安全问题
    分析依赖项以发现安全问题
    记录日志
    错误处理
  不要重复发明轮子
  本章小结
第5章  部署模式和工具
  技术要求
  设计系统
    基于原则构建
  探索一些标准的机器学习模式
    在数据湖中畅游
    微服务
    基于事件的设计
    批处理
  容器化
  在AWS上托管你自己的微服务

    推送到ECR
    在ECS上托管
  使用Airflow构建通用管道
    Airflow
  构建高级机器学习管道
    使用ZenML
    使用Kubeflow
  选择你的部署策略
  本章小结
第6章  扩展规模
  技术要求
  使用Spark进行扩展
    Spark技巧和窍门
    云上的Spark
  启动无服务器基础设施
  使用Kubernetes实现大规模容器化
  使用Ray进行扩展
    开始使用Ray进行机器学习
  设计大规模系统
  本章小结
第7章  深度学习、生成人工智能和LLMOps
  深入探讨深度学习
    使用PyTorch
    将深度学习扩展并投入生产实践
    微调和迁移学习
  使用LLM
    理解LLM
    通过API使用LLM
    使用LLM进行编码
  利用LLM构建未来
    LLM验证
    PromptOps
  本章小结
第8章  构建ML微服务
  技术要求
  解预测问题
  设计我们的预测服务
  选择工具
  规模化训练
  使用FastAPI提供模型服务
    响应和请求模式
    在微服务中管理模型
    将所有内容整合在一起
  容器化并部署到Kubernetes
    将应用程序容器化
    使用Kubernetes进行扩展
    部署策略
  本章小结
第9章  构建一个提取、转换、机器学习用例
  技术要求

  理解批处理问题
  设计ETML解决方案
  工具选择
    接口和存储
    模型的扩展
    ETML管道的调度
  执行构建
    使用高级Airflow功能构建ETML管道
  本章小结

内容大纲

作者介绍

目录

同类热销排行榜

推荐书目