欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • Python机器学习工程实战(第2版)/人工智能与大数据系列
      • 作者:(美)彼得·麦克马洪|责编:刘志红|译者:殷海英//刘志红//黄继敏
      • 出版社:电子工业
      • ISBN:9787121500169
      • 出版日期:2025/04/01
      • 页数:404
    • 售价:79.2
  • 内容大纲

        本书是一本面向机器学习实务的专业指南,通过系统化的工程学视角帮助读者将机器学习理论转化为实际应用。全书共九章。内容从基础知识到模型标准化、部署模式、扩展规模及深度学习应用,层层深入,逐步构建机器学习工程的完整知识体系。书中特别强调如何在Python中高效编码与设计,如何在大规模数据集上开发,以及当下热门的大型语言模型(LLM)构建与运营方法。本书不仅传播技术,更传递了工程学的严谨与实践精神,旨在培养能够解决复杂技术问题并引领数据科学发展的专业人才。无论是初学者,还是行业从业者,本书对读者来说都是一次深入机器学习工程的宝贵探索。
  • 作者介绍

  • 目录

    第1章  机器学习工程简介
      技术要求
    定义数据学科的分类
        数据科学家
        机器学习工程师
        机器学习运维工程师
        数据工程师
      作为一个高效的团队进行协作
      在现实世界中的机器学习工程
      什么是机器学习解决方案?
        为什么使用Python?
      机器学习系统的高层设计
        示例1:批量异常检测服务
        示例2:预测API
        示例3:分类流程
      本章小结
    第2章  机器学习开发流程
      技术要求
      配置我们的工具
        设置AWS账户
      从概念到解决方案的四个步骤
        将这与CRISP-DM进行比较
        发现
        使用用户故事
        运行
        开发
      部署
        了解你的部署选项
        理解DevOps和MLOps
        使用GitHub Actions构建第一个CI/CD示例
        持续模型性能测试
        持续模型训练
      本章小结
    第3章  从模型到模型工厂
      技术要求
      定义模型工厂
      掌握学习的方法
        定义目标
        减小损失
        准备数据
        为机器学习设计特征工程
        设计分类特征工程
        设计数值特征工程
      设计训练系统
        训练-系统设计选项
        训练-运行模式
        训练-持久化
      模型重训练
        检测数据漂移
        检测概念漂移

        设置限制
        诊断漂移
        修正数据漂移
        其他监控工具
      自动训练
        自动化的层次结构
        优化超参数
        AutoML
      持久化你的模型
      构建模型工厂与管道
        Scikit-learn管道
        Spark ML管道
      本章小结
    第4章  打包封装
      技术要求
      编写优秀的Python代码
        回顾基础知识
        诀窍与技巧
        坚持标准
        编写高质量的PySpark代码
      选择风格
        面向对象编程
        函数式编程
      打包你的代码
        为什么要打包?
        选择打包的用例
        设计你的包
      构建你自己的包
        使用Makefile管理你的环境
        使用Poetry进行打包
      测试、日志记录、安全性和错误处理
        测试
        保护你的解决方案
        分析自己的代码以发现安全问题
        分析依赖项以发现安全问题
        记录日志
        错误处理
      不要重复发明轮子
      本章小结
    第5章  部署模式和工具
      技术要求
      设计系统
        基于原则构建
      探索一些标准的机器学习模式
        在数据湖中畅游
        微服务
        基于事件的设计
        批处理
      容器化
      在AWS上托管你自己的微服务

        推送到ECR
        在ECS上托管
      使用Airflow构建通用管道
        Airflow
      构建高级机器学习管道
        使用ZenML
        使用Kubeflow
      选择你的部署策略
      本章小结
    第6章  扩展规模
      技术要求
      使用Spark进行扩展
        Spark技巧和窍门
        云上的Spark
      启动无服务器基础设施
      使用Kubernetes实现大规模容器化
      使用Ray进行扩展
        开始使用Ray进行机器学习
      设计大规模系统
      本章小结
    第7章  深度学习、生成人工智能和LLMOps
      深入探讨深度学习
        使用PyTorch
        将深度学习扩展并投入生产实践
        微调和迁移学习
      使用LLM
        理解LLM
        通过API使用LLM
        使用LLM进行编码
      利用LLM构建未来
        LLM验证
        PromptOps
      本章小结
    第8章  构建ML微服务
      技术要求
      解预测问题
      设计我们的预测服务
      选择工具
      规模化训练
      使用FastAPI提供模型服务
        响应和请求模式
        在微服务中管理模型
        将所有内容整合在一起
      容器化并部署到Kubernetes
        将应用程序容器化
        使用Kubernetes进行扩展
        部署策略
      本章小结
    第9章  构建一个提取、转换、机器学习用例
      技术要求

      理解批处理问题
      设计ETML解决方案
      工具选择
        接口和存储
        模型的扩展
        ETML管道的调度
      执行构建
        使用高级Airflow功能构建ETML管道
      本章小结