欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • 构建数据和机器学习平台
      • 作者:(意)马尔科·特兰克维林//(美)瓦利阿帕·拉克什曼南//(英)菲拉特·泰基内尔|责编:刘炽|译者:杜春晓
      • 出版社:中国电力
      • ISBN:9787519899561
      • 出版日期:2025/06/01
      • 页数:350
    • 售价:39.2
  • 内容大纲

        所有云架构师都要掌握数据平台的构建方法,只有这样,企业才能快速和高效地利用数据驱动决策,并交付企业范围的智能。这本指南介绍如何利用亚马逊AWS、微软Azure、谷歌GCP平台和Snowflake、Databricks等多云工具来设计、构建和打造现代化的云原生数据和机器学习平台。
        三位作者利用真实企业架构,介绍了云环境从数据摄取到激活的整个数据生命周期。阅读本书,你将学到如何转换、加固和改造数据仓库和数据湖等熟悉的解决方案,使其走向现代化。你将能利用最新的AI/ML模式,获取准确和更快的洞察力,继而赢得竞争优势。
        你将学到如何:
        设计现代化和安全的云原生或混合式数据分析和机器学习平台。
        整合数据到妥善治理、可扩展和有弹性的数据平台,以数据加速创新。
        实现企业数据访问的民主化,治理业务团队抽取洞察力的方式,并构建AI/ML能力。
        赋予业务团队用流处理流水线实时决策的能力。
        构建MLOps平台,采用预测分析和规范性分析方法。
  • 作者介绍

  • 目录

    前言
    第1章  数据平台现代化概览
      1.1  数据生命周期
        1.1.1  智慧之旅
        1.1.2  水管类比
        1.1.3  采集
        1.1.4  存储
        1.1.5  处理和转换
        1.1.6  分析和可视化
        1.1.7  激活
      1.2  传统方法的局限性
        1.2.1  反模式:用ETL打破数据孤岛
        1.2.2  反模式:集中控制
        1.2.3  反模式:数据集市和Hadoop
      1.3  创建统一的分析平台
        1.3.1  从内部平台改为云平台
        1.3.2  数据集市和数据湖的缺点
        1.3.3  融合数据仓库和数据湖
      1.4  混合云
        1.4.1  混合的必要性
        1.4.2  混合云的挑战
        1.4.3  混合方案为什么可行
        1.4.4  边缘计算
      1.5  采用AI
        1.5.1  机器学习
        1.5.2  采用机器学习
      1.6  AI为什么要上云
        1.6.1  云基础设施
        1.6.2  普及机器学习
        1.6.3  实时
        1.6.4  MLOps
      1.7  核心原则
      1.8  小结
    第2章  数据创新战略步骤
      2.1  步骤1:战略规划
        2.1.1  战略目标
        2.1.2  识别干系人
        2.1.3  变更管理
      2.2  步骤2:采用云方法,降低总拥有成本
        2.2.1  为什么云的成本更低
        2.2.2  上云能省多少钱
        2.2.3  上云时机
      2.3  步骤3:打破孤岛
        2.3.1  统一数据访问
        2.3.2  选择存储
        2.3.3  构建语义层
      2.4  步骤4:在上下文更快决策
        2.4.1  从批处理到流处理
        2.4.2  上下文信息
        2.4.3  成本管理

      2.5  步骤5:用AI方案包跨越式发展
        2.5.1  预测分析
        2.5.2  理解和生成非结构化数据
        2.5.3  个性化
        2.5.4  解决方案包
      2.6  步骤6:运营由AI驱动的工作流
        2.6.1  找到自动决策和AI辅助的最佳平衡点
        2.6.2  营造数据文化
        2.6.3  充实数据科学团队
      2.7  步骤7:将数据作为产品来管理
        2.7.1  将产品管理原则应用于数据
        2.7.2  理解并维护企业的数据流地图
        2.7.3  识别关键指标
        2.7.4  共识标准、承诺的路线图和愿景性待办事项
        2.7.5  为现有客户构建产品
        2.7.6  管理变更,勇于担责
        2.7.7  客户访谈,发现数据需求
        2.7.8  充分利用白板和原型
        2.7.9  只构建立即就能投入使用的产品
        2.7.10  标准化常用实体和KPI
        2.7.11  数据平台提供自助服务
      2.8  小结
    第3章  为数据团队而设计
      3.1  数据处理机构分类
      3.2  数据分析驱动型机构
        3.2.1  愿景
        3.2.2  角色
        3.2.3  技术框架
      3.3  数据工程驱动型机构
        3.3.1  愿景
        3.3.2  角色
        3.3.3  技术框架
      3.4  数据科学驱动型机构
        3.4.1  愿景
        3.4.2  角色
        3.4.3  技术框架
      3.5  小结
    ……
    第4章  迁移框架
    第5章  构建数据湖
    第6章  用企业数据仓库创新
    第7章  湖仓一体融合架构
    第8章  流式架构
    第9章  利用混合和边缘架构扩展数据平台
    第10章  AI应用架构
    第11章  构建机器学习平台
    第12章  数据平台现代化:典型案例