欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • 数据管理十讲/十讲系列/计算机科学前沿丛书
      • 作者:编者:袁野//崔斌//李战怀|责编:梁伟//游静
      • 出版社:机械工业
      • ISBN:9787111733348
      • 出版日期:2024/03/01
      • 页数:381
    • 售价:35.6
  • 内容大纲

        随着社交网络等新型应用的兴起和云计算等新技术的快速发展,人类获取数据的规模正以前所未有的速度增长,数据中包含了大量有价值的信息,能够有效助力社会、经济、科技的发展,因此数据管理与分析方面的研究工作倍受关注。本书针对该领域的研究热点和前沿技术进行了深入浅出的介绍,包括图数据、云数据库系统、时空数据、数据质量、数据库智能化等,帮助读者构建宏观视野,把握领域前沿。
        本书适合数据管理与分析等相关领域的科研人员、年轻教师、研究生,以及从事相关工作的人员阅读。
  • 作者介绍

  • 目录

    丛书序
    “十讲  ”序
    前言
    第1讲  图数据管理本讲  概览
      1.1  图数据库的数据模型和查询语言
        1.1.1  数据模型
        1.1.2  查询语言
      1.2  图数据库的系统架构
        1.2.1  Neo4j
        1.2.2  Jena
        1.2.3  gStore
      1.3  图数据库中的查询处理
        1.3.1  基于探索的子图匹配算法
        1.3.2  基于连接的子图匹配算法
        1.3.3  分布式子图匹配算法
      1.4  本讲小结
      参考文献
    第2讲  云数据管理本讲  概览
      2.1  云数据库概述
        2.1.1  云数据库的定义
        2.1.2  云数据库的优势
      2.2  云服务简介
        2.2.1  云服务的背景
        2.2.2  云服务的特性
      2.3  云托管数据库
        2.3.1  传统数据库的制约
        2.3.2  云托管数据库的起源
        2.3.3  云托管数据库的利弊
      2.4  云原生数据库
        2.4.1  云原生数据库系统架构
        2.4.2  OLTP云数据库架构
        2.4.3  OLAP云数据库架构
        2.4.4  云原生数据库系统关键技术
      2.5  本讲小结
      参考文献
    第3讲  多模态数据管理本讲  概览
      3.1  问题背景
      3.2  数据存储
        3.2.1  分散存储
        3.2.2  统一存储
      3.3  数据建模
        3.3.1  统一建模
        3.3.2  混合建模
      3.4  数据查询
        3.4.1  查询执行
        3.4.2  查询优化
      3.5  多模态数据管理系统
      3.6  本讲小结
      参考文献
    第4讲  时空数据管理本讲  概览

      4.1  时空数据管理概述
        4.1.1  空间数据管理的基本概念
        4.1.2  轨迹数据管理的基本概念
      4.2  空间数据管理
        4.2.1  空间数据索引
        4.2.2  空间区域查询
        4.2.3  空间数据k最近邻查询
        4.2.4  空间数据Skyline查询
      4.3  轨迹数据管理
        4.3.1  地图匹配
        4.3.2  轨迹数据索引
        4.3.3  轨迹数据相似性查询
        4.3.4  轨迹数据聚类
      4.4  本讲小结
      参考文献
    第5讲  流数据管理本讲  概览
      5.1  流数据管理的基本概念
        5.1.1  流数据管理
        5.1.2  流数据管理的作用
      5.2  基础流算法
        5.2.1  常见数据流模型
        5.2.2  元素个数估计
        5.2.3  top k元素估计与直方图
        5.2.4  数据流上不同元素个数估计
      5.3  数据挖掘与流算法
        5.3.1  数据流上的频繁项估计
        5.3.2  数据流上的聚类
      5.4  进阶流算法
        5.4.1  Count Sketch
        5.4.2  Count-Min Sketch
      5.5  流数据管理系统
        5.5.1  常见的流数据管理系统
        5.5.2  流数据管理系统的比较
        5.5.3  批、流数据管理系统对比
      5.6  流数据的应用与未来
        5.6.1  流数据的应用
        5.6.2  流数据管理的未来展望
      5.7  本讲小结
      参考文献
    第6讲  区块链数据管理本讲  概览
      6.1  区块链概述
        6.1.1  区块链:信任构建的基础设施
        6.1.2  区块链发展历史
        6.1.3  区块链架构划分
      6.2  区块链数据存储
        6.2.1  链式数据结构
        6.2.2  默克尔树
        6.2.3  区块数据和状态数据
        6.2.4  数据存储方式
      6.3  共识算法

        6.3.1  PoX系列
        6.3.2  Raft共识协议
        6.3.3  PBFT协议
      6.4  交易处理方式
        6.4.1  “共识-执行”模型
        6.4.2  “执行-共识-验证”模式
        6.4.3  分片执行
      6.5  区块链查询方法
        6.5.1  可验证查询
        6.5.2  基于可信执行环境的查询处理
      6.6  本讲小结
      参考文献
    第7讲  数据质量管理本讲  概览
      7.1  概述
        7.1.1  数据质量管理的意义与价值
        7.1.2  数据质量管理研究历程介绍
      7.2  数据质量
        7.2.1  数据质量维度
        7.2.2  数据质量评估模型
        7.2.3  数据可用性问题
      7.3  数据可用性理论研究
        7.3.1  数据可用性概念与表达机理
        7.3.2  数据可用性的判定理论
        7.3.3  大数据量质融合管理理论与技术
        7.3.4  弱可用数据的近似计算理论与算法
      7.4  数据清洗技术研究
        7.4.1  数据质量问题分类
        7.4.2  清洗流程概述
      7.5  数据质量持续改进模型与技术
        7.5.1  人工参与的数据清洗模型
        7.5.2  面向大数据的清洗技术
        7.5.3  数据质量问题溯源分析技术
        7.5.4  人工智能赋能的数据清洗技术
      7.6  数据清洗工具与系统介绍
        7.6.1  基于规则约束的数据清洗工具
        7.6.2  基于众包的数据清洗工具
        7.6.3  基于知识库的数据清洗工具
        7.6.4  基于学习模型的数据清洗工具
        7.6.5  基于可视化的数据清洗工具
      7.7  本讲小结
      参考文献
    第8讲  数据安全与隐私本讲  概览
      8.1  数据隐私安全概述
        8.1.1  数据隐私安全
        8.1.2  数据隐私安全分类
      8.2  面向数据采集的隐私保护
        8.2.1  数据采集隐私保护概述
        8.2.2  匿名化隐私保护
        8.2.3  差分隐私保护
      8.3  面向数据存储的密态处理

        8.3.1  密态数据处理概述
        8.3.2  面向关系模型的密态数据处理
        8.3.3  面向空间模型的密态数据处理
      8.4  面向数据共享的联邦计算
        8.4.1  数据联邦计算概述
        8.4.2  面向关系模型的数据联邦
        8.4.3  面向空间模型的数据联邦
      8.5  本讲小结
      参考文献
    第9讲  新硬件驱动的数据管理本讲  概览
      9.1  新硬件驱动的数据管理概述
        9.1.1  经典硬件:数据库系统的底层设施
        9.1.2  新硬件带来的发展机遇
      9.2  数据库相关新硬件概述
        9.2.1  以NVM为代表的新型存储介质
        9.2.2  以GPU、FPGA为代表的新型计算硬件
        9.2.3  支持RDMA的高性能网络
      9.3  基于新硬件的存储与索引
        9.3.1  NVM作为字节寻址存储堆
        9.3.2  NVM作为文件系统
        9.3.3  基于NVM的多层存储架构
        9.3.4  基于NVM的数据库索引
      9.4  基于新硬件的查询处理与优化
        9.4.1  NVM友好的查询优化
        9.4.2  基于GPU等新计算硬件的查询优化
        9.4.3  基于GPU等新计算硬件的高性能查询处理
      9.5  基于新硬件的持久化与事务处理
        9.5.1  基于NVM的日志与持久化技术
        9.5.2  众核、异构环境下的并发控制
        9.5.3  基于RDMA的分布式事务
      9.6  基于新硬件的数据库系统架构
        9.6.1  多级存储架构
        9.6.2  异构计算架构
        9.6.3  分布式架构
      9.7  未来发展方向
      9.8  本讲小结
      参考文献
    第10讲  数据库系统智能化本讲  概览
      10.1  智能化数据库系统概述
        10.1.1  智能化数据库系统研究动机
        10.1.2  自治数据库系统架构
      10.2  查询处理智能优化
        10.2.1  自然语言到SQL自动转换
        10.2.2  查询负载预测
        10.2.3  智能索引推荐
      10.3  基于学习的查询优化
        10.3.1  智能代价估计
        10.3.2  智能查询优化器
      10.4  数据库系统自诊断
        10.4.1  慢查询的识别与重写

        10.4.2  实时故障检测与恢复
      10.5  数据库系统自调节
        10.5.1  问题定义
        10.5.2  运行状态自感知
        10.5.3  关键特征参数选择
        10.5.4  基于学习的系统参数调优
      10.6  本讲小结
      10.7  未来研究方向和挑战
      参考文献