欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • 大数据导论(高等学校数据科学与大数据技术专业系列教材)
      • 作者:编者:陶皖|责编:段沐含//雷鸿俊
      • 出版社:西安电子科大
      • ISBN:9787560657516
      • 出版日期:2020/09/01
      • 页数:192
    • 售价:14
  • 内容大纲

        目前,大数据已上升为国家战略,从辅助变为引领,从热点变为支点。因此,在各类以应用型人才培养为主的高校中,需要面向文、管、理、工等不同学科的学生普及大数据理念及其相关技术,以利于其在专业领域的实践中应用大数据理念,实施大数据技术。
        本书从大数据概念及特点入手,以大数据应用的技术框架为主线,首先介绍了大数据采集与准备、大数据存储与计算处理、大数据分析及大数据可视化中的基本概念与技术,然后介绍了典型的大数据应用,最后讨论了大数据安全与伦理问题。
        本书结合概念、技术及应用介绍大数据的基础知识,适合作为计算机、软件工程、数据科学、大数据及信息管理等方向本科生的大数据导论课程的教材,也可作为文、管类本科生、研究生的大数据通识课程的教材,还可作为相关研究人员、爱好者的参考用书。
  • 作者介绍

  • 目录

    第1章  绪论
      1.1  什么是大数据
        1.1.1  “大数据”的由来
        1.1.2  大数据的概念及特征
        1.1.3  大数据的奥秘
      1.2  相关术语
        1.2.1  从数据到智慧
        1.2.2  结构化与非结构化数据
      1.3  大数据的应用、挑战与变革
        1.3.1  大数据的应用
        1.3.2  大数据带来的挑战
        1.3.3  大数据带来的变革
      1.4  大数据所涉及的技术
      1.5  物联网、云计算与大数据
      1.6  数据科学与大数据
        1.6.1  数据科学
        1.6.2  “数据科学与大数据技术”专业
      习题
      参考文献
    第2章  大数据采集与准备
      2.1  大数据来源与采集
        2.1.1  大数据来源
        2.1.2  大数据采集技术
      2.2  大数据采集工具
        2.2.1  网络爬虫
        2.2.2  其他数据采集工具
      2.3  数据准备
        2.3.1  数据清洗
        2.3.2  数据集成
        2.3.3  数据变换
        2.3.4  数据规约
      习颙
      参考文献
    第3章  大数据存储与计算处理
      3.1  大数据存储
        3.1.1  大数据如何存储
        3.1.2  大数据存储问题
      3.2  HDFS文件系统
        3.2.1  相关概念
        3.2.2  HDFS的结构
        3.2.3  HDFS的存储原理
      3.3  NoSQL数据库
        3.3.1  NoSQL的产生
        3.3.2  NoSQL与RDBMS
        3.3.3  NoSQL的分类
        3.3.4  NoSQL 与NewSQL
      3.4  HBase数据库
        3.4.1  HBase 简介
        3.4.2  HBase的体系结构
        3.4.3  HBase的数据模型

      3.5  大数据处理
        3.5.1  多处理器技术
        3.5.2  并行计算
      3.6  分布式计算
        3.6.1  分布式计算简介
        3.6.2  分布式计算的理论基础
      3.7  MapReduce模型
        3.7.1  MapReduce 由来
        3.7.2  MapReduce编程模型
        3.7.3  YARN/MapReduce2
        3.7.4  MapReduce性能调优
      3.8  Spark通用计算框架
        3.8.1  Spark简介
        3.8.2  Spark生态系统
        3.8.3  Spark 框架及计算
        3.8.4  Spark的部署模式
      习题
      参考文献
    第4章  大数据分析
      4.1  大数据分析概述
        4.1.1  数据分析的原则
        4.1.2  大数据分析的特点
        4.1.3  大数据分析路线及流程
        4.1.4  大数据分析的技术
        4.1.5  大数据分析的难点
      4.2  大数据分析模型
        4.2.1  大数据分析模型建立方法
        4.2.2  分类分析模型
        4.2.3  关联分析模型
        4.2.4  聚类分析模型
      4.3  大数据分析算法
        4.3.1  大数据算法概述
        4.3.2  决策树算法简介
        4.3.3  Apriori算法简介
        4.3.4  K-Means算法简介
      4.4  大数据分析的应用
        4.4.1  文本分析
        4.4.2  情感分析
        4.4.3  推荐系统
      4.5  大数据分析常用工具
      习题
      参考文献
    第5章  大数据可视化
      5.1  大数据可视化技术概述
        5.1.1  数据可视化简史
        5.1.2  数据可视化的功能
        5.1.3  大数据可视化简介
      5.2  大数据可视化技术基础
        5.2.1  数据可视化流程
        5.2.2  数据可视化编码

        5.2.3  数据可视化设计
      5.3  大数据可视化应用
        5.3.1  文本可视化
        5.3.2  日志数据可视化
        5.3.3  社交网络可视化
        5.3.4  地理信息可视化
        5.3.5  数据可视化交互
      5.4  大数据可视化软件和工具
        5.4.1  大数据可视化软件分类
        5.4.2  科学可视化软件和工具
        5.4.3  信息可视化软件和工具
        5.4.4  可视化分析软件和工具
      5.5  Python数据可视化示例
        5.5.1  绘制饼图
        5.5.2  绘制箱线图
        5.5.3  绘制风杆
        5.5.4  使用散点图分析数据
      习题
      参考文献
    第6章  大数据应用
      6.1  互联网行业大数据
      6.2  教育大数据
      6.3  农业大数据
      6.4  旅游大数据
      习题
      参考文献
    第7章  大数据安全与伦理
      7.1  大数据安全
        7.1.1  大数据安全挑战
        7.1.2  大数据安全问题及对策
        7.1.3  大数据安全技术
      7.2  大数据伦理
        7.2.1  什么是伦理
        7.2.2  大数据伦理问题
        7.2.3  农业大数据技术的伦理问题
      习题
      参考文献
    附录A  Hadoop安装配置
    附录B  Python语言简介