-
内容大纲
目前,大数据已上升为国家战略,从辅助变为引领,从热点变为支点。因此,在各类以应用型人才培养为主的高校中,需要面向文、管、理、工等不同学科的学生普及大数据理念及其相关技术,以利于其在专业领域的实践中应用大数据理念,实施大数据技术。
本书从大数据概念及特点入手,以大数据应用的技术框架为主线,首先介绍了大数据采集与准备、大数据存储与计算处理、大数据分析及大数据可视化中的基本概念与技术,然后介绍了典型的大数据应用,最后讨论了大数据安全与伦理问题。
本书结合概念、技术及应用介绍大数据的基础知识,适合作为计算机、软件工程、数据科学、大数据及信息管理等方向本科生的大数据导论课程的教材,也可作为文、管类本科生、研究生的大数据通识课程的教材,还可作为相关研究人员、爱好者的参考用书。 -
作者介绍
-
目录
第1章 绪论
1.1 什么是大数据
1.1.1 “大数据”的由来
1.1.2 大数据的概念及特征
1.1.3 大数据的奥秘
1.2 相关术语
1.2.1 从数据到智慧
1.2.2 结构化与非结构化数据
1.3 大数据的应用、挑战与变革
1.3.1 大数据的应用
1.3.2 大数据带来的挑战
1.3.3 大数据带来的变革
1.4 大数据所涉及的技术
1.5 物联网、云计算与大数据
1.6 数据科学与大数据
1.6.1 数据科学
1.6.2 “数据科学与大数据技术”专业
习题
参考文献
第2章 大数据采集与准备
2.1 大数据来源与采集
2.1.1 大数据来源
2.1.2 大数据采集技术
2.2 大数据采集工具
2.2.1 网络爬虫
2.2.2 其他数据采集工具
2.3 数据准备
2.3.1 数据清洗
2.3.2 数据集成
2.3.3 数据变换
2.3.4 数据规约
习颙
参考文献
第3章 大数据存储与计算处理
3.1 大数据存储
3.1.1 大数据如何存储
3.1.2 大数据存储问题
3.2 HDFS文件系统
3.2.1 相关概念
3.2.2 HDFS的结构
3.2.3 HDFS的存储原理
3.3 NoSQL数据库
3.3.1 NoSQL的产生
3.3.2 NoSQL与RDBMS
3.3.3 NoSQL的分类
3.3.4 NoSQL 与NewSQL
3.4 HBase数据库
3.4.1 HBase 简介
3.4.2 HBase的体系结构
3.4.3 HBase的数据模型
3.5 大数据处理
3.5.1 多处理器技术
3.5.2 并行计算
3.6 分布式计算
3.6.1 分布式计算简介
3.6.2 分布式计算的理论基础
3.7 MapReduce模型
3.7.1 MapReduce 由来
3.7.2 MapReduce编程模型
3.7.3 YARN/MapReduce2
3.7.4 MapReduce性能调优
3.8 Spark通用计算框架
3.8.1 Spark简介
3.8.2 Spark生态系统
3.8.3 Spark 框架及计算
3.8.4 Spark的部署模式
习题
参考文献
第4章 大数据分析
4.1 大数据分析概述
4.1.1 数据分析的原则
4.1.2 大数据分析的特点
4.1.3 大数据分析路线及流程
4.1.4 大数据分析的技术
4.1.5 大数据分析的难点
4.2 大数据分析模型
4.2.1 大数据分析模型建立方法
4.2.2 分类分析模型
4.2.3 关联分析模型
4.2.4 聚类分析模型
4.3 大数据分析算法
4.3.1 大数据算法概述
4.3.2 决策树算法简介
4.3.3 Apriori算法简介
4.3.4 K-Means算法简介
4.4 大数据分析的应用
4.4.1 文本分析
4.4.2 情感分析
4.4.3 推荐系统
4.5 大数据分析常用工具
习题
参考文献
第5章 大数据可视化
5.1 大数据可视化技术概述
5.1.1 数据可视化简史
5.1.2 数据可视化的功能
5.1.3 大数据可视化简介
5.2 大数据可视化技术基础
5.2.1 数据可视化流程
5.2.2 数据可视化编码
5.2.3 数据可视化设计
5.3 大数据可视化应用
5.3.1 文本可视化
5.3.2 日志数据可视化
5.3.3 社交网络可视化
5.3.4 地理信息可视化
5.3.5 数据可视化交互
5.4 大数据可视化软件和工具
5.4.1 大数据可视化软件分类
5.4.2 科学可视化软件和工具
5.4.3 信息可视化软件和工具
5.4.4 可视化分析软件和工具
5.5 Python数据可视化示例
5.5.1 绘制饼图
5.5.2 绘制箱线图
5.5.3 绘制风杆
5.5.4 使用散点图分析数据
习题
参考文献
第6章 大数据应用
6.1 互联网行业大数据
6.2 教育大数据
6.3 农业大数据
6.4 旅游大数据
习题
参考文献
第7章 大数据安全与伦理
7.1 大数据安全
7.1.1 大数据安全挑战
7.1.2 大数据安全问题及对策
7.1.3 大数据安全技术
7.2 大数据伦理
7.2.1 什么是伦理
7.2.2 大数据伦理问题
7.2.3 农业大数据技术的伦理问题
习题
参考文献
附录A Hadoop安装配置
附录B Python语言简介
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...