-
内容大纲
统计学是处理文本、图像和声音等各种数据类型的科学。本书分11章,具体包括绪论,统计数据搜集、整理和展示,数据概括性度量,时间数列,统计指数与综合评价指数,参数估计与假设检验,相关与回归分析,大数据统计挖掘简介和Python统计分析与实验。
本书注重创新性、实用性和高阶性,融合大数据和人工智能前沿知识,插入丰富的教学案例,能够给师生全新的教学体验。
本书可作为高等院校人文社科类相关专业的教材,也可作为企事业单位统计工作人员的参考用书。 -
作者介绍
-
目录
第1章 绪论
1.1 统计学及其特征
1.1.1 统计学定义
1.1.2 研究对象基本特征
1.1.3 统计数据的类型
1.1.4 非结构化数据特征
1.1.5 统计学的分类
1.2 统计学产生和发展历程
1.2.1 统计萌芽时期(—17世纪中叶)
1.2.2 古典统计学时期(17世纪中叶—18世纪中叶)
1.2.3 近代统计学时期(18世纪末叶—19世纪末叶)
1.2.4 现代统计学时期(20世纪初—20世纪末)
1.2.5 大数据与人工智能时期(21世纪初—)
1.3 统计研究过程
1.4 统计学运用经典与前沿案例
1.4.1 孟德尔豌豆遗传的统计规律
1.4.2 诗词大数据带您认识苏轼
1.4.3 啤酒与尿布的故事
1.4.4 谷歌大数据预测流感
1.5 统计学的若干基本概念
1.5.1 统计总体与样本
1.5.2 标志、指标与指标体系
1.6 常用统计相关软件
1.6.1 Python
1.6.2 R语言
1.6.3 SPSS
第2章 统计数据搜集
2.1 统计数据搜集方法
2.1.1 大量观察法
2.1.2 访问法
2.1.3 报告法
2.1.4 终端系统法
2.1.5 网络爬虫法
2.2 统计数据搜集组织形式
2.2.1 统计报表
2.2.2 普查
2.2.3 非随机抽样调查
2.2.4 随机抽样调查
2.2.5 大数据对数据搜集的影响
2.3 调查问卷及其设计
2.3.1 调查问卷设计步骤
2.3.2 调查问卷的基本结构
2.3.3 大数据时代调查问卷发展方向
2.4 统计调查方案
2.4.1 确定调查目的(Why)
2.4.2 确定调查对象和调查单位(Who)
2.4.3 确定调查项目(What)
2.4.4 确定调查的方式、方法和组织计划(How)
2.4.5 确定调查时间和调查期限(When)
第3章 统计数据整理
3.1 统计整理基本步骤
3.2 非结构化数据结构化原理
3.2.1 图像数字化原理
3.2.2 音频数字化原理
3.2.3 文本结构化原理
3.3 数据预处理
3.3.1 缺失数据处理
3.3.2 异常数据处理
3.3.3 噪声数据处理
3.3.4 数据审核
3.3.5 数据变换
3.4 数据的分组
3.4.1 统计分组基本概念
3.4.2 变量数列分组
3.5 统计表
3.6 统计分布类型
3.6.1 钟形分布
3.6.2 U形分布
3.6.3 J形分布
3.6.4 多峰(谷)分布
第4章 统计图展示
4.1 品质数据的统计图显示
4.1.1 饼图
4.1.2 条形图
4.1.3 帕累托图
4.1.4 树状图
4.1.5 统计地图
4.2 数值型数据的统计图显示
4.2.1 直方图
4.2.2 箱线图
4.2.3 折线图
4.3 变量关系的统计图显示
4.3.1 两变量—散点图
4.3.2 两变量—热力图
4.3.3 两变量—金字塔图
4.3.4 多变量—气泡图
4.3.5 多变量—雷达图
4.4 复杂关系统计图显示
4.4.1 词云图
4.4.2 决策树图
4.4.3 鱼骨图
4.5 合理运用统计图表
4.5.1 鉴别统计图优劣的准则
4.5.2 统计的误用与滥用方式
4.5.3 统计图扭曲程度的测定
第5章 数据概括性度量
5.1 指标类型及其运用原则
5.1.1 总量指标和相对指标
5.1.2 指标的核算方法与运用
5.2 平均指标
5.2.1 数值平均数
5.2.2 位置平均数
5.2.3 相关统计指标比较
5.3 波动程度指标
5.3.1 全距、四分位差和平均差
5.3.2 确定性与不确定性条件下方差与标准差
5.3.3 变异系数
5.3.4 信息熵、泰尔指数与基尼系数
5.4 偏度与峰度
5.4.1 偏度
5.4.2 峰度
第6章 时间数列
6.1 时间数列及类型
6.1.1 时间数列概念
6.1.2 时间数列的分类
6.2 时间数列水平分析
6.2.1 发展水平指标
6.2.2 平均发展水平及其计算
6.2.3 增长量与平均增长量
6.3 时间数列速度分析
6.3.1 发展速度和增长速度
6.3.2 平均发展速度和平均增长速度
6.4 时间数列长期分析
6.4.1 时间数列的分解
6.4.2 长期趋势的测定
6.5 时间数列季节变动分析
6.5.1 季节变动概念
6.5.2 季节变动的测定
第7章 统计指数与综合评价指数
7.1 统计指数相关概念
7.2 统计指数编制的基本方法
7.2.1 简单指数法
7.2.2 综合指数法
7.2.3 平均指数法
7.2.4 其他统计指数法
7.3 指数体系与因素分析法
7.4 综合评价指数相关概念
7.5 综合评价指数常见方法
7.5.1 层次分析法
7.5.2 优劣解距离法
7.5.3 熵权法
7.6 常见统计指数与综合评价指数
7.6.1 股票价格指数
7.6.2 消费者价格指数
7.6.3 国民幸福指数
第8章 参数估计与假设检验
8.1 常见抽样分布
8.1.1 抽样推断的基本概念
8.1.2 正态分布
8.1.3 卡方分布
8.1.4 t分布
8.1.5 F分布
8.2 点估计
8.2.1 点估计概念
8.2.2 点估计的优良性准则
8.3 区间估计
8.3.1 区间估计的概念
8.3.2 单个总体均值区间估计
8.3.3 总体比率的区间估计
8.3.4 样本容量的确定
8.3.5 Bootstrap抽样估计
8.4 假设检验的基本问题
8.4.1 假设检验问题的提出
8.4.2 原假设与备择假设
8.4.3 小概率事件原理与两类错误
8.5 常用参数的假设检验
8.5.1 假设检验的基本步骤
8.5.2 总体均值的假设检验
第9章 相关与回归分析
9.1 相关分析
9.1.1 现象之间的关系
9.1.2 定性分析:散点图
9.1.3 定量分析:相关系数
9.2 线性回归分析
9.2.1 回归模型
9.2.2 线性模型参数的估计
9.2.3 参数估计量的性质
9.3 回归模型的评价
9.3.1 经济意义检验
9.3.2 统计检验
9.4 线性回归模型的应用
第10章 大数据统计挖掘简介
10.1 决策树
10.1.1 决策树基本原理
10.1.2 信息熵与信息增益
10.1.3 截枝
10.2 KNN分类
10.2.1 最近邻估计原理
10.2.2 统计距离
10.3 关联规则
10.3.1 商品相关统计原理
10.3.2 核心概念与算法
10.4 贝叶斯分类
10.4.1 贝叶斯定理
10.4.2 朴素贝叶斯分类
10.5 模型选择与评估
10.6 统计特征提取
10.6.1 文本特征提取
10.6.2 声音特征提取
10.6.3 图像特征提取
第11章 Python统计分析与实验
11.1 Python编程基础
11.1.1 开发环境Anaconda安装
11.1.2 Jupyter使用简介
11.1.3 Python统计初步
11.1.4 Python常用数据结构
11.2 Python统计入门
11.2.1 数据读取与筛选
11.2.2 常用统计图
11.2.3 统计分布与拒绝域图
11.2.4 词云图与统计地图
11.3 Python数据处理实战
11.3.1 平安银行股票数据统计分析
11.3.2 南极企鹅描述性统计
11.3.3 高尔顿身高遗传数据分析
11.3.4 蒙特卡洛模拟圆周率
11.3.5 Bootstrap抽样估计
参考文献
同类热销排行榜
- 向着光亮那方/谁的青春不迷茫系列16.8
- 你所谓的稳定不过是在浪费生命15.2
- 全球通史(从史前史到21世纪第7版修订版下)/培文书系21.6
- 答案之书(精)15.2
- 八万四千问18
- 万历十五年/黄仁宇作品系列10.4
- 耶路撒冷三千年(精)31.2
- 中国大历史/黄仁宇作品系列11.2
- 梦的解析15.92
- 鱼羊野史(第6卷11-12月晓松说历史上的今天)18
推荐书目
-

孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-

时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-

本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...
[
