-
内容大纲
本书选用统计学和数据科学中常见的R语言和Python语言“双语”编写,主要内容包括:引言、R语言编程基础、R语言数据处理、R语言可视化、R语言随机抽样和随机数、R语言基本统计推断、R语言回归分析、R语言大数据分析、Python语言基础、Python数据处理等内容。此外,本书在每章正文后设置主要函数列表、练习题和实验题,以帮助学生复习巩固和自主练习。同时,还为教师配备了课程教学大纲(含课程思政内容)、课件、习题解答、模拟试题及配套答案等丰富的教学资源。
本书结构严谨,逻辑清晰,叙述清楚,说明到位,行文流畅,习题配备合理,可读性强,可作为高等学校统计学、大数据科学与技术等专业的教材或相关专业的教学参考书,也可供统计分析软件初学者或从业者参考。 -
作者介绍
王洪,男,统计学博士,副教授,博士生导师。美国加利福尼亚大学洛杉矶分校(UCLA)生物统计专业博士后,国家认证系统分析师,主要从事机器学习和生物统计等方面的研究工作。以第一作者或通讯作者的身份发表SCI论文30余篇,获软件著作权1项。主持和参加多项国家社科基金、国家自科基金项目,主持多项全国统计科研项目重点项目、教育部人文社科基金等省部级项目,主持多项企业合作横向课题。 -
目录
前言
第1章 引言
1.1 统计分析的未来
1.2 常见统计分析软件比较
1.3 R语言软件的下载、安装及基本操作
1.3.1 下载和安装R语言软件
1.3.2 R语言软件基本操作与控制
1.3.3 常用的R程序包
1.3.4 RStudio
1.3.5 Markdown
1.4 Python语言软件的下载、安装及运行
1.4.1 下载与安装Python语言软件
1.4.2 Anaconda
1.4.3 运行Python
1.5 本章小结
1.6 练习题
1.7 实验题
第2章 R语言编程基础
2.1 R语言版的“Hello World!”
2.2 R语言脚本运行
2.3 R语言常量和变量
2.4 R语言对象基本操作
2.4.1 R语言对象属性
2.4.2 列出对象与删除对象
2.5 R语言数据类型
2.5.1 向量
2.5.2 数组
2.5.3 矩阵
2.5.4 数据框
2.5.5 列表
2.6 R语言流程控制
2.6.1 分支条件语句
2.6.2 循环语句
2.7 R语言自定义函数
2.8 本章小结
2.9 练习题
2.10 实验题
第3章 R语言数据处理
3.1 数据的输入与输出
3.1.1 终端输出
3.1.2 读取数据
3.1.3 保存数据
3.2 数据选择
3.2.1 常见数据操作函数
3.2.2 取子集
3.2.3 常见数据选择函数
3.3 数据整理
3.3.1 修改变量名称
3.3.2 增加新变量
3.3.3 彻底删除新变量
3.3.4 类型转换函数
3.3.5 排序
3.3.6 数据合并
3.3.7 缺失数据处理
3.4 本章小结
3.5 练习题
3.6 实验题
第4章 R语言可视化
4.1 R语言基础绘图
4.1.1 高级绘图函数
4.1.2 低级绘图函数
4.1.3 交互式绘图函数
4.1.4 使用图形参数
4.1.5 图形保存
4.2 ggplot2绘图包
4.2.1 ggplot语法
4.2.2 ggplot绘图函数
4.3 增强型绘图plotly包
4.3.1 将ggplot2对象转换为plotly对象
4.3.2 直接创建plotly对象
4.4 交互式动态网页Shiny包
4.4.1 Shiny简介
4.4.2 Shiny应用程序的结构
4.4.3 编写简单的Shiny应用
4.4.4 运行Shiny应用程序
4.5 本章小结
4.6 练习题
4.7 实验题
第5章 R语言随机抽样和随机数
5.1 随机变量分布
5.2 随机抽样
5.3 生成已知分布的随机数
5.3.1 R语言函数生成随机数
5.3.2 逆变换法生成随机数
5.3.3 舍选法
5.4 随机数的应用
5.4.1 估计参数
5.4.2 验证大数定律
5.4.3 验证中心极限定理
5.5 本章小结
5.6 练习题
5.7 实验题
第6章 R语言基本统计推断
6.1 R语言汇总统计量函数
6.2 R语言参数估计方法
6.2.1 点估计
6.2.2 区间估计
6.3 假设检验
6.3.1 t检验
6.3.2 二项分布的总体检验
6.3.3 泊松分布的总体检验
6.3.4 样本比例的总体检验
6.3.5 方差分析
6.4 非参数统计推断
6.4.1 K-S检验
6.4.2 Wilcoxon符号秩检验
6.4.3 Wilcoxon秩和检验
6.4.4 Pearson卡方检验
6.4.5 Fisher精确检验
6.5 本章小结
6.6 练习题
6.7 实验题
第7章 R语言回归分析
7.1 一元回归模型
7.1.1 R语言回归函数
7.1.2 一元回归分析示例
7.2 多元回归模型
7.2.1 多元回归分析示例
7.2.2 处理类别变量
7.2.3 回归系数的置信区间
7.2.4 标准化的回归系数
7.3 回归模型的拟合优度
7.3.1 R
7.3.2 调整后的R
7.4 回归模型诊断
7.4.1 残差的分类
7.4.2 线性假设诊断
7.4.3 残差分析和异常点检测
7.4.4 多重共线性检测
7.5 模型选择
7.5.1 最佳子集回归
7.5.2 逐步回归
7.6 模型的预测
7.6.1 回归模型的预测
7.6.2 标准化数据的预测
7.7 本章小结
7.8 练习题
7.9 实验题
第8章 R语言大数据分析
8.1 R语言效率编程
8.1.1 检查代码运行时间
8.1.2 优化R循环
8.1.3 向量化运算
8.1.4 优先使用base包命令
8.1.5 使用C++编程
8.1.6 使用apply族函数
8.2 内存管理
8.2.1 内存使用
8.2.2 内存清理
8.3 R 并行处理包
8.3.1 parallel软件包
8.3.2 foreach软件包
8.4 R 高效读取大数据
8.4.1 提升读取效率的函数
8.4.2 在内存外存储数据
8.5 本章小结
8.6 练习题
8.7 实验题
第9章 Python语言基础
9.1 在R中调用Python
9.2 Python入门
9.2.1 Python版“Hello World!”
9.2.2 关键字和标识符
9.2.3 变量和常量
9.2.4 Python语句、缩进和注释
9.2.5 Python数据类型
9.2.6 数据类型转换
9.2.7 运算符和操作对象
9.3 Python数据结构
9.3.1 序列
9.3.2 列表
9.3.3 元组
9.3.4 字符串
9.3.5 字典
9.4 Python流程控制
9.4.1 条件语句
9.4.2 循环语句
9.5 函数
9.5.1 调用函数
9.5.2 定义函数
9.5.3 函数参数
9.5.4 匿名函数
9.5.5 pass语句
9.5.6 Python模块
9.6 本章小结
9.7 练习题
9.8 实验题
第10章 Python数据处理
10.1 数据文件的读写操作
10.1.1 数据的读取
10.1.2 数据的写入
10.1.3 文本文件的操作
10.1.4 CSV文件的操作
10.2 NumPy科学计算库
10.2.1 NumPy的安装
10.2.2 NumPy中的数组创建
10.2.3 数组操作
10.2.4 数组索引
10.2.5 多维数组
10.2.6 ufunc函数
10.2.7 NumPy随机数
10.3 Pandas数据处理库
10.3.1 Pandas数据结构
10.3.2 Pandas数据索引
10.3.3 利用Pandas查询数据
10.4 Matplotlib绘图库
10.4.1 安装和导入Matplotlib
10.4.2 plot绘图
10.4.3 常见统计图形
10.5 本章小结
10.6 练习题
10.7 实验题
参考文献
同类热销排行榜
- 向着光亮那方/谁的青春不迷茫系列16.8
- 你所谓的稳定不过是在浪费生命15.2
- 全球通史(从史前史到21世纪第7版修订版下)/培文书系21.6
- 答案之书(精)15.2
- 八万四千问18
- 万历十五年/黄仁宇作品系列10.4
- 耶路撒冷三千年(精)31.2
- 中国大历史/黄仁宇作品系列11.2
- 梦的解析15.92
- 鱼羊野史(第6卷11-12月晓松说历史上的今天)18
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...