-
内容大纲
本书以易于初学者理解为原则,强调实战和应用,结合大量精选的实例对常用的R语言数据分析方法进行了深入浅出的介绍,以帮助读者解决数据分析中的实际问题。
本书以通俗易懂的方式详细介绍R语言的基础知识和公共医学数据库挖掘,同时通过实际操作引导读者入门医学科研论文中的数据分析。 -
作者介绍
-
目录
第1章 R语言介绍
1.1 R语言概述
1.1.1 什么是R语言
1.1.2 临床医生使用R语言的优势
1.2 R编程环境的搭建
1.2.1 R语言的下载和安装
1.2.2 RStudio的下载和安装
1.2.3 RStudio操作
1.3 R语言包
1.3.1 什么是R包
1.3.2 R包的安装
1.4 初识R语言的注意事项
第2章 R语言的基本语法
2.1 R语言的数据结构
2.1.1 向量
2.1.2 矩阵
2.1.3 数组
2.1.4 数据框
2.2 R语言函数简介
2.2.1 函数的定义
2.2.2 常用内置函数的使用
2.3 R语言中的数据读写
2.3.1 读取文件
2.3.2 写入文件
2.3.3 读写其他数据文件
2.4 R语言流程控制
2.4.1 判断语句
2.4.2 循环语句
2.5 字符串操作
2.6 R语言数据保存
第3章 R语言数据清洗
3.1 数据清洗的重要性
3.2 数据质量评估
3.3 数据清洗
3.3.1 缺失值检查及处理
3.3.2 异常值检查及处理
3.3.3 重复值检查及处理
3.4 数据清洗dplyr包的使用
3.5 数据清洗实战
第4章 R语言数据可视化
4.1 基础绘图
4.2 ggplot2绘图
4.2.1 ggplot2语法入门及相关软件包
4.2.2 ggplot2绘制简单的统计图形
4.2.3 ggplot2绘制复杂图形(统计图的组合、分面展示)
4.3 高质量SCI论文绘图
4.3.1 聚类分析和相关分析的热图详解
4.3.2 ROC曲线的绘制
4.3.3 火山图的绘制
第5章 R语言统计建模分析
5.1 经典统计分析
5.1.1 t检验
5.1.2 方差分析
5.1.3 卡方检验
5.1.4 简单线性回归分析
5.2 高级回归分析
5.2.1 多重线性回归分析
5.2.2 Logistic回归分析
5.2.3 回归分析实战
5.3 SCI文章两表一图实战
5.3.1 SCI文章—基线资料表
5.3.2 SCI文章—单因素回归分析表或多因素回归分析表
5.3.3 SCI文章—亚组分析的森林图
5.3.4 限制性立方样条图
第6章 R语言机器学习实战入门
6.1 什么是机器学习
6.2 机器学习的流程
6.2.1 数据收集
6.2.2 数据预处理
6.2.3 特征工程
6.2.4 模型构建和训练
6.3 机器学习分类
6.3.1 监督学习
6.3.2 无监督学习
6.3.3 强化学习
6.4 过拟合和欠拟合
6.4.1 过拟合
6.4.2 欠拟合
6.5 衡量机器学习模型的指标
6.5.1 正确率、精确率和召回率
6.5.2 几个常见的比率
6.5.3 混淆矩阵
6.5.4 F1score和ROC曲线
6.6 K折交叉验证
6.7 支持向量机概述
6.8 随机森林概述
6.9 糖尿病风险预测实战
6.9.1 数据集背景
6.9.2 数据预处理
6.9.3 模型建立
6.9.4 模型评估
6.10 ICU患者死亡率预测实战
6.10.1 数据集背景
6.10.2 数据预处理
6.10.3 模型建立
6.10.4 模型评估
第7章 列线图在预测模型中的应用
7.1 列线图基本原理
7.2 列线图的三大要素
7.3 列线图解读
7.4 列线图的实战
7.4.1 列线图R实例一
7.4.2 列线图R实例二
7.5 列线图在数据挖掘中的应用
第8章 临床数据挖掘中的生存分析
8.1 基本概念和原理
8.1.1 什么是生存数据
8.1.2 生存分析的含义
8.1.3 为什么要用生存分析
8.1.4 生存分析的删失
8.1.5 生存分析的常用方法
8.2 Kaplan-Meier法生存分析实战
8.2.1 Kaplan-Meier法介绍
8.2.2 Kaplan-Meier生存曲线R语言实战
8.3 Cox生存分析实战
8.3.1 Cox回归模型介绍
8.3.2 Cox回归模型实战
8.4 竞争风险模型
8.4.1 临床研究中如何处理竞争事件
8.4.2 竞争风险模型R语言实战
第9章 NHANES数据库挖掘实战
9.1 NHANES数据库介绍
9.2 NHANES数据库的下载与合并
9.3 NHANES权重介绍及使用
9.3.1 什么是权重
9.3.2 NHANES权重分析的必要性
9.3.3 NHANES权重如何选择
9.3.4 NHANES权重实战
9.4 NHANES数据分析实战
9.5 NHANES数据库发文选题介绍
第10章 GEO数据库挖掘实战
10.1 GEO数据库介绍
10.1.1 GEO数据库概况
10.1.2 GEO数据库组织结构
10.2 GEO数据库检索
10.3 芯片基础知识
10.4 GEO数据库分析实战
10.4.1 找GSE编号
10.4.2 安装生物信息分析所需的R包
10.4.3 下载表达矩阵
10.4.4 获取分组信息
10.4.5 获取表达矩阵并检查数据
10.4.6 转换探针ID
10.4.7 差异分析
10.4.8 分析结果可视化—火山图、热图
10.5 GEO多数据集差异分析
第11章 孟德尔随机化分析实战
11.1 什么是孟德尔随机化
11.1.1 基因型和表型
11.1.2 孟德尔随机化简介
11.2 孟德尔随机化研究流程
11.2.1 MR研究流程七步法
11.2.2 MR分析数据库介绍
11.3 孟德尔随机化分析实战
11.3.1 TwoSampleMR包双样本MR分析
11.3.2 MR分析网站—MR-Base实战
11.4 孟德尔随机化研究论文复现实战
11.5 孟德尔随机化分析的优势和论文选题
第12章 单细胞测序实战
12.1 单细胞测序概述
12.1.1 为什么要做单细胞测序
12.1.2 单细胞测序技术原理
12.2 单细胞测序分析流程
12.2.1 读取原始数据并建立表达矩阵
12.2.2 消除技术误差
12.2.3 细胞聚类与可视化
12.3 单细胞转录组分析实战
12.3.1 安装Seurat包
12.3.2 数据导入
12.3.3 数据质控
12.3.4 寻找高变基因
12.3.5 PCA降维
12.3.6 细胞聚类
12.3.7 寻找差异表达标记基因
12.3.8 细胞注释
12.4 单细胞测序多样本分析实战
12.5 单细胞测序临床应用
同类热销排行榜
- 目送/人生三书
- 21世纪的《背影》 + 感人至深的“生死笔记”+ 龙应台亲手摄影 + 跨三代共读的人生之书! 华人世界率性犀利的一枝笔,龙应台独家...
- 顾城的诗(金版)(精)/蓝星诗库
- 人类群星闪耀时(插图本)/译林名著精选
- 牛津高阶英汉双解词典(附光盘第8版)(精)
- 文化苦旅(新版)
- 摆渡人
- 解忧杂货店(精)
- 骆驼祥子
- 曾国藩(又笨又慢平天下)
- 查令十字街84号(珍藏版)(精)
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...