-
内容大纲
哈德利·威克姆、加勒特·格罗勒芒德著的《R数据科学(全彩印刷)/图灵程序设计丛书》的目标是教会读者使用重要的数据科学工具,从而为实施数据科学奠定坚实的基础。读完本书后,你将掌握R语言的精华,并能够熟练使用多种工具来解决各种数据科学难题。每一章都按照这样的顺序组织内容:先给出一些引人入胜的示例,以便你可以整体了解这一章的内容,然后再深入细节。本书的每一节都配有习题,以帮助你实践所学到的知识。
本书适合R数据科学家阅读。 -
作者介绍
-
目录
前言
第一部分 探索
第1章 使用ggplot2进行数据可视化
1.1 简介
1.2 第一步
1.2.1 mpg数据框
1.2.2 创建ggplot图形
1.2.3 绘图模板
1.2.4 练习
1.3 图形属性映射
1.4 常见问题
1.5 分面
1.6 几何对象
1.7 统计变换
1.8 位置调整
1.9 坐标系
1.10 图形分层语法
第2章 工作流:基础
2.1 代码基础
2.2 对象名称
2.3 函数调用
第3章 使用dplyr进行数据转换
3.1 简介
3.1.1 准备工作
3.1.2 nycflig
3.1.3 dplyr基础
3.2 使用filter()筛选行
3.2.1 比较运算符
3.2.2 逻辑运算符
3.2.3 缺失值
3.2.4 练习
3.3 使用arrange()排列行
3.4 使用select()选择列
3.5 使用mutate()添加新变量
3.5.1 常用创建函数
3.5.2 练习
3.6 使用summarize()进行分组摘要
3.6.1 使用管道组合多种操作
3.6.2 缺失值
3.6.3 计数
3.6.4 常用的摘要函数
3.6.5 按多个变量分组
3.6.6 取消分组
3.6.7 练习
3.7 分组新变量(和筛选器)
第4章 工作流:脚本
4.1 运行代码
4.2 RStudio自动诊断
第5章 探索性数据分析
5.1 简介
5.2 问题
5.3 变动
5.3.1 对分布进行可视化表示
5.3.2 典型值
5.3.3 异常值
5.3.4 练习
5.4 缺失值
5.5 相关变动
5.5.1 分类变量与连续变量
……
第6章 工作流:项目
第二部分 数据处理
第7章 使用tibble实现简单数据框
第8章 使用readr进行数据导入
第9章 使用dplyr处理关系数据
第10章 使用stringr处理字符串
第11章 使用forcats处理因子
第12章 使用lubridate处理日期和时间
第三部分 编程
第13章 使用magrittr进行管道操作
第14章 函数
第15章 向量
第16章 使用purrr实现迭代
第四部分 模型
第17章 使用modelr实现基础模型
第18章 模型构建
第19章 使用purrr和broom处理多个模型
第五部分 沟通
第20章 R Markdown
第21章 使用ggplot2进行图形化沟通
第22章 R Markdown输出类型
第23章 R Markdown工作流
作者简介
封面简介
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...