-
内容大纲
这是一本金融商业数据分析的实战工具书。作者都是在金融行业有10~20年数据分析经验的资深专家,他们将多年来的项目经验、培训和咨询经验融合成了这本书。它将指导读者零基础掌握金融数据分析的工具、思路、方法和技巧,快速实现从入门到进阶的突破。
本书强调实战,方法论与实践相结合,所有案例均来自实际的金融业务,涵盖工具使用、数据处理、统计分析等数据分析的全流程。
本书内容共14章,可分为3篇。
分析工具篇(第1~4章):首先介绍了数据科学和数理统计的基本常识,然后讲解了数据分析工具SAS EG和Python的基础知识。
数据处理篇(第5~9章):首先通过描述性统计分析进行数据探索,继而讲解基本的报表和统计制图,还介绍了如何使用SASEG进行数据处理,用Python进行数据整合、数据清洗,从而构建出满足分析需求的数据集。
统计分析篇(第10~14章):从统计学的基本概念引出假设检验、样本t检验,三大统计分析、构造预测模型,并分享了基于时间序列的建模方法。 -
作者介绍
-
目录
前言
分析工具篇
第1章 数据科学与数理统计
1.1 数据科学的基本概念
1.2 数理统计技术
1.2.1 描述性统计分析
1.2.2 统计推断与统计建模
第2章 SAS EG数据操作基础
2.1 SAS EG入门
2.1.1 SAS EG简介
2.1.2 SAS EG的窗口及菜单
2.2 访问数据
2.2.1 SAS EG实现方式
2.2.2 SAS程序实现方式
2.3 定义SAS数据集
2.3.1 SAS数据的相关概念
2.3.2 SAS EG实现方式
2.3.3 SAS程序实现方式
2.4 导入其他格式的数据文件
2.4.1 SAS EG实现方式
2.4.2 SAS程序实现方式
第3章 Python编程基础
3.1 Python概述
3.2 Anaconda的安装及使用方法
3.2.1 下载与安装
3.2.2 使用Jupyter Notebook
3.2.3 使用Spyder
3.2.4 使用Conda管理第三方库
3.3 Python的基本数据类型
3.3.1 字符串
3.3.2 浮点型和整型
3.3.3 布尔类型
3.3.4 其他数据类型
3.4 Python的基本数据结构
3.4.1 列表
3.4.2 元组
3.4.3 集合
3.4.4 字典
3.5 Python的编程结构
3.5.1 三种基本的编程结构简介
3.5.2 顺序结构
3.5.3 分支结构
3.5.4 循环结构
3.6 Python的函数与模块
3.6.1 Python的函数
3.6.2 Python的模块
3.7 使用Pandas读写结构化数据
3.7.1 读数据
3.7.2 写数据
第4章 在SAS EG中使用程序
4.1 如何在SAS EG中使用程序
4.2 SAS程序
4.2.1 SAS程序分析简介
4.2.2 DATA步
4.2.3 PROC步
数据处理篇
第5章 描述性统计分析与制图
5.1 描述性统计分析
5.1.1 变量度量类型与分布类型
5.1.2 变量的统计量
5.1.3 连续变量的分布与集中趋势
5.1.4 连续变量的离散程度
5.1.5 数据分布的对称与高矮
5.2 制作报表与统计图
5.3 制图步骤及统计图适用场景
5.4 利用SAS EG进行统计分析
5.4.1 连续变量描述性统计分析
5.4.2 单因子频数统计分析
5.4.3 汇总统计分析
5.4.4 绘制条形图进行统计分析
5.4.5 绘制地图进行统计分析
第6章 表数据的行处理
6.1 数据筛选
6.1.1 SAS EG实现方式
6.1.2 SAS程序实现方式
6.2 排序与求秩
6.2.1 SAS EG实现方式
6.2.2 SAS程序实现方式
6.3 抽样
6.3.1 抽样理论介绍
6.3.2 SAS EG实现方式
6.3.3 SAS程序实现方式
6.4 数据分组和汇总
6.4.1 SAS EG实现方式
6.4.2 SAS程序实现方式
第7章 表数据的列处理
7.1 构造列变量
7.2 拆分列
7.3 堆叠列
7.4 转置列
7.4.1 SAS EG实现方式
7.4.2 SAS 程序实现方式
7.5 对列重编码
7.5.1 SAS EG实现方式
7.5.2 SAS程序实现方式
7.6 变量标准化
7.6.1 SAS EG实现方式
7.6.2 SAS程序实现方式
第8章 数据集的操作
8.1 纵向连接
8.1.1 SAS EG实现方式
8.1.2 SAS程序实现方式
8.2 横向连接
8.2.1 SAS EG实现方式
8.2.2 SAS程序实现方式
8.3 数据集的比较
8.3.1 SAS EG实现方式
8.3.2 SAS程序实现方式
8.4 创建格式
8.4.1 相关理论介绍
8.4.2 SAS EG实现方式
8.4.3 SAS程序实现方式
8.5 删除数据集、格式和视图
8.5.1 SAS EG实现方式
8.5.2 SAS程序实现方式
第9章 利用Python处理数据
9.1 数据整合
9.1.1 行操作和列操作
9.1.2 条件查询
9.1.3 横向连接
9.1.4 纵向合并
9.1.5 排序
9.1.6 分组汇总
9.1.7 拆分与堆叠列
9.1.8 赋值与条件赋值
9.2 数据清洗
9.2.1 重复值处理
9.2.2 缺失值处理
9.2.3 噪声值处理
9.3 实战
9.3.1 提取行为特征的RFM方法
9.3.2 使用RFM方法计算变量
9.3.3 数据整理与汇报
统计分析篇
第10章 数据科学的统计推断
10.1 基本的统计学概念
10.1.1 总体、样本和统计量
10.1.2 点估计、区间估计和中心极限定理
10.2 假设检验
10.2.1 理论介绍
10.2.2 利用Python实现单样本t检验
10.2.3 利用SAS EG实现单样本t检验
10.2.4 利用SAS EG实现双样本t检验
10.2.5 利用Python实现双样本t检验
10.3 方差分析
10.3.1 利用Python实现单因素方差分析
10.3.2 利用SAS EG实现单因素方差分析
10.3.3 利用Python实现多因素方差分析
10.3.4 利用SAS EG实现多因素方差分析
10.4 相关分析
10.4.1 相关分析理论
10.4.2 Python实现方式
10.4.3 SAS EG实现方式
10.5 列联表分析与卡方检验
10.5.1 利用Python实现列联表分析
10.5.2 利用SAS EG实现列联表分析
10.5.3 利用Python实现卡方检验
10.5.4 利用SAS EG实现卡方检验
第11章 构造连续变量的预测模型
11.1 线性回归模型介绍
11.1.1 简单线性回归
11.1.2 多元线性回归
11.2 模型的构建
11.2.1 多元线性回归模型的构建
11.2.2 将连续变量和分类变量同时作为解释变量来构建模型
11.3 线性回归模型的诊断
11.3.1 残差
11.3.2 强影响点
11.3.3 共线性
11.4 建模流程
11.5 利用SAS EG实现客户价值预测
11.5.1 单连续变量下建模
11.5.2 多连续变量下建模
11.5.3 加入分类解释变量建模
第12章 构造二分类变量的预测模型
12.1 逻辑回归入门
12.2 模型表现优劣的评估
12.3 多水平值分类变量的逻辑回归
12.4 关于构造因果关系模型的讨论
12.5 利用SAS EG实现贷款违约可能性预测
第13章 描述性数据分析方法
13.1 客户细分
13.1.1 客户细分的意义
13.1.2 根据客户利润贡献细分
13.1.3 根据个人或公司的生命历程细分
13.1.4 根据客户的产品偏好细分
13.1.5 根据客户的多维行为属性细分
13.1.6 根据客户结构细分
13.1.7 综合应用
13.2 连续变量间关系探索与变量压缩
13.2.1 多元变量间关系统计基础
13.2.2 多元变量压缩的思路
13.2.3 主成分分析
13.2.4 因子分析
13.3 聚类分析
13.3.1 基本逻辑
13.3.2 层次聚类
13.3.3 快速聚类
13.3.4 两步法聚类
第14章 时间序列分析
14.1 时间序列及其分析方法简介
14.2 利用效应分解法分析时间序列
14.2.1 时间序列的效应分解
14.2.2 SAS EG实现方式
14.2.3 Python实现方式
14.3 平稳时间序列分析
14.3.1 平稳时间序列简介
14.3.2 AR模型、MA模型、ARMA模型简介
14.3.3 Python实现方式
14.4 非平稳时间序列分析
14.4.1 差分与ARIMA模型
14.4.2 SAS EG实现方式
14.4.3 Python实现方式
同类热销排行榜
[an error occurred while processing this directive]推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...