欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • 用Python动手学统计学(第2版)/图灵程序设计丛书
      • 作者:(日)马场真哉|责编:王军花|译者:吴昊天//胡屹
      • 出版社:人民邮电
      • ISBN:9787115673817
      • 出版日期:2025/06/01
      • 页数:480
    • 售价:39.92
  • 内容大纲

        本书是统计学的入门书,对同一个知识点分别使用文字说明、数学式和Python示例代码进行讲解,循序渐进地介绍了统计学和Python的基础知识、描述统计、统计推断、假设检验、正态线性模型和广义线性模型等统计模型,以及机器学习等。通过阅读本书,读者不仅可以深刻理解统计学术语、统计分析方法和预测方法等,还可以学到前沿的机器学习知识,以及如何使用Python实现数据可视化和建模等。
        本书结构清晰、直观易懂,适合统计学和Python的初学者及对数据科学和机器学习感兴趣的读者使用,也可作为高等院校计算机、统计等专业学生的入门书。
  • 作者介绍

  • 目录

    第1章 开始学习统计学
      1-1 统计学
        1-1-1 描述统计
        1-1-2 统计推断
      1-2 描述统计的必要性
        1-2-1 为什么需要描述统计
        1-2-2 均值存在的问题
        1-2-3 使用均值以外的指标
        1-2-4 数据可视化
      1-3 统计推断的必要性
        1-3-1 为什么需要统计推断
        1-3-2 术语 总体与样本
        1-3-3 术语 样本容量
        1-3-4 推断的形象描述
        1-3-5 样本的随机偏差与区间估计
        1-3-6 判断与假设检验
        1-3-7 模型与推断
        1-3-8 从线性模型到机器学习
    第2章 Python与Jupyter Notebook基础
      2-1 环境搭建
        2-1-1 术语 Python
        2-1-2 术语 Anaconda
        2-1-3 术语 Jupyter Notebook
        2-1-4 安装Anaconda
        2-1-5 安装早期版本的Anaconda
        2-1-6 术语 Python编程术语
      2-2 认识Jupyter Notebook
        2-2-1 启动Jupyter Notebook
        2-2-2 创建新文件
        2-2-3 执行代码
        2-2-4 保存执行结果
        2-2-5 使用Markdown功能
        2-2-6 退出Jupyter Notebook
        2-2-7 使用Anaconda Prompt
      2-3 Python编程基础
        2-3-1 实现四则运算
        2-3-2 实现其他运算
        2-3-3 实现注释
        2-3-4 实现数据类型
        2-3-5 实现比较运算
        2-3-6 实现变量
        2-3-7 实现函数
        2-3-8 实现常用的函数
        2-3-9 实现类与实例
        2-3-10 实现基于if语句的程序分支
        2-3-11 实现基于for语句的循环
        2-3-12 编写易用程序的技巧
        2-4 认识numpy与pandas
        2-4-1 实现导入外部功能
        2-4-2 术语 numpy与pandas

        2-4-3 实现列表
        2-4-4 实现行与列
        2-4-5 实现数组
        2-4-6 实现数组的运算
        2-4-7 实现二维数组
        2-4-8 实现生成等差数列的方法
        2-4-9 实现各类数组的生成
        2-4-10 实现切片
        2-4-11 实现数据帧
        2-4-12 实现读取文件中的数据
        2-4-13 实现连接数据帧
        2-4-14 实现取出指定的列
        2-4-15 实现取出指定的行
        2-4-16 实现序列
        2-4-17 实现函数文档
    第3章 描述统计
      3-1 数据的种类
        3-1-1 术语 观察、变量
        3-1-2 术语 定量数据、分类数据
        3-1-3 术语 离散型数据、连续型数据
        3-1-4 术语 二值数据、多值数据
        3-1-5 术语 名义尺度、顺序尺度、间距尺度、比例尺度
        3-1-6 术语 单变量数据、多变量数据
        3-1-7 术语 时间序列数据、横截面数据
      3-2 读懂数学式
        3-2-1 数学式作为表达方式
        3-2-2 用数学式表示样本
        3-2-3 为什么要使用数学式
        3-2-4 加法与Σ符号
        3-2-5 用数学式表示样本均值
        3-2-6 乘法与Π符号
        3-3 频数分布
        3-3-1 为什么要学习多种统计方法
        3-3-2 术语 频数、频数分布
        3-3-3 术语 组、组中值
        3-3-4 实现环境准备
        3-3-5 实现频数分布
        3-3-6 术语 频率分布、累积频数分布、累积频率分布
        3-3-7 实现频率分布、累积频数分布、累积频率分布
        3-3-8 术语 直方图
        3-3-9 用于绘图的matplotlib、seaborn
        3-3-10 实现直方图
        3-3-11 实现组的大小不同的直方图
        3-3-12 术语 核密度估计
        3-3-13 实现核密度估计
      3-4 单变量数据的统计量
        3-4-1 实现环境准备
        3-4-2 准备实验数据
        3-4-3 实现样本容量
        3-4-4 实现总和

        8-3-22 实现回归模型中的方差分析
      8-4 含有多个解释变量的模型
        8-4-1 实现环境准备
        8-4-2 实现错误的分析:只比较均值
        8-4-3 术语 协变量
        8-4-4 实现比较回归直线的截距
        8-4-5 实现使用普通的方差分析进行检验
        8-4-6 实现多个解释变量的平方和计算
        8-4-7 术语 调整平方和
        8-4-8 实现Type II检验
        8-4-9 实现读入新数据
        8-4-10 术语 交互作用
        8-4-11 实现错误的分析:模型中未包含交互作用
        8-4-12 实现建立包含交互作用的模型
        8-4-13 实现Type III检验
        8-4-14 实现使用AIC进行变量选择
        8-4-15 实现交互作用项的含义
        8-4-16 实现formula参数的功能
        8-4-17 实现设计矩阵
    第9章 广义线性模型
      9-1 广义线性模型概述
        9-1-1 广义线性模型的组成
        9-1-2 本书使用的概率分布
        9-1-3 术语 泊松分布
        9-1-4 术语 指数型分布族
        9-1-5 指数型分布族常用的概率分布
        9-1-6 术语 线性预测算子
        9-1-7 术语 联系函数
        9-1-8 联系函数与概率分布的关系
        9-1-9 广义线性模型的参数估计
        9-1-10 广义线性模型的检验方法
      9-2 逻辑斯谛回归
        9-2-1 术语 逻辑斯谛回归
        9-2-2 本节示例
        9-2-3 二值分类问题
        9-2-4 术语 logit函数
        9-2-5 术语 反函数
        9-2-6 术语 logistic函数
        9-2-7 logistic函数的性质
        9-2-8 逻辑斯谛回归的推导
        9-2-9 逻辑斯谛回归的似然函数
        9-2-10 实现环境准备
        9-2-11 实现读入数据并可视化
        9-2-12 实现逻辑斯谛回归
        9-2-13 实现逻辑斯谛回归的结果
        9-2-14 实现逻辑斯谛回归的模型选择
        9-2-15 实现使用逻辑斯谛回归进行预测
        9-2-16 实现逻辑斯谛回归的回归曲线
        9-2-17 术语 优势和对数优势
        9-2-18 术语 优势比和对数优势比

        9-2-19 实现逻辑斯谛回归的系数与优势比的关系
      9-3 广义线性模型的评估
        9-3-1 实现环境准备
        9-3-2 术语 皮尔逊残差
        9-3-3 实现皮尔逊残差
        9-3-4 术语 偏差
        9-3-5 术语 偏差残差
        9-3-6 实现偏差残差
        9-3-7 术语 交叉熵误差
      9-4 泊松回归
        9-4-1 泊松分布
        9-4-2 泊松分布与二项分布的关系
        9-4-3 实现环境准备
        9-4-4 实现泊松分布
        9-4-5 术语 泊松回归
        9-4-6 本节示例
        9-4-7 泊松回归的推导
        9-4-8 实现读入数据
        9-4-9 实现泊松回归
        9-4-10 实现泊松回归的模型选择
        9-4-11 实现使用泊松回归进行预测
        9-4-12 实现泊松回归的回归曲线
        9-4-13 实现回归系数的含义
    第10章 统计学与机器学习
      10-1 机器学习基础
        10-1-1 术语 机器学习
        10-1-2 术语 监督学习
        10-1-3 术语 无监督学习
        10-1-4 术语 强化学习
        10-1-5 术语 基于规则的机器学习
        10-1-6 统计学与机器学习无法彻底分离
        10-1-7 统计学注重过程,机器学习注重结果
      10-2 正则化、Ridge回归与Lasso回归
        10-2-1 术语 正则化
        10-2-2 术语 Ridge回归
        10-2-3 术语 Lasso回归
        10-2-4 确定正则化强度
        10-2-5 将解释变量标准化
        10-2-6 Ridge回归与Lasso回归的差异
        10-2-7 变量选择与正则化的对比
        10-2-8 正则化的意义
      10-3 Python中的Ridge回归与Lasso回归
        10-3-1 术语 scikit-learn
        10-3-2 实现环境准备
        10-3-3 实现解释变量的标准化
        10-3-4 实现定义响应变量
        10-3-5 实现普通最小二乘法
        10-3-6 实现使用sklearn实现线性回归
        10-3-7 实现Ridge回归:惩罚指标的影响
        10-3-8 实现Ridge回归:确定最佳正则化强度

        10-3-9 实现Lasso回归:惩罚指标的影响
        10-3-10 实现Lasso回归:确定最佳正则化强度
        10-3-11 实现使用Lasso回归进行预测
      10-4 线性模型与神经网络
        10-4-1 术语 输入向量、目标向量、权重、偏置
        10-4-2 术语 单层感知机
        10-4-3 术语 激活函数
        10-4-4 从线性模型到神经网络
        10-4-5 术语 隐藏层
        10-4-6 术语 神经网络
        10-4-7 神经网络的结构
        10-4-8 神经网络中的L2正则化
        10-4-9 实现环境准备
        10-4-10 实现一元回归分析
        10-4-11 实现使用神经网络实现回归
        10-4-12 实现逻辑斯谛回归
        10-4-13 实现使用神经网络实现分类
        10-4-14 实现生成用于复杂分类问题的数据
        10-4-15 实现将数据分割为训练集与测试集
        10-4-16 实现对复杂数据进行逻辑斯谛回归分析
        10-4-17 实现使用神经网络对复杂数据进行分类
        10-4-18 线性模型与神经网络各自的优点
      参考文献(图灵社区下载)

        3-4-5 实现样本均值
        3-4-6 术语 样本方差
        3-4-7 实现样本方差
        3-4-8 术语 无偏方差
        3-4-9 实现无偏方差
        3-4-10 术语 标准差
        3-4-11 实现标准差
        3-4-12 术语 变异系数
        3-4-13 实现变异系数
        3-4-14 术语 标准化
        3-4-15 实现标准化
        3-4-16 术语 最小值、最大值、中位数、四分位数
        3-4-17 实现最小值、最大值
        3-4-18 实现中位数
        3-4-19 实现四分位数
        3-4-20 实现众数
        3-4-21 实现pandas的describe函数
      3-5 多变量数据的统计量
        3-5-1 实现环境准备
        3-5-2 实现准备用于实验的数据
        3-5-3 术语 协方差
        3-5-4 术语 协方差矩阵
        3-5-5 实现协方差
        3-5-6 实现协方差矩阵
        3-5-7 术语 皮尔逊积矩相关系数
        3-5-8 术语 相关矩阵
        3-5-9 实现皮尔逊积矩相关系数
        3-5-10 相关系数无效的情况
        3-5-11 术语 列联表
        3-5-12 实现列联表
      3-6 分层分析
        3-6-1 术语 分层分析
        3-6-2 术语 整洁数据
        3-6-3 术语 杂乱数据
        3-6-4 杂乱数据的例子
        3-6-5 实现环境准备
        3-6-6 实现读取实验数据
        3-6-7 实现分组计算统计量
        3-6-8 实现企鹅数据
        3-6-9 实现企鹅数据的分层分析
        3-6-10 实现缺失数据的处理
        3-6-11 实现简单直方图
        3-6-12 实现分组直方图
      3-7 使用图形
        3-7-1 实现环境准备
        3-7-2 术语 matplotlib、seaborn
        3-7-3 实现读取实验数据
        3-7-4 实现散点图
        3-7-5 实现图形的装饰和保存
        3-7-6 实现折线图

        3-7-7 实现条形图
        3-7-8 实现箱形图
        3-7-9 实现小提琴图
        3-7-10 术语 轴级函数与图级函数
        3-7-11 实现基于种类和性别的小提琴图
        3-7-12 实现基于种类、岛名和性别的小提琴图
        3-7-13 实现散点图矩阵
    第4章 概率论与概率分布
      4-1 什么是概率论
        4-1-1 为什么要学习概率论
        4-1-2 第4章 的内容脉络
        4-1-3 术语 集合
        4-1-4 术语 元素
        4-1-5 术语 集合的外延表示与内涵表示
        4-1-6 术语 子集
        4-1-7 术语 维恩图
        4-1-8 术语 交集与并集
        4-1-9 术语 差集
        4-1-10 术语 空集
        4-1-11 术语 全集
        4-1-12 术语 补集
        4-1-13 术语 样本点、样本空间、事件
        4-1-14 术语 互斥事件
        4-1-15 通过掷骰子联想到的各种概率
        4-1-16 术语 概率的公理化定义
        4-1-17 用频率解释概率
        4-1-18 主观概率学派
        4-1-19 术语 概率的加法定理
        4-1-20 术语 条件概率
        4-1-21 术语 概率的乘法定理
        4-1-22 术语 独立事件
      4-2 什么是概率分布
        4-2-1 术语 随机变量与样本值
        4-2-2 术语 离散随机变量与连续随机变量
        4-2-3 术语 概率分布
        4-2-4 术语 概率质量函数
        4-2-5 术语 均匀分布(离散型)
        4-2-6 术语 概率密度
        4-2-7 术语 概率密度函数
        4-2-8 概率的总和与概率密度积分的联系
        4-2-9 术语 均匀分布(连续型)
        4-2-10 术语 累积分布函数
        4-2-11 均匀分布的累积分布函数
        4-2-12 术语 百分位数
        4-2-13 术语 期望值
        4-2-14 术语 随机变量的方差
        4-2-15 均匀分布的期望值与方差
        4-2-16 术语 多元概率分布
        4-2-17 术语 联合概率分布
        4-2-18 术语 边缘化、边缘分布

        4-2-19 术语 条件概率分布
        4-2-20 术语 随机变量的独立
        4-2-21 二元概率分布的例子
        4-2-22 术语 随机变量的协方差与相关系数
        4-2-23 术语 独立同分布
      4-3 二项分布
        4-3-1 术语 试验
        4-3-2 术语 二值随机变量
        4-3-3 术语 伯努利试验
        4-3-4 术语 成功概率
        4-3-5 术语 伯努利分布
        4-3-6 设计程序来模拟抽签
        4-3-7 实现环境准备
        4-3-8 实现抽1张便笺的模拟
        4-3-9 实现抽10张便笺的模拟
        4-3-10 实现抽10张便笺并重复10 000 次的模拟
        4-3-11 术语 二项分布
        4-3-12 实现二项分布
        4-3-13 实现生成服从二项分布的随机数
        4-3-14 实现二项分布的期望值与方差
        4-3-15 实现二项分布的累积分布函数
        4-3-16 实现二项分布的百分位数
        4-3-17 实现二项分布的右侧概率
      4-4 正态分布
        4-4-1 实现环境准备
        4-4-2 术语 正态分布
        4-4-3 实现正态分布的概率密度函数
        4-4-4 正态分布的由来
        4-4-5 实现误差累积的模拟
        4-4-6 术语 中心极限定理
        4-4-7 正态分布的性质
        4-4-8 实现生成服从正态分布的随机数
        4-4-9 实现正态分布的累积分布函数
        4-4-10 实现正态分布的百分位数
        4-4-11 实现正态分布的右侧概率
    第5章 统计推断
      5-1 统计推断的思路
        5-1-1 术语 抽样
        5-1-2 术语 简单随机抽样
        5-1-3 湖中钓鱼示例
        5-1-4 样本与随机变量
        5-1-5 作为抽样过程的总体分布
        5-1-6 用术语 来描述抽样过程
        5-1-7 模型的应用
        5-1-8 术语 瓮模型
        5-1-9 把抽样过程抽象化的模型
        5-1-10 总体分布与总体的频率分布
        5-1-11 更现实的湖中钓鱼示例
        5-1-12 做假设
        5-1-13 假设总体服从正态分布

        5-1-14 术语 概率分布的参数
        5-1-15 术语 参数模型与非参数模型
        5-1-16 术语 统计推断
        5-1-17 假设总体分布是正态分布之后的做法
        5-1-18 小结:统计推断的思路
        5-1-19 从5-2节开始的解说流程
        5-1-20 所做的假设是否恰当
      5-2 用Python模拟抽样
        5-2-1 实现环境准备
        5-2-2 抽样过程
        5-2-3 实现在只有5条鱼的湖中抽样
        5-2-4 实现从鱼较多的湖中抽样
        5-2-5 实现总体分布的可视化
        5-2-6 实现对比总体分布和正态分布的概率密度函数
        5-2-7 实现抽样过程的抽象描述
        5-2-8 补充讨论
        5-2-9 假设总体服从正态分布是否恰当
      5-3 估计总体均值
        5-3-1 实现环境准备
        5-3-2 术语 总体均值、总体方差、总体标准差
        5-3-3 术语 估计量、估计值
        5-3-4 样本均值作为总体均值的估计量
        5-3-5 模拟的内容
        5-3-6 实现载入总体数据
        5-3-7 实现计算样本均值
        5-3-8 实现多次计算样本均值
        5-3-9 实现样本均值的均值
        5-3-10 术语 无偏性、无偏估计量
        5-3-11 样本均值作为总体均值的无偏估计量
        5-3-12 实现编写一个多次计算样本均值的函数
        5-3-13 实现不同样本容量的样本均值的分布
        5-3-14 计算样本均值的标准差
        5-3-15 术语 标准误差
        5-3-16 实现样本容量更大时的样本均值
        5-3-17 术语 一致性、一致估计量
        5-3-18 术语 大数定律
        5-3-19 统计推断的思考模式
      5-4 估计总体方差
        5-4-1 实现环境准备
        5-4-2 实现准备一个总体
        5-4-3 用样本方差、无偏方差估计总体方差
        5-4-4 实现计算样本方差和无偏方差
        5-4-5 实现样本方差的均值
        5-4-6 实现无偏方差的均值
        5-4-7 无偏方差用作总体方差的无偏估计量
        5-4-8 实现样本容量更大时的无偏方差
      5-5 从正态总体衍生的概率分布
        5-5-1 实现环境准备
        5-5-2 术语 样本分布
        5-5-3 正态分布的应用

        5-5-4 术语 分布
        5-5-5 实现模拟准备
        5-5-6 实现分布
        5-5-7 样本均值服从的分布
        5-5-8 实现样本均值的标准化
        5-5-9 术语 t值
        5-5-10 术语 t分布
        5-5-11 实现t分布
        5-5-12 术语 F分布
        5-5-13 实现F分布
        5-6 区间估计
        5-6-1 实现环境准备
        5-6-2 术语 点估计、区间估计
        5-6-3 实现点估计
        5-6-4 术语 置信水平、置信区间
        5-6-5 术语 置信界限
        5-6-6 总体均值的区间估计
        5-6-7 实现总体均值的区间估计
        5-6-8 决定置信区间大小的因素
        5-6-9 区间估计结果的解读
        5-6-10 总体方差的区间估计
        5-6-11 实现总体方差的区间估计
    第6章 假设检验
      6-1 单样本t检验
        6-1-1 假设检验入门
        6-1-2 关于总体均值的单样本t检验
        6-1-3 术语 零假设与备择假设
        6-1-4 术语 显著性差异
        6-1-5 t检验的直观解释
        6-1-6 均值差异大不代表存在显著性差异
        6-1-7 术语 检验统计量
        6-1-8 回顾t值
        6-1-9 小结
        6-1-10 术语 第一类错误与第二类错误
        6-1-11 术语 显著性水平
        6-1-12 术语 拒绝域与接受域
        6-1-13 术语 p值
        6-1-14 小结
        6-1-15 回顾t值与t分布的关系
        6-1-16 术语 单侧检验与双侧检验
        6-1-17 计算拒绝域
        6-1-18 计算p值
        6-1-19 本节涉及的数学式
        6-1-20 实现环境准备
        6-1-21 实现计算t值
        6-1-22 实现计算拒绝域
        6-1-23 实现计算p值
        6-1-24 实现通过模拟计算p值
      6-2 均值差检验
        6-2-1 双样本t检验

        6-2-2 配对样本t检验
        6-2-3 实现环境准备
        6-2-4 实现配对样本t检验
        6-2-5 独立样本t检验(异方差)
        6-2-6 实现独立样本t检验(异方差)
        6-2-7 独立样本t检验(同方差)
        6-2-8 术语 p值操纵
      6-3 列联表检验
        6-3-1 使用列联表的优点
        6-3-2 本节示例
        6-3-3 计算期望频数
        6-3-4 计算观测频数和期望频数的差异
        6-3-5 实现环境准备
        6-3-6 实现计算p值
        6-3-7 实现列联表检验
        6-4 检验结果的解读
        6-4-1 p值小于或等于0.05  时的表述方法
        6-4-2 p值大于0.05  时的表述方法
        6-4-3 假设检验的常见误区
        6-4-4 p值小不代表差异大
        6-4-5 p值大于0.05  不代表没有差异
        6-4-6 术语 假设检验的非对称性
        6-4-7 在检验之前确定显著性水平
        6-4-8 是否有必要学习假设检验
        6-4-9 是否满足前提条件
    第7章 统计模型基础
      7-1 统计模型
        7-1-1 术语 模型
        7-1-2 术语 建模
        7-1-3 模型的作用
        7-1-4 从正态总体中随机抽样的模型
        7-1-5 术语 数学模型
        7-1-6 术语 概率模型
        7-1-7 模型的估计
        7-1-8 模型的升级
        7-1-9 基于模型的预测
        7-1-10 简化复杂的世界
        7-1-11 从某个角度观察复杂的现象
        7-1-12 统计模型与经典数据分析的对比
        7-1-13 统计模型的应用
      7-2 建立线性模型的方法
        7-2-1 本节示例
        7-2-2 术语 响应变量与解释变量
        7-2-3 术语 线性模型
        7-2-4 术语 系数与权重
        7-2-5 如何建立线性模型
        7-2-6 线性模型的选择
        7-2-7 术语 变量选择
        7-2-8 术语 空模型
        7-2-9 通过假设检验选择变量

        7-2-10 通过信息量准则选择变量
        7-2-11 模型评估
        7-2-12 在建模之前确定分析目的
      7-3 数据表示与模型名称
        7-3-1 从广义线性模型的角度对模型进行分类
        7-3-2 术语 正态线性模型
        7-3-3 术语 回归分析
        7-3-4 术语 多元回归分析
        7-3-5 术语 方差分析
        7-3-6 术语 协方差分析
        7-3-7 机器学习中的术语
      7-4 参数估计:最大化似然
        7-4-1 为什么要学习参数估计
        7-4-2 术语 似然
        7-4-3 术语 似然函数
        7-4-4 术语 对数似然
        7-4-5 对数的性质
        7-4-6 术语 最大似然法
        7-4-7 术语 最大似然估计量
        7-4-8 术语 最大对数似然
        7-4-9 服从正态分布的数据的似然
        7-4-10 术语 多余参数
        7-4-11 正态线性模型的似然
        7-4-12 最大似然法计算示例
        7-4-13 最大似然估计量的性质
      7-5 参数估计:最小化损失
        7-5-1 术语 损失函数
        7-5-2 术语 拟合值与预测值
        7-5-3 术语 残差
        7-5-4 为什么不能将残差之和直接作为损失指标
        7-5-5 术语 残差平方和
        7-5-6 术语 最小二乘法
        7-5-7 最小二乘法与最大似然法的关系
        7-5-8 术语 误差函数
        7-5-9 多种损失函数
      7-6 预测精度的评估与变量选择
        7-6-1 术语 拟合精度与预测精度
        7-6-2 术语 过拟合
        7-6-3 变量选择的意义
        7-6-4 术语 泛化误差
        7-6-5 术语 训练集与测试集
        7-6-6 术语 交叉验证
        7-6-7 术语 赤池信息量准则
        7-6-8 术语 相对熵
        7-6-9 相对熵的最小化与平均对数似然
        7-6-10 AIC与平均对数似然中的偏差
        7-6-11 使用AIC进行变量选择
        7-6-12 用变量选择代替假设检验
        7-6-13 应该使用假设检验还是AIC
    第8章 正态线性模型

      8-1 含有单个连续型解释变量的模型(一元回归)
        8-1-1 实现环境准备
        8-1-2 实现读入数据并绘制其图形
        8-1-3 建模
        8-1-4 使用最小二乘法估计系数
        8-1-5 实现估计系数
        8-1-6 估计出的系数的期望值与方差
        8-1-7 实现使用statsmodels建模
        8-1-8 实现打印估计结果并检验系数
        8-1-9 实现summary函数的输出
        8-1-10 实现使用AIC进行模型选择
        8-1-11 实现使用一元回归进行预测
        8-1-12 实现置信区间和预测区间
        8-1-13 术语 回归直线
        8-1-14 实现使用seaborn绘制回归直线
        8-1-15 实现绘制置信区间和预测区间
        8-1-16 回归直线的方差
      8-2 正态线性模型的评估
        8-2-1 实现环境准备
        8-2-2 实现获取残差
        8-2-3 术语 决定系数
        8-2-4 实现决定系数
        8-2-5 术语 修正决定系数
        8-2-6 实现修正决定系数
        8-2-7 实现残差的可视化
        8-2-8 术语 分位图
        8-2-9 实现分位图
        8-2-10 实现对照summary函数的输出结果分析残差
      8-3 方差分析
        8-3-1 本节示例
        8-3-2 什么时候应该使用方差分析
        8-3-3 术语 多重假设检验
        8-3-4 方差分析的直观理解:F比
        8-3-5 显著性差异与小提琴图
        8-3-6 方差分析的直观理解:分离效应和误差
        8-3-7 术语 组间差异与组内差异
        8-3-8 实现环境准备
        8-3-9 实现生成数据并可视化
        8-3-10 实现计算各水平均值与总体均值
        8-3-11 实现方差分析①:计算组间偏差平方和与组内偏差平方和
        8-3-12 实现方差分析②:计算组间方差与组内方差
        8-3-13 实现方差分析③:计算F比和p值
        8-3-14 单因素方差分析的计算过程
        8-3-15 术语 平方和分解
        8-3-16 解释变量为分类变量的正态线性模型
        8-3-17 术语 虚拟变量
        8-3-18 实现statsmodels中的方差分析
        8-3-19 术语 方差分析表
        8-3-20 模型系数的含义
        8-3-21 实现使用模型分离效应和误差

推荐书目

  • 孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...

  • 时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...

  • 本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...

更多>>>