欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • 数据科学与机器学习(数学与统计方法)/数据科学与工程技术丛书
      • 作者:(澳)迪尔克·P.克洛泽//兹德拉夫科·I.波提夫//托马斯·泰姆勒//拉迪斯拉夫·维斯曼|责编:张秀华|译者:于俊伟//刘楠
      • 出版社:机械工业
      • ISBN:9787111711391
      • 出版日期:2023/01/01
      • 页数:393
    • 售价:55.6
  • 内容大纲

        本书展示了现代机器学习技术背后的数学思想,深入探讨了数据科学方法,给出了主要定理和后续推导的证明,并提供了大量Python代码,旨在帮助读者更好地理解数学和统计学知识,为数据科学中丰富多样的思想和机器学习算法提供支撑。书中首先介绍了数据的相关概念,阐述了统计学习、蒙特卡罗方法、无监督学习的相关内容,接着探讨了回归方法、正则化方法和核方法,然后论述了分类问题与决策树和集成方法,最后介绍了深度学习的相关内容。此外,本书在附录中给出了相关内容的背景知识,包含线性代数与泛函分析、多元微分与优化问题、概率与统计,以及Python入门内容。本书通俗易懂、内容全面,主要面向学习数据科学和机器学习课程的本科生和研究生。
  • 作者介绍

  • 目录

    译者序
    前言
    数学符号
    第1章  导入、汇总和可视化数据
      1.1  简介
      1.2  类型结构特征
      1.3  汇总表
      1.4  汇总统计量
      1.5  数据可视化
        1.5.1  定性变量绘图
        1.5.2  定量变量绘图
        1.5.3  双变量的数据可视化
      1.6  扩展阅读
      1.7  习题
    第2章  统计学习
      2.1  简介
      2.2  监督学习和无监督学习
      2.3  训练损失和测试损失
      2.4  统计学习中的权衡处理
      2.5  估计风险
        2.5.1  样本内风险
        2.5.2  交叉验证
      2.6  数据建模
      2.7  多元正态模型
      2.8  正态线性模型
      2.9  贝叶斯学习
      2.10  扩展阅读
      2.11  习题
    第3章  蒙特卡罗方法
      3.1  简介
      3.2  蒙特卡罗抽样
        3.2.1  生成随机数
        3.2.2  模拟随机变量
        3.2.3  模拟随机向量和随机过程
        3.2.4  重采样
        3.2.5  马尔可夫链蒙特卡罗
      3.3  蒙特卡罗估计
        3.3.1  朴素蒙特卡罗
        3.3.2  自举法
        3.3.3  方差缩减
      3.4  蒙特卡罗优化
        3.4.1  模拟退火
        3.4.2  交叉熵方法
        3.4.3  分裂优化
        3.4.4  噪声优化
      3.5  扩展阅读
      3.6  习题
    第4章  无监督学习
      4.1  简介
      4.2  无监督学习的风险和损失

      4.3  期望大化算法
      4.4  经验分布和密度估计
      4.5  通过混合模型聚类
        4.5.1  混合模型
        4.5.2  混合模型的EM
    算法
      4.6  向量量化聚类
        4.6.1  K均值
        4.6.2  通过连续多极值优化进行聚类
      4.7  层次聚类
      4.8  主成分分析
        4.8.1  动机:椭球体的主轴
        4.8.2  PCA和奇异值分解
      4.9  扩展阅读
      4.10  习题
    第5章  回归
      5.1  简介
      5.2  线性回归
      5.3  线性模型分析
        5.3.1  参数估计
        5.3.2  模型选择和预测
        5.3.3  交叉验证与预测残差平方和
        5.3.4  样本内风险和赤池信息准则
        5.3.5  分类特征
        5.3.6  嵌套模型
        5.3.7  决定系数
      5.4  正态线性模型的推理
        5.4.1  比较两个正态线性模型
        5.4.2  置信区间和预测区间
      5.5  非线性回归模型
      5.6  用Python实现线性模型
        5.6.1  建模
        5.6.2  分析
        5.6.3  方差分析
        5.6.4  置信区间和预测区间
        5.6.5  模型验证
        5.6.6  变量选择
      5.7  广义线性模型
      5.8  扩展阅读
      5.9  习题
    第6章  正则化和核方法
      6.1  简介
      6.2  正则化
      6.3  再生核希尔伯特空间
      6.4  再生核的构造
        6.4.1  通过特征映射构造再生核
        6.4.2  根据特征函数构造再生核
        6.4.3  利用正交特征构造再生核
        6.4.4  通过核构造再生核
      6.5  表示定理

      6.6  平滑三次样条
      6.7  高斯过程回归
      6.8  核PCA
      6.9  扩展阅读
      6.10  习题
    第7章  分类
      7.1  简介
      7.2  分类评价指标
      7.3  基于贝叶斯规则的分类
      7.4  线性判别分析和二次判别分析
      7.5  逻辑回归和softmax分类
      7.6  K近邻分类
      7.7  支持向量机
      7.8  使用ScikitLearn进行分类
      7.9  扩展阅读
      7.10  习题
    第8章  决策树和集成方法
      8.1  简介
      8.2  自顶向下的决策树构建方法
        8.2.1  区域预测函数
        8.2.2  分裂规则
        8.2.3  终止条件
        8.2.4  基本实现
      8.3  其他考虑因素
        8.3.1  二叉树与非二叉树
        8.3.2  数据预处理
        8.3.3  替代分裂规则
        8.3.4  类别变量
        8.3.5  缺失值
      8.4  控制树形
        8.4.1  代价复杂度剪枝
        8.4.2  决策树的优点和局限性
      8.5  自举聚合
      8.6  随机森林
      8.7  提升法
      8.8  扩展阅读
      8.9  习题
    第9章  深度学习
      9.1  简介
      9.2  前馈神经网络
      9.3  反向传播
      9.4  训练方法
        9.4.1  速下降法
        9.4.2  LevenbergMarquardt方法
        9.4.3  受限内存BFGS方法
        9.4.4  自适应梯度法
      9.5  Python示例
        9.5.1  简单多项式回归
        9.5.2  图像分类
      9.6  扩展阅读

      9.7  习题
    附录A  线性代数与泛函分析
    附录B  多元微分与优化问题
    附录C  概率与统计
    附录D  Python入门
    参考文献