欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • R语言机器学习实战
      • 作者:(美)弗雷德·恩旺加//迈克·查普尔|责编:王峰松|译者:李毅
      • 出版社:人民邮电
      • ISBN:9787115583932
      • 出版日期:2022/12/01
      • 页数:286
    • 售价:47.92
  • 内容大纲

        本书探讨了如何使用R语言进行机器学习,涵盖基本的原理和方法,并通过大量的示例和练习,让读者掌握R语言的数据处理技巧。本书包括入门、回归、分类、模型的评估和改进、无监督学习五大部分,涉及线性回归、logistic回归、k近邻、朴素贝叶斯、决策树、聚类和关联规则等机器学习模型。本书配套提供相关的代码和数据,方便读者学习和使用。本书适合R语言和机器学习的爱好者、从业者以及相关院校的师生选用。
  • 作者介绍

  • 目录

    第一部分  入门
      第1章  什么是机器学习
        1.1  从数据中发现知识
          1.1.1  算法介绍
          1.1.2  人工智能、机器学习和深度学习
        1.2  机器学习技术
          1.2.1  监督学习
          1.2.2  无监督学习
        1.3  模型选择
          1.3.1  分类技术
          1.3.2  回归技术
          1.3.3  相似性学习技术
        1.4  评估模型
          1.4.1  分类错误
          1.4.2  回归错误
          1.4.3  错误类型
          1.4.4  分割数据集
        1.5  练习
      第2章  R和RStudio简介
        2.1  欢迎来到R
        2.2  R和RStudio组件
          2.2.1  R语言
          2.2.2  RStudio
          2.2.3  R包
        2.3  编写和运行R脚本
        2.4  R中的数据类型
          2.4.1  向量
          2.4.2  测试数据类型
          2.4.3  转换数据类型
          2.4.4  缺失值
        2.5  练习
      第3章  数据管理
        3.1  tidyverse
        3.2  数据收集
          3.2.1  主要考虑因素
          3.2.2  导入数据
        3.3  数据探索
          3.3.1  数据描述
          3.3.2  数据可视化
        3.4  数据准备
          3.4.1  数据清洗
          3.4.2  数据转换
          3.4.3  减少数据
        3.5  练习
    第二部分  回归
      第4章  线性回归
        4.1  自行车租赁与回归
        4.2  变量之间的关系
          4.2.1  相关性
          4.2.2  回归

        4.3  简单线性回归
          4.3.1  普通最小二乘法
          4.3.2  简单线性回归模型
          4.3.3  评估模型
        4.4  多元线性回归
          4.4.1  多元线性回归模型
          4.4.2  评估模型
          4.4.3  改进模型
          4.4.4  优缺点
        4.5  案例研究:预测血压
          4.5.1  导入数据
          4.5.2  探索数据
          4.5.3  简单线性回归模型的拟合
          4.5.4  多元线性回归模型的拟合
        4.6  练习
      第5章  logistic回归
        5.1  寻找潜在捐赠者
        5.2  分类
        5.3  logistic回归
          5.3.1  优势比
          5.3.2  二分类logistic回归模型
          5.3.3  评估模型
          5.3.4  改进模型
          5.3.5  优缺点
        5.4  案例研究:收入预测
          5.4.1  导入数据
          5.4.2  探索和准备数据
          5.4.3  训练模型
          5.4.4  评估模型
        5.5  练习
    第三部分  分类
      第6章  k近邻
        6.1  检测心脏病
        6.2  k近邻
          6.2.1  发现最近邻居
          6.2.2  标记未标记数据
          6.2.3  选择合适的k
          6.2.4  k近邻模型
          6.2.5  评估模型
          6.2.6  改进模型
          6.2.7  优缺点
        6.3  案例研究:重新分析捐赠者数据集
          6.3.1  导入数据
          6.3.2  探索和准备数据
          6.3.3  建立模型
          6.3.4  评估模型
        6.4  练习
      第7章  朴素贝叶斯
        7.1  垃圾邮件分类
        7.2  朴素贝叶斯

          7.2.1  概率
          7.2.2  联合概率
          7.2.3  条件概率
          7.2.4  朴素贝叶斯分类
          7.2.5  可加性平滑
          7.2.6  朴素贝叶斯模型
          7.2.7  评估模型
          7.2.8  朴素贝叶斯分类器的优缺点
        7.3  案例研究:重新审视心脏病检测问题
          7.3.1  导入数据
          7.3.2  探索和准备数据
          7.3.3  建立模型
          7.3.4  评估模型
        7.4  练习
      第8章  决策树
        8.1  预测许可证决策
        8.2  决策树
          8.2.1  递归分区
          8.2.2  熵
          8.2.3  信息增益
          8.2.4  基尼不纯度
          8.2.5  剪枝
          8.2.6  建立分类树模型
          8.2.7  评估模型
          8.2.8  决策树的优缺点
        8.3  案例研究:重新审视收入预测问题
          8.3.1  导入数据
          8.3.2  探索和准备数据
          8.3.3  建立模型
          8.3.4  评估模型
        8.4  练习
    第四部分  模型的评估和改进
      第9章  评估模型
        9.1  评估未来表现
          9.1.1  交叉验证
          9.1.2  自助抽样
        9.2  超越预测准确性
          9.2.1  Kappa
          9.2.2  查准率和查全率
          9.2.3  灵敏度和特异性
        9.3  可视化模型性能
          9.3.1  接收者操作特性曲线
          9.3.2  曲线下面积
        9.4  练习
      第10章  改进模型
        10.1  调整参数
          10.1.1  自动参数调整
          10.1.2  自定义参数调整
        10.2  集成方法
          10.2.1  装袋

          10.2.2  提升
          10.2.3  堆叠
        10.3  练习
    第五部分  无监督学习
      第11章  用关联规则发现模式
        11.1  超市购物篮分析
        11.2  关联规则
          11.2.1  识别强规则
          11.2.2  Apriori算法
        11.3  发现关联规则
          11.3.1  生成规则
          11.3.2  评估规则
          11.3.3  优缺点
        11.4  案例研究:识别杂货店购买模式
          11.4.1  导入数据
          11.4.2  探索和预处理数据
          11.4.3  生成规则
          11.4.4  评估规则
        11.5  练习
        11.6  参考文献
      第12章  用聚类对数据分组
        12.1  聚类
        12.2  k均值聚类
        12.3  基于k均值聚类的大学细分
          12.3.1  创建簇
          12.3.2  分析簇
          12.3.3  选择最佳簇数
          12.3.4  k均值聚类的优缺点
        12.4  案例研究:对购物中心客户进行细分
          12.4.1  探索和准备数据
          12.4.2  聚类数据
          12.4.3  评估簇
        12.5  练习
        12.6  参考文献