欢迎光临澳大利亚新华书店网 [登录 | 免费注册]

    • Python无监督学习
      • 作者:(德)朱塞佩·博纳科尔索|责编:胡俊英|译者:瞿源//刘江峰
      • 出版社:人民邮电
      • ISBN:9787115540720
      • 出版日期:2020/09/01
      • 页数:272
    • 售价:31.6
  • 内容大纲

        机器学习是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。无监督学习是机器学习中的一种学习方式,是数据科学的一个重要分支,常用于数据挖掘领域,通过构建模型来为业务决策提供依据。
        本书通过Python语言讲解无监督学习,全书内容包括10章,前面9章由浅入深地讲解了无监督学习的基础知识、聚类的基础知识、高级聚类、层次聚类、软聚类和高斯混合模型、异常检测、降维和分量分析、无监督神经网络模型、生成式对抗网络和自组织映射,第10章以问题解答的形式对前面9章涉及的问题给出了解决方案。
        本书适合数据科学家、机器学习从业者和普通的软件开发人员阅读,通过学习本书介绍的无监督学习理论和Python编程方法,读者能够在业务实践中获得有价值的参考。
  • 作者介绍

  • 目录

    第1章  无监督学习入门
      1.1  技术要求
      1.2  为什么需要机器学习
        1.2.1  描述性分析
        1.2.2  诊断性分析
        1.2.3  预测性分析
        1.2.4  规范性分析
      1.3  机器学习算法的类型
        1.3.1  有监督学习算法
        1.3.2  无监督学习算法
        1.3.3  半监督学习算法
        1.3.4  强化学习算法
      1.4  为什么用Python进行数据科学和机器学习
      1.5  总结
      1.6  问题
    第2章  聚类基础知识
      2.1  技术要求
      2.2  聚类介绍
      2.3  K-means
      2.4  威斯康星州乳腺癌数据集分析
      2.5  评估指标
        2.5.1  最小化惯性
        2.5.2  轮廓分数
        2.5.3  完整性分数
        2.5.4  同质性分数
        2.5.5  调整后的相互信息分数
        2.5.6  调整后的兰德分数
        2.5.7  列联矩阵
      2.6  K-近邻
      2.7  向量量化
      2.8  总结
      2.9  问题
    第3章  高级聚类
      3.1  技术要求
      3.2  谱聚类
      3.3  均值漂移
      3.4  DBSCAN
        3.4.1  Calinski-Harabasz分数
        3.4.2  使用DBSCAN分析工作数据集中的缺勤率
        3.4.3  聚类不稳定性作为性能指标
      3.5  K-medoids
      3.6  联机聚类
        3.6.1  Mini-batch K-means
        3.6.2  BIRCH
        3.6.3  Mini-batch K-means与BIRCH的比较
      3.7  总结
      3.8  问题
    第4章  实操中的层次聚类
      4.1  技术要求
      4.2  聚类层次结构

      4.3  凝聚聚类
        4.3.1  单一链和完整链
        4.3.2  平均链
        4.3.3  Ward链
      4.4  树状图分析
      4.5  同表型相关性系数作为一种性能指标
      4.6  水处理厂数据集的凝聚聚类
      4.7  连通性约束
      4.8  总结
      4.9  问题
    第5章  软聚类和高斯混合模型
      5.1  技术要求
      5.2  软聚类
      5.3  Fuzzy c-means
      5.4  高斯混合
        5.4.1  高斯混合的EM算法
        5.4.2  用AIC和BIC方法评估高斯混合的性能
        5.4.3  贝叶斯高斯混合选择成分
        5.4.4  生成高斯混合
      5.5  总结
      5.6  问题
    第6章  异常检测
      6.1  技术要求
      6.2  概率密度函数
        6.2.1  作为异常值或新值的异常
        6.2.2  数据集结构
      6.3  直方图
      6.4  核密度估计
        6.4.1  高斯内核
        6.4.2  Epanechnikov内核
        6.4.3  指数内核
        6.4.4  均匀/Tophat内核
        6.4.5  估计密度
      6.5  应用异常检测
      6.6  单类支持向量机
      6.7  基于孤立森林的异常检测
      6.8  总结
      6.9  问题
    第7章  降维与分量分析
      7.1  技术要求
      7.2  主成分分析
        7.2.1  具有奇异值分解的PCA
        7.2.2  具有MNIST数据集的PCA
        7.2.3  基于内核的主成分分析
        7.2.4  通过因子分析增加异方差噪声的强壮性
        7.2.5  稀疏主成分分析与字典学习
        7.2.6  非负矩阵分解
      7.3  独立成分分析
      7.4  具有潜在Dirichlet分配的主题建模
      7.5  总结

      7.6  问题
    第8章  无监督神经网络模型
      8.1  技术要求
      8.2  自编码器
        8.2.1  深度卷积自编码器示例
        8.2.2  去噪自编码器
        8.2.3  稀疏自编码器
        8.2.4  变分自编码器
      8.3  基于赫布的主成分分析
        8.3.1  Sanger网络
        8.3.2  Rubner-Tavan网络
      8.4  无监督的深度置信网络
        8.4.1  受限玻尔兹曼机
        8.4.2  深度置信网络
        8.4.3  无监督DBN示例
      8.5  总结
      8.6  问题
    第9章  生成式对抗网络和自组织映射
      9.1  技术要求
      9.2  生成式对抗网络
        9.2.1  GAN分析
        9.2.2  深度卷积GAN示例
        9.2.3  Wasserstein GAN
      9.3  自组织映射
      9.4  总结
      9.5  问题
    第10章  问题解答
      10.1第1章  
      10.2第2章  
      10.3第3章  
      10.4第4章  
      10.5第5章  
      10.6第6章  
      10.7第7章  
      10.8第8章  
      10.9第9章