-
内容大纲
本书从实践应用的角度出发,系统介绍了利用Python进行数据挖掘与机器学习所需的基础知识。内容涵盖数据挖掘的基本概念、机器学习的主要算法、Python编程语言基础、数据处理与可视化技术;深入解析了Python在数据挖掘与机器学习领域的核心库和框架,并通过具体实例展示了如何利用这些工具进行数据挖掘、模型训练与预测分析;同时,还介绍了机器学习模型的评估与优化方法,以及模型的实际应用场景。书中大部分章节配有习题与案例分析,旨在帮助读者深入理解并熟练掌握Python数据挖掘与机器学习的关键技能。
本书既可作为高等院校计算机、软件、大数据、人工智能等相关专业的教材,也可作为数据分析师、机器学习工程师等专业人士的技术参考书。 -
作者介绍
-
目录
前言
绪论
第一部分 基础篇
第1章 Python基础
1.1 Python运行环境配置
1.1.1 安装Python
1.1.2 安装Anaconda
1.1.3 PyTorch的安装
1.1.4 编程IDE的安装
1.2 Python基础语法
1.2.1 标识符、关键字与变量操作
1.2.2 数据结构与类型
1.2.3 运算符
1.2.4 控制结构
1.2.5 函数
1.2.6 文件操作
1.3 Python常用库
1.3.1 NumPy
1.3.2 Pandas
1.3.3 Matplotlib
1.3.4 Scikit-Learn
1.4 小结与习题
第2章 数学基础
2.1 线性代数
2.1.1 向量与矩阵
2.1.2 矩阵运算
2.2 概率论
2.2.1 概率分布
2.2.2 条件概率分布
2.3 微积分
2.3.1 微分
2.3.2 积分
2.4 小结与习题
第二部分 算法篇
第3章 分类
3.1 引例:图像分类
3.1.1 CIFAR-10数据集
3.1.2 ResNet分类
3.2 支持向量机
3.2.1 超平面
3.2.2 最大间隔
3.2.3 基本型的对偶问题
3.2.4 核函数
3.3 卷积神经网络
3.3.1 LeNet
3.3.2 AlexNet
3.3.3 VGG
3.3.4 ResNet
3.4 Transformer
3.4.1 Vision Transformer
3.4.2 注意力机制
3.5 小结与习题
第4章 回归
4.1 引例:房价预测
4.1.1 加州房价数据集
4.1.2 岭回归预测
4.2 线性回归
4.2.1 最小二乘法
4.2.2 多元回归
4.3 正则化回归
4.3.1 岭回归
4.3.2 LASSO回归
4.3.3 弹性网回归
4.4 时序回归
4.4.1 自回归模型
4.4.2 循环神经网络
4.4.3 长短期记忆网络
4.4.4 门控循环单元
4.5 小结与习题
第5章 聚类
5.1 引例:鸢尾花的聚类分析
5.1.1 鸢尾花数据集
5.1.2 使用K均值聚类算法进行聚类
5.2 K均值聚类
5.2.1 K均值的基本步骤
5.2.2 K均值的改进算法
5.3 层次聚类
5.3.1 层次聚类的基本步骤
5.3.2 层次聚类的改进算法
5.4 图聚类
5.4.1 图聚类基础模型
5.4.2 谱聚类与Louvain算法
5.5 小结与习题
第6章 关联分析
6.1 引例:购物篮关联分析
6.1.1 线上商城交易数据
6.1.2 频繁项集和关联规则
6.1.3 Apriori算法挖掘频繁项集
6.1.4 结果分析
6.2 Apriori算法
6.2.1 Apriori性质
6.2.2 频繁项集的发现
6.2.3 频繁项集到关联规则
6.3 FP-Growth算法
6.3.1 原理概述
6.3.2 频繁模式树的构建
6.3.3 频繁模式树的挖掘
6.3.4 Apriori算法和FP-Growth算法的优缺点
6.4 频繁子图挖掘与类Apriori算法
6.4.1 频繁子图
6.4.2 候选生成
6.4.3 候选剪枝
6.4.4 候选删除
6.5 模式增长类算法——GSpan算法
6.5.1 深度优先搜索和深度优先搜索树
6.5.2 DFS编码和最小DFS编码
6.5.3 最右路径扩展
6.5.4 GSpan算法原理解析
6.6 小结与习题
第7章 异常检测
7.1 引例:服务器异常用户操作检测
7.1.1 Masquerade Data数据集
7.1.2 特征提取
7.1.3 模型训练
7.1.4 模型表现评估与K值选择
7.2 近邻法
7.2.1 K近邻算法
7.2.2 KNN算法改进
7.3 密度法
7.3.1 局部异常因子算法
7.3.2 密度法进阶
7.4 自编码器
7.4.1 编码器与解码器
7.4.2 自编码器扩展
7.5 小结与习题
第三部分 实践篇
第8章 案例-皮肤病诊断
8.1 皮肤病数据集ISIC2018
8.1.1 ISIC2018分类任务数据集
8.1.2 ISIC2018分割任务数据集
8.2 皮肤病变分类
8.2.1 ResNet18模型分类
8.2.2 皮肤病分类结果
8.3 黑色素瘤病灶分割
8.3.1 UNet模型
8.3.2 Dice损失函数
8.3.3 病灶分割结果
8.4 小结
第9章 案例-股价预测
9.1 A股股票数据集
9.1.1 上证指数基本盘数据
9.1.2 Top5股票基本盘数据
9.2 A股股票收益率预测
9.2.1 LSTM模型预测
9.2.2 股价预测结果
9.3 A股股票模拟选股
9.3.1 LSTM模型预测
9.3.2 Top5股票预测结果
9.3.3 Top5股票实际收益计算
9.4 小结
第10章 案例-单细胞转录组学
10.1 单细胞数据集
10.1.1 单细胞聚类数据集
10.1.2 单细胞轨迹分析数据集
10.2 单细胞聚类
10.2.1 数据导入和预处理
10.2.2 实现单细胞聚类
10.2.3 聚类结果分析
10.3 单细胞轨迹分析
10.3.1 数据预处理
10.3.2 细胞群体划分与关系分析
10.3.3 细胞轨迹分析
10.4 小结
第11章 案例-商品共现分析与个性化推荐
11.1 商品共现分析
11.1.1 任务介绍与数据集准备
11.1.2 FP-Growth算法实现商品共现分析
11.1.3 结果分析
11.2 电商平台的个性化推荐
11.2.1 基于图神经网络进行个性化推荐
11.2.2 数据处理
11.2.3 用户-商品邻接矩阵的构建
11.2.4 NGCF模型实现
11.2.5 模型训练与测试
11.2.6 结果分析
11.3 小结
第12章 案例-农作物损害检测与成因分析
12.1 基于卷积模型的番茄叶片病害识别
12.1.1 PlantVillage数据集
12.1.2 基于病害数据的卷积模型构建与训练
12.1.3 番茄叶片病害识别准确率与模型损失
12.2 农作物异常成因分析
12.2.1 Machine Learning in Agriculture数据集
12.2.2 基于农作物环境数据的自编码器模型构建与训练
12.2.3 作物损害成因分析
12.3 小结
附录 符号表
参考文献
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-

孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-

时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-

本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...
[
