-
内容大纲
本书主要总结著者多年学习、实践、探索、研究和应用Python语言机器学习的基本算法,系统全面地介绍了机器学习Scikit-learn库、数据预处理、模型评估和模型选择方法、分类、回归、聚类、降维,以及图像处理和图像识别等内容。全书重点介绍了30多种Python语言机器学习基本算法在卫生健康领域的实践。分类算法包括逻辑回归分类、线性判别分析、朴素贝叶斯分类、K近邻分类、决策树分类、随机森林分类、支持向量机分类和多层感知机分类8种;回归算法包括普通线性回归、多项式回归、岭回归、Lasso回归、K近邻回归、决策树回归、随机森林回归、支持向量回归和多层感知机回归9种;聚类算法包括K-means聚类、加速K-means聚类、谱聚类、均值转换聚类、DBSCAN聚类、层次聚类和近邻传播算法7种;降维算法包括主成分分析、核主成分分析、独立成分分析、非负矩阵分解、截断奇异值分解、线性判别分析、因子分析和特征选择8种。各种方法的实践部分主要按照基本原理简介、实践数据、实践任务、语法、实践程序和实践结果六部分进行编写。本书的案例主要来源于卫生健康相关专题调查数据摘编和著者为本书专门创建的数据,具有较好的代表性。本书的案例实践程序是在Anaconda Spyder集成开发环境中完成的。在程序部分,各条语句均有较为详尽的注释,便于读者学习理解。各案例的实践程序均具有较好的可复用性。
本书通俗易懂,注重Python语言机器学习的技术路线和基本方法实践,易学好用。主要读者对象包括卫生健康行业从业人员、高等院校预防医学和临床医学等专业本科生和研究生,以及其他对机器学习预测和评估技术有需求的人员。本书可以作为Python语言机器学习技术培训的入门级教材或参考书。 -
作者介绍
-
目录
第一章 机器学习Scikit-learn库概述
第一节 Scikit-learn机器学习简介
一、机器学习算法分类
二、Scikit-learn库的特点
三、Scikit-learn库的主要功能
四、Scikit-learn库的调用、安装、升级和卸载
五、Scikit-learn机器学习技术路线
第二节 数据预处理方法
一、数值型数据预处理方法
二、分类数据预处理方法
三、特征提取方法
四、数据预处理类的主要方法
第三节 监督学习和无监督学习算法
一、监督学习:分类与回归
二、无监督学习:聚类与降维
第四节 模型评估和选择方法
一、模型评估方法
二、模型选择方法
三、模型评估可视化方法
第二章 数据预处理
第一节 数据清理
一、实践数据
二、实践任务
三、实践程序
四、实践结果
第二节 缺失值填充
一、实践数据
二、实践任务
三、实践程序
四、实践结果
第三节 数据转化和转换
一、实践数据
二、实践任务
三、实践程序
四、实践结果
第四节 特征缩放和标准化归一化
一、实践数据
二、实践任务
三、实践程序
四、实践结果
第五节 分类变量编码和哑变量转化
一、实践数据
二、实践任务
三、实践程序
四、实践结果
第三章 模型评估和模型选择方法
第一节 回归模型评估
一、评估指标和计算方法
二、语法示例
第二节 分类模型评估
一、评估指标和计算方法
二、语法示例
第三节 交叉验证
一、交叉验证方法
二、语法
第四节 聚类模型评估
一、评估指标和计算方法
二、语法示例
第五节 工作流机器学习
一、实践数据
二、实践任务
三、Pipeline和train_test_split语法
四、实践程序
五、实践结果
第六节 模型选择
一、GridSearchCV穷举搜索法
二、RandomizedSearchCV随机搜索法
三、从多种学习算法中选择最佳模型
第四章 分类
第一节 逻辑回归分类
一、Logistic回归二分类
二、Logistic回归多分类
第二节 线性判别分析
一、实践数据
二、实践任务
三、LinearDiscriminantAnalysis语法
四、实践程序
五、实践结果
第三节 朴素贝叶斯分类
一、实践数据
二、实践任务
三、GaussianNB语法
四、实践程序
五、实践结果
第四节 K近邻分类
一、实践数据
二、实践任务
三、KNeighborsClassifier语法
四、实践程序
五、实践结果
第五节 决策树分类
一、实践数据
二、实践任务
三、DecisionTreeClassifier语法
四、实践程序
五、实践结果
第六节 随机森林分类
一、实践数据
二、实践任务
三、RandomForestClassifier语法
四、实践程序
五、实践结果
第七节 支持向量机分类
一、实践数据
二、实践任务
三、SVC语法
四、实践程序
五、实践结果
第八节 多层感知机分类
一、实践数据
二、实践任务
三、MLPClassifier语法
四、实践程序
五、实践结果
第五章 回归
第一节 普通线性回归
一、实践数据
二、实践任务
三、LinearRegression语法
四、实践程序
五、实践结果
第二节 多项式回归
一、实践数据
二、实践任务
三、PolynomialFeatures语法
四、实践程序
五、实践结果
第三节 岭回归
一、实践数据
二、实践任务
三、Ridge语法
四、实践程序
五、实践结果
第四节 Lasso回归
一、实践数据
二、实践任务
三、Lasso语法
四、实践程序
五、实践结果
第五节 K近邻回归
一、实践数据
二、实践任务
三、KNeighborsRegressor语法
四、实践程序
五、实践结果
第六节 决策树回归
一、实践数据
二、实践任务
三、DecisionTreeRegressor语法
四、实践程序
五、实践结果
第七节 随机森林回归
一、实践数据
二、实践任务
三、RandomForestRegressor语法
四、实践程序
五、实践结果
第八节 支持向量回归
一、实践数据
二、实践任务
三、SVR语法
四、实践程序
五、实践结果
第九节 多层感知机回归
一、实践数据
二、实践任务
三、MLPRegressor语法
四、实践程序
五、实践结果
第六章 聚类
第一节 K-means聚类
一、实践数据
二、实践任务
三、KMeans语法
四、实践程序
五、实践结果
第二节 加速K-means聚类
一、实践数据
二、实践任务
三、MiniBatchKMeans语法
四、实践程序
五、实践结果
第三节 谱聚类
一、实践数据
二、实践任务
三、SpectralClustering语法
四、实践程序
五、实践结果
第四节 均值转换聚类
一、实践数据
二、实践任务
三、MeanShift语法
四、实践程序
五、实践结果
第五节 DBSCAN聚类
一、实践数据
二、实践任务
三、DBSCAN语法
四、实践程序
五、实践结果
第六节 层次聚类
一、实践数据
二、实践任务
三、AgglomerativeClustering语法
四、实践程序
五、实践结果
第七节 近邻传播算法
一、实践数据
二、实践任务
三、AffinityPropagation语法
四、实践程序
五、实践结果
第七章 降维
第一节 主成分分析
一、实践数据
二、实践任务
三、PCA语法
四、实践程序
五、实践结果
第二节 核主成分分析
一、实践数据
二、实践任务
三、KernelPCA语法
四、实践程序
五、实践结果
第三节 独立成分分析
一、实践数据
二、实践任务
三、FastICA语法
四、实践程序
五、实践结果
第四节 非负矩阵分解
一、实践数据
二、实践任务
三、NMF语法
四、实践程序
五、实践结果
第五节 截断奇异值分解
一、实践数据
二、实践任务
三、TruncatedSVD语法
四、实践程序
五、实践结果
第六节 线性判别分析
一、实践数据
二、实践任务
三、LinearDiscriminantAnalysis语法
四、实践程序
五、实践结果
第七节 因子分析
一、实践数据
二、实践任务
三、FactorAnalysis语法
四、实践程序
五、实践结果
第八节 特征选择
一、实践数据
二、实践任务
三、VarianceThreshold语法
四、实践程序
五、实践结果
第八章 图像处理和图像识别
第一节 图像基本知识
一、颜色值
二、像素
三、图像坐标系
第二节 Pillow库安装及主要模块
一、安装和导入Pillow库
二、主要模块及功能
第三节 Image模块和Image类的主要功能用法
一、打开图像
二、保存图像
三、查看图像的属性
四、图像缩放
五、图像裁剪
六、图像旋转
七、图像翻转
八、新建图像
九、图像复制
十、图像粘贴
十一、图像合并
十二、图像合成
十三、改变像素生成新图像
十四、生成缩略图
十五、图像颜色直方图
十六、分解像素值
第四节 ImageStat模块图像统计
一、语法
二、用法示例程序
三、运行结果
第五节 其他模块的用法
一、图像滤镜
二、添加水印
第六节 图像数字化处理
一、实践数据
二、实践任务
三、主要技术路线
四、实践程序
五、实践结果
第七节 图像分类
一、采用单一分类算法进行图像分类
二、从多种学习算法中选择最佳模型进行图像分类
主要参考文献
同类热销排行榜
- 目送/人生三书
-
21世纪的《背影》 + 感人至深的“生死笔记”+ 龙应台亲手摄影 + 跨三代共读的人生之书!
华人世界率性犀利的一枝笔,龙应台独家...
- 顾城的诗(金版)(精)/蓝星诗库
- 人类群星闪耀时(插图本)/译林名著精选
- 牛津高阶英汉双解词典(附光盘第8版)(精)
- 文化苦旅(新版)
- 摆渡人
- 解忧杂货店(精)
- 骆驼祥子
- 曾国藩(又笨又慢平天下)
- 查令十字街84号(珍藏版)(精)
推荐书目
-

孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-

时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-

本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...
[
