-
内容大纲
随着数据存储技术、无线传感技术和网络技术的快速发展,数据正以前所未有的速度在不断地增长和积累。在各种实际应用中,需要处理的数据量越来越大,而样例选择是解决大数据问题的一种有效策略,是机器学习的重要数据预处理步骤,对后续学习算法的训练及性能有很大的影响。在机器学习中,样例选择有两种场景:一是主动学习中的样例选择,二是监督学习中的样例选择,本书将重点介绍这两种场景的样例选择,包括它们之间的区别与联系,样例选择的准则与启发式算法,还将介绍面向大数据机器学习的样例选择及模糊样例选择。
本书可作为从事机器学习和数据挖掘研究科研人员的参考书,也可以作为人工智能、数据科学与技术、应用数学、计算机科学与技术等专业高年级本科生和研究生机器学习和数据挖掘课程的教学参考书。 -
作者介绍
-
目录
第1章 机器学习基础
1.1 分类问题
1.2 K-近邻算法
1.3 决策树
1.4 神经网络
1.5 极限学习机
1.6 支持向量机
第2章 主动学习中的样例选择
2.1 主动学习概述
2.2 样例选择准则
2.3 基于信息熵的主动学习
2.4 基于投票熵的主动学习
2.5 基于在线序列极限学习机的主动学习
第3章 监督学习中的样例选择
3.1 监督学习中的样例选择概述
3.2 压缩近邻算法及其变体
3.3 基于组合先验熵和预测熵的样例选择算法
3.4 基于监督聚类的样例选择算法
3.5 基于概率神经网络的样例选择算法
3.6 基于交叉验证策略的样例选择算法
第4章 大数据样例选择
4.1 大数据与大数据样例选择概述
4.2 大数据主动学习
4.3 基于MapReduce和投票机制的大数据样例选择
4.4 基于局部敏感哈希和双投票机制的大数据样例选择
4.5 基于遗传算法和开源框架的大数据样例选择
第5章 模糊样例选择
5.1 压缩模糊K-近邻样例选择算法
5.2 基于MapReduce和Spark的大数据CFKNN算法
5.3 基于模糊粗糙集技术的样例选择算法
参考文献
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-
孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-
时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-
本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...