-
内容大纲
当今大多数机器学习系统都是从人类的反馈中学习的。然而,大多数机器学习课程几乎只关注算法,而不是系统的人机交互部分。这可能会给从事真实世界机器学习的数据科学家留下很大的知识差距。本书是优化整个机器学习过程的实用指南,包括注释、主动学习、迁移学习技术,以及使用机器学习优化过程的每一步。作者讨论学术界在机器学习应用中对于数据构建的偏见带来的弊端,以及对于机器学习者在数据构建与使用方面的建议。 -
作者介绍
罗伯特·莫纳克(RobertMonarch),斯坦福大学博士,现在为苹果公司领导工程团队,专注于机器学习、新产品隐私保护架构等,曾为亚马逊等众多大型公司构建标注、主动学习和机器学习系统。 -
目录
第1部分 入门
第1章 人在回路机器学习导论
1.1 人在回路机器学习的基本原理
1.2 标注简介
1.2.1 简单及较为复杂的标注策略
1.2.2 填补数据科学知识空白
1.2.3 高质量的人工标注:标注为何如此困难?
1.3 主动学习简介:提升速度和降低训练数据成本
1.3.1 三种常见的主动学习采样策略:不确定性采样、多样性采样、随机采样
1.3.2 什么是随机选择的评估数据?
1.3.3 什么时候运用主动学习
1.4 机器学习与人机交互
1.4.1 用户界面:如何创建训练数据?
1.4.2 启动效应:什么会影响人类的感知?
1.4.3 通过评估机器学习预测进行标注的优缺点
1.4.4 设计标注界面的基本原则
1.5 机器学习辅助人类与人类辅助机器学习
1.6 利用迁移学习快速启动模型
1.6.1 计算机视觉中的迁移学习
1.6.2 自然语言处理中的迁移学习
1.7 本书中能学到什么
1.8 小结
第2章 人在回路机器学习入门
2.1 超越黑客式学习:第一个主动学习算法
2.2 第一个系统的架构
2.3 解释模型预测和数据以支持主动学习
2.3.1 置信度排序
2.3.2 标识离群值
2.3.3 迭代后的预期结果
2.4 构建人工标注界面
2.4.1 一个简单的文本标注界面
2.4.2 管理机器学习数据
2.5 部署你的第一个人在回路机器学习系统
2.5.1 获得评估数据总是优先事项
2.5.2 每个数据点都有机会
2.5.3 为数据选择正确的策略
2.5.4 重新训练模型并迭代
2.6 小结
第2部分 主动学习
第3章 不确定性采样
3.1 解释机器学习模型中的不确定性
3.1.1 为什么要在模型中寻找不确定性?
3.1.2 softmax函数和概率分布
3.1.3 解释主动学习的成效
3.2 不确定性采样算法
3.2.1 最低置信度采样
3.2.2 置信度边际采样
3.2.3 置信度比率采样
3.2.4 基于熵(分类熵)的采样
3.2.5 对熵的深入探讨
3.3 识别不同类型的模型何时出现混淆
3.3.1 使用logistic回归和MaxEnt模型进行不确定性采样
3.3.2 使用SVM进行不确定性采样
3.3.3 使用贝叶斯模型进行不确定性采样
3.3.4 使用决策树和随机森林进行不确定性采样
3.4 衡量多个预测结果的不确定性
3.4.1 使用集成模型进行不确定性采样
……
第3部分 标注
第4部分 针对机器学习的人机交互
同类热销排行榜
- C语言与程序设计教程(高等学校计算机类十二五规划教材)16
- 电机与拖动基础(教育部高等学校自动化专业教学指导分委员会规划工程应用型自动化专业系列教材)13.48
- 传感器与检测技术(第2版高职高专电子信息类系列教材)13.6
- ASP.NET项目开发实战(高职高专计算机项目任务驱动模式教材)15.2
- Access数据库实用教程(第2版十二五职业教育国家规划教材)14.72
- 信号与系统(第3版下普通高等教育九五国家级重点教材)15.08
- 电气控制与PLC(普通高等教育十二五电气信息类规划教材)17.2
- 数字电子技术基础(第2版)17.36
- VB程序设计及应用(第3版十二五职业教育国家规划教材)14.32
- Java Web从入门到精通(附光盘)/软件开发视频大讲堂27.92
推荐书目
-

孩子你慢慢来/人生三书 华人世界率性犀利的一枝笔,龙应台独家授权《孩子你慢慢来》20周年经典新版。她的《...
-

时间简史(插图版) 相对论、黑洞、弯曲空间……这些词给我们的感觉是艰深、晦涩、难以理解而且与我们的...
-

本质(精) 改革开放40年,恰如一部四部曲的年代大戏。技术突变、产品迭代、产业升级、资本对接...
[
