购物车
我的订单
我的账号
帮助
全文搜索
全文搜索
商品名
作者
出版社
ISBN
立即搜索
高级搜索
使用帮助
首 页
本周新书
本月新书
热点销售
畅销排行
每周排行
每月排行
商品分类
图书
>
文学书店
>
经管书店
>
社科书店
>
艺术书店
>
教育书店
>
时尚生活
>
IT 技 术
>
建筑书店
>
科技书店
>
医药书店
>
少儿书店
影音
>
流行音乐店
>
世界音乐店
>
中国民乐店
>
影视音乐店
>
戏曲艺术店
>
电影
>
连续剧
>
教学
>
儿童
>
生活百科
共有
18
个搜索结果
强化学习
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
(英)菲尔·温德尔|责编:刘炽|译者:邹伟//康俊鹏//王伟
出版社:
中国电力
强化学习将是未来十年 在人工智能领域的最大突破 之一,强化学习算法能够使 得智能体在环境中学习任意 目标。这一令人兴奋的发展 打破了传统机器学习的算法 约束。这本实用的书向数据 科学和人工智能专业人员展 示了如何通过强化的手段使 机器能够自己学习。 本书作者创办了自己名 字命名的研究型公司,本书 涵盖了从基本的构建模块到 最先进的实践。通过本书, 你将探索强化学习的当前状 态、关注工业应用、学习大 量算法,本书还有专门章节 介绍如何将强化学习的解决 方案部署到生产环节。这并 不是一本随用随翻的工具书 ,书中包含很多数学知识, 并期望读者是熟悉机器学习 的。 学习强化学习是什么, 以及算法如何解决具体问题 。 掌握强化学习的基础知 识,包括马尔可夫决策过程 、动态规划和时间差分算法 。 深入研究一系列基于值 函数和政策梯度的算法。 应用先进的强化学习解 决方案,如元学习、分层学 习、多智能体、模仿学习等 。 了解最前沿的深度强化 学习算法,包括Rainbow、 PPO、TD3、SAC等。 通过本书专门的配套网 站获得实践代码和案例。
售价:
51.20
EASY RL(强化学习教程)
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
编者:王琦//杨毅远//江季|责编:郭媛
出版社:
人民邮电
强化学习作为机器学习 及人工智能领域的一种重要 方法,在游戏、自动驾驶、 机器人路线规划等领域得到 了广泛的应用。 本书结合了李宏毅老师 的“深度强化学习”、周博磊 老师的“强化学习纲要”、李 科浇老师的“世界冠军带你 从零实践强化学习”公开课 的精华内容,在理论严谨的 基础上深入浅出地介绍马尔 可夫决策过程、蒙特卡洛方 法、时序差分方法、Sarsa 、Q学习等传统强化学习算 法,以及策略梯度、近端策 略优化、深度Q网络、深度 确定性策略梯度等常见深度 强化学习算法的基本概念和 方法,并以大量生动有趣的 例子帮助读者理解强化学习 问题的建模过程以及核心算 法的细节。 此外,本书还提供习题 解答以及Python代码实现, 可以让读者进行端到端、从 理论到轻松实践的全生态学 习,充分掌握强化学习算法 的原理并能进行实战。 本书适合对强化学习感 兴趣的读者阅读,也可以作 为相关课程的配套教材。
售价:
39.96
深度强化学习原理与实践
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
陈喆|责编:白立军//常建丽
出版社:
清华大学
本书从原理的角度,力 求讲解清楚深度学习、强化 学习、深度强化学习中的一 些精选方法,并从实践的角 度,通过一系列循序渐进的 原创实验,引领读者独立编 程实现这些方法,以期为读 者精通深度强化学习并应用 深度强化学习方法解决实际 问题奠定坚实基础。 本书不仅适合计算机科 学与技术、人工智能、物联 网工程、数据科学与大数据 、软件工程、通信工程、电 子信息、机器人工程、自动 化、智能制造等相关专业高 年级本科生及研究生教学与 自学使用,也适合机器学习 等领域的从业者、科研人员 及爱好者自学与参考使用。
售价:
23.60
强化学习与机器人控制(精)
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
(墨)余文//阿道夫·佩鲁斯基亚|责编:王军|译者:刘晓骏
出版社:
清华大学
在《强化学习与机器人 控制》一书中,专家团队不 仅简洁明了地描述了人机交 互控制方案,还深入介绍了 新颖的无模型强化学习控制 器。本书首先简述更先进的 人机交互控制方案和强化学 习,然后讲解典型的环境模 型,最后介绍一些更著名的 参数估计识别技术。 《强化学习与机器人控 制》提供了严谨的数学推理 和演示,这有助于读者理解 控制方案和算法。书中还描 述了人机交互控制和基于强 化学习控制的稳定性和收敛 性分析。另外,还讨论了一 些前沿话题,如逆运动学和 速度运动学解决方案、神经 控制以及机器人领域未来可 能的发展趋势。 ·全面介绍基于模型的人 机交互控制。 ·详细研究基于欧拉角的 无模型人机交互控制和“人 机回圈”机制控制。 ·实际讨论机器人位置和 力控制的强化学习以及机器 人力控制的连续时间强化学 习。 ·深入研究使用强化学习 来控制最坏情况下不确定性 的机器人,并使用多智能体 强化学习对冗余机器人进行 控制。
售价:
39.20
强化学习与深度学习(通过C语言模拟)
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
(日)小高知宏|译者:张小猛
出版社:
机械工业
本书以深度学习和强化学习作为切入点,通过原 理解析、算法步骤说明、代码实现、代码运行调试, 对强化学习、深度学习以及深度强化学习进行了介绍 和说明。本书共4章。第1章介绍了人工智能、机器学 习、深度学习、强化学习的基本概念。第2章以Q学习 为例,重点介绍了强化学习的原理、算法步骤、代码 实现、代码运行调试。第3章先对深度学习的几种常见 的类型和原理进行介绍,然后给出了例程和调试方法 。第4章以Q学习中运用神经网络为例,介绍了深度强 化学习的基本原理和方法,同时也给出了例程和调试 方法。 本书适合想要获得深度学习进阶知识、强化学习 技术及其应用实践的学生、从业者,特别是立志从事 AI相关行业的人士阅读参考。
售价:
23.60
深度强化学习实战/深度学习系列
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
(美)亚历山大·扎伊//布兰登·布朗|责编:吴晋瑜|译者:李晗
出版社:
人民邮电
丛书项:
深度学习系列
本书先介绍深度强化学 习的基础知识及相关算法, 然后给出多个实战项目,以 期让读者可以根据环境的直 接反馈对智能体加以调整和 改进,进一步提升运用深度 强化学习技术解决实际问题 的能力。本书涵盖深度Q网 络、策略梯度法、演员-评 论家算法、进化算法、 Dist-DQN、多智能体强化学 习、可解释性强化学习等内 容。本书给出的实战项目紧 贴深度强化学习技术的发展 趋势,且所有项目示例以 Jupter Notebook样式给出 ,便于读者修改代码、观察 结果并及时获取经验,能够 带给读者交互式的学习体验 。
售价:
47.92
TensorFlow2强化学习手册/中外学者论AI
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
(美)普拉文·帕拉尼萨米|责编:王芳|译者:陈翔//王玺钧
出版社:
清华大学
丛书项:
中外学者论AI
深度强化学习能够构建 智能体、产品和服务,超越 计算机视觉或感知执行动作 。TensorFlow 2.x是最流行 的深度学习框架的最新主要 版本,用于开发和训练深度 神经网络。 本书介绍了深度强化学 习的基本原理和TensorFlow 的最新版本,同时也介绍了 OpenAl Gym、基于模型和 无模型的强化学习,并学习 如何开发基本智能体。同时 给出了高级深度强化学习算 法(Actor-Critic、深度确定 性策略梯度、深度Q网络、 近端策略优化和深度递归Q 网络等)的实现。
售价:
39.60
强化学习的数学原理(英文版)
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
赵世钰|责编:郭赛
出版社:
清华大学
本书从强化学习最基本 的概念开始介绍,将介绍基 础的分析工具,包括贝尔曼 公式和贝尔曼最优公式,然 后推广到基于模型的和无模 型的强化学习算法,最后推 广到基于函数逼近的强化学 法。本书强调从数学的角度 引入概念、分析问题、分析 算法,并不强调算法的编程 实现。本书不要求读者具备 任何关于强化学习的知识背 景,仅要求读者具备一定的 概率论和线性代数的知识。 如果读者已经具备强化学习 的学习基础,本书可以帮助 读者更深入地理解一些问题 并提供新的视角。 本书面向对强化学习感 兴趣的本科生、研究生、研 究人员和企业或研究所的从 业者。
售价:
47.20
网络智能化中的深度强化学习技术
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
戚琦//付霄元//庄子睿//王敬宇//廖建新|责编:代晓丽
出版社:
人民邮电
随着人工智能技术的广 泛应用,网络智能化近年来 受到广泛的关注,已经成为 下一代移动通信与未来网络 的重要技术。阿尔法围棋( AlphaGo)之后,深度强化 学习不断推陈出新,为网络 中的决策问题提供了有效的 潜在解决方案。本书系统介 绍了网络智能化中深度强化 学习的基本理论、算法及应 用场景。全书共8章,针对 互联网、移动通信网、边缘 网络、数据中心等典型网络 ,阐述了网络管理、网络控 制、任务调度等决策需求, 深入论述了深度强化学习的 模型构建与应用技术。第1 章介绍了网络智能的需求与 挑战;第2章介绍了先进的 深度强化学习模型与方法; 第3~6章论述了无线接入优 化、网络管理、网络控制与 任务调度等普遍网络管控任 务中,深度强化学习技术的 应用方法;第7章和第8章论 述了深度强化学习在流媒体 控制以及自组织网络等典型 场景中的新研究进展。 本书可为高等院校计算 机和通信相关专业的本科生 、研究生提供参考,也可供 对网络智能化与深度强化学 习领域感兴趣的研究人员和 工程技术人员参考。
售价:
59.92
强化学习入门(从原理到实践)
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
编者:叶强//闫维新//黎斌|责编:迟振春
出版社:
机械工业
强化学习主要研究的问 题是:具有一定思考和行为 能力的个体在与其所处的环 境进行交互的过程中,通过 学习策略达到收获最大化或 实现特定的目标。 本书以理论和实践相结 合的形式深入浅出地介绍强 化学习的历史、基本概念、 经典算法和一些前沿技术, 共分为三大部分:第一部分 (第1~5章)介绍强化学习 的发展历史、基本概念以及 一些经典的强化学习算法; 第二部分(第6~9章)在简 要回顾深度学习技术的基础 上着重介绍深度强化学习的 一些前沿实用算法;第三部 分(第10章)以五子棋为例 详细讲解战胜了人类顶级围 棋选手的Alpha Zero算法的 核心思想。 对于本书介绍的每一个 经典算法,我们都结合了一 定的应用场景,详细介绍如 何用Python代码来实现。 本书既可以作为计算机 专业高年级本科生及硕士生 关于人工智能领域的入门参 考读物,也可以作为对人工 智能技术(特别是强化学习 技术)感兴趣的人员理解强 化学习思想的补充读物。
售价:
31.60
强化学习(第2版)/智源人工智能丛书
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
(加)理查德·萨顿//(美)安德鲁·巴图|译者:俞凯
出版社:
电子工业
丛书项:
智源人工智能丛书
本书作为强化学习思想的深度解剖之作,被业内 公认为是一本强化学习基础理论的经典著作。它从强 化学习的基本思想出发,深入浅出又严谨细致地介绍 了马尔可夫决策过程、蒙特卡洛方法、时序差分方法 、同轨离轨策略等强化学习的基本概念和方法,并以 大量的实例帮助读者理解强化学习的问题建模过程以 及核心的算法细节。 本书适合所有对强化学习感兴趣的读者阅读、收 藏。
售价:
67.20
图强化学习(原理与实践入门)
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
编者:谢文杰//周炜星|责编:杜杨//申美莹
出版社:
清华大学
图强化学习是深度强化 学习的重要分支领域。本书 作为该领域的入门教材,在 内容上尽可能覆盖图强化学 习的基础知识,并提供应用 实践案例。全书共10章,大 致分为三部分:第一部分( 第1~3章)介绍图强化学习 研究对象(复杂系统、图和 复杂网络);第二部分(第 4~7章)介绍图强化学习基 础知识(图嵌入、图神经网 络和深度强化学习);第三 部分(第8~10章)介绍图 强化学习模型框架和应用实 践案例,并进行总结和展望 。每章都附有习题并介绍了 相关阅读材料,以便有兴趣 的读者进一步深入探索。 本书可作为高等院校计 算机、图数据挖掘及相关专 业的本科生或研究生教材, 也可供对图强化学习感兴趣 的研究人员和工程技术人员 阅读参考。
售价:
27.60
信息物理系统强化学习(网络安全示例)/计算机科学丛书
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
(美)李崇//邱美康|责编:王春华//冯秀泳|译者:卢苗苗//计湘婷//何源//席瑞//金梦
出版社:
机械工业
丛书项:
计算机科学丛书
本书通过系统介绍强化 学习领域的基础与算法,在 强化学习与信息物理系统两 个领域之间建立起联系,每 一部分都列举了一个或几个 最新的信息物理系统示例, 以帮助读者直观地理解强化 学习技术的实用性。本书分 为三个部分。第一部分对强 化学习、信息物理系统和网 络安全进行了概要介绍。第 二部分正式介绍强化学习的 框架,并对强化学习问题进 行定义,给出了两类解决方 法-基于模型的解决方案和 无模型的解决方案。第三部 分通过回顾现有的网络安全 技术并描述新兴的网络威胁 ,将注意力转移到网络安全 ,之后给出了两个案例研究 。
售价:
31.60
智能控制与强化学习(先进值迭代评判设计)
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
王鼎//赵明明//哈明鸣//任进|责编:哈爽
出版社:
人民邮电
在人工智能技术的大力 驱动下,智能控制与强化学 习发展迅猛,先进自动化设 计与控制日新月异。本书针 对复杂离散时间系统的优化 调节、最优跟踪、零和博弈 等问题,以实现稳定学习、 演化学习和快速学习为目标 ,建立一套先进的值迭代评 判学习控制理论与设计方法 。首先,对先进值迭代框架 下迭代策略的稳定性进行全 面深入的分析,建立一系列 适用于不同场景的稳定性判 据,从理论层面揭示值迭代 算法能够实现离线最优控制 和在线演化控制。其次,基 于迭代历史信息,提出一种 新颖的收敛速度可调节的值 迭代算法,有助于加快学习 速度、减少计算代价,更高 效地获得非线性系统的最优 控制律。结合人工智能技术 ,对无模型值迭代评判学习 控制的发展前景也进行了讨 论。 本书内容丰富、结构清 晰、由浅入深、分析透彻, 既可作为智能控制、强化学 习、优化控制、计算智能、 自适应与学习系统等领域研 究人员和学生的参考书,又 可供相关领域的技术人员使 用。
售价:
55.92
深度强化学习理论与实践/计算机技术开发与应用丛书
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
编者:龙强//章胜|责编:赵佳霓
出版社:
清华大学
丛书项:
计算机技术开发与应用丛书
本书比较全面、系统地 介绍了深度强化学习的理论 和算法,并配有大量的案例 和编程实现的代码。全书核 心内容可以分为3部分,第 一部分为经典强化学习,包 括第2~4章,主要内容有动 态规划法、蒙特卡罗法、时 序差分法;第二部分为深度 强化学习,包括第6~8章, 主要内容有值函数近似算法 、策略梯度算法、策略梯度 法进阶;第三部分重点介绍 深度强化学习的经典应用案 例——AlphaGo系列算法。 另外,作为理论和算法的辅 助,第1章介绍强化学习的 模型,第5章简单介绍深度 学习和PyTorch。 本书对理论、模型和算 法的描述比较数学化,笔者 力求做到用严谨、清晰、简 洁的数学语言来写作;几乎 每个算法配有一个或多个测 试案例,便于读者理解理论 和算法;每个案例都配有编 程实现的代码,便于读者理 论联系实际,并亲自上手实 践。为降低读者编写代码的 难度,本书所有案例的代码 都是可以独立运行的,并且 尽量减少了对依赖包的使用 。 本书可以作为理工科相 关专业研究生的学位课教材 ,也可以作为人工智能、机 器学习相关专业高年级本科 生的选修课教材,还可以作 为相关领域学术研究人员、 教师和工程技术人员的参考 资料。
售价:
35.60
深度强化学习(学术前沿与实战应用)/智能科学与技术丛书
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
编者:刘驰//王占健//戴子彭//马晓鑫//朴成哲等|责编:姚蕾
出版社:
机械工业
丛书项:
智能科学与技术丛书
本书共分为四篇,即深度强化学习、多智能体深 度强化学习、多任务深度强化学习和深度强化学习的 应用。由浅入深、通俗易懂,涵盖经典算法和近几年 的前沿技术进展。特别是书中详细介绍了每一种代表 性算法的代码原型实现,旨在理论与实践相结合,让 读者学有所得、学有所用。 第一篇(包含第1~3章)主要讲解深度强化学习 基础,侧重于单智能体强化学习算法,相对简单,有 助于初级读者理解,同时涵盖了近几年的经典算法和 一些前沿的研究成果。 第二篇(包含第4~5章)主要侧重于对多智能体 深度强化学习的讲解,从多智能体强化学习基本概念 到相关算法的讲解和分析,以多个极具代表性的算法 为例带领读者逐步学习多智能体训练及控制的理论与 方法。同时,还介绍了多智能体强化学习领域一些前 沿学术成果。 第三篇(包含第6~7章)扩展到多任务场景,称 为多任务深度强化学习。首先介绍了多任务强化学习 的基本概念和相关基础知识,随后讲解了部分经典的 多任务深度强化学习算法。 第四篇(包含第8~11章)主要讲解深度强化学习 的实际应用,涉及游戏、机器人控制、计算机视觉和 自然语言处理四大领域。通过领域应用中思想和方法 的讲解,培养读者跨领域解决实际问题的能力,以帮 助读者熟练掌握和使用深度强化学习这一强大的方法 来解决和优化实际工程领域中的问题。
售价:
39.60
密码学隐私增强技术导论(新一代信息技术网络空间安全高等教育系列教材)
所属分类:
电子电脑
>>
电工无线电自动化
>>
无线电电子.电讯
作者:
编者:鞠雷//刘巍然|责编:张中兴//王静//李萍|总主编:王小云//沈昌祥
出版社:
科学
本书是新一代信息技术 网络空间安全高等教育系列 教材之一。隐私增强技术允 许在对数据进行处理和分析 的同时保护数据的机密性, 并且在某些情况下还可以保 护数据的完整性及可用性, 从而既保护数据主体的隐私 ,也维护数据控制者的商业 利益。这些技术是确保数据 安全合规流通的关键。近年 来,基于密码学的隐私增强 技术在基础理论、算法协议 ,以及实际应用等方面取得 了显著进展,成为学术界和 工业界的热点议题。本书全 面介绍了包括差分隐私、同 态加密、安全多方计算、门 限签名、零知识证明等在内 的主流密码学隐私增强技术 ,从发展历程、核心原理到 算法分析进行了多维度的阐 述,并通过实例展示了它们 在人工智能和大数据等场景 中的实际应用。本书内容由 浅入深,结合理论知识与应 用实践,旨在帮助读者掌握 隐私增强技术的最新动态, 并为进一步学习与应用这些 技术打下坚实基础。
售价:
35.60
传感器与检测技术简明教程(强化课程思政工程教育和深度学习模式提质赋能特色教材)
所属分类:
电子电脑
>>
电工无线电自动化
>>
自动化技术
作者:
编者:胡蓉//胡向东|责编:张振霞
出版社:
机械工业
本书是重庆市线上线下 混合式一流课程、重庆市课 程思政示范课程配套教材, 是“十二五”普通高等教育本 科国家级规划教材《传感器 与检测技术》(胡向东主编 )的简明版。本书针对新工 科背景下的信息获取与智能 感知类创新型人才培养需求 ,瞄准传感器与检测技术系 统领域知识构建、素质提升 和能力发展目标,系统介绍 传感器与检测技术的基础概 念、基本原理、典型应用和 技术发展。内容包括概述、 传感器的基本特性、电阻式 传感器、电感式传感器、电 容式传感器、压电式传感器 、磁敏式传感器、热电式传 感器、光电式传感器、辐射 与波式传感器、新型传感器 、参数检测、误差理论与数 据处理基础、自动检测系统 。 本书以学习者为中心, 知识体系精练优化,内容与 时俱进,在线资源丰富;价 值观、方法论与知识点融会 贯通,推行“学思践创融合” 深度学习模式,强化新工科 背景下质量导向的深学善思 、质疑批判和工程实践,赋 能卓越创新,适应最新发展 。 本书可作为高等院校测 控技术与仪器、自动化、电 气工程及其自动化、机械设 计制造及其自动化、智能感 知工程、机器人工程、物联 网工程、电子与电气工程、 车辆工程、交通工程、工业 智能等专业本科生的教材, 也可供从事传感器与检测技 术相关领域应用和设计开发 的研究人员、工程技术人员 参考。
售价:
26.00
共有
18
个搜索结果
共有
1
页
第一页
上一页
下一页
最后页
转到第