婵犵數濮烽弫鍛婃叏閻戣棄鏋侀柛娑橈攻閸欏繘鏌i幋锝嗩棄闁哄绶氶弻鐔兼⒒鐎靛壊妲紒鎯у⒔缁垳鎹㈠☉銏犵闁绘垵妫涢崝顖氣攽閻愭潙鐏﹂柣鐕傜畵瀹曟洟鎮㈤崗鑲╁帾婵犵數鍋涢悘婵嬪礉濮樿埖鐓熼幖鎼枛瀵喗鎱ㄦ繝鍐┿仢鐎规洘顨婇幊鏍煘閸喕娌梻鍌欑閹碱偊骞婅箛鏇炲灊鐎光偓閸曨剙浠奸梺缁樺灱濡嫰鎷戦悢鍏肩厪濠㈣埖绋撻悾閬嶆煃瑜滈崜娑㈠极婵犳艾钃熼柕濞垮劗閺€浠嬫煕閳╁啩绶遍柍褜鍓氶〃濠囧蓟閿涘嫧鍋撻敐搴′簽闁靛棙甯炵槐鎺撴綇閵娿儲璇為梺绯曟杹閸嬫挸顪冮妶鍡楃瑨閻庢凹鍓涙竟鏇㈠礂閸忕厧寮垮┑鈽嗗灠閻忔繃绂嶈ぐ鎺撶厱闁绘劕鐏氶弳顒勬煛瀹€瀣М闁诡喒鏅犻幃婊兾熺化鏇炰壕闁告劦鍠楅崑锝夋煃瑜滈崜鐔煎极閸愵喖鐒垫い鎺嗗亾鐎规挸瀚板娲川婵犲嫧妲堥柡瀣典簻闇夋繝濠傚閻帡鏌$仦璇插鐎殿喗娼欒灃闁逞屽墯缁傚秵銈i崘鈺佲偓鍨箾閸繄浠㈤柡瀣☉椤儻顦查梺甯秮閻涱噣骞嬮敃鈧~鍛存煟濮楀棗浜濋柡鍌楀亾闂備浇顕ч崙鐣岀礊閸℃ḿ顩查悹鐑樏紓姘攽閻樺弶澶勯柍閿嬪灩缁辨挻鎷呴崗澶嬶紙濡炪倕绻愮€氱兘宕甸弴銏″仯闁惧繗顫夌壕顏堟煙閻戞﹩娈旂紒鐘崇洴閺岋絽螖閳ь剟鎮ч崘顔肩婵炲樊浜濋埛鎺楁煕鐏炵偓鐨戝褎绋撶槐鎺斺偓锝庡亜濞搭喗顨ラ悙瀵稿⒌妤犵偛娲、姗€鎮╁▓鍨櫗闂佽娴烽幊鎾寸珶婵犲洤绐楅柡宥庡幘瀹撲線鏌″搴″箺闁绘挾鍠栭弻銊モ攽閸℃ê娅e┑陇灏欑划顖炲Φ閸曨垼鏁冮柨婵嗘川閻eジ姊洪崷顓熷殌閻庢矮鍗抽獮鏍亹閹烘挸浠梺鍝勵槼濞夋洟顢欓崶顒佲拻闁稿本鑹鹃埀顒勵棑濞嗐垹顫濈捄铏瑰姦濡炪倖甯掗崐鍛婄濠婂牊鐓犳繛鑼额嚙閻忥繝鏌¢崨鏉跨厫閻庝絻鍋愰埀顒佺⊕宀e潡宕㈤悙顑跨箚闁靛牆绻掗悾铏箾婢跺绀堥柤娲憾瀹曠ǹ螖娴e搫甯鹃梻浣规偠閸庮垶宕濈仦鐐弿鐎广儱妫▓浠嬫煟閹邦厽缍戞繛鎼枟椤ㄣ儵鎮欏顔煎壎闂佽鍠楃划鎾崇暦閸楃儐娼ㄩ柛鈩冿公缁辨瑩姊婚崒姘偓鎼佸磹閹间礁纾瑰瀣捣閻棗銆掑锝呬壕濡ょ姷鍋為悧鐘汇€侀弴姘辩Т闂佹悶鍎洪崜锕傚极瀹ュ鐓熼柟閭﹀幗缂嶆垿鏌嶈閸撴繈宕洪弽顐e床婵犻潧顑嗛ˉ鍫熺箾閹寸偠澹樻い锝呮惈椤啴濡堕崘銊ュ閻庡厜鍋撻柟闂寸閽冪喐绻涢幋鏃€鍣伴柍褜鍓ㄧ粻鎾荤嵁鐎n亖鏀介柛銉㈡櫃缁喖鈹戦悩娈挎毌闁告挻绻嗛妵鎰板礃椤旇棄浜遍梺瑙勫礃椤曆囨嫅閻斿吋鐓ラ柣鏂挎惈瀛濈紓浣插亾闁告劦鍠楅悡鍐煕濠靛棗顏╅柍褜鍓氶幃鍌氼嚕閸愬弬鏃堝川椤旇瀚煎┑鐐存綑閸氬鎮疯缁棃顢楅埀顒勬箒濠电姴锕ゆ鍛婃櫠閻楀牅绻嗛柛娆忣槸婵秵顨ラ悙鏉戠瑨閾绘牠鏌嶈閸撴岸宕曢锔界厽闁绘柨鎽滈惌濠囨⒑鐢喚鍒版い鏇秮楠炲酣鎸婃径灞藉箰闂備礁鎲¢崝锔界閻愮儤鏅繝濠傜墛閻撴稑顭跨捄鐚村姛濠⒀勫灴閺屾盯寮捄銊愌囨寠閻斿吋鐓曟い鎰Т閸旀粓鏌i幘瀵糕槈闂囧鏌ㄥ┑鍡欏⒈婵炲吋鍔楅埀顒冾潐濞叉牠鎯岄崒鐐茶摕闁斥晛鍟刊鎾偡濞嗗繐顏╃痪鐐▕濮婄儤娼幍顔煎闂佸湱鎳撳ú顓烆嚕椤愶箑绠荤紓浣股戝▍銏ゆ⒑鐠恒劌娅愰柟鍑ゆ嫹 [闂傚倸鍊搁崐鎼佸磹閹间礁纾归柟闂寸绾惧湱鈧懓瀚崳纾嬨亹閹烘垹鍊炲銈嗗笂缁€渚€宕滈鐑嗘富闁靛牆妫楁慨褏绱掗悩鍐茬伌闁绘侗鍣f慨鈧柕鍫濇閸樻捇鏌℃径灞戒沪濠㈢懓妫濆畷婵嗩吋閸℃劒绨婚梺鍝勫€搁悘婵嬵敂椤愩倗纾奸弶鍫涘妽瀹曞瞼鈧娲樼敮鎺楋綖濠靛鏁勯柦妯侯槷婢规洟姊洪崨濠勭細闁稿孩濞婇幆灞解枎閹惧鍘遍梺鍝勬储閸斿矂鎮橀悩鐢电<闁绘瑢鍋撻柛銊ョ埣瀵濡搁埡鍌氫簽闂佺ǹ鏈粙鎴︻敂閿燂拷 | 闂傚倸鍊搁崐鎼佸磹閹间礁纾归柟闂寸绾惧綊鏌i幋锝呅撻柛銈呭閺屻倝宕妷锔芥瘎婵炲濮靛銊ф閹捐纾兼繛鍡樺笒閸橈紕绱撴笟鍥ф珮闁搞劏娉涢悾宄扳攽閸狀喗妫冨畷姗€濡搁妷褌鍠婇梻鍌欑閹碱偊宕锔藉亱濠电姴娲ょ壕鐟扳攽閻樺磭顣查柣鎾卞灪娣囧﹪顢涘▎鎺濆妳濠碘€冲级閹倿寮婚敐鍡樺劅妞ゆ梻鍘х猾宥呪攽椤旂》榫氭繛鍜冪悼閸掓帒鈻庨幘宕囶唶闁瑰吋鐣崹铏光偓姘▕濮婄粯鎷呴搹骞库偓濠囨煛閸涱喚娲寸€规洦鍨跺鍫曞箣椤撶偞顓块梻浣哥秺濡法绮堟笟鈧畷姗€鍩€椤掆偓椤啴濡堕崱妯烘殫闂佸摜濮甸幑鍥х暦閵忋値鏁傞柛娑卞灣閻﹀牓姊哄Ч鍥х伈婵炰匠鍕浄婵犲﹤鐗婇悡鐔肩叓閸ャ劍鈷掔紒鐘靛仧閳ь剝顫夊ú妯兼崲閸岀儑缍栨繝闈涱儐閸ゅ鏌i姀銈嗘锭妤犵偞鍔欏缁樻媴閸涢潧缍婂鐢割敆閸曗斁鍋撻崘顔煎窛妞ゆ梻铏庡ú鎼佹⒑鐠恒劌娅愰柟鍑ゆ嫹]

    • 智能控制与强化学习(先进值迭代评判设计)
      • 作者:王鼎//赵明明//哈明鸣//任进|责编:哈爽
      • 出版社:人民邮电
      • ISBN:9787115633958
      • 出版日期:2024/03/01
      • 页数:236
    • 售价:55.92
  • 内容大纲

        在人工智能技术的大力驱动下,智能控制与强化学习发展迅猛,先进自动化设计与控制日新月异。本书针对复杂离散时间系统的优化调节、最优跟踪、零和博弈等问题,以实现稳定学习、演化学习和快速学习为目标,建立一套先进的值迭代评判学习控制理论与设计方法。首先,对先进值迭代框架下迭代策略的稳定性进行全面深入的分析,建立一系列适用于不同场景的稳定性判据,从理论层面揭示值迭代算法能够实现离线最优控制和在线演化控制。其次,基于迭代历史信息,提出一种新颖的收敛速度可调节的值迭代算法,有助于加快学习速度、减少计算代价,更高效地获得非线性系统的最优控制律。结合人工智能技术,对无模型值迭代评判学习控制的发展前景也进行了讨论。
        本书内容丰富、结构清晰、由浅入深、分析透彻,既可作为智能控制、强化学习、优化控制、计算智能、自适应与学习系统等领域研究人员和学生的参考书,又可供相关领域的技术人员使用。
  • 作者介绍

  • 目录

    第1章  智能评判控制的先进值迭代方法概述
      1.1  引言
      1.2  面向最优调节的值迭代算法
        1.2.1  离散时间HJB方程
        1.2.2  传统值迭代算法
        1.2.3  广义值迭代算法
        1.2.4  集成值迭代算法
        1.2.5  演化值迭代算法
        1.2.6  可调节值迭代算法
      1.3  面向最优跟踪的值迭代算法
        1.3.1  求解稳态控制的值迭代跟踪算法
        1.3.2  无稳态控制的值迭代跟踪算法
      1.4  面向零和博弈的值迭代算法
        1.4.1  离散时间HJI方程
        1.4.2  零和博弈最优调节问题
        1.4.3  零和博弈最优跟踪问题
      1.5  小结
      参考文献
    第2章  基于折扣广义值迭代的线性最优调节与稳定性分析
      2.1  引言
      2.2  问题描述
      2.3  线性系统的折扣广义值迭代算法
        2.3.1  折扣广义值迭代算法推导
        2.3.2  性能分析
      2.4  仿真实验
      2.5  小结
      参考文献
    第3章  基于折扣广义值迭代的非线性最优控制与稳定性分析
      3.1  引言
      3.2  问题描述
      3.3  非线性系统的折扣广义值迭代算法
        3.3.1  折扣广义值迭代算法推导
        3.3.2  性能分析
      3.4  仿真实验
      3.5  小结
      参考文献
    第4章  基于折扣广义值迭代的非线性智能最优跟踪
      4.1  引言
      4.2  问题描述
      4.3  面向智能最优跟踪的广义值迭代
        4.3.1  面向最优跟踪的折扣广义值迭代算法推导
        4.3.2  面向最优跟踪的折扣广义值迭代算法性质
      4.4  基于神经网络的算法实现
      4.5  仿真实验
      4.6  小结
      参考文献
    第5章  基于广义值迭代的新型事件触发最优跟踪控制
      5.1  引言
      5.2  问题描述
      5.3  基于事件的近似最优跟踪控制设计

        5.3.1  广义值迭代算法推导
        5.3.2  事件触发最优控制设计
      5.4  基于神经网络的算法实现
        5.4.1  模型网络
        5.4.2  评判网络
        5.4.3  执行网络
      5.5  仿真实验
      5.6  小结
      参考文献
    第6章  具有先进评判学习结构的广义值迭代轨迹跟踪
      6.1  引言
      6.2  问题描述
        6.2.1  传统代价函数的局限性
        6.2.2  基于新型代价函数的最优跟踪控制
      6.3  基于新型代价函数的广义值迭代算法
        6.3.1  具有新型代价函数的广义值迭代算法推导
        6.3.2  具有新型代价函数的广义值迭代算法性质
      6.4  具有新型代价函数的迭代二次启发式规划算法
        6.4.1  迭代二次启发式规划算法推导
        6.4.2  未知系统动态辨识
        6.4.3  单一神经网络算法实现
      6.5  仿真实验
      6.6  小结
      参考文献
    第7章  融合集成与演化值迭代的非线性零和博弈设计
      7.1  引言
      7.2  问题描述
      7.3  面向零和博弈的广义值迭代算法
        7.3.1  非线性零和博弃的广义值迭代算法推导
        7.3.2  线性零和博弃的广义值迭代算法推导
        7.3.3  面向零和博弈的广义值迭代算法特性
      7.4  零和博弈问题的演化值迭代控制设计
      7.5  仿真实验
      7.6  小结
      参考文献
    第8章  收敛速度可调节的新型值迭代机制
      8.1  引言
      8.2  问题描述
      8.3  新型可调节值迭代框架
        8.3.1  新型可调节值迭代算法推导
        8.3.2  新型可调节值迭代算法性质
        8.3.3  加速值迭代算法的实际设计
      8.4  仿真实验
      8.5  小结
      参考文献
    第9章  融合可调节与稳定值迭代的约束跟踪控制
      9.1  引言
      9.2  问题描述
      9.3  面向最优跟踪的可调节值迭代算法
        9.3.1  约束跟踪问题的可调节值迭代算法推导

        9.3.2  约束跟踪问题的可调节值迭代算法性质
      9.4  稳定值迭代算法及演化控制设计
        9.4.1  约束跟踪问题的稳定值迭代算法推导
        9.4.2  约束跟踪问题的稳定值迭代演化控制
      9.5  仿真实验
      9.6  小结
      参考文献
    第10章  面向非线性零和博弈的演化与增量值迭代
      10.1  引言
      10.2  问题描述
      10.3  面向零和博弈的演化值迭代算法
        10.3.1  零和博弈问题的折扣值迭代算法推导
        10.3.2  零和博弈问题的演化值迭代算法特性
      10.4  面向零和博弈的增量值迭代算法
        10.4.1  考虑历史迭代信息的值迭代算法
        10.4.2  零和博弈最优调节的增量值迭代算法
        10.4.3  零和博弈最优跟踪的增量值迭代算法
      10.5  仿真实验
      10.6  小结
      参考文献
    后记