婵犵數濮烽弫鍛婃叏閻戣棄鏋侀柟闂寸绾剧粯绻涢幋鐑嗙劯婵炴垶鐟﹂崕鐔兼煏婵炲灝鍔氶柣搴弮濮婃椽宕楅懖鈹垮仦闂佸搫鎳忕划宀勬偩閻戣棄钃熼柕澶涚畱閳ь剛鏁婚弻銊モ攽閸℃侗鈧鏌$€n偆銆掔紒杈ㄥ浮閸┾偓妞ゆ帒瀚壕鍏兼叏濡灝浜归柛鐐垫暬閺岋綁鎮╅悜妯糕偓鍐偣閳ь剟鏁冮埀顒€宓勯梺鍛婄☉鏋ù婊勭矒閺屻劑寮村Δ鈧禍楣冩倵濞堝灝鏋涘褍閰i獮鎴﹀閻橆偅鏂€闁诲函缍嗘禍璺横缚婵犲洦鈷戠紓浣光棨椤忓嫷鍤曢悹铏规磪閹烘绠涢柣妤€鐗冮幏娲⒒閸屾氨澧涚紒瀣浮楠炴牠骞囬鐘殿啎閻庣懓澹婇崰鏍嵁閺嶎厽鐓熼柨婵嗘噹濡茬粯銇勯锝囩畼闁圭懓瀚伴幖褰掓偡閺夎法顔囬梻鍌氬€风欢姘跺焵椤掑倸浠滈柤娲诲灡閺呰埖瀵肩€涙ḿ鍘炬俊銈忕畳濞夋洜鑺遍崸妤佺厪闁搞儯鍔屾慨宥嗩殽閻愭潙娴鐐差儔閹粓宕卞鍡橈紙闂傚倸鍊搁崐椋庣矆娓氣偓楠炴牠顢曚綅閸ヮ剦鏁嶉柣鎰綑閳ь剝鍩栫换婵嬫濞戞艾顣哄銈冨劜瀹€鎼佸蓟濞戔懇鈧箓骞嬪┑鍥╀簮婵犵鍓濊ぐ鍐偋閹捐钃熼柨鐔哄Т缁€鍐煃閸濆嫬鈧悂寮冲Δ鍛拺濞村吋鐟х粔顒€霉濠婂骸澧版俊鍙夊姍楠炴帒螖閳ь剚鍎柣鐔哥矊闁帮絽顕i幎钘夌厸闁告劦浜為敍婊堟煛婢跺﹦澧戦柛鏂跨Ч钘熼柛顐犲劜閻撴稑霉閿濆牜娼愮€规洖鐭傞弻鈩冩媴鐟欏嫬纾抽梺杞扮劍閹瑰洭寮幘缁樻櫢闁跨噦鎷� [闂傚倸鍊搁崐鎼佸磹瀹勬噴褰掑炊椤掍礁鍓銈嗗姧缁犳垿鐛姀銈嗙厓閺夌偞澹嗛崝宥嗐亜閺傚灝顏紒杈ㄦ崌瀹曟帒顫濋钘変壕闁告縿鍎抽惌娆撴煕閺囥劌鐏犵紒鐙€鍨堕弻銊╂偆閸屾稑顏� | 闂傚倸鍊搁崐鎼佸磹閻戣姤鍤勯柤鍝ユ暩娴犳氨绱撻崒娆掑厡缂侇噮鍨跺畷婵單旈崘銊ョ亰闂佸搫鍟悧濠囧磹婵犳碍鐓㈡俊顖欒濡叉悂鏌f惔顔煎籍婵﹨娅g划娆撳箰鎼淬垺瀚抽梻浣虹《閺呮盯宕弶鎴殨闁归棿绀侀崘鈧銈嗘尵閸犳捇宕㈤鍛瘈闁汇垽娼ф禒婊堟煟韫囨梻绠炵€规洘绻傞~婵嬫嚋閻㈤潧骞愰梻浣呵归張顒勩€冮崨顔绢洸闁跨噦鎷�]

    • 机器学习中的样例选择
      • 作者:翟俊海|责编:张敏
      • 出版社:北京大学
      • ISBN:9787301357194
      • 出版日期:2024/11/01
      • 页数:226
    • 售价:19.2
  • 内容大纲

        随着数据存储技术、无线传感技术和网络技术的快速发展,数据正以前所未有的速度在不断地增长和积累。在各种实际应用中,需要处理的数据量越来越大,而样例选择是解决大数据问题的一种有效策略,是机器学习的重要数据预处理步骤,对后续学习算法的训练及性能有很大的影响。在机器学习中,样例选择有两种场景:一是主动学习中的样例选择,二是监督学习中的样例选择,本书将重点介绍这两种场景的样例选择,包括它们之间的区别与联系,样例选择的准则与启发式算法,还将介绍面向大数据机器学习的样例选择及模糊样例选择。
        本书可作为从事机器学习和数据挖掘研究科研人员的参考书,也可以作为人工智能、数据科学与技术、应用数学、计算机科学与技术等专业高年级本科生和研究生机器学习和数据挖掘课程的教学参考书。
  • 作者介绍

  • 目录

    第1章  机器学习基础
      1.1  分类问题
      1.2  K-近邻算法
      1.3  决策树
      1.4  神经网络
      1.5  极限学习机
      1.6  支持向量机
    第2章  主动学习中的样例选择
      2.1  主动学习概述
      2.2  样例选择准则
      2.3  基于信息熵的主动学习
      2.4  基于投票熵的主动学习
      2.5  基于在线序列极限学习机的主动学习
    第3章  监督学习中的样例选择
      3.1  监督学习中的样例选择概述
      3.2  压缩近邻算法及其变体
      3.3  基于组合先验熵和预测熵的样例选择算法
      3.4  基于监督聚类的样例选择算法
      3.5  基于概率神经网络的样例选择算法
      3.6  基于交叉验证策略的样例选择算法
    第4章  大数据样例选择
      4.1  大数据与大数据样例选择概述
      4.2  大数据主动学习
      4.3  基于MapReduce和投票机制的大数据样例选择
      4.4  基于局部敏感哈希和双投票机制的大数据样例选择
      4.5  基于遗传算法和开源框架的大数据样例选择
    第5章  模糊样例选择
      5.1  压缩模糊K-近邻样例选择算法
      5.2  基于MapReduce和Spark的大数据CFKNN算法
      5.3  基于模糊粗糙集技术的样例选择算法
    参考文献