版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
人工智能ArtificialIntelligence第五章ppt課件2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)2內(nèi)容提要5.1機(jī)器學(xué)習(xí)概述
5.2歸納學(xué)習(xí)
5.3類比學(xué)習(xí)
5.4統(tǒng)計(jì)學(xué)習(xí)
5.5強(qiáng)化學(xué)習(xí)
5.6進(jìn)化計(jì)算
5.7群體智能
5.8知識(shí)發(fā)現(xiàn)
5.9小結(jié)
機(jī)器學(xué)習(xí)概述機(jī)器學(xué)習(xí)的研究目標(biāo)和困難研究目標(biāo):通用學(xué)習(xí)算法:理論分析任務(wù)和開(kāi)發(fā)用于非實(shí)用學(xué)習(xí)任務(wù)的算法認(rèn)知模型:研究人的學(xué)習(xí)的計(jì)算模型和實(shí)驗(yàn)?zāi)P凸こ棠繕?biāo):解決專門的實(shí)際問(wèn)題,并開(kāi)發(fā)完成這些任務(wù)的工程系統(tǒng)困難:學(xué)習(xí)系統(tǒng)性能的預(yù)測(cè)更加困難獲取知識(shí)的本質(zhì)還是猜想。由特定的觀察和類比生成的知識(shí)不可能證明其正確性。2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)5機(jī)器學(xué)習(xí)模型學(xué)習(xí)的一種模型環(huán)境:外部信息的來(lái)源,它將為系統(tǒng)的學(xué)習(xí)提供有關(guān)信息知識(shí)庫(kù):代表系統(tǒng)已經(jīng)具有的知識(shí)學(xué)習(xí)環(huán)節(jié):系統(tǒng)的學(xué)習(xí)機(jī)構(gòu),它通過(guò)對(duì)環(huán)境的感知取得外部信息,然后經(jīng)分析、綜合、類比、歸納等思維過(guò)程獲得知識(shí),生成新的知識(shí)或改進(jìn)知識(shí)庫(kù)的組織結(jié)構(gòu)。執(zhí)行環(huán)節(jié):基于學(xué)習(xí)后得到的新的知識(shí)庫(kù),執(zhí)行一系列任務(wù),并將運(yùn)行結(jié)果報(bào)告學(xué)習(xí)環(huán)節(jié),以完成對(duì)新知識(shí)庫(kù)的評(píng)價(jià),指導(dǎo)進(jìn)一步的學(xué)習(xí)工作,是該模型的核心。環(huán)境學(xué)習(xí)環(huán)節(jié)知識(shí)庫(kù)執(zhí)行環(huán)節(jié)2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)6機(jī)器學(xué)習(xí)發(fā)展階段機(jī)器學(xué)習(xí)的研究大致可以分為三個(gè)階段:五六十年代的探索階段:主要受神經(jīng)生理學(xué)、生理學(xué)和生物學(xué)的影響,研究主要側(cè)重于非符號(hào)的神經(jīng)元模型的研究,主要研制通用學(xué)習(xí)系統(tǒng),即神經(jīng)網(wǎng)絡(luò)或自組織系統(tǒng)。主要成果有:感知機(jī)(Perceptron)Friedberg等模擬隨機(jī)突變和自然選擇過(guò)程的程序,Hunt等的決策樹(shù)歸納程序CLS。2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)7七十年代的發(fā)展階段:由于當(dāng)時(shí)專家系統(tǒng)的蓬勃發(fā)展,知識(shí)獲取成為當(dāng)務(wù)之急,這給機(jī)器學(xué)習(xí)帶來(lái)了契機(jī),主要側(cè)重于符號(hào)學(xué)習(xí)的研究。機(jī)器學(xué)習(xí)的研究脫離了基于統(tǒng)計(jì)的以優(yōu)化理論為基礎(chǔ)的研究方法,提出了基于符號(hào)運(yùn)算為基礎(chǔ)的機(jī)器學(xué)習(xí)方法,并產(chǎn)生了許多相關(guān)的學(xué)習(xí)系統(tǒng),主要系統(tǒng)和算法包括:Winston的積木世界學(xué)習(xí)系統(tǒng);Michalski基于邏輯的歸納學(xué)習(xí)系統(tǒng)AQVAL;Michalski和Chilausky的AQ11;Quinlan的ID3程序Mitchell的版本空間方法。機(jī)器學(xué)習(xí)發(fā)展階段2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)8八九十年代至今的鼎盛階段。理論研究和應(yīng)用研究也有了新的突破,機(jī)器學(xué)習(xí)的研究進(jìn)入了全面的、系統(tǒng)化的時(shí)期。主要成果有:一方面?zhèn)鹘y(tǒng)的符號(hào)學(xué)習(xí)的各種方法已日臻完善。Michalski等將AQ11擴(kuò)充為一個(gè)多功能學(xué)習(xí)系統(tǒng)AQ15,ID3算法中使用了熵,從而使決策樹(shù)歸納得到了很大的改進(jìn)??茖W(xué)發(fā)現(xiàn)系統(tǒng)BACON開(kāi)辟了無(wú)導(dǎo)師學(xué)習(xí)的兩個(gè)重要研究領(lǐng)域。神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)在消沉了一段時(shí)期后又重新蓬勃發(fā)展起來(lái)了,同時(shí)計(jì)算機(jī)硬件技術(shù)的高速發(fā)展也為開(kāi)展大規(guī)模和高性能的人工神經(jīng)網(wǎng)絡(luò)提供了保障,使得基于神經(jīng)網(wǎng)絡(luò)的連接學(xué)習(xí)從低谷走出,發(fā)展迅猛。其中Rumelhart等人提出的BP模型,提供了一個(gè)訓(xùn)練多層網(wǎng)絡(luò)的實(shí)際可行的方法,克服了Perceptron的大部分局限性。機(jī)器學(xué)習(xí)發(fā)展階段2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)9另一方面,機(jī)器學(xué)習(xí)的基礎(chǔ)理論的研究越來(lái)越引起人們的重視。1984年美國(guó)學(xué)者Valiant提出了基于概率近似正確性的學(xué)習(xí)理論(PAC學(xué)習(xí)),對(duì)布爾函數(shù)的一些特殊子類的可學(xué)習(xí)性進(jìn)行了探討,將可學(xué)習(xí)性與計(jì)算復(fù)雜性聯(lián)系在一起,并由此派生出了“計(jì)算學(xué)習(xí)理論”(COLT)1995年,Vapnik出版了“統(tǒng)計(jì)學(xué)習(xí)理論”一書(shū)。對(duì)PAC的研究是一種理論性,存在性的;Vapnik的研究卻是構(gòu)造性的,他將這類研究模型稱為支持向量機(jī)SVM(SupportVectorMachine)。機(jī)器學(xué)習(xí)發(fā)展階段2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)10機(jī)器學(xué)習(xí)概述機(jī)器學(xué)習(xí)的研究方法1、演繹學(xué)習(xí):是一種常規(guī)的邏輯推理方法。其推理的過(guò)程就是從公理出發(fā),經(jīng)過(guò)邏輯變換,推導(dǎo)出結(jié)論。2、歸納學(xué)習(xí):環(huán)境或教師提供一系列正例和反例,通過(guò)歸納推理,機(jī)器將這些例子進(jìn)行推廣,產(chǎn)生一個(gè)或一組一般的概念描述。3、類比學(xué)習(xí):利用兩個(gè)不同領(lǐng)域(目標(biāo)域和源域)知識(shí)的相似性,從源域的知識(shí)(包括相似的特征和其他特征)推斷出目標(biāo)域的相應(yīng)知識(shí)的推理方法。4、統(tǒng)計(jì)學(xué)習(xí):基于數(shù)據(jù)構(gòu)建概率統(tǒng)計(jì)模型并運(yùn)用模型對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè)與分析。5、強(qiáng)化學(xué)習(xí):又稱激勵(lì)學(xué)習(xí),是從環(huán)境到行為映射的學(xué)習(xí),以使獎(jiǎng)勵(lì)信號(hào)函數(shù)值最大。6.進(jìn)化學(xué)習(xí):是研究利用自然進(jìn)化和適應(yīng)思想的計(jì)算系統(tǒng)。2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)112024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)12內(nèi)容提要5.1機(jī)器學(xué)習(xí)概述
5.2歸納學(xué)習(xí)
5.3類比學(xué)習(xí)
5.4統(tǒng)計(jì)學(xué)習(xí)
5.5強(qiáng)化學(xué)習(xí)
5.6進(jìn)化計(jì)算
5.7群體智能
5.8知識(shí)發(fā)現(xiàn)
5.9小結(jié)
歸納學(xué)習(xí)歸納學(xué)習(xí)(InductiveLearning)就是從個(gè)別到一般,根據(jù)某個(gè)概念的一系列已知的正例和反例,從中歸納出一個(gè)一般的概念描述旨在從大量的經(jīng)驗(yàn)數(shù)據(jù)中歸納抽取出一般的判定規(guī)則和模式。是機(jī)器學(xué)習(xí)中最核心、最成熟的分支。歸納學(xué)習(xí)也稱為:經(jīng)驗(yàn)學(xué)習(xí):歸納學(xué)習(xí)依賴于經(jīng)驗(yàn)數(shù)據(jù)基于相似性的學(xué)習(xí):歸納學(xué)習(xí)依賴于數(shù)據(jù)間的相似形歸納的操作:泛化(Generalization):擴(kuò)展某假設(shè)的語(yǔ)義信息,使其能夠包含更多的正例特化(Specialization):泛化的相反操作,用于限制概念描述的應(yīng)用范圍2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)13歸納學(xué)習(xí)歸納學(xué)習(xí)的分類和研究領(lǐng)域:符號(hào)學(xué)習(xí)監(jiān)督學(xué)習(xí):實(shí)例學(xué)習(xí):系統(tǒng)事先將訓(xùn)練例子(經(jīng)驗(yàn)數(shù)據(jù))分類:正、負(fù)例子。由于它產(chǎn)生規(guī)則,所以也稱為概念學(xué)習(xí)無(wú)監(jiān)督學(xué)習(xí):事先不知道訓(xùn)練例子的分類概念聚類:機(jī)器發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò):本質(zhì)上是實(shí)例學(xué)習(xí),為區(qū)別起見(jiàn),稱為聯(lián)結(jié)學(xué)習(xí)學(xué)習(xí)的計(jì)算理論傳統(tǒng)的算法復(fù)雜性分析概率近似正確性學(xué)習(xí)研究(計(jì)算學(xué)習(xí)理論)2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)14實(shí)例學(xué)習(xí)基本思想:環(huán)境提供給系統(tǒng)一些特殊的實(shí)例,這些例子事先由施教者劃分為正例和反例。實(shí)例學(xué)習(xí)由此進(jìn)行歸納推理,產(chǎn)生適用于更大范圍的一般性知識(shí),得到一般的規(guī)則,它將覆蓋所有的正例并排除所有的反例。環(huán)境提供給學(xué)習(xí)環(huán)境的例子是低水平的信息,這是在特殊情況下執(zhí)行環(huán)節(jié)的行為。學(xué)習(xí)環(huán)節(jié)歸納出的規(guī)則是高水平的信息,可以在一般情況下用這些規(guī)則指導(dǎo)執(zhí)行環(huán)節(jié)的工作2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)15實(shí)例學(xué)習(xí)例子空間要考慮的問(wèn)題:示教例子的質(zhì)量例子空間的組織和搜索方法規(guī)則空間要考慮的問(wèn)題形成知識(shí)的歸納推理方法搜索規(guī)則空間的方法對(duì)規(guī)則空間的要求例子空間規(guī)則空間選擇例子解釋例子2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)16實(shí)例學(xué)習(xí)按規(guī)則空間搜索方法分類:數(shù)據(jù)驅(qū)動(dòng)方法:變型空間方法:采用統(tǒng)一的形式表示規(guī)則和例子。改進(jìn)假設(shè)方法:例子和規(guī)則的表示不統(tǒng)一。程序根據(jù)例子選擇一種操作,用該操作修改H中的規(guī)則模型驅(qū)動(dòng)方法:產(chǎn)生和測(cè)試方法:針對(duì)示教例子反復(fù)產(chǎn)生和測(cè)試假設(shè)的規(guī)則。利用基于模型的知識(shí)產(chǎn)生假設(shè)的規(guī)則,便于只產(chǎn)生可能合理的假設(shè)方案示例方法:使用規(guī)則方案的集合來(lái)限制可能合理的規(guī)則形式,最符合示教例子的規(guī)則被認(rèn)為是最合理的規(guī)則2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)17實(shí)例學(xué)習(xí)按任務(wù)的復(fù)雜性劃分為:學(xué)習(xí)單個(gè)概念:由系統(tǒng)提供的某個(gè)概念的正例和反例,只要求系統(tǒng)歸納出一個(gè)概念的描述規(guī)則學(xué)習(xí)多個(gè)概念:要求歸納出多個(gè)相互獨(dú)立的概念學(xué)習(xí)執(zhí)行多步任務(wù):執(zhí)行環(huán)節(jié)使用一個(gè)操作序列去完成任務(wù),即執(zhí)行環(huán)節(jié)進(jìn)行任務(wù)規(guī)劃。因此,歸納出的規(guī)則應(yīng)該是進(jìn)行任務(wù)規(guī)劃的規(guī)則2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)18變型空間方法基本思想:以整個(gè)規(guī)則空間為初始的假設(shè)規(guī)則集合H,根據(jù)示教例子中的信息,對(duì)集合H進(jìn)行一般化或特殊化處理,逐步縮小集合H,最后使H收斂為只含要求的規(guī)則。規(guī)則空間中的偏序關(guān)系:它是按一般性和特殊性來(lái)建立的一種概念之間的關(guān)系排序后的變形空間:最上面:是最一般的規(guī)則(概念),是沒(méi)有描述的點(diǎn),所有的例子都符合這一概念最下面一行的各點(diǎn):是示教正例對(duì)應(yīng)的概念,每個(gè)點(diǎn)的概念只符合一個(gè)正例2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)19假設(shè)規(guī)則的集合H:H是規(guī)則空間的子集H中最一般的元素組成的子集稱為G集合H中最特殊的元素組成的子集稱為S集合在規(guī)則空間中,H是G和S中間的一段??梢杂肎和S來(lái)表示H變型空間方法:初始:G是最上面一個(gè)點(diǎn),S是最下面的直線(示教正例),H為整個(gè)規(guī)則空間搜索過(guò)程:G下移,S上移,H逐步縮小。結(jié)果:H收斂為只含一個(gè)要求的概念變型空間方法2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)20消除侯選元素算法(1)正規(guī)的初始H集是整個(gè)規(guī)則空間,這時(shí)S包含所有可能的示教正例(最特殊的概念)。(2)接收一個(gè)新的示教例子。如果是正例:去掉G中不覆蓋新正例的概念,然后修改S為由新正例和S原有的元素共同歸納出的最特殊的結(jié)果如果是反例:從S中去掉覆蓋該反例的概念;然后修改G為由新反例和G原有元素共同特殊化為最一般的結(jié)果(3)若G=S,且是單元集合,則轉(zhuǎn)(4),否則轉(zhuǎn)(2)(4)輸出H中的概念(即G和S)變型空間方法2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)21變型空間法的缺點(diǎn)(1)抗干擾能力差變形空間法是數(shù)據(jù)驅(qū)動(dòng)的方法,所有數(shù)據(jù)驅(qū)動(dòng)的方法都難以處理有干擾的訓(xùn)練例子算法得到的概念應(yīng)滿足每個(gè)示教例子的要求,所以一個(gè)錯(cuò)誤的例子會(huì)造成很大的影響(2)無(wú)法發(fā)現(xiàn)析取概念變型空間方法2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)22決策樹(shù)學(xué)習(xí)決策樹(shù)通過(guò)把實(shí)例從根節(jié)點(diǎn)排列到某個(gè)葉子節(jié)點(diǎn)來(lái)分類實(shí)例。葉子節(jié)點(diǎn)即為實(shí)例所屬的分類樹(shù)上每個(gè)節(jié)點(diǎn)說(shuō)明了對(duì)實(shí)例的某個(gè)屬性的測(cè)試節(jié)點(diǎn)的每個(gè)后繼分支對(duì)應(yīng)于該屬性的一個(gè)可能值正實(shí)例:產(chǎn)生正值決策的實(shí)例負(fù)實(shí)例:產(chǎn)生負(fù)值決策的實(shí)例決策樹(shù)代表實(shí)例屬性值約束的合取的析取式。從樹(shù)根到樹(shù)葉的每一條路徑對(duì)應(yīng)一組屬性測(cè)試的合取,樹(shù)本身對(duì)應(yīng)這些合取的析取2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)23決策樹(shù)學(xué)習(xí)例子InstancesNo.ofwingsBrokenwingsLivingstatusWingarea/weightFly120Alive2.5True221Alive2.5False322Alive2.6False420Alive3.0True520Dead3.2False600Alive0False710Alive0False820Alive3.4True920alive2.0False2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)24ID3算法1、是利用信息論原理對(duì)大量樣本的屬性進(jìn)行分析和歸納而產(chǎn)生的。2、決策樹(shù)的根結(jié)點(diǎn)是所有樣本中信息量最大的屬性。樹(shù)的中間結(jié)點(diǎn)是該結(jié)點(diǎn)為根的子樹(shù)所包含的樣本子集中信息量最大的屬性。決策樹(shù)的葉結(jié)點(diǎn)是樣本的類別值。3.用信息增益(即信息論中的互信息)來(lái)選擇屬性作為決策樹(shù)的結(jié)點(diǎn)。2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)25決策樹(shù)學(xué)習(xí)熵(entropy):給定有關(guān)某概念的正例和負(fù)例的集合S。對(duì)此BOOLEAN分類的熵為:Entropy(S)=-poslog2(pos)–neglog2(neg)“pos”和”neg”分別表示S中正例和負(fù)例的比例。并定義:0log2(0)=0如果分類器有c個(gè)不同的輸出,則:Entropy(S)=-ci=1pilog2(pi)pi表示S中屬于類i的比例2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)26決策樹(shù)學(xué)習(xí)例1:p1=p2=1/2H1=-(1/2)*log2(1/2)-(1/2)*log2(1/2)=1例2:p1=1/4p2=3/4H2=-(1/4)*log2(1/4)-(3/4)*log2(3/4)=0.81例3:p1=1p2=0H3=-1*log21=02024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)27決策樹(shù)學(xué)習(xí)實(shí)例集合S中屬性A的信息增益為:Gain(S,A)=Entropy(S)-(|SV|/|S|)Entropy(Sv)vvaluesofASv表示S的子集,其屬性A的值為V2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)28決策樹(shù)學(xué)習(xí)思路:考察任一個(gè)屬性,計(jì)算其熵值;對(duì)這個(gè)特定屬性,考察根據(jù)其不同的屬性值分成的若干子集;對(duì)任意子集,考察不同的類別,計(jì)算其熵值并求和;從所有屬性中,選擇熵值最?。ɑ蛟鲆孀畲螅┑膶傩宰鳛楫?dāng)前決策節(jié)點(diǎn)。2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)292024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)30內(nèi)容提要5.1機(jī)器學(xué)習(xí)概述
5.2歸納學(xué)習(xí)
5.3類比學(xué)習(xí)
5.4統(tǒng)計(jì)學(xué)習(xí)
5.5強(qiáng)化學(xué)習(xí)
5.6進(jìn)化計(jì)算
5.7群體智能
5.8知識(shí)發(fā)現(xiàn)
5.9小結(jié)
31類比學(xué)習(xí)類比學(xué)習(xí)類比學(xué)習(xí)(learningbyanalogy)就是通過(guò)類比,即通過(guò)對(duì)相似事物加以比較所進(jìn)行的一種學(xué)習(xí)。其推理過(guò)程如下: 回憶與聯(lián)想選擇建立對(duì)應(yīng)關(guān)系轉(zhuǎn)換 P(a)∧Q(a),P(a)≌P(b)├Q(b)Q(a)2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)32類比學(xué)習(xí)主要包括如下四個(gè)過(guò)程:輸入一組已知條件和一組未完全確定的條件。對(duì)兩組出入條件尋找其可類比的對(duì)應(yīng)關(guān)系。根據(jù)相似轉(zhuǎn)換的方法,進(jìn)行映射。對(duì)類推得到的知識(shí)進(jìn)行校驗(yàn)。類比學(xué)習(xí)2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)33發(fā)展簡(jiǎn)況1971年,Kling,R.E.,StanfordResearchInstitute,發(fā)表文章“AParadigmforReasoningbyAnalogy”提出了記憶網(wǎng)模型和案例檢索算法。1981年,JaimeG.Carbonell,Carnegie-MellonUniversity,發(fā)表文章“AComputationalModelofAnalogicalProblemSolving”,提出了轉(zhuǎn)換類比1983年,JaimeG.Carbonell,發(fā)表文章“DerivationalAnalogyanditsroleinProblemSolving”,提出了派生類比1991年,JaimeG.Carbonell等,發(fā)表文章“PRODIGY:AnIntegratedArchitectureforPlanningandLearning”,開(kāi)發(fā)了PRODIGY系統(tǒng)。2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)34類比的形式定義ABA’B’αα’ββ’類比問(wèn)題求解的一般模式2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)35轉(zhuǎn)換類比2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)36手段-目的分析的問(wèn)題求解模型問(wèn)題空間:一組可能的問(wèn)題組合狀態(tài)集。一個(gè)初始狀態(tài)。一個(gè)或多個(gè)目標(biāo)狀態(tài)。一組變換規(guī)則集差別函數(shù)對(duì)可用規(guī)則編序的索引函數(shù)一組全局路徑限制差別表S-MEA算法2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)37比較當(dāng)前狀態(tài)和目標(biāo)狀態(tài),得出差別選擇合適的規(guī)則,以減少兩個(gè)狀態(tài)間的差別盡可能應(yīng)用轉(zhuǎn)換規(guī)則,直至完成狀態(tài)轉(zhuǎn)換。否則保存當(dāng)前狀態(tài),并將MEA算法遞歸地應(yīng)用于其它子問(wèn)題,直到該子問(wèn)題確認(rèn)不能滿足該規(guī)劃的前提條件為止。當(dāng)子問(wèn)題求解后,恢復(fù)被保存的當(dāng)前狀態(tài),再繼續(xù)求解原來(lái)的問(wèn)題2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)38類比求解問(wèn)題的計(jì)算模型EMEA的T-空間包括:轉(zhuǎn)換空間中每個(gè)狀態(tài)是初始問(wèn)題的潛在解,包括初始狀態(tài)、最終狀態(tài)、操作符序列以及路徑限制。初始狀態(tài):O-空間中檢索到的相似問(wèn)題的解序列。目標(biāo)狀態(tài):求解新問(wèn)題的解的規(guī)范說(shuō)明。操作符將一個(gè)完整的解序列映射到另一個(gè)潛在的解序列。差別函數(shù):新問(wèn)題情況下檢索解的初始狀態(tài)、中止?fàn)顟B(tài)、路徑的約束和應(yīng)用度之間的差別測(cè)度的綜合。差別表:用來(lái)檢索T-空間的操作。沒(méi)有路徑約束,可用更為復(fù)雜的差別函數(shù)補(bǔ)償??捎脝l(fā)式函數(shù)作為規(guī)則排序。2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)39基于案例推理人們?yōu)榱私鉀Q一個(gè)新問(wèn)題,先是進(jìn)行回憶,從記憶中找到一個(gè)與新問(wèn)題相似的案例,然后把該案例中的有關(guān)信息和知識(shí)復(fù)用到新問(wèn)題的求解之中。在基于案例推理(Case-BasedReasoning,簡(jiǎn)稱CBR)中,把當(dāng)前所面臨的問(wèn)題或情況稱為目標(biāo)案例(targetcase),而把記憶的問(wèn)題或情況稱為源案例(basecase)。粗略地說(shuō),基于案例推理就是由目標(biāo)案例的提示而獲得記憶中的源案例,并由源案例來(lái)指導(dǎo)目標(biāo)案例求解的一種策略。2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)40
基于案例學(xué)習(xí)的一般過(guò)程CBR的過(guò)程模型2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)412024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)42遷移學(xué)習(xí)遷移學(xué)習(xí)(transferlearning)的目標(biāo)是將從一個(gè)環(huán)境中學(xué)到的知識(shí)用來(lái)幫助新環(huán)境中的學(xué)習(xí)任務(wù)。在傳統(tǒng)分類學(xué)習(xí)中,為了保證訓(xùn)練得到的分類模型具有準(zhǔn)確性和高可靠性,都有兩個(gè)基本的假設(shè):①用于學(xué)習(xí)的訓(xùn)練樣本與新的測(cè)試樣本滿足獨(dú)立同分布的條件;②必須有足夠可利用的訓(xùn)練樣本才能學(xué)習(xí)得到一個(gè)好的分類模型。但是,在實(shí)際應(yīng)用中發(fā)現(xiàn)要滿足這兩個(gè)條件往往是困難的。遷移學(xué)習(xí)是運(yùn)用已有的知識(shí)對(duì)不同但相關(guān)領(lǐng)域問(wèn)題進(jìn)行求解。它放寬了傳統(tǒng)機(jī)器學(xué)習(xí)中的兩個(gè)基本假設(shè),目的是遷移已有的知識(shí)來(lái)解決目標(biāo)領(lǐng)域中僅有少量有標(biāo)簽樣本數(shù)據(jù)甚至沒(méi)有的學(xué)習(xí)問(wèn)題。2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)43內(nèi)容提要5.1機(jī)器學(xué)習(xí)概述
5.2歸納學(xué)習(xí)
5.3類比學(xué)習(xí)
5.4統(tǒng)計(jì)學(xué)習(xí)
5.5強(qiáng)化學(xué)習(xí)
5.6進(jìn)化計(jì)算
5.7群體智能
5.8知識(shí)發(fā)現(xiàn)
5.9小結(jié)
2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)44統(tǒng)計(jì)學(xué)習(xí)統(tǒng)計(jì)方法是從事物的外在數(shù)量上的表現(xiàn)去推斷該事物可能的規(guī)律性??茖W(xué)規(guī)律性的東西一般總是隱藏得比較深,最初總是從其數(shù)量表現(xiàn)上通過(guò)統(tǒng)計(jì)分析看出一些線索,然后提出一定的假說(shuō)或?qū)W說(shuō),作進(jìn)一步深入的理論研究。當(dāng)理論研究提出一定的結(jié)論時(shí),往往還需要在實(shí)踐中加以驗(yàn)證。就是說(shuō),觀測(cè)一些自然現(xiàn)象或?qū)iT安排的實(shí)驗(yàn)所得資料,是否與理論相符、在多大的程度上相符、偏離可能是朝哪個(gè)方向等等問(wèn)題,都需要用統(tǒng)計(jì)分析的方法處理。列聯(lián)表及列聯(lián)表分析研究?jī)蓚€(gè)屬性變量之間是否有聯(lián)系研究步驟:通過(guò)問(wèn)卷調(diào)查或統(tǒng)計(jì)資料獲得屬性變量的信息整理問(wèn)卷或統(tǒng)計(jì)資料獲得列聯(lián)表數(shù)據(jù)通過(guò)統(tǒng)計(jì)假設(shè)檢驗(yàn)兩個(gè)屬性變量是否具有獨(dú)立性2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)45
邏輯回歸基本理論和方法研究某一事件發(fā)生的概率P=P(y=1)與若干因素之間的關(guān)系
在0和1之間任意范圍之間的數(shù)量若干個(gè)狀態(tài)的標(biāo)量2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)46邏輯回歸模型人們通常把p的某個(gè)函數(shù)f(p)假設(shè)為變量的函數(shù)形式,取稱之為logit函數(shù),也叫邏輯變換。因此,邏輯變換是取列聯(lián)表中優(yōu)勢(shì)的對(duì)數(shù)。當(dāng)概率在0-1取值時(shí),Logit可以取任意實(shí)數(shù),避免了線性概率模型的結(jié)構(gòu)缺陷。2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)47邏輯變換logistic變換Logistic回歸模型
優(yōu)勢(shì)比2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)48概率p的預(yù)測(cè)P與多因素之間的關(guān)系預(yù)測(cè)2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)49P與單因素之間的關(guān)系圖px1最可能成功范圍最不可能成功范圍2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)50回歸系數(shù)的含義優(yōu)勢(shì)比(OddsRatio)—事件發(fā)生與不發(fā)生的概率比優(yōu)勢(shì)比與單變量系數(shù)之間的關(guān)系
2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)51支持向量機(jī)支持向量機(jī)(supportvectormachine:SVM)是一種二類分類方法,它的基本模型是定義在特征空間上的間隔最大的線性分類器。支持向量機(jī)方法是建立在統(tǒng)計(jì)學(xué)習(xí)理論的VC
維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小原理基礎(chǔ)上的。它在解決小樣本、非線性及高維模式識(shí)別中表現(xiàn)出許多特有的優(yōu)勢(shì),并能夠推廣應(yīng)用到函數(shù)擬合等其他機(jī)器學(xué)習(xí)問(wèn)題中。2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)52統(tǒng)計(jì)學(xué)習(xí)問(wèn)題學(xué)習(xí)問(wèn)題的表示學(xué)習(xí)的目的就是,在聯(lián)合概率分布函數(shù)F(x,y)未知、所有可用的信息都包含在訓(xùn)練集中的情況下,尋找函數(shù)f(x,w0),使它(在函數(shù)類f(x,w),(wW)上最小化風(fēng)險(xiǎn)泛函模式別別問(wèn)題2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)53經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則(ERM)
最小化經(jīng)驗(yàn)風(fēng)險(xiǎn)(訓(xùn)練樣本錯(cuò)誤率)用ERM準(zhǔn)則代替期望風(fēng)險(xiǎn)最小化并沒(méi)有經(jīng)過(guò)充分的理論論證,只是直觀上合理的想當(dāng)然做法這種思想?yún)s在多年的機(jī)器學(xué)習(xí)方法研究中占據(jù)了主要地位。人們多年來(lái)將大部分注意力集中到如何更好地最小化經(jīng)驗(yàn)風(fēng)險(xiǎn)上。而實(shí)際上,即使可以假定當(dāng)n趨向于無(wú)窮大時(shí)經(jīng)驗(yàn)風(fēng)險(xiǎn)也不一定趨近于期望風(fēng)險(xiǎn),在很多問(wèn)題中的樣本數(shù)目也離無(wú)窮大相去甚遠(yuǎn),如神經(jīng)網(wǎng)絡(luò)。2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)54學(xué)習(xí)機(jī)器實(shí)際風(fēng)險(xiǎn)的界學(xué)習(xí)機(jī)器實(shí)際風(fēng)險(xiǎn)的界其中n樣本數(shù)量,h是VC維,Φ是遞減函數(shù)兩種方法:神經(jīng)網(wǎng)絡(luò):保持置信范圍固定(通過(guò)選擇一個(gè)適當(dāng)構(gòu)造的機(jī)器)并最小化經(jīng)驗(yàn)風(fēng)險(xiǎn)。支持向量機(jī)(SVM):保持經(jīng)驗(yàn)風(fēng)險(xiǎn)固定(比如等于零)并最小化置信范圍。2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)55結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則函數(shù)集Fk={F(x,w);w∈Wk},k=1,2,…,nF1F2…FnVC維:h1≤h2≤…≤hn在使保證風(fēng)險(xiǎn)(風(fēng)險(xiǎn)的上界)最小的子集中選擇使經(jīng)驗(yàn)風(fēng)險(xiǎn)最小的函數(shù)2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)562024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)57
Sn
S*經(jīng)驗(yàn)風(fēng)險(xiǎn)Empiricalrisk置信范圍Confidenceinterval風(fēng)險(xiǎn)界限Boundontheriskh1h*hnhS1S*Sn結(jié)構(gòu)風(fēng)險(xiǎn)最小化歸納原則(SRM)最大間隔分類器不但能將兩類正確分開(kāi),而且使分類間隔最大。h≤min([R2A2],N)+12024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)582024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)59考慮2維空間中極端直線之間的間隔情況求出兩條極端直線的距離:如何計(jì)算分劃間隔?特征空間與核函數(shù)Mercer定理:要保證L2(C)下的對(duì)稱函數(shù) 能以正的系數(shù)展開(kāi)成(即描述了在某個(gè)特征空間中的一個(gè)積),其中緊集,充分必要條件是,對(duì)使得的所有,條件成立。2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)60特征空間與核函數(shù)Mercer核多項(xiàng)式核高斯徑向基函數(shù)核Sigmoid核(只在部分參數(shù)值情況下才滿足核函數(shù)的定義)2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)612024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)62提升方法弱學(xué)習(xí)機(jī)(weaklearner):對(duì)一定分布的訓(xùn)練樣本給出假設(shè)(僅僅強(qiáng)于隨機(jī)猜測(cè)) 根據(jù)有云猜測(cè)可能會(huì)下雨強(qiáng)學(xué)習(xí)機(jī)(stronglearner):根據(jù)得到的弱學(xué)習(xí)機(jī)和相應(yīng)的權(quán)重給出假設(shè)(最大程度上符合實(shí)際情況:almostperfectexpert) 根據(jù)CNN,ABC,CBS以往的預(yù)測(cè)表現(xiàn)及實(shí)際天氣情況作出綜合準(zhǔn)確的天氣預(yù)測(cè)弱學(xué)習(xí)機(jī)強(qiáng)學(xué)習(xí)機(jī)Boosting2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)63提升方法過(guò)程:在一定的權(quán)重條件下訓(xùn)練數(shù)據(jù),得出分類法Ct根據(jù)Ct的錯(cuò)誤率調(diào)整權(quán)重SetofweightedinstancesClassifierCt
trainclassifier
adjustweights2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)64提升流程(loop1)強(qiáng)學(xué)習(xí)機(jī)弱學(xué)習(xí)機(jī)原始訓(xùn)練集加權(quán)后的訓(xùn)練集加權(quán)后的假設(shè)X>1?1:-1弱假設(shè)2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)65提升流程(loop2)強(qiáng)學(xué)習(xí)機(jī)弱學(xué)習(xí)機(jī)原始訓(xùn)練集加權(quán)后的訓(xùn)練集加權(quán)后的假設(shè)Y>3?1:-1弱假設(shè)2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)66提升流程(loop3)強(qiáng)學(xué)習(xí)機(jī)弱學(xué)習(xí)機(jī)原始訓(xùn)練集加權(quán)后的訓(xùn)練集加權(quán)后的假設(shè)Z>7?1:-1弱假設(shè)2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)67內(nèi)容提要5.1機(jī)器學(xué)習(xí)概述
5.2歸納學(xué)習(xí)
5.3類比學(xué)習(xí)
5.4統(tǒng)計(jì)學(xué)習(xí)
5.5強(qiáng)化學(xué)習(xí)
5.6進(jìn)化計(jì)算
5.7群體智能
5.8知識(shí)發(fā)現(xiàn)
5.9小結(jié)
強(qiáng)化學(xué)習(xí)人類(通常)從與外界環(huán)境的交互中學(xué)習(xí)。但是,動(dòng)作的反饋并不總是立即的和直接的。例如,經(jīng)常需要比較長(zhǎng)時(shí)間才能充分知道我們的動(dòng)作所得出的結(jié)果。在強(qiáng)化學(xué)習(xí)中,學(xué)習(xí)系統(tǒng)根據(jù)從環(huán)境中反饋的信號(hào)的狀態(tài)(獎(jiǎng)勵(lì)/懲罰),調(diào)整系統(tǒng)的參數(shù)。強(qiáng)化學(xué)習(xí)由于其方法的通用性,對(duì)學(xué)習(xí)背景知識(shí)要求較少,以及適用于復(fù)雜、動(dòng)態(tài)的環(huán)境等特點(diǎn),在近年,引起了許多研究者的注意,成為機(jī)器學(xué)習(xí)的主要的方式之一。強(qiáng)化學(xué)習(xí)一般比較困難,主要是因?yàn)閷W(xué)習(xí)系統(tǒng)并不知道哪個(gè)動(dòng)作是正確的,也不知道哪個(gè)獎(jiǎng)懲賦予哪個(gè)動(dòng)作。2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)68強(qiáng)化學(xué)習(xí)強(qiáng)化學(xué)習(xí)由四部分組成:策略π,報(bào)酬函數(shù)r,值映射V和環(huán)境的模型。策略π:定義在任何給定時(shí)刻學(xué)習(xí)系統(tǒng)的選擇和動(dòng)作的方法。這樣,策略可以通過(guò)一組產(chǎn)生式規(guī)則或者一個(gè)簡(jiǎn)單的查找表來(lái)表示。報(bào)酬函數(shù)r:定義了在時(shí)刻t問(wèn)題的狀態(tài)/目標(biāo)關(guān)系。它把每個(gè)動(dòng)作,或更精細(xì)的每個(gè)狀態(tài)-響應(yīng)對(duì),映射為一個(gè)報(bào)酬量,以指出那個(gè)狀態(tài)完成目標(biāo)的愿望的大小。賦值函數(shù)V:是環(huán)境中每個(gè)狀態(tài)的一個(gè)屬性,它指出對(duì)從這個(gè)狀態(tài)繼續(xù)下去的動(dòng)作系統(tǒng)可以期望的報(bào)酬。報(bào)酬函數(shù)度量狀態(tài)-響應(yīng)對(duì)的立即的期望值,而賦值函數(shù)指出環(huán)境中一個(gè)狀態(tài)的長(zhǎng)期的期望值。模型:是抓住環(huán)境行為的方面的一個(gè)機(jī)制。模型讓我們?cè)跊](méi)有實(shí)際試驗(yàn)它們的情況下估計(jì)未來(lái)可能的動(dòng)作。2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)692024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)70主體強(qiáng)化學(xué)習(xí)模型i:input輸入r:reward獎(jiǎng)勵(lì)s:state狀態(tài)a:action動(dòng)作狀態(tài)sisi+1ri+1獎(jiǎng)勵(lì)ri環(huán)境動(dòng)作
aia0a1a2s0s1s2s32024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)71學(xué)習(xí)自動(dòng)機(jī)在強(qiáng)化學(xué)習(xí)方法中,學(xué)習(xí)自動(dòng)機(jī)是最普通的方法。這種系統(tǒng)的學(xué)習(xí)機(jī)制包括兩個(gè)模塊:學(xué)習(xí)自動(dòng)機(jī)和環(huán)境。學(xué)習(xí)過(guò)程是根據(jù)環(huán)境產(chǎn)生的刺激開(kāi)始的。自動(dòng)機(jī)根據(jù)所接收到的刺激,對(duì)環(huán)境做出反應(yīng),環(huán)境接收到該反應(yīng)對(duì)其做出評(píng)估,并向自動(dòng)機(jī)提供新的刺激。學(xué)習(xí)系統(tǒng)根據(jù)自動(dòng)機(jī)上次的反應(yīng)和當(dāng)前的輸入自動(dòng)地調(diào)整其參數(shù)。2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)72自適應(yīng)動(dòng)態(tài)程序設(shè)計(jì)在自適應(yīng)動(dòng)態(tài)程序設(shè)計(jì)中,狀態(tài)i的效用值U(i)可以用下式計(jì)算:其中,R(i)是在狀態(tài)i時(shí)的獎(jiǎng)勵(lì),Mij是從狀態(tài)i到狀態(tài)j的概率。2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)73Q-學(xué)習(xí)在Q學(xué)習(xí)中,Q是狀態(tài)-動(dòng)作對(duì)到學(xué)習(xí)到的值的一個(gè)函數(shù)。對(duì)所有的狀態(tài)和動(dòng)作:Q:(statexaction)→value對(duì)Q學(xué)習(xí)中的一步:(10.15)其中c和γ都≤1,rt+1是狀態(tài)st+1的獎(jiǎng)勵(lì)。2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)74內(nèi)容提要5.1機(jī)器學(xué)習(xí)概述
5.2歸納學(xué)習(xí)
5.3類比學(xué)習(xí)
5.4統(tǒng)計(jì)學(xué)習(xí)
5.5強(qiáng)化學(xué)習(xí)
5.6進(jìn)化計(jì)算
5.7群體智能
5.8知識(shí)發(fā)現(xiàn)
5.9小結(jié)
2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)75進(jìn)化計(jì)算進(jìn)化計(jì)算(evolutionarycomputation)是研究利用自然進(jìn)化和適應(yīng)思想的計(jì)算系統(tǒng)。達(dá)爾文進(jìn)化論是一種穩(wěn)健的搜索和優(yōu)化機(jī)制,對(duì)計(jì)算機(jī)科學(xué),特別是對(duì)人工智能的發(fā)展產(chǎn)生了很大的影響。大多數(shù)生物體是通過(guò)自然選擇和有性生殖進(jìn)行進(jìn)化。自然選擇決定了群體中哪些個(gè)體能夠生存和繁殖,有性生殖保證了后代基因中的混合和重組。自然選擇的法則是適應(yīng)者生存,不適應(yīng)者被淘汰,簡(jiǎn)言之為優(yōu)生劣汰。生物進(jìn)化的基本條件生物進(jìn)化過(guò)程的發(fā)生需要四個(gè)基本條件:1)存在有多個(gè)生物個(gè)體組成的種群;2)生物個(gè)體之間存在著差異,或群體具有多樣性;3)生物能夠自我繁殖;4)不同個(gè)體具有不同的環(huán)境生存能力,具有優(yōu)良基因結(jié)構(gòu)的個(gè)體繁殖能力強(qiáng),反之則弱。2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)762024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)77遺傳算法與自然進(jìn)化的比較自然界染色體基因等位基因(allele)染色體位置(locus)基因型(genotype)表型(phenotype)遺傳算法字符串字符,特征特征值字符串位置結(jié)構(gòu)參數(shù)集,譯碼結(jié)構(gòu)2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)78達(dá)爾文進(jìn)化算法建立原始種體。通過(guò)突變建立子孫。選擇:返回到步驟(1)?!?024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)79遺傳算法遺傳算法先將搜索結(jié)構(gòu)編碼為字符串形式,每個(gè)字符串結(jié)構(gòu)被稱為個(gè)體。然后對(duì)一組字符串結(jié)構(gòu)(被稱為一個(gè)群體)進(jìn)行循環(huán)操作。每次循環(huán)被稱作一代,包括一個(gè)保存字符串中較優(yōu)結(jié)構(gòu)的過(guò)程和一個(gè)有結(jié)構(gòu)的、隨機(jī)的字符串間的信息交換過(guò)程。類似于自然進(jìn)化,遺傳算法通過(guò)作用于染色體上的基因?qū)ふ液玫娜旧w來(lái)求解問(wèn)題。2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)80基本遺傳算法隨機(jī)產(chǎn)生一個(gè)由固定長(zhǎng)度字符串組成的初始群體;對(duì)于字符串群體,迭代地執(zhí)行下述步驟,直到選種標(biāo)準(zhǔn)被滿足為止:計(jì)算群體中的每個(gè)個(gè)體字符串的適應(yīng)值;應(yīng)用下述三種操作(至少前兩種)來(lái)產(chǎn)生新的群體:復(fù)制:把現(xiàn)有的個(gè)體字符串復(fù)制到新的群體中。雜交:通過(guò)遺傳重組隨機(jī)選擇兩個(gè)現(xiàn)有的子字符串,產(chǎn)生新的字符串。變異:將現(xiàn)有字符串中某一位的字符隨機(jī)變異。把在后代中出現(xiàn)的最高適應(yīng)值的個(gè)體字符串指定為遺傳算法運(yùn)行的結(jié)果。這一結(jié)果可以是問(wèn)題的解(或近似解)。2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)81基本遺傳算法流程圖GEN=0概率地選擇遺傳操作隨機(jī)創(chuàng)建初始群體計(jì)算群體中每個(gè)個(gè)體的適應(yīng)值i:=0顯示結(jié)果結(jié)束GEN:=GEN+1是是否(轉(zhuǎn)下頁(yè))i=N?GEN=M?12024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)82概率地選擇遺傳操作根據(jù)適應(yīng)值選擇一個(gè)個(gè)體完成交叉i:=i+1i:=i+1復(fù)制個(gè)體p(r)選擇(接上頁(yè))基于適應(yīng)值選擇兩個(gè)個(gè)體把新的兩個(gè)孩子加到群體中p(c)交叉變異p(m)把新的孩子加入到群體中完成變異根據(jù)適應(yīng)值選擇一個(gè)個(gè)體把變異后個(gè)體加入到群體中12024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)83
進(jìn)化策略進(jìn)化策略模仿自然進(jìn)化原理作為一種求解參數(shù)優(yōu)化問(wèn)題的方法。最簡(jiǎn)單的實(shí)現(xiàn)方法如下:定義的問(wèn)題是尋找n維的實(shí)數(shù)向量x,它使函數(shù)(2)雙親向量的初始群體從每維可行范圍內(nèi)隨機(jī)選擇。(3)子孫向量的創(chuàng)建是從每個(gè)雙親向量加上零均方差高斯隨機(jī)變量。(4)根據(jù)最小誤差選擇向量為下一代新的雙親。(5)向量的標(biāo)準(zhǔn)偏差保持不變,或者沒(méi)有可用的計(jì)算方法,那么處理結(jié)束。2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)84
進(jìn)化規(guī)劃進(jìn)化規(guī)劃(evolutionaryprogramming,又譯為進(jìn)化程序設(shè)計(jì))的過(guò)程,可理解為從所有可能的計(jì)算機(jī)程序形成的空間中,搜索有高的適應(yīng)值的計(jì)算機(jī)程序個(gè)體,在進(jìn)化程序設(shè)計(jì)中,幾百或幾千個(gè)計(jì)算機(jī)程序參與遺傳進(jìn)化。2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)85進(jìn)化規(guī)劃步驟產(chǎn)生出初始群體,它由關(guān)于問(wèn)題(計(jì)算機(jī)程序)的函數(shù)隨機(jī)組合而成。迭代完成下述子步驟,直至滿足選種標(biāo)準(zhǔn)為止:執(zhí)行群體中的每個(gè)程序,根據(jù)它解決問(wèn)題的能力,給它指定一個(gè)適應(yīng)值應(yīng)用變異等操作創(chuàng)造新的計(jì)算機(jī)程序群體?;谶m應(yīng)值根據(jù)概率從群體中選出一個(gè)計(jì)算機(jī)程序個(gè)體,然后用合適的操作作用于該計(jì)算機(jī)程序個(gè)體。把現(xiàn)有的計(jì)算機(jī)程序復(fù)制到新的群體中。通過(guò)遺傳隨機(jī)重組兩個(gè)現(xiàn)有的程序,創(chuàng)造出新的計(jì)算機(jī)程序個(gè)體。在后代中適應(yīng)值最高的計(jì)算機(jī)程序個(gè)體被指定為進(jìn)化程序設(shè)計(jì)的結(jié)果。這一結(jié)果可能是問(wèn)題的解或近似解。2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)86進(jìn)化計(jì)算進(jìn)化計(jì)算(evolutionarycomputation)是研究利用自然進(jìn)化和適應(yīng)思想的計(jì)算系統(tǒng)。達(dá)爾文進(jìn)化論是一種穩(wěn)健的搜索和優(yōu)化機(jī)制,對(duì)計(jì)算機(jī)科學(xué),特別是對(duì)人工智能的發(fā)展產(chǎn)生了很大的影響。大多數(shù)生物體是通過(guò)自然選擇和有性生殖進(jìn)行進(jìn)化。自然選擇決定了群體中哪些個(gè)體能夠生存和繁殖,有性生殖保證了后代基因中的混合和重組。自然選擇的法則是適應(yīng)者生存,不適應(yīng)者被淘汰,簡(jiǎn)言之為優(yōu)生劣汰。2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)87內(nèi)容提要5.1機(jī)器學(xué)習(xí)概述
5.2歸納學(xué)習(xí)
5.3類比學(xué)習(xí)
5.4統(tǒng)計(jì)學(xué)習(xí)
5.5強(qiáng)化學(xué)習(xí)
5.6進(jìn)化計(jì)算
5.7群體智能
5.8知識(shí)發(fā)現(xiàn)
5.9小結(jié)
2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)88群體智能指無(wú)智能的個(gè)體通過(guò)合作表現(xiàn)出智能行為的特性,在沒(méi)有集中控制且不提供全局模型的前提下,為復(fù)雜問(wèn)題求解提供了基礎(chǔ)。特點(diǎn)分布式:能夠適應(yīng)當(dāng)前網(wǎng)絡(luò)環(huán)境下的工作狀態(tài);魯棒性:沒(méi)有中心的控制與數(shù)據(jù),個(gè)體的故障不影響整個(gè)問(wèn)題的求解;擴(kuò)充性:個(gè)體的增加,系統(tǒng)的通信開(kāi)銷增加小;簡(jiǎn)單性:個(gè)體簡(jiǎn)單,實(shí)現(xiàn)也比較簡(jiǎn)單。蟻群算法提出蟻群系統(tǒng)1992年,意大利學(xué)者M(jìn).Dorigo在其博士論文中提出蟻群系統(tǒng)(AntSystem)。近年來(lái),M.Dorigo等人進(jìn)一步將螞蟻算法發(fā)展為一種通用的優(yōu)化技術(shù)——蟻群優(yōu)化(antcolonyoptimization,ACO)。
2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)89螞蟻從A點(diǎn)出發(fā),隨機(jī)選擇路線ABD或ACD。經(jīng)過(guò)9個(gè)時(shí)間單位時(shí):走ABD的螞蟻到達(dá)終點(diǎn),走ACD的螞蟻剛好走到C點(diǎn)。蟻巢食物蟻群算法原理2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)90
最后的極限是所有的螞蟻只選擇ABD路線。(正反饋過(guò)程)蟻巢食物蟻群算法原理2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)912024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)92蟻群算法模型基本模型簡(jiǎn)化模型由JamesKenney(社會(huì)心理學(xué)博士)和RussEberhart(電子工程學(xué)博士,/~eberhart/)于1995年提出粒子群算法(ParticleSwarmOptimization,PSO)源于對(duì)鳥(niǎo)群捕食行為的研究,是基于迭代的方法簡(jiǎn)單易于實(shí)現(xiàn),需要調(diào)整的參數(shù)相對(duì)較少粒子群優(yōu)化2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)93鳥(niǎo)群:假設(shè)一個(gè)區(qū)域,所有的鳥(niǎo)都不知道食物的位置,但是它們知道當(dāng)前位置離食物還有多遠(yuǎn)。PSO算法每個(gè)解看作一只鳥(niǎo),稱為“粒子(particle)”,所有的粒子都有一個(gè)適應(yīng)值,每個(gè)粒子都有一個(gè)速度決定它們的飛翔方向和距離,粒子們追隨當(dāng)前最優(yōu)粒子在解空間中搜索。粒子群優(yōu)化2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)94粒子速度和位置的更新假設(shè)在D維搜索空間中,有m個(gè)粒子;其中第i個(gè)粒子的位置為矢量其飛翔速度也是一個(gè)矢量,記為第i個(gè)粒子搜索到的最優(yōu)位置為整個(gè)粒子群搜索到的最優(yōu)位置為第i個(gè)粒子的位置和速度更新為:粒子群優(yōu)化算法2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)95粒子速度和位置的更新
其中,w稱為慣性權(quán)重,c1和c2為兩個(gè)正常數(shù),稱為加速因子。將vidk限制在一個(gè)最大速度vmax內(nèi)。xkvkppgbestxk+1vk+1kkk+1k+1粒子群優(yōu)化算法2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)96粒子速度和位置的更新
“慣性部分”,對(duì)自身運(yùn)動(dòng)狀態(tài)的信任“認(rèn)知部分”,對(duì)微粒本身的思考,即來(lái)源于自己經(jīng)驗(yàn)的部分“社會(huì)部分”,微粒間的信息共享,來(lái)源于群體中的其它優(yōu)秀微粒的經(jīng)驗(yàn)粒子群優(yōu)化算法2024/11/25史忠植人工智能:機(jī)器學(xué)習(xí)97StartInitializeparticleswithrandompositionandvelocityvectors.Foreachparticle’sposition(xi)evaluatefitnessIffitness(xi)betterthanfitness(p)thenp=xiLoopuntilallparticlesexhaustSetbestofpsas
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 小學(xué)生團(tuán)隊(duì)拓展訓(xùn)練制度
- 商業(yè)參考計(jì)劃書(shū)范文5篇
- 培訓(xùn)安全課件
- 人力短缺應(yīng)急預(yù)案
- 木里培訓(xùn)課件
- 課件制作培訓(xùn)班英語(yǔ)課件
- 2023年度寧夏回族自治區(qū)政府采購(gòu)評(píng)審專家資格通關(guān)題庫(kù)附帶答案
- 《模具加工注意事項(xiàng)》課件
- 《如何建立團(tuán)隊(duì)氛圍》課件
- CNV培訓(xùn)課件教學(xué)課件
- 2024版房屋市政工程生產(chǎn)安全重大事故隱患判定標(biāo)準(zhǔn)內(nèi)容解讀
- 期末 (試題) -2024-2025學(xué)年人教PEP版(2024)英語(yǔ)三年級(jí)上冊(cè)
- 膠囊劑生產(chǎn)工藝流程圖
- 肝膽外科出科考試試卷
- 制藥廠安全事故應(yīng)急救援預(yù)案匯編
- 塔吊運(yùn)行作業(yè)方案
- 上市公司信息披露制度的跨國(guó)比較及借鑒
- 重慶中考數(shù)學(xué)最新26題練習(xí)及答案
- 飛機(jī)起落架緩沖器的設(shè)計(jì)航空專業(yè)
- 江蘇衛(wèi)視跨年演唱會(huì)電視轉(zhuǎn)播技術(shù)方案-209年精選文檔
- 水電工程施工機(jī)械臺(tái)時(shí)費(fèi)定額(2004年版)
評(píng)論
0/150
提交評(píng)論