人工智能入門(mén) 課件 劉峽壁6.群智能、7.總結(jié)_第1頁(yè)
人工智能入門(mén) 課件 劉峽壁6.群智能、7.總結(jié)_第2頁(yè)
人工智能入門(mén) 課件 劉峽壁6.群智能、7.總結(jié)_第3頁(yè)
人工智能入門(mén) 課件 劉峽壁6.群智能、7.總結(jié)_第4頁(yè)
人工智能入門(mén) 課件 劉峽壁6.群智能、7.總結(jié)_第5頁(yè)
已閱讀5頁(yè),還剩82頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

群智能AI:SI2大綱什么是群智能(SI)?

模擬SI進(jìn)行搜索

-蟻群優(yōu)化算法(ACO)-粒子群優(yōu)化算法(PSO)AI:SI3PartⅠ:什么是SI?KevinKelly:“這些不起眼的組件,只要正確地組合在一起,就能產(chǎn)生出人意料的智能效果?!笔裁词侨褐悄??AI:SI4盡管自然界中的一些社會(huì)系統(tǒng)是由簡(jiǎn)單的個(gè)體組成的,但它們可以表現(xiàn)出一種智能的集體行為。問(wèn)題的智能解決方案自然地從這些個(gè)體的自組織和交流中產(chǎn)生。這些系統(tǒng)提供了重要的技術(shù),可用于開(kāi)發(fā)人工智能系統(tǒng)。自然之美AI:SI5自然界和社會(huì)中的集體行為的例子這可以被視為多智能體系統(tǒng)。AI:SI6涌現(xiàn)Goldstein:“在復(fù)雜系統(tǒng)的自組織過(guò)程中,新奇、一致的結(jié)構(gòu)、模式和性質(zhì)的產(chǎn)生。”默里·蓋爾曼:“從深層次的簡(jiǎn)單性中產(chǎn)生的表面復(fù)雜性”Bottom-upbehavior:“遵循簡(jiǎn)單規(guī)則的簡(jiǎn)單代理產(chǎn)生復(fù)雜的結(jié)構(gòu)/行為。代理不遵循來(lái)自領(lǐng)導(dǎo)者的命令?!卑紫仭按蠼烫谩蓖炼咽怯砂紫伻后w建造的:這是自然界中涌現(xiàn)的一個(gè)經(jīng)典例子AI:SI7生物學(xué)動(dòng)機(jī):昆蟲(chóng)社會(huì)社會(huì)性昆蟲(chóng)的群體能夠從刻板、不可靠、不智能且簡(jiǎn)單的昆蟲(chóng)個(gè)體中實(shí)現(xiàn)靈活、可靠、智能和復(fù)雜的系統(tǒng)層面性能。

昆蟲(chóng)遵循簡(jiǎn)單規(guī)則,使用簡(jiǎn)單的局部通信(氣味軌跡、聲音、觸覺(jué))并且計(jì)算需求低。全局結(jié)構(gòu)(例如,巢穴)可靠地由許多不可靠的個(gè)體行動(dòng)涌現(xiàn)出來(lái)。AI:SI8生物學(xué)動(dòng)機(jī):群落、畜群和魚(yú)群在80年代末,克雷格·雷諾茲創(chuàng)建了一個(gè)名為“Boids”的動(dòng)物運(yùn)動(dòng)模型。它根據(jù)三條簡(jiǎn)單規(guī)則產(chǎn)生非常逼真的運(yùn)動(dòng),這些規(guī)則定義了boid的轉(zhuǎn)向行為。這個(gè)模型及其變種已被用于驅(qū)動(dòng)電影中的鳥(niǎo)、昆蟲(chóng)、人、魚(yú)、羚羊等的動(dòng)畫(huà)效果(例如,《蝙蝠俠歸來(lái)》、《獅子王》)AI:SI9Boid規(guī)則分離:轉(zhuǎn)向以避免擁擠的本地群體成員優(yōu)先于其他規(guī)則的基本規(guī)則在避免與環(huán)境中的其他物體發(fā)生碰撞時(shí)也很有用。對(duì)齊:朝向本地同群伙伴的平均航向和速度轉(zhuǎn)向強(qiáng)制保持凝聚,以保持同群伙伴在一起。也有助于避免碰撞。凝聚力:轉(zhuǎn)向以朝向本地同群伙伴的平均位置移動(dòng)畜群邊緣的代理更容易受到捕食者的攻擊有助于保持畜群在一起AI:SI10一個(gè)應(yīng)用:《獅子王》Videofrom:/471/current/notes/AI:SI群體智能

群體智能(SI)是一種基于對(duì)去中心化、自組織系統(tǒng)中的集體行為的研究的人工智能技術(shù)。1989年,Beni、Hackwood和Wang在細(xì)胞機(jī)器人系統(tǒng)的背景下首次使用了“群體智能”這一表述,用于描述簡(jiǎn)單機(jī)械代理的自組織行為。后來(lái),該術(shù)語(yǔ)擴(kuò)展為包括“任何受社會(huì)昆蟲(chóng)群落和其他動(dòng)物群體集體行為啟發(fā)的算法設(shè)計(jì)或分布式問(wèn)題解決設(shè)備的嘗試”[Bonabeau、Dorigo和Theraulaz,1999]。11AI:ANN12群體智能(續(xù))群體智能系統(tǒng)通常由相互之間以及與環(huán)境進(jìn)行局部交互的大量簡(jiǎn)單代理組成。雖然通常不存在決定個(gè)體代理應(yīng)如何行為的集中控制結(jié)構(gòu),但這些代理之間的局部交互往往會(huì)導(dǎo)致全局行為的涌現(xiàn)。有時(shí)被稱(chēng)為“集體智能”AI:SI13群體智能的組成部分代理:

與世界和其他代理(直接或間接)進(jìn)行交互簡(jiǎn)單的行為

例如:螞蟻、白蟻、蜜蜂、黃蜂通信:

代理如何相互交互

例如:螞蟻的信息素

單個(gè)代理的簡(jiǎn)單行為+一組代理之間的通信=該組代理的涌現(xiàn)復(fù)雜行為AI:ANN14間接通信信號(hào)傳播:-一個(gè)代理發(fā)送一個(gè)信號(hào),該信號(hào)被廣播到環(huán)境中,并且其強(qiáng)度隨著距離的減小而減小。-在點(diǎn)x處,信號(hào)可能有以下強(qiáng)度之一:V(x)=V(x0)/dist(x,x0)V(x)=V(x0)/dist(x,x0)2

路徑-代理留下“放射性碎屑”形成路徑-一個(gè)代理跟隨路徑,使路徑逐漸變淡,直到消失AI:SI15間接通信黑板系統(tǒng)-一個(gè)公共區(qū)域(共享內(nèi)存),代理可以在其中交換信息、數(shù)據(jù)和知識(shí)。-黑板=強(qiáng)大的分布式知識(shí)計(jì)算范例-代理=知識(shí)源(KS)

IntelligentAgentsIntelligentAgentsIntelligentAgentsBlackboardMessageReplyAgentsIntelligentAgentsIntelligentAgentsIntelligentAgentsIntelligentAgentsIntelligentAgentsIntelligentAgentsAI:SI16直接通信Actor語(yǔ)言一個(gè)Actor執(zhí)行一系列動(dòng)作以回復(fù)接收到的消息言語(yǔ)行為理論言語(yǔ)行為具有以下三個(gè)方面:Locution=說(shuō)話者的物理表達(dá)Illocution=說(shuō)話者話語(yǔ)的意圖意義(施為)Perlocution=Locution產(chǎn)生的動(dòng)作例如:張告訴李:“請(qǐng)把門(mén)關(guān)上”。

locution

illocutioncontent perlocution:門(mén)關(guān)上了(希望如此?。〢I:ANN17群智能特點(diǎn)分布式,沒(méi)有中央控制或數(shù)據(jù)源通信有限沒(méi)有(顯式的)環(huán)境模型感知環(huán)境(感知)能夠應(yīng)對(duì)環(huán)境變化。

群體智能與人類(lèi)有關(guān)嗎?AI:SI18PartⅡ-Ⅲ:如何模擬群體智能進(jìn)行搜索?示例1:螞蟻-->蟻群優(yōu)化算法(ACO)示例2:鳥(niǎo)群-->粒子群優(yōu)化算法(PSO)AI:SI19PartⅡ蟻群優(yōu)化算法(ACO)AI:SI20螞蟻

單個(gè)螞蟻是具有有限記憶并且能夠執(zhí)行簡(jiǎn)單動(dòng)作的簡(jiǎn)單昆蟲(chóng)。個(gè)體螞蟻是具有有限記憶并能執(zhí)行簡(jiǎn)單動(dòng)作的簡(jiǎn)單昆蟲(chóng)。然而,一個(gè)螞蟻群能夠展現(xiàn)出復(fù)雜的集體行為,為問(wèn)題提供智能解決方案搬運(yùn)大型物品搭建橋梁尋找從巢穴到食物源的最短路線,根據(jù)距離和易接近性對(duì)食物源進(jìn)行優(yōu)先排序。AI:ANN21螞蟻此外,在蟻群中,每只螞蟻都有其規(guī)定任務(wù),但如果集體需要,螞蟻可以切換任務(wù)。

在巢外,螞蟻可以執(zhí)行以下四種任務(wù):覓食:尋找和獲取食物巡邏:尋找食物來(lái)源垃圾清理工作:對(duì)巢內(nèi)垃圾進(jìn)行分類(lèi)巢穴維護(hù)工作:建造和清理巢穴

螞蟻是否執(zhí)行某項(xiàng)任務(wù)取決于:環(huán)境物理狀態(tài):如果巢的一部分受損,會(huì)有更多的螞蟻進(jìn)行巢穴維護(hù)工作來(lái)修復(fù)它與其他螞蟻的社會(huì)互動(dòng)

交流(直接或間接)是必要的AI:ANN22螞蟻如何找到最短路徑?他們通過(guò)在其所走的路徑上留下信息素,建立了一個(gè)間接通信系統(tǒng)。孤立的螞蟻隨機(jī)移動(dòng),但當(dāng)它發(fā)現(xiàn)信息素痕跡時(shí),這只螞蟻有很大可能會(huì)決定沿著這條痕跡前進(jìn)。覓食的螞蟻會(huì)在其路徑上留下信息素。當(dāng)它找到食物來(lái)源時(shí),它會(huì)返回巢穴并加強(qiáng)其痕跡。因此,其他螞蟻有更大的可能性開(kāi)始跟隨這條痕跡,從而在其上留下更多的信息素。這個(gè)過(guò)程就像一個(gè)正反饋循環(huán)系統(tǒng),因?yàn)橐粭l痕跡上的信息素濃度越高,螞蟻開(kāi)始沿著它旅行的可能性就越大。AI:SI23螞蟻如何找到最短路徑?這個(gè)過(guò)程就像一個(gè)正反饋循環(huán)系統(tǒng),因?yàn)橐粭l痕跡上的信息素濃度越高,螞蟻開(kāi)始沿著它旅行的可能性就越大。B路上的信息素濃度將以比A路更高的速度增加,很快A路上的螞蟻將選擇跟隨B路。由于大多數(shù)螞蟻將不再走A路,并且由于信息素是易揮發(fā)的,A路上的痕跡將開(kāi)始蒸發(fā)。只有最短的路線將保留下來(lái)!AI:SI24螞蟻群優(yōu)化模型每只人工螞蟻都是一個(gè)概率機(jī)制,用于構(gòu)建問(wèn)題的解決方案,使用以下方法:人工信息素沉積啟發(fā)式信息:信息素痕跡等真實(shí)螞蟻與人工螞蟻之間的區(qū)別:信息素只在構(gòu)建出解決方案后才更新。其他機(jī)制AI:ANN25螞蟻群優(yōu)化模型構(gòu)造螞蟻解決方案解決方案組件的隨機(jī)選擇規(guī)則。更新信息素用于增加與良好或有前途的解決方案相關(guān)聯(lián)的信息素值,并減少與不良解決方案相關(guān)聯(lián)的信息素值。通過(guò)信息素蒸發(fā)減少所有信息素值-->允許“遺忘”->有利于探索新區(qū)域增加與一組選定的良好解決方案相關(guān)聯(lián)的信息素水平-->使算法收斂到解決方案AI:ANN26蟻群系統(tǒng)(AS):第一個(gè)蟻群優(yōu)化算法構(gòu)造螞蟻解決方案

信息素的數(shù)量啟發(fā)式距離α、β常數(shù)AI:ANN27蟻群系統(tǒng)(AS)更新信息素蒸發(fā)率每只螞蟻在邊(i,j)上留下的信息素AI:ANN28對(duì)于旅行推銷(xiāo)員問(wèn)題(TSP)的蟻群系統(tǒng)(AS)初始化將每只螞蟻放置在隨機(jī)選擇的城市中為每個(gè)螞蟻選擇下一個(gè)城市更多的城市需要訪問(wèn)遍歷每只螞蟻返回初始城市使用每個(gè)螞蟻的旅行成本更新信息素水平打印最佳旅行yesNo停止準(zhǔn)則yesNoB.Ombuki-Berman之后的流程圖:群體智能AI:ANN29TSP的簡(jiǎn)單示例(4個(gè)城市)圖片來(lái)自O(shè)lleGallmo:群體智能AI:ANN30AS的擴(kuò)展蟻群系統(tǒng)傾向于快速收斂這意味著它對(duì)找到的最佳解的利用程度太高,它應(yīng)該更多地探索解空間信息素蒸發(fā)/更新規(guī)則(可能存在更好的規(guī)則)蟻群系統(tǒng)的擴(kuò)展蟻群系統(tǒng)的精英策略(EAS)基于排名的蟻群系統(tǒng)(RANK)MAX-MIN蟻群系統(tǒng)(MMAS)蟻群系統(tǒng)(ACS)AI:ANN31PartⅢ:粒子群優(yōu)化算法(PSO)“再次,大自然為我們提供了一種處理信息的方法,既優(yōu)雅又靈活”AI:ANN32鳥(niǎo)群飛行在粒子群優(yōu)化中,“群”被定義為一組看似無(wú)序的移動(dòng)個(gè)體集合,這些個(gè)體傾向于聚集在一起,而每個(gè)個(gè)體似乎都朝著隨機(jī)的方向移動(dòng)。鳥(niǎo)群飛行是粒子群優(yōu)化在自然界中的最好例子之一。AI:ANN33鳥(niǎo)群飛行的建模鳥(niǎo)群飛行的同步性被認(rèn)為是一種功能,鳥(niǎo)類(lèi)努力保持自己與鄰居之間的最佳距離。鳥(niǎo)類(lèi)和魚(yú)類(lèi)通過(guò)調(diào)整自身的物理運(yùn)動(dòng)來(lái)避免捕食者、尋找食物和配偶。人類(lèi)傾向于調(diào)整自己的信仰和態(tài)度,以符合社會(huì)同齡人的信仰和態(tài)度。人類(lèi)在抽象的多維空間中自由變化。AI:ANN34從鳥(niǎo)類(lèi)到粒子想象一個(gè)鳥(niǎo)群在一個(gè)只有一個(gè)食物源的區(qū)域。一只鳥(niǎo)不知道食物在哪里,但它知道它與食物的距離。最好的策略是跟隨離食物更近的鳥(niǎo)。粒子保存和傳播它們找到的最佳解決方案。AI:ANN35粒子群優(yōu)化的特點(diǎn)通過(guò)分配隨機(jī)位置和速度進(jìn)行種群初始化;然后讓潛在的解通過(guò)超空間飛行。每個(gè)粒子跟蹤其在超空間中的“最佳”(最高適應(yīng)度)位置。這被稱(chēng)為個(gè)體粒子的“pBest”它被稱(chēng)為種群中的“gBest”它被稱(chēng)為定義鄰域中的“l(fā)Best”在每個(gè)時(shí)間步,每個(gè)粒子隨機(jī)地加速向其pBest和gBest(或lBest)移動(dòng)。AI:ANN36粒子群優(yōu)化過(guò)程步驟1.在超空間中初始化種群。步驟2.評(píng)估個(gè)體粒子的適應(yīng)度。步驟3.根據(jù)先前的最佳和全局(或鄰域)最佳修改速度。步驟4.根據(jù)某些條件終止。步驟5.轉(zhuǎn)到步驟2。AI:ANN37粒子是如何飛行的?gBest和pBest(lBest)的組合lBest可以是:社會(huì)性:周?chē)牧W涌偸窍嗤?,無(wú)論它們?cè)诳臻g中的位置如何地理性:周?chē)牧W邮蔷嚯x最短的那些粒子全局PSO與局部PSOAI:ANN38粒子群優(yōu)化速度更新方程全局版本:其中k是維度,c1和c2是正的常數(shù),rand()是隨機(jī)函數(shù),w是慣性權(quán)重。對(duì)于鄰域版本,將pgk更改為plk。AI:ANN39全局PSO的速度更新方案。AI:ANN40PSO:相關(guān)問(wèn)題控制速度(確定Vmax的最佳值)通常將最大速度設(shè)置為變量的動(dòng)態(tài)范圍通常將c1和c2設(shè)置為2慣性權(quán)重影響全局和局部探索之間的權(quán)衡。好的方法是在運(yùn)行過(guò)程中減小慣性權(quán)重(例如,在1000代中從0.9減小到0.4)。群集大小和鄰域大小。AI:ANN41PSO的優(yōu)點(diǎn)適應(yīng)操作在速度上進(jìn)行大多數(shù)其他方法在位置上進(jìn)行操作。效果:PSO具有內(nèi)置的動(dòng)力。粒子傾向于跳過(guò)最優(yōu)解-這是一個(gè)優(yōu)勢(shì),因?yàn)闊o(wú)論如何都會(huì)記住最好的位置。概念簡(jiǎn)單易于實(shí)現(xiàn)計(jì)算效率高對(duì)各種問(wèn)題有效AI:ANN42PSO的一個(gè)應(yīng)用-圖像注釋細(xì)化PSO用于優(yōu)化反饋神經(jīng)網(wǎng)絡(luò),以結(jié)合關(guān)鍵詞之間的相似度測(cè)量。AI:ANN43PSO的一個(gè)應(yīng)用-圖像注釋細(xì)化總結(jié)AI:Summary45理解并創(chuàng)造智能實(shí)體兩種觀點(diǎn):弱AI(圖靈測(cè)試);強(qiáng)AI(中文屋實(shí)驗(yàn))六種途徑:符號(hào)智能;人工神經(jīng)網(wǎng)絡(luò);機(jī)器學(xué)習(xí);行為智能;進(jìn)化計(jì)算;群智能。AI:Summary46S.J.RusselllandP.Norvig,“artificialintelligence:amodernapproach”.具有學(xué)習(xí)能力的智能系統(tǒng)的架構(gòu)AI:Summary47大綱路線圖1:學(xué)習(xí)-神經(jīng)網(wǎng)絡(luò)-行為智能路線圖2:搜索-圖搜索-進(jìn)化計(jì)算學(xué)習(xí)學(xué)習(xí)意味著變化AI:Summary49AI:MachineLearning49定義學(xué)習(xí)任務(wù)基于經(jīng)驗(yàn),根據(jù)性能準(zhǔn)則,提升完成相應(yīng)任務(wù)的性能任務(wù):下跳棋性能:對(duì)于任意對(duì)手,取勝的概率

經(jīng)驗(yàn):以自己為對(duì)手,進(jìn)行的練習(xí)任務(wù):識(shí)別手寫(xiě)字性能:被正確分類(lèi)的字所占的比例經(jīng)驗(yàn):經(jīng)過(guò)人工標(biāo)注的手寫(xiě)字的數(shù)據(jù)庫(kù)任務(wù):視覺(jué)傳感器自動(dòng)駕駛性能:出錯(cuò)前行駛的平均距離經(jīng)驗(yàn):人類(lèi)駕駛的時(shí)候記錄下來(lái)的一系列圖像和對(duì)應(yīng)控制命令A(yù)I:Summary50AI:NouvelleAI50學(xué)習(xí)中的信息反饋類(lèi)型監(jiān)督學(xué)習(xí)學(xué)習(xí)需要的輸入輸出對(duì)已經(jīng)給定或者可以推導(dǎo)得到。非監(jiān)督學(xué)習(xí)沒(méi)有輸出的信息強(qiáng)化學(xué)習(xí)智能體在環(huán)境中作出行動(dòng),對(duì)于智能體的每一步行動(dòng),都會(huì)得到一個(gè)評(píng)價(jià)值,但是不被告知如何行動(dòng)才可以正確的達(dá)到目標(biāo)。AI:Summary51學(xué)習(xí)的實(shí)質(zhì)函數(shù)估計(jì)三個(gè)問(wèn)題1.怎樣假設(shè)函數(shù)形式?2.怎樣設(shè)計(jì)學(xué)習(xí)目標(biāo)?3.怎樣發(fā)現(xiàn)最優(yōu)函數(shù)?AI:Summary52AI:ANN521.1怎樣假設(shè)函數(shù)形式?-1

M-P神經(jīng)元θx1x2xnyω1ω2ωn輸入輸出閾值McClloch與Pitts,《神經(jīng)活動(dòng)中固有的思想邏輯運(yùn)算》,1943f:激活函數(shù)g:整合函數(shù)AI:Summary53AI:ANN53整合函數(shù)加權(quán)求和

徑向距離AI:Summary54AI:ANN54激活函數(shù)

閾值型線性飽和線性S型函數(shù)雙曲正切函數(shù)高斯函數(shù)AI:Summary55AI:ANN55前饋網(wǎng)絡(luò)的一般結(jié)構(gòu)反饋網(wǎng)絡(luò)的一般結(jié)構(gòu)AI:Summary56AI:ANN56單層感知器閾值激活函數(shù)輸出單元相互獨(dú)立,即沒(méi)有共享的權(quán)重Rosenblatt,1957AI:Summary57(0,0)(1,-0.5)(1,1.5)(2,0.5)

class1

class24.11設(shè)計(jì)一個(gè)感知器,用于區(qū)分兩類(lèi)數(shù)據(jù),其中第一類(lèi)數(shù)據(jù)是(1,1.5)和(2,0.5),第二類(lèi)數(shù)據(jù)是(0,0)和(1,-0.5)輸入1輸入2輸出11.5020.500011-0.51w1w2yx1x2AI:Summary58滿(mǎn)足以上約束(只是一種可能)-1-1yx1x2-1AI:Summary59AI:ANN59多層感知器(MLP)層與層之間通常是全連接的隱含層單元的個(gè)數(shù)通常手動(dòng)選擇AI:Summary60監(jiān)督學(xué)習(xí):-使實(shí)際輸出與期望輸出之間的誤差最小

(BP)-最大化信息增益(IG)(決策樹(shù))

強(qiáng)化學(xué)習(xí):

使長(zhǎng)期的累積收益最大非監(jiān)督學(xué)習(xí):

使數(shù)據(jù)與聚類(lèi)之間的距離最小

(聚類(lèi))1.2怎樣設(shè)計(jì)學(xué)習(xí)目標(biāo)?AI:Summary61r(state,action)即時(shí)獎(jiǎng)勵(lì)值Q(state,action)valuesV*(state)values100

0

0

100

G

0

0

0

0

0

0

0

0

0

90

81100

G

0

81

72

90

81

81

72

90

81

100

G

90100081901001.3怎樣發(fā)現(xiàn)最優(yōu)函數(shù)?

使用累計(jì)折扣收益,折扣率=0.981=0+0.9*90Q-學(xué)習(xí)算法AI:Summary62Q值例:Hanoi塔AI:Summary63補(bǔ)充題:以下GridWorld中,除了到達(dá)目標(biāo)狀態(tài)(G)的動(dòng)作獲得的即時(shí)獎(jiǎng)勵(lì)為10以外,其余動(dòng)作對(duì)應(yīng)的即時(shí)獎(jiǎng)勵(lì)皆為0。如采用折扣系數(shù)為0.8的累積折扣收益,請(qǐng)計(jì)算圖中的Q函數(shù)值,直接標(biāo)注在圖中。G1086.41086.486.41086.4搜索(最優(yōu)化)01AI:Summary65什么是搜索?以可以接受的計(jì)算代價(jià),在問(wèn)題所有解答中找出最優(yōu)解或可行解。理想的搜索算法:盡可能快地找到最優(yōu)解。求解的效果與效率之間存在矛盾-完備性,最優(yōu)性,復(fù)雜性-盲目vs.啟發(fā),局部

vs.全局,可行

vs.最優(yōu).AI:Summary66數(shù)學(xué)和計(jì)算機(jī)科學(xué)中的核心主題確定性搜索-圖搜索隨機(jī)和基于群體的搜索-進(jìn)化計(jì)算-群智能啟發(fā)式搜索方法AI:Summary67用于問(wèn)題求解圖搜索算法的一般結(jié)構(gòu)是不斷擴(kuò)展頂點(diǎn),直到發(fā)現(xiàn)目標(biāo)頂點(diǎn)(狀態(tài)空間)或者確定初始頂點(diǎn)的可解性(與或圖)。).不同圖搜索算法的主要區(qū)別在于頂點(diǎn)的擴(kuò)展順序不同。盲目搜索不考慮問(wèn)題特性,包括廣度優(yōu)先搜索、深度優(yōu)先搜索、有界深度優(yōu)先搜索和迭代加深深度優(yōu)先搜索。啟發(fā)式搜索算法根據(jù)問(wèn)題所提供的啟發(fā)式信息,用估價(jià)函數(shù)估計(jì)頂點(diǎn)的搜索效率,選擇估計(jì)效率最高的頂點(diǎn)進(jìn)行擴(kuò)展。2.1圖搜索AI:Summary68狀態(tài)空間vs.與/或圖狀態(tài)空間與/或圖AI:Summary692.5為什么采用與或圖表示法時(shí),解決問(wèn)題的答案對(duì)應(yīng)于一個(gè)子圖,而不是一條路徑?答:因?yàn)榕c節(jié)點(diǎn)AI:Summary70A*算法是影響最大的,應(yīng)用于狀態(tài)空間的啟發(fā)式搜索算法。它通過(guò)對(duì)估價(jià)函數(shù)施加一定約束,可以保證搜索到最優(yōu)解??扇菰S的啟發(fā)式函數(shù):如果對(duì)于每一個(gè)頂點(diǎn)n都有h(n)≤h*(n),則該啟發(fā)式函數(shù)h(n)是可容許的。其中h*(n)表示從頂點(diǎn)n到目標(biāo)頂點(diǎn)的最小代價(jià)。支配性:如果對(duì)于所有頂點(diǎn)都有

h2(n)≥h1(n)

,并且兩者都是可容許的,則h2

優(yōu)于h1,使用h2

搜索速度更快A*算法AI:Summary712.3請(qǐng)用狀態(tài)空間法求解農(nóng)夫過(guò)河問(wèn)題,該問(wèn)題是:一農(nóng)夫帶著一只狼、一只羊和一筐菜來(lái)到河邊,欲乘船到河對(duì)岸。但船太小,農(nóng)夫每次只能帶一樣?xùn)|西過(guò)河。而在沒(méi)有農(nóng)夫看管的情況下,狼會(huì)吃羊,羊會(huì)吃菜。農(nóng)夫應(yīng)該怎樣做,才能在沒(méi)有任何損失的情況下把所有東西帶到河對(duì)岸?2.13試用A*算法解決習(xí)題2.3中給出的農(nóng)夫過(guò)河問(wèn)題。解:?jiǎn)栴}狀態(tài)表示為(a,b,c,d),其中a,b,c,d分別表示農(nóng)夫、狼,羊和菜的位置,1表示在左岸,0表示在右岸。則起始狀態(tài)為(1,1,1,1),終止?fàn)顟B(tài)為(0,0,0,0)。改變狀態(tài)的操作共八種,分別為:農(nóng)夫帶著{狼、羊、菜}從{左岸到右岸、右岸到左岸}。搜索路徑為:(1,1,1,1)

(0,1,0,1)

(1,1,0,1)

(0,0,0,1)

(1,0,1,1)

(0,0,1,0)

(1,0,1,0)

(0,0,0,0)

AI:Summary72h(x)=河左岸物體個(gè)數(shù)

或無(wú)窮大(≠人:狼、羊?qū)?yīng)位不能相等;羊、菜對(duì)應(yīng)位不能相等)(1,1,1,1)h=3f=3(0,0,1,1)h=∞f=∞(0,1,0,1)h=2f=3(0,1,1,0)h=∞f=∞(1,1,0,1)h=2f=4(0,0,0,1)h=1f=4(0,1,0,0)h=1f=4(1,0,0,1)h=∞f=∞(1,0,1,1)h=2f=6(1,1,0,0)h=∞f=∞(1,1,1,0)h=2f=6102345AI:Summary73(1,0,1,1)h=2f=6(0,0,1,0)h=1f=6(0,0,0,1)h=1f=6(1,0,1,0)h=1f=7(1,1,1,0)h=2f=8(0,0,0,0)h=0f=7h(x)=河左岸物體個(gè)數(shù)

或無(wú)窮大(≠人:狼、羊?qū)?yīng)位不能相等;羊、菜對(duì)應(yīng)位不能相等)續(xù)上圖6(1,0,0,1)h=∞f=∞7910(1,1,1,0)h=2f=68AI:Summary74博弈樹(shù)

表示博弈過(guò)程的數(shù)據(jù)結(jié)構(gòu)

在想象對(duì)手是最強(qiáng)對(duì)手的情況下采取最好的行動(dòng),這在結(jié)構(gòu)上表現(xiàn)為與或圖極大極小算法

-限制博弈樹(shù)的深度-評(píng)價(jià)博弈狀態(tài)-選擇移動(dòng)到具有最高極大極小值的位置!α-β剪枝

在有界深度優(yōu)先搜索過(guò)程中,通過(guò)剪掉一些不必要的分枝達(dá)到提高搜索效率的目的。博弈搜索AI:Summary752.17極大極小搜索的思想基礎(chǔ)是什么?為什么博弈子樹(shù)的深度越深,計(jì)算機(jī)博弈水平越高?答:思想基礎(chǔ)是:假設(shè)對(duì)方為最強(qiáng)對(duì)手,在考慮對(duì)方每一步都作出最佳應(yīng)對(duì)的情況下,也就是對(duì)自己最不利的情況下(極?。?,選擇能給自己帶來(lái)最大收益的一步(極大)。原因:子樹(shù)深度越深,表示思考的步數(shù)越多,從而能夠得到更好的結(jié)果。AI:Summary762.21設(shè)有如圖所示的一棵博弈樹(shù),其中末一行的數(shù)字是葉頂點(diǎn)的靜態(tài)估值,請(qǐng)對(duì)該博弈樹(shù)作如下工作:用極小極大值法計(jì)算各節(jié)點(diǎn)的倒推值。利用-剪枝技術(shù)剪去不必要搜索的分枝。敘述剪枝發(fā)生在何處,即剪去了哪些分枝(在剪枝處用×在圖上做標(biāo)記)。

AI:Summary77進(jìn)化計(jì)算基于生物進(jìn)化理論優(yōu)化行為—最優(yōu)解個(gè)體

解;適應(yīng)度

目標(biāo);環(huán)境

問(wèn)題EC的組成表示:個(gè)體和種群適應(yīng)度估計(jì):目標(biāo)選擇:父代和子代基因操作:突變和/或重組初始化/終止條件2.2進(jìn)化計(jì)算AI:Summary78AI:EC78進(jìn)化算法構(gòu)成tt+1突變重組繁殖選擇圖片來(lái)源IdaSprinkhuizen-Kuyper:Introductionto

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論