




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、游戲中的人工智能技術(shù),浙江大學(xué)計(jì)算機(jī)學(xué)院,學(xué)習(xí)內(nèi)容和目標(biāo),游戲AI的基本概念 游戲中簡(jiǎn)單的AI模式 游戲中常用的AI技術(shù) 有限狀態(tài)機(jī) A,模糊邏輯等 實(shí)現(xiàn)AI引擎的要點(diǎn),GAME AI技術(shù)簡(jiǎn)介(1),GAME AI的描述 使得游戲表現(xiàn)出與人的智能行為/ 活動(dòng)相類(lèi)似,或者與玩家的思維/感知相符合的特性。 GAME AI的實(shí)現(xiàn) 技術(shù)實(shí)現(xiàn) 利用充分的領(lǐng)域知識(shí)和常識(shí) 客觀世界的運(yùn)動(dòng)規(guī)律(game physics) 利用已有的AI技術(shù) 融合娛樂(lè)性,GAME AI技術(shù)簡(jiǎn)介(2),游戲中涉及的AI技術(shù) 專(zhuān)家系統(tǒng) 用知識(shí)表示專(zhuān)家的經(jīng)驗(yàn),并在此基礎(chǔ)上作自動(dòng)推理 案例式推理 將輸入與數(shù)據(jù)庫(kù)中已有的案例進(jìn)行比較,選
2、取最為相近的案例,其已有的解決方法即為輸出 有限狀態(tài)機(jī) 基于規(guī)則的系統(tǒng),有限個(gè)狀態(tài)連接成一有向圖,每一條邊稱(chēng)為一個(gè)轉(zhuǎn)移,GAME AI技術(shù)簡(jiǎn)介(3),游戲中涉及的AI技術(shù)(續(xù)) 產(chǎn)生式系統(tǒng) 包含多個(gè)產(chǎn)生式,每一條產(chǎn)生式由條件和動(dòng)作兩部分組成,當(dāng)產(chǎn)生式的條件滿(mǎn)足時(shí),系統(tǒng)就執(zhí)行相應(yīng)的動(dòng)作 決策樹(shù) 給定輸入,從樹(shù)的根部開(kāi)始,將輸入與當(dāng)前結(jié)點(diǎn)相比較,選擇當(dāng)前結(jié)點(diǎn)的某一個(gè)子結(jié)點(diǎn)作為下一次比較的對(duì)象。當(dāng)?shù)竭_(dá)樹(shù)的葉子時(shí),則給出相應(yīng)的決策 搜索方法 找到一列動(dòng)作(或狀態(tài)轉(zhuǎn)移),使得最終的結(jié)果滿(mǎn)足某一特定目標(biāo),GAME AI技術(shù)簡(jiǎn)介(4),游戲中涉及的AI技術(shù)(續(xù)) 規(guī)劃系統(tǒng) 給定世界的初始狀態(tài),以及下一步可能
3、采取的動(dòng)作的精確定義,找到完成某個(gè)特定目標(biāo)的最優(yōu)路徑 一階謂詞邏輯 謂詞邏輯通過(guò)定義“物體”、“屬性”、“關(guān)系”等對(duì)當(dāng)前場(chǎng)景的狀態(tài)進(jìn)行推理 情景演算 用一階邏輯計(jì)算在給定情景下AI生命的反應(yīng),GAME AI技術(shù)簡(jiǎn)介(5),游戲中涉及的AI技術(shù)(續(xù)) 多Agent 研究在多個(gè)相互競(jìng)爭(zhēng)相互合作的智能體之間所產(chǎn)生的交互智能行為 人工生命 多agent系統(tǒng)一種,試圖將生命系統(tǒng)中一些普遍規(guī)律應(yīng)用到虛擬世界的人工智能體上 群組行為(Flocking) 人工生命的一類(lèi),研究協(xié)同移動(dòng)技術(shù),例如人工智能體如何在大量的羊群中移動(dòng),GAME AI技術(shù)簡(jiǎn)介(6),游戲中涉及的AI技術(shù)(續(xù)) Robotics 讓機(jī)器在
4、自然環(huán)境下交互的工作 遺傳算法 直接模擬生物進(jìn)化過(guò)程,通過(guò)隨機(jī)選擇、雜交和突變等對(duì)程序、算法或者一系列參數(shù)進(jìn)行操作 神經(jīng)網(wǎng)絡(luò) 模擬動(dòng)物神經(jīng)系統(tǒng)功能的機(jī)器學(xué)習(xí)方法 通過(guò)反復(fù)調(diào)節(jié)系統(tǒng)內(nèi)部中各個(gè)神經(jīng)元之間的連接參數(shù),使得訓(xùn)練得到的系統(tǒng)在大多數(shù)情況下作出優(yōu)或者近似優(yōu)的反應(yīng),GAME AI技術(shù)簡(jiǎn)介(7),游戲中涉及的AI技術(shù)(續(xù)) 模糊邏輯 與傳統(tǒng)二值(對(duì)-錯(cuò))邏輯不同,模糊邏輯用實(shí)數(shù)表示物體隸屬于某一類(lèi)的可能性 置信網(wǎng)絡(luò) 提供建立不同現(xiàn)象之間內(nèi)在因果關(guān)系的工具,并利用概率理論處理未知的和不完全的知識(shí) 對(duì)當(dāng)前狀態(tài)作出判斷,并決定下一步可能的動(dòng)作以及其帶來(lái)的后果,GAME AI技術(shù)簡(jiǎn)介(8),GAME A
5、I技術(shù)的分類(lèi) 確定型 基于領(lǐng)域固定領(lǐng)域知識(shí),模擬簡(jiǎn)單的固定行為 行為型 基于行為模式來(lái)模擬智能行為 戰(zhàn)術(shù)型 策略模擬 RTS(real time strategy) 其他,確定型AI算法,確定性算法指預(yù)先編入代碼當(dāng)中的可預(yù)測(cè)的行為 從最簡(jiǎn)單的算法開(kāi)始 例如,系統(tǒng)中有一顆小行星,以某一速度作勻速直線運(yùn)動(dòng),它在任意時(shí)刻的位置由下列公式?jīng)Q定: 某種程度上,它們是智能的,但是這種智能是確定的,可預(yù)測(cè)的,Tracking/Chasing AI,當(dāng)智能體找到目標(biāo)后,一心一意向其移動(dòng),而不考慮任何其他的因素,例如障礙物、另外的目標(biāo)等 非常機(jī)械化 在每一幀中,智能體計(jì)算其到目標(biāo)的前進(jìn)方向,并根據(jù)其速度,前進(jìn)一
6、段距離,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,Tracking/Chasing算法,Tracking算法還可以做的更為真實(shí)一點(diǎn),就像紅外導(dǎo)彈一樣: 在每一幀中,智能體仍然首先計(jì)算其到目標(biāo)的前進(jìn)方向 這時(shí),智能體的速度允許發(fā)生變化,并根據(jù)更新后的速度,計(jì)算下一幀的位置 速度有一個(gè)上限,超過(guò)這個(gè)上限,智能體的速度將減慢,直到重新加速為止,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,Evading算法,與前面的chasing算法基本相同,唯一區(qū)別是智能體沿著遠(yuǎn)離物體的方向移動(dòng),浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,追逐行為的模擬示例,你追我趕Game AI/chasing and avoiding dem
7、o,基于行為模式的AI,在任一時(shí)間點(diǎn),每一個(gè)智能體都按照預(yù)先設(shè)定的某種模式運(yùn)動(dòng) 決策系統(tǒng)根據(jù)系統(tǒng)當(dāng)前的狀態(tài),為每一個(gè)智能體從模式集合中選擇適當(dāng)?shù)哪J?模式描述了智能體將在下面幾幀中所采取的一系列動(dòng)作 特例:scripted AI,當(dāng)系統(tǒng)到達(dá)某一特定狀態(tài)(例如,每個(gè)回合的結(jié)束),系統(tǒng)運(yùn)行的一段程序(用腳本寫(xiě)),決定系統(tǒng)下一步的動(dòng)作,典型的行為模式,基本模式 用一段指令定義模式 寫(xiě)一個(gè)解釋器解釋這段指令,并用于控制智能體的行為 條件邏輯模式 更為靈活的控制 可以通過(guò)條件邏輯選擇模式 也可以選擇本身帶有條件邏輯轉(zhuǎn)移的模式,編程技巧,非常直觀 Pattern是一列數(shù)組 數(shù)組的每一項(xiàng)定義智能體在該幀的速
8、度(方向大?。?在模擬過(guò)程中,智能體就按照預(yù)先設(shè)定的參數(shù)在每一幀之間運(yùn)動(dòng) 當(dāng)移動(dòng)到數(shù)組末尾時(shí),重新選擇一個(gè)新的模式,行為型的AI技術(shù)示例,Chasing behavior AI demo,策略性AI與通用問(wèn)題求解,AI的研究人員試圖尋找一個(gè)通用的計(jì)算模型和方法,解決所有的問(wèn)題 感知輸入系統(tǒng) 有一個(gè)記憶模擬存儲(chǔ)系統(tǒng) 推理機(jī) 行為輸出系統(tǒng) 博弈問(wèn)題 有限狀態(tài)機(jī)(FSM) 規(guī)劃和搜索,有限狀態(tài)機(jī),狀態(tài)(要采取的行為) 追擊 隨機(jī)走動(dòng) 巡邏 吃 轉(zhuǎn)移(發(fā)生轉(zhuǎn)移的原因) 時(shí)間片結(jié)束 發(fā)生某個(gè)時(shí)間 完成某個(gè)行為,伐木,將木頭運(yùn)往最近的倉(cāng)庫(kù),足夠多木材,放下木頭: 返回林場(chǎng),到倉(cāng)庫(kù),到林場(chǎng),有限狀態(tài)機(jī),機(jī)器
9、 所有部件的總稱(chēng) 狀態(tài) 對(duì)于層次有限狀態(tài)機(jī)而言,狀態(tài)包括各種子狀態(tài) 轉(zhuǎn)移 系統(tǒng)從當(dāng)前活動(dòng)狀態(tài)出發(fā),判斷下一個(gè)活動(dòng)狀態(tài),改變系統(tǒng)當(dāng)前的格局,并執(zhí)行相應(yīng)的操作,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,有限狀態(tài)機(jī),條件 定義發(fā)生轉(zhuǎn)移的先決條件 輸入和事件 允許狀態(tài)機(jī)對(duì)環(huán)境變化作出反應(yīng) 動(dòng)作 作為狀態(tài)的一部分,或者伴隨轉(zhuǎn)移出現(xiàn),浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,狀態(tài)空間圖,有向圖 每個(gè)結(jié)點(diǎn)表示系統(tǒng)狀態(tài)模型,每條弧表示狀態(tài)轉(zhuǎn)移所伴隨的動(dòng)作行為 結(jié)點(diǎn)可以是無(wú)窮多個(gè) 有些結(jié)點(diǎn)之間可能沒(méi)有弧相連接,特定狀態(tài)的查找,結(jié)點(diǎn) 包含查找目標(biāo) 終點(diǎn) 搜索路徑的結(jié)束 查找空間 所有結(jié)點(diǎn)的集合 目標(biāo) 所要到達(dá)的結(jié)點(diǎn) 經(jīng)驗(yàn)
10、 在一定程度上提示下一步搜索的方向 解答路徑 從起始結(jié)點(diǎn)開(kāi)始,到目標(biāo)的一條有向路徑,模糊的有限狀態(tài)機(jī),將模糊邏輯和有限狀態(tài)機(jī)結(jié)合 狀態(tài)之間的遷移不再是確定的 同時(shí)有多個(gè)狀態(tài),有限狀態(tài)機(jī)和模糊的有限狀態(tài)機(jī)示例,FSM/FuFSM 代碼示例 隸屬度 演示,規(guī)劃,Part of intelligence is the ability to plan - Move to a goal State 將系統(tǒng)表示成一系列狀態(tài)的集合 通過(guò)操作(Operator)改變狀態(tài),浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,路徑規(guī)劃,狀態(tài) 智能體在空間的位置 其他離散空間 體素 室內(nèi)位置 局部區(qū)塊(tile) 操作 從一個(gè)位
11、置移動(dòng)到其他位置,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,路徑規(guī)劃算法,必須對(duì)狀態(tài)空間進(jìn)行搜索,才能轉(zhuǎn)移至目標(biāo)狀態(tài) 完全性 如果目標(biāo)狀態(tài)存在,算法是否能夠?qū)⑵湔业剑?時(shí)間復(fù)雜度 空間復(fù)雜度 能夠找到最優(yōu)解,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,搜索策略,如何評(píng)價(jià)搜索算法 時(shí)間:多長(zhǎng)時(shí)間能夠找到解 找到的解是最優(yōu)、次優(yōu)還是其他 盲目搜索 沒(méi)有先驗(yàn)知識(shí) 僅僅知道目標(biāo)狀態(tài)是什么 經(jīng)驗(yàn)搜索 用經(jīng)驗(yàn)公式表示擁有的先驗(yàn)知識(shí) “經(jīng)驗(yàn)”只能作相對(duì)簡(jiǎn)單、低級(jí)的決策,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,廣度優(yōu)先搜索,根結(jié)點(diǎn)-兒子結(jié)點(diǎn)-孫子結(jié)點(diǎn) 缺點(diǎn):內(nèi)存消耗大,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,Root,Ro
12、ot,Child1,Child2,(1),(2),(3),深度優(yōu)先搜索,先兒子結(jié)點(diǎn),后兄弟,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,(1),(2),(3),雙向搜索,同時(shí)產(chǎn)生兩棵搜索樹(shù) 一棵從起點(diǎn)出發(fā) 一棵從目標(biāo)出發(fā),浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,啟發(fā)式搜索,定義目標(biāo)函數(shù),反映擁有的先驗(yàn)知識(shí) 估計(jì)離目標(biāo)的距離 估計(jì)到達(dá)目標(biāo)的花費(fèi) 用上述估計(jì)指導(dǎo)路徑的搜索,加快搜索過(guò)程,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,貪婪搜索法,永遠(yuǎn)沿著具有最小目標(biāo)函數(shù)值的路徑進(jìn)行搜索 不一定能夠找到目標(biāo) 可能得到局部最優(yōu)解,而不是全局最優(yōu),浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,A*啟發(fā)搜索,考慮到貪婪搜索法不能保
13、證找到最優(yōu)解 改進(jìn) 目標(biāo)函數(shù)由兩個(gè)部分組成 從當(dāng)前狀態(tài)到目標(biāo)狀態(tài)的“花費(fèi)”(估計(jì)) 從初始狀態(tài)到當(dāng)前狀態(tài)的“花費(fèi)”,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,基本想法,貪婪搜索法 對(duì)可能的后繼狀態(tài)n,計(jì)算其到目標(biāo)狀態(tài)的“花費(fèi)”h(n),并置于一個(gè)優(yōu)先隊(duì)列中 A* 對(duì)可能的后繼狀態(tài)n,計(jì)算其目標(biāo)函數(shù)f(n),并置于優(yōu)先隊(duì)列中 f(n) = g(n) + h(n),其中g(shù)(n)是從初始狀態(tài)到n的“花費(fèi)”,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,基本想法,選擇下一步狀態(tài)n,使得f(n)是隊(duì)列中最小的 如果h(n)估計(jì)準(zhǔn)確的話(huà),方法是可行的,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,結(jié)束條件,A*算法結(jié)束條件是
14、:當(dāng)且僅當(dāng)目標(biāo)狀態(tài)被從優(yōu)先隊(duì)列中挑選出來(lái),浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,A*算法,優(yōu)先隊(duì)列PQ 初始為空 V(一系列三元組(狀態(tài),f,回溯指針)集合,表示訪問(wèn)過(guò)的結(jié)點(diǎn)) 初始為空 將初始結(jié)點(diǎn)S置于PQ中,V中放入(S, f(s), NULL) 算法: 如果V為空,退出程序,沒(méi)有解 否則,從PQ中取出第一項(xiàng),記為n 如果n就是目標(biāo)結(jié)點(diǎn),則搜索結(jié)束 否則,產(chǎn)生n的后繼結(jié)點(diǎn),浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,A*算法,對(duì)n的每一個(gè)后繼結(jié)點(diǎn)n 計(jì)算f=g(n)+h(n)=g(n)+cost(n,n)+h(n) 如果n未被訪問(wèn)過(guò),或者n曾經(jīng)被訪問(wèn)過(guò),但是記錄的f(n)f,或者n已經(jīng)在PQ隊(duì)列
15、中,但是記錄的f(n)f 放置/更新n于優(yōu)先隊(duì)列中,使其對(duì)應(yīng)的目標(biāo)函數(shù)值為f 添加(n, f, n)至V當(dāng)中 否則忽略n,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,A*算法能否找到最優(yōu)路徑,否,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,A*算法性質(zhì),令h*(n)=從目標(biāo)到n最小花費(fèi)真實(shí)值. 經(jīng)驗(yàn)h稱(chēng)為可行的當(dāng)且僅當(dāng)對(duì)所有的狀態(tài)n, h(n) =h*(n). 可行經(jīng)驗(yàn)確保永不過(guò)估計(jì)結(jié)點(diǎn)到目標(biāo)的花費(fèi) 具有可行經(jīng)驗(yàn)的A*算法一定收斂到最優(yōu)解 比較費(fèi)內(nèi)存 當(dāng)不存在解時(shí),算法失敗 避免對(duì)全空間進(jìn)行搜索 作雙向搜索,路徑的規(guī)劃和尋找演示,A star demo 最短路經(jīng) 戰(zhàn)術(shù)最短路經(jīng) 暴露時(shí)間 有效火力 視野,群
16、體行為的模擬(1),物群的行為 物群聚集在一起飛行,遇到另一物群時(shí),他們將避開(kāi)和分散,必要時(shí)分成多群 分開(kāi)后,將尋找伙伴,形成新的物群,并最終恢復(fù)原來(lái)的物群 物群能夠?qū)Ω锻话l(fā)行為,能否對(duì)不斷變化的環(huán)境做出實(shí)時(shí)的反應(yīng),并作為一個(gè)整體行動(dòng) 。,群體行為的模擬(2),物群模擬的簡(jiǎn)單規(guī)則 分離(separation):同物群中的其他成員若即若離。 列隊(duì)(alignment):與物群中的其他成員保持相同的航向 內(nèi)聚(cohesion):不掉隊(duì) 避開(kāi)(avoidance):避開(kāi)障礙物和天敵 生存(survival):必要時(shí)進(jìn)行捕食或者逃脫被吃 .,群體行為的模擬(3),游戲中的物群行為 RTS游戲的部隊(duì)的
17、編隊(duì)模擬 RPG游戲中的群體行為模擬 行為模擬的實(shí)現(xiàn) 無(wú)狀態(tài) 不紀(jì)錄任何信息 每次將重新評(píng)估其環(huán)境,群體行為的模擬(4),示例 前進(jìn)方向不確定,但整體行動(dòng) 避開(kāi)障礙物 飛行動(dòng)物 老鷹:飛行速度快,視野廣,吃麻雀 麻雀:飛行速度一般,視野一般,吃昆蟲(chóng) 昆蟲(chóng):飛行速度慢,視野小,不捕食,能繁殖 物群的喂養(yǎng) 餓吃試圖接近獵物 昆蟲(chóng)不能滅絕,群體行為的模擬(4),演示: flocking demo,模糊邏輯,傳統(tǒng)邏輯把思維過(guò)程絕對(duì)化,從而達(dá)到精確、嚴(yán)格的目的 舉例:一個(gè)被討論的對(duì)象X,要么屬于某一個(gè)集合A,要么不屬于該集合,兩者比居其一,而且兩者僅居其一,決不模棱兩可 對(duì)于命題:張三的性格穩(wěn)重,如何判
18、斷這一命題的真假?,模糊邏輯,對(duì)于上述的例子,模糊邏輯允許我們用一個(gè)0,1的實(shí)數(shù)表示X屬于A的隸屬程度。傳統(tǒng)邏輯即隸屬程度只能從0和1之間選擇的情況 對(duì)于“性格穩(wěn)重”這個(gè)模糊概念,我們能夠用“一點(diǎn)而也不穩(wěn)重”、“不太穩(wěn)重”、“不好說(shuō)”、“有點(diǎn)穩(wěn)重”、“挺穩(wěn)重”、“很穩(wěn)重”等沒(méi)有明確界限的詞語(yǔ)形容,模糊邏輯的應(yīng)用,將重心轉(zhuǎn)移至物體屬于某個(gè)集合的隸屬程度上 在AI領(lǐng)域的主要應(yīng)用為 決策 行為選擇 輸入、輸出過(guò)濾,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,符合邏輯操作,設(shè)A,B,C均為U中的模糊集 模糊并 若對(duì)8x2U,均有c=max(A(x),B(x),則稱(chēng)C為A與B的模糊并 模糊交 若對(duì)8x2U,均
19、有c=min(A(x),B(x),則稱(chēng)C為A與B的模糊交,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,例子,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,大約6英尺,長(zhǎng)的高的人,與,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,或,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,非,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,模糊控制,舉例:車(chē)輛駕駛 前提:兩輛車(chē)之間不能相撞 在模糊邏輯中的實(shí)現(xiàn): 用兩個(gè)變量描述每一輛車(chē) 當(dāng)前時(shí)刻,車(chē)與前面一輛車(chē)之間的距離d 當(dāng)前時(shí)刻與前一時(shí)刻距離的差d,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,模糊控制,If d=0且d=兩個(gè)車(chē)位長(zhǎng),保持現(xiàn)有速度 If d0且d兩個(gè)車(chē)位長(zhǎng),加快速度,浙江大學(xué)CAD&
20、CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,小結(jié),模糊邏輯和模糊控制被廣泛用于游戲當(dāng)中 當(dāng)你想模擬人的思維模式時(shí) 模糊邏輯同樣能夠用于表示無(wú)生命時(shí)間 給定風(fēng)速和方向,問(wèn)云如何移動(dòng),浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,小結(jié),在游戲中,模糊邏輯還能夠用于 對(duì)抗敵人的人工智能 非玩家的角色(描述某個(gè)販賣(mài)情報(bào)的人對(duì)你的信任程度) Flocking算法,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,神經(jīng)網(wǎng)絡(luò),簡(jiǎn)化的人腦模型 人腦大概有1012個(gè)神經(jīng)元 每一個(gè)神經(jīng)元都能夠處理和發(fā)送信息 神經(jīng)元的三個(gè)主要組成部分: 細(xì)胞體,神經(jīng)元新陳代謝的中心 樹(shù)突,接收來(lái)自其他神經(jīng)元的信號(hào) 軸突,向其他神經(jīng)元發(fā)送信號(hào),浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)
21、實(shí)驗(yàn)室,神經(jīng)網(wǎng)絡(luò),生物學(xué)發(fā)現(xiàn) 神經(jīng)元是人腦的基本組成部分 如果將神經(jīng)元看作結(jié)點(diǎn),它們之間的連接看作弧,則這些神經(jīng)元組成一個(gè)稠密連接的圖 雖然單個(gè)神經(jīng)元的工作過(guò)程較簡(jiǎn)單,當(dāng)大量神經(jīng)元連成一個(gè)網(wǎng)絡(luò)并動(dòng)態(tài)運(yùn)行時(shí),系統(tǒng)是非常復(fù)雜的,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,人工神經(jīng)元模型,是人類(lèi)大腦神經(jīng) 元的簡(jiǎn)化 N個(gè)輸入 1個(gè)輸出 作用函數(shù),浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,人工神經(jīng)網(wǎng)絡(luò)基礎(chǔ),McCulloch and Pitts與1943年第一次提出人工神經(jīng)網(wǎng)絡(luò)概念 一個(gè)處理單元將接收的信息x0,x1,xn-1通過(guò)用W0,W1,Wn-1表示互聯(lián)強(qiáng)度,以點(diǎn)積的形式合成自己的輸入,并將輸入與以某種方式
22、設(shè)定的閾值相比較,再經(jīng)某種形式的作用函數(shù)f的轉(zhuǎn)換,得到該單元的輸出y f可以是階梯函數(shù)、線性或者是指數(shù)形式的函數(shù),浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,神經(jīng)計(jì)算,神經(jīng)網(wǎng)絡(luò)是基于人腦的平行體系結(jié)構(gòu) 與多處理器計(jì)算機(jī)相類(lèi)似 獨(dú)立處理單元 高度互聯(lián) 簡(jiǎn)單消息傳遞 適應(yīng)性交互,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,訓(xùn)練神經(jīng)網(wǎng)絡(luò),初始化:隨機(jī)設(shè)定各條邊的W值 給定一對(duì)(輸入,輸出),已有神經(jīng)網(wǎng)絡(luò)根據(jù)輸入計(jì)算輸出,將其與預(yù)計(jì)輸出相比較,并根據(jù)兩者之間的差值調(diào)整各條邊的W值 神經(jīng)網(wǎng)絡(luò)也可以自動(dòng)學(xué)習(xí),但是相比訓(xùn)練,收斂速度要慢很多,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,訓(xùn)練神經(jīng)網(wǎng)絡(luò),對(duì)已知樣本分類(lèi)的正確率 對(duì)
23、未知樣本分類(lèi)的正確率 過(guò)訓(xùn)練,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,對(duì)邏輯關(guān)系“或”的學(xué)習(xí),浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,網(wǎng)絡(luò)有兩個(gè)輸入,一個(gè)輸出,都是二元變量 輸出為1如果 W0I0 +W1I1 + Wb 0 輸出為0如果 W0 I0+W1 I1 + Wb = 0,調(diào)整權(quán)重,權(quán)重的修改與期望輸出和實(shí)際輸出之差成正比 是學(xué)習(xí)率,d是期望輸出,y是實(shí)際輸出,xi是輸入,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,示例,當(dāng)?shù)?步時(shí),(d-y)=0,因此W=0,則訓(xùn)練結(jié)束,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,多層感知器,反向傳播網(wǎng)絡(luò) 徑向基函數(shù)網(wǎng)絡(luò) 能夠?qū)W習(xí)任意復(fù)雜的模式 輸入、輸出均可以為實(shí)數(shù)
24、,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,反向傳播網(wǎng)絡(luò),三層:輸入層、隱含層、輸出層,前一層的輸出是后一層的輸入 是一種前饋網(wǎng),不形成回路 可以有多個(gè)隱含層 三層結(jié)點(diǎn)已經(jīng)能夠產(chǎn)生任意復(fù)雜的映射,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,典型BP網(wǎng)絡(luò)結(jié)構(gòu),浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,作用函數(shù):,BP學(xué)習(xí)算法,將全部權(quán)值與結(jié)點(diǎn)的閾值設(shè)置為一個(gè)小的隨機(jī)值 加在輸入與輸出 計(jì)算實(shí)際輸出 修正權(quán)值 從輸出結(jié)點(diǎn)開(kāi)始,反向的向第一隱含層(即存在多層隱含層時(shí)最接近輸入層的隱含層)傳播由總誤差誘發(fā)的權(quán)值修正 在到達(dá)預(yù)定誤差精度和循環(huán)次數(shù)后退出,否則轉(zhuǎn)步驟2重復(fù),浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,徑向基函
25、數(shù)網(wǎng)絡(luò),前饋網(wǎng)絡(luò),只有一個(gè)隱含層 能夠表示任意復(fù)雜的映射 隱含層的作用函數(shù)稱(chēng)為徑向基函數(shù),在某一點(diǎn)函數(shù)有最大值,而離開(kāi)該點(diǎn)一定距離的值被映射為0 一般的,取徑向基函數(shù)為高斯函數(shù),浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,訓(xùn)練RBF網(wǎng)絡(luò),需要決定 隱含層包含多少個(gè)結(jié)點(diǎn) 每個(gè)結(jié)點(diǎn)作用函數(shù) 訓(xùn)練過(guò)程 首先通過(guò)觀察訓(xùn)練樣本,決定作用函數(shù)的形狀 用前面的delta規(guī)則修正權(quán)重 應(yīng)用 物體分類(lèi) 函數(shù)插值,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,小結(jié),BP和RBF網(wǎng)絡(luò)是兩個(gè)常用的神經(jīng)網(wǎng)絡(luò)模型 當(dāng)系統(tǒng)遇到新的未知樣本,RBF可以通過(guò)添加隱含層結(jié)點(diǎn)加強(qiáng)系統(tǒng)的判斷能力 兩者都能處理動(dòng)態(tài)時(shí)序數(shù)據(jù),浙江大學(xué)CAD&CG 國(guó)
26、家重點(diǎn)實(shí)驗(yàn)室,神經(jīng)網(wǎng)絡(luò)應(yīng)用,當(dāng)我們沒(méi)辦法明確給出一個(gè)算法解時(shí) 當(dāng)我們有充足的樣本時(shí) 當(dāng)我們需要從數(shù)據(jù)中獲得一點(diǎn)什么時(shí) 我們可以使用神經(jīng)網(wǎng)絡(luò),浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,神經(jīng)網(wǎng)絡(luò)應(yīng)用,對(duì)于那些傳統(tǒng)計(jì)算解決不了的問(wèn)題,神經(jīng)網(wǎng)絡(luò)也無(wú)法解決 神經(jīng)網(wǎng)絡(luò)可以簡(jiǎn)化某些特定問(wèn)題的解答,例如,從數(shù)據(jù)中提煉一個(gè)模型 對(duì)于數(shù)據(jù)形成過(guò)程未知或者復(fù)雜的問(wèn)題而言,神經(jīng)網(wǎng)絡(luò)能夠幫助我們從一定程度上理解內(nèi)在的規(guī)律,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,神經(jīng)網(wǎng)絡(luò)應(yīng)用,投資分析 筆跡分析 過(guò)程控制 市場(chǎng)調(diào)查 狀態(tài)監(jiān)控,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,神經(jīng)網(wǎng)絡(luò)與游戲,判斷所處的環(huán)境 決定下一步的動(dòng)作 用于表示積累的
27、經(jīng)驗(yàn),浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,神經(jīng)元網(wǎng)絡(luò),坦克的射擊訓(xùn)練示例 Neuro network demo,遺傳算法,遺傳算法的基本思想是基于Darwin進(jìn)化論和Mendel的遺傳學(xué)說(shuō)的 適者生存原理 基因遺傳原理(基因突變和基因雜交) 遺傳算法一般用于在難易預(yù)測(cè)其中各個(gè)因素之間相互作用的大型系統(tǒng)上作非線性?xún)?yōu)化,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,遺傳算法工作原理,選擇初始群體 觀察每個(gè)個(gè)體對(duì)環(huán)境的適應(yīng)能量 選擇 重復(fù) 雜交 變異 觀察每個(gè)個(gè)體對(duì)環(huán)境的適應(yīng)能量 選擇 直到滿(mǎn)足某些結(jié)束條件,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,進(jìn)化和遺傳學(xué)的概念,串(string) 它是個(gè)體(Indiv
28、idual)的形式,在算法中為二進(jìn)制串,并且對(duì)應(yīng)于遺傳學(xué)中的染色體(Chromosome) 群體(Population) 個(gè)體的集合稱(chēng)為群體,串是群體的元素 基因(Gene) 基因是串中的元素,基因用于表示個(gè)體的特征。例如有一個(gè)串S1011,則其中的1,0,1,1這4個(gè)元素分別稱(chēng)為基因。它們的值稱(chēng)為等位基因(Alletes) 基因位置(Gene Position) 一個(gè)基因在串中的位置稱(chēng)為基因位置,有時(shí)也簡(jiǎn)稱(chēng)基因位?;蛭恢糜纱淖笙蛴矣?jì)算,例如在串S1101中,0的基因位置是3?;蛭恢脤?duì)應(yīng)于遺傳學(xué)中的地點(diǎn)(Locus),進(jìn)化和遺傳學(xué)的概念,基因特征值(Gene Feature) 在用串表示
29、整數(shù)時(shí),基因的特征值與二進(jìn)制數(shù)的權(quán)一致;例如在串S=1011中,基因位置3中的1,它的基因特征值為2;基因位置1中的1,它的基因特征值為8 非線性 它對(duì)應(yīng)遺傳學(xué)中的異位顯性(Epistasis) 適應(yīng)度(Fitness) 表示某一個(gè)體對(duì)于環(huán)境的適應(yīng)程度,選擇,這是從群體中選擇出較適應(yīng)環(huán)境的個(gè)體。這些選中的個(gè)體用于繁殖下一代。故有時(shí)也稱(chēng)這一操作為再生(Reproduction)。由于在選擇用于繁殖下一代的個(gè)體時(shí),是根據(jù)個(gè)體對(duì)環(huán)境的適應(yīng)度而決定其繁殖量的,故而有時(shí)也稱(chēng)為非均勻再生(differential reproduction),浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,選擇,根據(jù)適者生存原則選擇
30、下一代的個(gè)體。在選擇時(shí),以適應(yīng)度為選擇原則。適應(yīng)度準(zhǔn)則體現(xiàn)了適者生存,不適應(yīng)者淘汰的自然法則 給出目標(biāo)函數(shù)f,則f(bi)稱(chēng)為個(gè)體bi的適應(yīng)度 為選中bi為下一代個(gè)體的次數(shù),浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,選擇,性質(zhì): 適應(yīng)度較高的個(gè)體,繁殖下一代的數(shù)目較多。 適應(yīng)度較小的個(gè)體,繁殖下一代的數(shù)目較少;甚至被淘汰。 選擇產(chǎn)生對(duì)環(huán)境適應(yīng)能力較強(qiáng)的后代。對(duì)于問(wèn)題求解角度來(lái)講,就是選擇出和最優(yōu)解較接近的中間解。,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,交叉,對(duì)于選中用于繁殖下一代的個(gè)體,隨機(jī)地選擇兩個(gè)個(gè)體的相同位置,按交叉概率P,在選中的位置實(shí)行交換。這個(gè)過(guò)程反映了隨機(jī)信息交換;目的在于產(chǎn)生新的基
31、因組合,也即產(chǎn)生新的個(gè)體。交叉時(shí),可實(shí)行單點(diǎn)交叉或多點(diǎn)交叉,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,交叉,例如有個(gè)體 S1=100101 S2=010111 選擇它們的左邊3位進(jìn)行交叉操作,則有 S1=010101 S2=100111 一般而言,交叉概率P的取值為0.25-0.75,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,變異,根據(jù)生物遺傳中基因變異的原理,以變異概率Pm對(duì)某些個(gè)體的某些位執(zhí)行變異。在變異時(shí),對(duì)執(zhí)行變異的串的對(duì)應(yīng)位求反,即把1變?yōu)?,把0變?yōu)?。變異概率Pm與生物變異極小的情況一致,所以,Pm的取值較小,一般取0.01-0.2 例如有個(gè)體S101011,對(duì)其的第1、4位置的基因進(jìn)行
32、變異,則有S=001111 單靠變異不能在求解中得到好處。但是,它能保證算法過(guò)程不會(huì)產(chǎn)生無(wú)法進(jìn)化的單一群體。因?yàn)樵谒械膫€(gè)體一樣時(shí),交叉是無(wú)法產(chǎn)生新的個(gè)體的,這時(shí)只能靠變異產(chǎn)生新的個(gè)體。也就是說(shuō),變異增加了全局優(yōu)化的特質(zhì)。,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,組合,選擇雜交進(jìn)化 選擇使得適者生存 雜交將不同個(gè)體中優(yōu)良的基因保存下來(lái),創(chuàng)造新的具有各方面優(yōu)勢(shì)的品種 選擇變異在優(yōu)化中加入隨機(jī)擾動(dòng) 遺傳算法是采用隨機(jī)方法進(jìn)行最優(yōu)解搜索,選擇體現(xiàn)了向最優(yōu)解迫近,變異體現(xiàn)了全局最優(yōu)解的復(fù)蓋 壞的變異將最終被選擇出去,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,組合,選擇雜交突變遺傳算法的力量,浙江大學(xué)CAD&
33、CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,遺傳算法,P:= 以隨機(jī)方式產(chǎn)生串的集合 如果最優(yōu)個(gè)體的適應(yīng)度還未達(dá)到給定的閥值,或者最優(yōu)個(gè)體的適應(yīng)度和群體適應(yīng)度仍然在上升 令fi=Fitness(pi), i=1n 令P= SelectionNewPopulation(p,f) 隨機(jī)兩兩組合P中的個(gè)體 對(duì)每一對(duì)個(gè)體,以概率C進(jìn)行雜交 對(duì)P中的每一個(gè)個(gè)體,以概率M進(jìn)行編譯 令P=P,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,結(jié)束條件,最優(yōu)個(gè)體的適應(yīng)度達(dá)到給定的閥值 最優(yōu)個(gè)體的適應(yīng)度和群體適應(yīng)度不再上升 達(dá)到預(yù)先設(shè)定的最大循環(huán)數(shù)(繁衍代數(shù)) 群體中的所有個(gè)體具有相同的屬性,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,遺傳算法參數(shù),群體大小n 交叉概率Pc 變異概率Pm 繁衍代數(shù) 其他:取決與具體的操作和結(jié)束條件,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,編碼方式,除二進(jìn)制編碼外,問(wèn)題的各種參數(shù)可以用實(shí)數(shù)向量構(gòu)成子串 選擇:與串類(lèi)似 變異:將按照高斯概率分布的隨機(jī)變量g加到某個(gè)參數(shù)上,浙江大學(xué)CAD&CG 國(guó)家重點(diǎn)實(shí)驗(yàn)室,遺傳規(guī)劃,遺傳算法的一個(gè)分支,由Koza提出,與遺傳算法用串的形式表示所不同的是,遺傳規(guī)劃的表示是計(jì)算機(jī)程序 它是一種自動(dòng)編程技術(shù) 終結(jié)符集合:變量、常數(shù) 函數(shù)集合:程序中的函數(shù) 用分析樹(shù)的形式表示中間產(chǎn)生的程序,
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 3.2中國(guó)特色社會(huì)主義的創(chuàng)立、發(fā)展和完善 教學(xué)設(shè)計(jì) 統(tǒng)編版高中思想政治必修1中國(guó)特色社會(huì)主義
- 2025年廣州市稅務(wù)系統(tǒng)遴選面試真題附詳解含答案
- 鋁行業(yè)規(guī)范條件
- 聯(lián)系村工作分類(lèi)指導(dǎo)實(shí)施方案范文(9篇)
- 敏感元件系統(tǒng)的高精度信號(hào)處理與分析技術(shù)
- 高溫作業(yè)防暑降溫用品配備
- 2025年瀘州古藺縣教育和體育局城區(qū)學(xué)校教師招聘考試筆試試題(含答案)
- 老爸的課件名稱(chēng)
- 老年綜合評(píng)估技能操作課件
- 老年護(hù)理課程直播課件
- GB/T 18348-2022商品條碼條碼符號(hào)印制質(zhì)量的檢驗(yàn)
- GB/T 17619-1998機(jī)動(dòng)車(chē)電子電器組件的電磁輻射抗擾性限值和測(cè)量方法
- GB/T 10560-2017礦用焊接圓環(huán)鏈用鋼
- 2023年山東鐵路投資控股集團(tuán)有限公司校園招聘筆試題庫(kù)及答案解析
- 音標(biāo)版中考必考英語(yǔ)1600單詞
- 工程竣工初驗(yàn)報(bào)告表格
- 考勤及簽到表30天
- 靜脈輸液護(hù)理技術(shù)操作規(guī)范PPT
- 機(jī)械制造企業(yè)隱患排查清單(公司級(jí)、車(chē)間級(jí)、崗位級(jí))
- 的溶劑溶解度參數(shù)表
- 夏季高溫施工安全生產(chǎn)培訓(xùn)
評(píng)論
0/150
提交評(píng)論