人工神經(jīng)網(wǎng)絡(luò)與人機(jī)博弈_第1頁
人工神經(jīng)網(wǎng)絡(luò)與人機(jī)博弈_第2頁
人工神經(jīng)網(wǎng)絡(luò)與人機(jī)博弈_第3頁
人工神經(jīng)網(wǎng)絡(luò)與人機(jī)博弈_第4頁
人工神經(jīng)網(wǎng)絡(luò)與人機(jī)博弈_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、人工神經(jīng)網(wǎng)絡(luò)與人機(jī)博弈第1頁,共21頁,2022年,5月20日,11點(diǎn)4分,星期日總目錄 生物學(xué)的神經(jīng)網(wǎng)絡(luò)1 人工神經(jīng)網(wǎng)絡(luò)2 神經(jīng)網(wǎng)絡(luò)的人機(jī)博弈應(yīng)用3 小實(shí)驗(yàn):井字過三關(guān)4第2頁,共21頁,2022年,5月20日,11點(diǎn)4分,星期日生物學(xué)的神經(jīng)網(wǎng)絡(luò)動物的大腦結(jié)構(gòu) 分為灰色的外層和白色的內(nèi)層?;疑珜又挥袔缀撩缀瘢渲芯o密地壓縮著幾十億個被稱作神經(jīng)元的微小細(xì)胞。白色層在皮層灰質(zhì)的下面,占據(jù)了皮層的大部分空間,是由神經(jīng)細(xì)胞相互之間的無數(shù)連接組成。皮層象核桃一樣起皺,這可以把一個很大的表面區(qū)域塞進(jìn)到一個較小的空間里。這與光滑的皮層相比能容納更多的神經(jīng)細(xì)胞。 人的大腦大約含有1OG (即100億)個這樣

2、的微 小處理單元 第3頁,共21頁,2022年,5月20日,11點(diǎn)4分,星期日生物學(xué)的神經(jīng)網(wǎng)絡(luò)神經(jīng)細(xì)胞 神經(jīng)細(xì)胞都長著一根像電線一樣的稱為軸突(axon)的東西,它的長度有時伸展到幾厘米,用來將信號傳遞給其他的神經(jīng)細(xì)胞。它由一個細(xì)胞體、一些樹突、和一根可以很長的軸突組成。 神經(jīng)細(xì)胞利用電-化學(xué)過程交換信號。輸入信號來自另一些神經(jīng)細(xì)胞。這些神經(jīng)細(xì)胞的軸突末梢和本神經(jīng)細(xì)胞的樹突相遇形成突觸,信號就從樹突上的突觸進(jìn)入本細(xì)胞。大腦的神經(jīng)細(xì)胞只有兩種狀態(tài):興奮和不興奮。發(fā)射信號的強(qiáng)度不變,變化的僅僅是頻率。神經(jīng)細(xì)胞把所有從樹突上突觸進(jìn)來的信號進(jìn)行相加,如果全部信號的總和超過某個閥值,就會激發(fā)神經(jīng)細(xì)胞進(jìn)入

3、興奮狀態(tài),這時就會有一個電信號通過軸突發(fā)送出去給其他神經(jīng)細(xì) 胞。第4頁,共21頁,2022年,5月20日,11點(diǎn)4分,星期日神經(jīng)網(wǎng)絡(luò)特點(diǎn)能實(shí)現(xiàn)無監(jiān)督的學(xué)習(xí)不存在導(dǎo)師,網(wǎng)絡(luò)根據(jù)外部數(shù)據(jù)的統(tǒng)計(jì)規(guī)律來調(diào)節(jié)系統(tǒng)參數(shù),以使網(wǎng)絡(luò)輸出能反映數(shù)據(jù)的某種特性。對損傷有冗余性 大腦即使有很大一部分受到了損傷,它仍然能夠執(zhí)行復(fù)雜的工作。 處理信息的效率極高神經(jīng)細(xì)胞采用了并行的工作方式,使得大腦能夠同時處理大量的數(shù)據(jù)。 善于歸納推廣 極擅長的事情之一就是模式識別,并能根據(jù)已熟悉信息進(jìn)行歸納推廣 。它是有意識的這個在人工神經(jīng)網(wǎng)絡(luò)中不予討論。 第5頁,共21頁,2022年,5月20日,11點(diǎn)4分,星期日人工神經(jīng)網(wǎng)絡(luò)模擬大

4、腦的人工神經(jīng)網(wǎng)絡(luò)ANN是由許多叫做人工神經(jīng)細(xì)胞(也稱人工神經(jīng)原,或人工神經(jīng)元)的細(xì)小結(jié)構(gòu)模塊組成。人工神經(jīng)細(xì)胞就像真實(shí)神經(jīng)細(xì)胞的一個簡化版,但采用了電子方式來模擬實(shí)現(xiàn)。 一個人工神經(jīng)細(xì)胞可以有任意n個輸入,n代表總數(shù)。可以用下面的數(shù)學(xué)表達(dá)式來代表所有n個輸入:x1, x2, x3, x4, x5, ., xn 同樣 n 個權(quán)重可表達(dá)為:w1, w2, w3, w4, w5 ., wn 那么激勵值就是所有輸入與它們對應(yīng)權(quán)重的之乘積之總和。第6頁,共21頁,2022年,5月20日,11點(diǎn)4分,星期日如下圖,網(wǎng)絡(luò)的每一層神經(jīng)細(xì)胞的輸出都向前饋送到了它們的下一層,直到獲得整個網(wǎng)絡(luò)的輸出為止。這一種類型

5、的神經(jīng)網(wǎng)絡(luò)就叫前饋網(wǎng)絡(luò)。網(wǎng)絡(luò)共有三層(輸入層不是神經(jīng)細(xì)胞,神經(jīng)細(xì)胞只有兩層)。輸入層中的每個輸入都饋送到了隱藏層,作為該層每一個神經(jīng)細(xì)胞的輸入;然后,從隱藏層的每個神經(jīng)細(xì)胞的輸出都連到了它下一層(即輸出層)的每一個神經(jīng)細(xì)胞。圖中僅僅畫了一個隱藏層,作為前饋網(wǎng)絡(luò),一般地可以有任意多個隱藏層。 人工神經(jīng)網(wǎng)絡(luò)第7頁,共21頁,2022年,5月20日,11點(diǎn)4分,星期日神經(jīng)網(wǎng)絡(luò)的人機(jī)博弈應(yīng)用人機(jī)博弈的重要事件 1988年,“深思”擊敗丹麥特級大師拉爾森1989年,每秒思考速度達(dá)200萬步的“深思” 0 比2不敵卡斯帕羅夫1993年,“深思”二代擊敗了丹麥國家隊(duì),在與前女子世界冠軍小波爾加的對抗中獲勝1

6、996年,性能高于“深思”數(shù)百倍的“深藍(lán)” 以2比4負(fù)于卡斯帕羅夫1997年,“更深的藍(lán)” 以3.5比2.5擊敗了卡斯帕羅夫2001年,一家德國公司開發(fā)的國際象棋軟件“更弗里茨”擊敗了除克拉姆尼克之外的所有排名世界前十位的棋手2002年10月,“更弗里茨”與克拉姆尼克在巴林進(jìn)行“人機(jī)大戰(zhàn)”,雙方以4比4戰(zhàn)平2003年1至2月 由兩位以色列電腦專家研究出的“更年少者”與卡斯帕羅夫?qū)?,雙方3比3戰(zhàn)平。1997年卡斯帕羅夫與深藍(lán)2的人機(jī)大戰(zhàn)2003年卡斯帕羅夫與更年少者的人機(jī)大戰(zhàn)第8頁,共21頁,2022年,5月20日,11點(diǎn)4分,星期日神經(jīng)網(wǎng)絡(luò)的人機(jī)博弈應(yīng)用Gerald Tesauro 的西洋雙

7、六棋 西洋雙陸棋是西方一種狀態(tài)空間比較大的棋類游戲。1992年,IBM的工程師Gerald Tesauro利用人工神經(jīng)網(wǎng)絡(luò),編寫出一款雙六棋程序TD-Gammon。在本例中使用的神經(jīng)網(wǎng)絡(luò)包含198 個輸入節(jié)點(diǎn)、 80個隱含節(jié)點(diǎn)和1 個輸出節(jié)點(diǎn)。其中輸入節(jié)點(diǎn)輸入的是棋盤的局面特征,輸出的是對棋盤的評估值。 第9頁,共21頁,2022年,5月20日,11點(diǎn)4分,星期日/massive/tdl.html#ref10有興趣的可以參考第10頁,共21頁,2022年,5月20日,11點(diǎn)4分,星期日五子棋 在本例中用這種方法的五子棋程序采用BP 神經(jīng)網(wǎng)絡(luò)來求評估值,網(wǎng)絡(luò)即為局面評估函數(shù) f 。它有56個輸入

8、節(jié)點(diǎn),28 個隱含節(jié)點(diǎn)和2 個輸出節(jié)點(diǎn)。第11頁,共21頁,2022年,5月20日,11點(diǎn)4分,星期日 輸入節(jié)點(diǎn)中有28 個代表計(jì)算機(jī)局面的特征,另 28 個代表對手局面的特征。2 個輸出節(jié)點(diǎn)分別是對計(jì)算機(jī)棋手局面與對手局面的評估, 兩個值相減得到對局面的評估值。莫建文等. 基于TD強(qiáng)化學(xué)習(xí)智能博弈程序的設(shè)計(jì)與實(shí)現(xiàn)J. 計(jì)算機(jī)應(yīng)用,2004,24(6):287-288有興趣的可以參考第12頁,共21頁,2022年,5月20日,11點(diǎn)4分,星期日小實(shí)驗(yàn):井字過三關(guān)介紹: 即課本第一章習(xí)題1.5中提到的tic-tac-toe。兩個玩家,一個打圈(O),一個打叉(X),輪流在3乘3的格上打自己的符號

9、,最先以橫、直、斜連成一線則為勝。先下玩家有優(yōu)勢,雙方無失誤,將是和局。一個空白的棋盤一場游戲的過程第13頁,共21頁,2022年,5月20日,11點(diǎn)4分,星期日原理概述設(shè)計(jì)由九個感知器組成的單層人工神經(jīng)網(wǎng)絡(luò)輸入:將棋局分布用九位的二進(jìn)制數(shù)表示,每一位作為一個輸入。對方 用 -1 表示;己方 用 1 表示;空白格用 0 表示。例子:1 -1 -1 0 1 0 1 0 -1輸出:應(yīng)該落子的位置輸出為1 其余位置輸出為0第14頁,共21頁,2022年,5月20日,11點(diǎn)4分,星期日部分輸入向量對應(yīng)的目標(biāo)輸出值部分訓(xùn)練樣例第15頁,共21頁,2022年,5月20日,11點(diǎn)4分,星期日 實(shí)驗(yàn)利用Matlab中的神經(jīng)網(wǎng)絡(luò)工具箱來進(jìn)行,將輸入向量和目標(biāo)輸出分別保存為p_1和t_1兩個文件,建立神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。學(xué)習(xí)速率取0.05,訓(xùn)練次數(shù)定為1000次。第16頁,共21頁,2022年,5月20日,11點(diǎn)4分,星期日訓(xùn)練結(jié)果 經(jīng)過訓(xùn)練,對部分棋局能作出正確判斷,但有時也會出現(xiàn)不正確的結(jié)果。 成功的例子失敗的例子第17頁,共21頁,2022年,5月20日,11點(diǎn)4分,星期日網(wǎng)絡(luò)過于簡單?應(yīng)該下這一步也應(yīng)該下這一步第18頁,共21頁,2022年,5月20日,11點(diǎn)4

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論