版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第二章
智能Agent
第二章
智能Agent
2015年1月湖南大學(xué)信息科學(xué)與工程學(xué)院內(nèi)容提要Agents和環(huán)境理性Agent環(huán)境的性質(zhì)Agent的類型與結(jié)構(gòu)內(nèi)容提要Agents和環(huán)境2AgentAgent通過感知器感知環(huán)境并通過執(zhí)行器對(duì)所處的環(huán)境產(chǎn)生影響人類Agent眼睛,耳朵為感知器手,腳,聲道為執(zhí)行器機(jī)器人Agent攝像頭,紅外距測(cè)儀為感知器馬達(dá)為執(zhí)行器AgentAgent通過感知器感知環(huán)境并通過執(zhí)行器對(duì)所處的環(huán)3Agent和環(huán)境Agent函數(shù)將任何感知?dú)v史數(shù)據(jù)映射為行為:Agent程序通過在物理系統(tǒng)上運(yùn)行來實(shí)現(xiàn)Agent函數(shù)Agent=體系結(jié)構(gòu)+程序Agent和環(huán)境Agent函數(shù)將任何感知?dú)v史數(shù)據(jù)映射為行為:4真空吸塵器世界感知器:地點(diǎn)和內(nèi)容(eg.[A,Dirty])行為:向左,向右,洗塵,無操作真空吸塵器世界感知器:地點(diǎn)和內(nèi)容(eg.[A,Dirty]5真空吸塵器世界真空吸塵器世界6理性Agent理性agent:對(duì)于每一可能的感知數(shù)據(jù)序列,一個(gè)理性的agent應(yīng)該采取一個(gè)行為以達(dá)到最大的性能。理性判斷的4個(gè)因素性能度量先驗(yàn)知識(shí)可以完成的行動(dòng)截至到此刻的感知序列理性Agent理性agent:對(duì)于每一可能的感知數(shù)據(jù)序列,一7理性Agent一個(gè)Agent應(yīng)該根據(jù)它感知的信息和它能夠進(jìn)行的行為而做正確的事情正確的行為將使得Agent能夠取得最大的成功性能度量:一個(gè)客觀的標(biāo)準(zhǔn)來評(píng)價(jià)Agent的行為的成功性Eg.真空器agent的性能度量可以是它清洗區(qū)域的數(shù)量,花費(fèi)的時(shí)間,消耗的能量,產(chǎn)生的噪音等等Eg.真空洗塵器8個(gè)小時(shí)內(nèi)清理的灰塵總量來度量性能?以行為來度量性能不如以結(jié)果來度量性能理性Agent一個(gè)Agent應(yīng)該根據(jù)它感知的信息和它能夠進(jìn)行8理性Agent全知:明確知道它的行動(dòng)產(chǎn)生的實(shí)際結(jié)果并且作出相應(yīng)的動(dòng)作理性不等同于全知(已知的知識(shí)都是有限的)理性不等于完美:理性是使期望的性能最大化完美是使實(shí)際的性能最大化理性Agent全知:明確知道它的行動(dòng)產(chǎn)生的實(shí)際結(jié)果并且作出相9理性Agent理性agent能夠進(jìn)行信息收集。理性的agent應(yīng)該具有自主性,能夠進(jìn)行學(xué)習(xí)從環(huán)境的感知信息中根據(jù)歷史經(jīng)驗(yàn)來學(xué)習(xí)理性Agent理性agent能夠進(jìn)行信息收集。10任務(wù)環(huán)境任務(wù)環(huán)境:包括性能(Performance),環(huán)境(Environment),agent的執(zhí)行器(Actuators)和傳感器(Sensors),英文縮寫為PEAS對(duì)于每一個(gè)智能agent,必須說明其PEAS參數(shù)Eg.自動(dòng)駕駛出租車性能度量環(huán)境執(zhí)行器傳感器任務(wù)環(huán)境任務(wù)環(huán)境:包括性能(Performance),環(huán)境(11任務(wù)環(huán)境Eg.自動(dòng)駕駛出租車性能度量:安全性,快速性,交通違規(guī),舒適度,利潤(rùn)環(huán)境:馬路,其他交通工具,行人,乘客執(zhí)行器:方向盤,加速油門,剎車,語音合成器傳感器:攝像頭,紅外或聲納,速度表,GPS,鍵盤,麥克風(fēng)任務(wù)環(huán)境Eg.自動(dòng)駕駛出租車12任務(wù)環(huán)境Environment:Patient,hospital,staffActuators:Screendisplay(questions,tests,diagnoses,treatments,referrals)Sensors:Keyboard(entryofsymptoms,findings,patient'sanswers)Eg.醫(yī)療診斷系統(tǒng)性能度量:病人的健康性,病人花費(fèi)環(huán)境:病人,醫(yī)院,工作人員執(zhí)行器:顯示屏(詢問,測(cè)試,診斷,治療方案)傳感器:鍵盤(輸入癥狀,現(xiàn)場(chǎng)檢測(cè),病人的回答)任務(wù)環(huán)境Environment:Patient,ho13任務(wù)環(huán)境14Eg.挑揀零件機(jī)器人性能度量:正確挑揀的零件所占的百分比環(huán)境:零件傳送帶,容器執(zhí)行器:機(jī)器人手臂和手傳感器:攝像頭,關(guān)節(jié)感知器任務(wù)環(huán)境14Eg.挑揀零件機(jī)器人任務(wù)環(huán)境15Eg.交互式英語教學(xué)者性能度量:最大化學(xué)生成績(jī)環(huán)境:學(xué)生執(zhí)行器:顯示屏(練習(xí)題,建議,正確答案)傳感器:鍵盤任務(wù)環(huán)境15Eg.交互式英語教學(xué)者環(huán)境的性質(zhì)16完全可觀察的vs.部分可觀察的一個(gè)agent的傳感器在每個(gè)時(shí)間點(diǎn)上都能獲取環(huán)境的完整狀態(tài)一個(gè)agent的傳感器在每個(gè)時(shí)間點(diǎn)上都能獲取環(huán)境的部分狀態(tài)真空洗塵器?自動(dòng)駕駛汽車?單agentvs.多agent單agent獨(dú)自運(yùn)行eg.字謎游戲多agent同時(shí)運(yùn)行eg.國(guó)際象棋國(guó)際象棋vs.駕駛出租車?環(huán)境的性質(zhì)16完全可觀察的vs.部分可觀察的環(huán)境的性質(zhì)確定的vs.隨機(jī)的環(huán)境的下一個(gè)狀態(tài)完全取決于當(dāng)前狀態(tài)和agent執(zhí)行的動(dòng)作部分可觀察?出租車駕駛?真空吸塵器?片段式的vs.延續(xù)式的agent的經(jīng)歷被分成一個(gè)個(gè)原子片段,在每個(gè)片段中agent感知信息并完成單個(gè)行動(dòng),下一個(gè)片段不依賴于以前的片段檢查次品零件的機(jī)器人?國(guó)際象棋?環(huán)境的性質(zhì)確定的vs.隨機(jī)的17環(huán)境的性質(zhì)18靜態(tài)的vs.動(dòng)態(tài)的環(huán)境在agent計(jì)算的時(shí)候不會(huì)變化(vs.會(huì)變化)半動(dòng)態(tài)的:環(huán)境本身不變化但agent的性能評(píng)價(jià)隨時(shí)間變化出租車,國(guó)際象棋,填字游戲?離散的vs.連續(xù)的環(huán)境的狀態(tài),時(shí)間的處理方式以及agent的感知信息和行動(dòng)都有離散/連續(xù)之分國(guó)際象棋,出租車駕駛?環(huán)境的性質(zhì)18靜態(tài)的vs.動(dòng)態(tài)的環(huán)境的性質(zhì)環(huán)境的性質(zhì)決定了agent的設(shè)計(jì)最難處理的情況:部分可觀察的,隨機(jī)的,連續(xù)的,動(dòng)態(tài)的,延續(xù)式的,多agent的環(huán)境的性質(zhì)環(huán)境的性質(zhì)決定了agent的設(shè)計(jì)19Agent函數(shù)和程序一個(gè)agent用agent函數(shù)來表示agent函數(shù)將感知數(shù)據(jù)序列映射為行為Agent程序以傳感器得到的當(dāng)前感知信息為輸入以執(zhí)行器的行動(dòng)為輸出僅僅以當(dāng)前感知為輸入而不是以整個(gè)歷史感知為輸入Agent函數(shù)和程序一個(gè)agent用agent函數(shù)來表示20Agent的表驅(qū)動(dòng)方法缺點(diǎn)表太大創(chuàng)建表時(shí)間長(zhǎng)非自主性,需人工填寫即使能夠?qū)W習(xí),也需要很長(zhǎng)的時(shí)間Agent的表驅(qū)動(dòng)方法缺點(diǎn)21Agent的類型四種基本的類型簡(jiǎn)單反射agent基于模型的反射agent基于目標(biāo)的agent基于效用的agentAgent的類型四種基本的類型22真空吸塵器的Agent程序真空吸塵器的Agent程序23簡(jiǎn)單反射的agent基于當(dāng)前的感知選擇行動(dòng),不關(guān)注感知?dú)v史簡(jiǎn)單反射的agent基于當(dāng)前的感知選擇行動(dòng),不關(guān)注感知?dú)v史24簡(jiǎn)單反射的agent環(huán)境是完全可觀察的還是部分可觀察的?Eg.真空吸塵器問題,剎車問題簡(jiǎn)單反射的agent環(huán)境是完全可觀察的還是部分可觀察的?Eg25基于模型的反射agentAgent根據(jù)感知?dú)v史維持內(nèi)部狀態(tài)Agent隨時(shí)更新內(nèi)部狀態(tài)信息基于模型的反射agentAgent根據(jù)感知?dú)v史維持內(nèi)部狀態(tài)26基于模型的反射agent基于模型的反射agent27基于目標(biāo)的agent除了根據(jù)感知信息之外,還要根據(jù)目標(biāo)信息來選擇行動(dòng)效率比較低,需要推理搜索和規(guī)劃算法基于目標(biāo)的agent除了根據(jù)感知信息之外,還要根據(jù)目標(biāo)信息來28基于目標(biāo)的agent基于目標(biāo)的agent29基于效用的agent當(dāng)達(dá)到目標(biāo)的行為有很多種的時(shí)候,需要考慮效率環(huán)境是部分可觀察的和隨機(jī)的,不確定下的決策過程可以通過基于效用的agent來實(shí)現(xiàn)。效用的作用多目標(biāo)相沖突時(shí)多目標(biāo)在不確定環(huán)境中一個(gè)目標(biāo)有多種行為可以達(dá)到時(shí)基于效用的agent當(dāng)達(dá)到目標(biāo)的行為有很多種的時(shí)候,需要考慮30基于效用的agent基于效用的agent31學(xué)習(xí)agent學(xué)習(xí)agent32學(xué)習(xí)agent4個(gè)組件性能元件:相當(dāng)于整個(gè)agent評(píng)判元件:反映性能元件做得如何學(xué)習(xí)元件:負(fù)責(zé)改進(jìn)提高問題產(chǎn)生器:提出一些新的有建設(shè)性的探索嘗試Eg.出租車行駛學(xué)習(xí)agent4個(gè)組件33總結(jié)Agents和環(huán)境理性Agent環(huán)境的性質(zhì)Agent的類型與結(jié)構(gòu)總結(jié)Agents和環(huán)境34Qa?
Qa?
第二章
智能Agent
第二章
智能Agent
2015年1月湖南大學(xué)信息科學(xué)與工程學(xué)院內(nèi)容提要Agents和環(huán)境理性Agent環(huán)境的性質(zhì)Agent的類型與結(jié)構(gòu)內(nèi)容提要Agents和環(huán)境37AgentAgent通過感知器感知環(huán)境并通過執(zhí)行器對(duì)所處的環(huán)境產(chǎn)生影響人類Agent眼睛,耳朵為感知器手,腳,聲道為執(zhí)行器機(jī)器人Agent攝像頭,紅外距測(cè)儀為感知器馬達(dá)為執(zhí)行器AgentAgent通過感知器感知環(huán)境并通過執(zhí)行器對(duì)所處的環(huán)38Agent和環(huán)境Agent函數(shù)將任何感知?dú)v史數(shù)據(jù)映射為行為:Agent程序通過在物理系統(tǒng)上運(yùn)行來實(shí)現(xiàn)Agent函數(shù)Agent=體系結(jié)構(gòu)+程序Agent和環(huán)境Agent函數(shù)將任何感知?dú)v史數(shù)據(jù)映射為行為:39真空吸塵器世界感知器:地點(diǎn)和內(nèi)容(eg.[A,Dirty])行為:向左,向右,洗塵,無操作真空吸塵器世界感知器:地點(diǎn)和內(nèi)容(eg.[A,Dirty]40真空吸塵器世界真空吸塵器世界41理性Agent理性agent:對(duì)于每一可能的感知數(shù)據(jù)序列,一個(gè)理性的agent應(yīng)該采取一個(gè)行為以達(dá)到最大的性能。理性判斷的4個(gè)因素性能度量先驗(yàn)知識(shí)可以完成的行動(dòng)截至到此刻的感知序列理性Agent理性agent:對(duì)于每一可能的感知數(shù)據(jù)序列,一42理性Agent一個(gè)Agent應(yīng)該根據(jù)它感知的信息和它能夠進(jìn)行的行為而做正確的事情正確的行為將使得Agent能夠取得最大的成功性能度量:一個(gè)客觀的標(biāo)準(zhǔn)來評(píng)價(jià)Agent的行為的成功性Eg.真空器agent的性能度量可以是它清洗區(qū)域的數(shù)量,花費(fèi)的時(shí)間,消耗的能量,產(chǎn)生的噪音等等Eg.真空洗塵器8個(gè)小時(shí)內(nèi)清理的灰塵總量來度量性能?以行為來度量性能不如以結(jié)果來度量性能理性Agent一個(gè)Agent應(yīng)該根據(jù)它感知的信息和它能夠進(jìn)行43理性Agent全知:明確知道它的行動(dòng)產(chǎn)生的實(shí)際結(jié)果并且作出相應(yīng)的動(dòng)作理性不等同于全知(已知的知識(shí)都是有限的)理性不等于完美:理性是使期望的性能最大化完美是使實(shí)際的性能最大化理性Agent全知:明確知道它的行動(dòng)產(chǎn)生的實(shí)際結(jié)果并且作出相44理性Agent理性agent能夠進(jìn)行信息收集。理性的agent應(yīng)該具有自主性,能夠進(jìn)行學(xué)習(xí)從環(huán)境的感知信息中根據(jù)歷史經(jīng)驗(yàn)來學(xué)習(xí)理性Agent理性agent能夠進(jìn)行信息收集。45任務(wù)環(huán)境任務(wù)環(huán)境:包括性能(Performance),環(huán)境(Environment),agent的執(zhí)行器(Actuators)和傳感器(Sensors),英文縮寫為PEAS對(duì)于每一個(gè)智能agent,必須說明其PEAS參數(shù)Eg.自動(dòng)駕駛出租車性能度量環(huán)境執(zhí)行器傳感器任務(wù)環(huán)境任務(wù)環(huán)境:包括性能(Performance),環(huán)境(46任務(wù)環(huán)境Eg.自動(dòng)駕駛出租車性能度量:安全性,快速性,交通違規(guī),舒適度,利潤(rùn)環(huán)境:馬路,其他交通工具,行人,乘客執(zhí)行器:方向盤,加速油門,剎車,語音合成器傳感器:攝像頭,紅外或聲納,速度表,GPS,鍵盤,麥克風(fēng)任務(wù)環(huán)境Eg.自動(dòng)駕駛出租車47任務(wù)環(huán)境Environment:Patient,hospital,staffActuators:Screendisplay(questions,tests,diagnoses,treatments,referrals)Sensors:Keyboard(entryofsymptoms,findings,patient'sanswers)Eg.醫(yī)療診斷系統(tǒng)性能度量:病人的健康性,病人花費(fèi)環(huán)境:病人,醫(yī)院,工作人員執(zhí)行器:顯示屏(詢問,測(cè)試,診斷,治療方案)傳感器:鍵盤(輸入癥狀,現(xiàn)場(chǎng)檢測(cè),病人的回答)任務(wù)環(huán)境Environment:Patient,ho48任務(wù)環(huán)境49Eg.挑揀零件機(jī)器人性能度量:正確挑揀的零件所占的百分比環(huán)境:零件傳送帶,容器執(zhí)行器:機(jī)器人手臂和手傳感器:攝像頭,關(guān)節(jié)感知器任務(wù)環(huán)境14Eg.挑揀零件機(jī)器人任務(wù)環(huán)境50Eg.交互式英語教學(xué)者性能度量:最大化學(xué)生成績(jī)環(huán)境:學(xué)生執(zhí)行器:顯示屏(練習(xí)題,建議,正確答案)傳感器:鍵盤任務(wù)環(huán)境15Eg.交互式英語教學(xué)者環(huán)境的性質(zhì)51完全可觀察的vs.部分可觀察的一個(gè)agent的傳感器在每個(gè)時(shí)間點(diǎn)上都能獲取環(huán)境的完整狀態(tài)一個(gè)agent的傳感器在每個(gè)時(shí)間點(diǎn)上都能獲取環(huán)境的部分狀態(tài)真空洗塵器?自動(dòng)駕駛汽車?單agentvs.多agent單agent獨(dú)自運(yùn)行eg.字謎游戲多agent同時(shí)運(yùn)行eg.國(guó)際象棋國(guó)際象棋vs.駕駛出租車?環(huán)境的性質(zhì)16完全可觀察的vs.部分可觀察的環(huán)境的性質(zhì)確定的vs.隨機(jī)的環(huán)境的下一個(gè)狀態(tài)完全取決于當(dāng)前狀態(tài)和agent執(zhí)行的動(dòng)作部分可觀察?出租車駕駛?真空吸塵器?片段式的vs.延續(xù)式的agent的經(jīng)歷被分成一個(gè)個(gè)原子片段,在每個(gè)片段中agent感知信息并完成單個(gè)行動(dòng),下一個(gè)片段不依賴于以前的片段檢查次品零件的機(jī)器人?國(guó)際象棋?環(huán)境的性質(zhì)確定的vs.隨機(jī)的52環(huán)境的性質(zhì)53靜態(tài)的vs.動(dòng)態(tài)的環(huán)境在agent計(jì)算的時(shí)候不會(huì)變化(vs.會(huì)變化)半動(dòng)態(tài)的:環(huán)境本身不變化但agent的性能評(píng)價(jià)隨時(shí)間變化出租車,國(guó)際象棋,填字游戲?離散的vs.連續(xù)的環(huán)境的狀態(tài),時(shí)間的處理方式以及agent的感知信息和行動(dòng)都有離散/連續(xù)之分國(guó)際象棋,出租車駕駛?環(huán)境的性質(zhì)18靜態(tài)的vs.動(dòng)態(tài)的環(huán)境的性質(zhì)環(huán)境的性質(zhì)決定了agent的設(shè)計(jì)最難處理的情況:部分可觀察的,隨機(jī)的,連續(xù)的,動(dòng)態(tài)的,延續(xù)式的,多agent的環(huán)境的性質(zhì)環(huán)境的性質(zhì)決定了agent的設(shè)計(jì)54Agent函數(shù)和程序一個(gè)agent用agent函數(shù)來表示agent函數(shù)將感知數(shù)據(jù)序列映射為行為Agent程序以傳感器得到的當(dāng)前感知信息為輸入以執(zhí)行器的行動(dòng)為輸出僅僅以當(dāng)前感知為輸入而不是以整個(gè)歷史感知為輸入Agent函數(shù)和程序一個(gè)agent用agent函數(shù)來表示55Agent的表驅(qū)動(dòng)方法缺點(diǎn)表太大創(chuàng)建表時(shí)間長(zhǎng)非自主性,需人工填寫即使能夠?qū)W習(xí),也需要很長(zhǎng)的時(shí)間Agent的表驅(qū)動(dòng)方法缺點(diǎn)56Agent的類型四種基本的類型簡(jiǎn)單反射agent基于模型的反射agent基于目標(biāo)的agent基于效用的agentAgent的類型四種基本的類型57真空吸塵器的Agent程序真空吸塵器的Agent程序58
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 案件辦理委托協(xié)議
- 貴州省六盤水市2025屆高三第二次診斷性監(jiān)測(cè)考試語文試題
- 感恩同行青春追夢(mèng)
- 2025年全球及中國(guó)升降式傳遞窗行業(yè)頭部企業(yè)市場(chǎng)占有率及排名調(diào)研報(bào)告
- 2025-2030全球沖壓飛輪行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 2025年全球及中國(guó)天窗玻璃更換和維修行業(yè)頭部企業(yè)市場(chǎng)占有率及排名調(diào)研報(bào)告
- 2025年全球及中國(guó)量子信息系統(tǒng)服務(wù)行業(yè)頭部企業(yè)市場(chǎng)占有率及排名調(diào)研報(bào)告
- 2025年度食品飲料代理銷售服務(wù)合同
- 二零二五年度石油化工設(shè)備采購(gòu)代理協(xié)議3篇
- 數(shù)字化工作空間與創(chuàng)新園區(qū)的未來展望
- 2023年高考英語考前必練-非謂語動(dòng)詞(含近三年真題及解析)
- 風(fēng)電工程需要編寫的專項(xiàng)施工方案及危大工程目錄
- 商業(yè)計(jì)劃書(BP)財(cái)務(wù)計(jì)劃風(fēng)險(xiǎn)控制資本退出與附錄的撰寫秘籍
- 全國(guó)職工拔河比賽執(zhí)行方案
- 冶金廠、軋鋼廠工藝流程圖
- 七年級(jí)下冊(cè)《Reading 1 A brave young man》優(yōu)質(zhì)課教案牛津譯林版-七年級(jí)英語教案
- 中國(guó)人婚戀狀況調(diào)查報(bào)告公布
- 《木蘭詩》第1第2課時(shí)示范公開課教學(xué)PPT課件【統(tǒng)編人教版七年級(jí)語文下冊(cè)】
- GB/T 11144-2007潤(rùn)滑液極壓性能測(cè)定法梯姆肯法
- 國(guó)家開發(fā)銀行
- 板帶生產(chǎn)工藝5(熱連軋帶鋼生產(chǎn))課件
評(píng)論
0/150
提交評(píng)論