




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第二章 智能Agent,內(nèi)容提要,Agents和環(huán)境 理性Agent 環(huán)境的性質(zhì) Agent的類型與結(jié)構(gòu),Agent,Agent通過(guò)感知器感知環(huán)境并通過(guò)執(zhí)行器對(duì)所處的環(huán)境產(chǎn)生影響 人類Agent 眼睛,耳朵為感知器 手,腳,聲道為執(zhí)行器 機(jī)器人Agent 攝像頭,紅外距測(cè)儀為感知器 馬達(dá)為執(zhí)行器,Agent和環(huán)境,Agent函數(shù)將任何感知?dú)v史數(shù)據(jù)映射為行為: Agent程序通過(guò)在物理系統(tǒng)上運(yùn)行來(lái)實(shí)現(xiàn)Agent函數(shù) Agent = 體系結(jié)構(gòu) + 程序,真空吸塵器世界,感知器:地點(diǎn)和內(nèi)容(eg. A,Dirty) 行為:向左,向右,洗塵,無(wú)操作,真空吸塵器世界,理性Agent,理性agent:對(duì)于
2、每一可能的感知數(shù)據(jù)序列,一個(gè)理性的agent應(yīng)該采取一個(gè)行為以達(dá)到最大的性能。 理性判斷的4個(gè)因素 性能度量 先驗(yàn)知識(shí) 可以完成的行動(dòng) 截至到此刻的感知序列,理性Agent,一個(gè)Agent應(yīng)該根據(jù)它感知的信息和它能夠進(jìn)行的行為而做正確的事情 正確的行為將使得Agent能夠取得最大的成功 性能度量:一個(gè)客觀的標(biāo)準(zhǔn)來(lái)評(píng)價(jià)Agent的行為的成功性 Eg.真空器agent的性能度量可以是它清洗區(qū)域的數(shù)量,花費(fèi)的時(shí)間,消耗的能量,產(chǎn)生的噪音等等 Eg.真空洗塵器8個(gè)小時(shí)內(nèi)清理的灰塵總量來(lái)度量性能? 以行為來(lái)度量性能不如以結(jié)果來(lái)度量性能,理性Agent,全知:明確知道它的行動(dòng)產(chǎn)生的實(shí)際結(jié)果并且作出相應(yīng)的動(dòng)
3、作 理性不等同于全知(已知的知識(shí)都是有限的) 理性不等于完美: 理性是使期望的性能最大化 完美是使實(shí)際的性能最大化,理性Agent,理性agent能夠進(jìn)行信息收集。 理性的agent應(yīng)該具有自主性,能夠進(jìn)行學(xué)習(xí) 從環(huán)境的感知信息中根據(jù)歷史經(jīng)驗(yàn)來(lái)學(xué)習(xí),任務(wù)環(huán)境,任務(wù)環(huán)境:包括性能(Performance),環(huán)境(Environment),agent的執(zhí)行器(Actuators)和傳感器(Sensors),英文縮寫為PEAS 對(duì)于每一個(gè)智能agent,必須說(shuō)明其PEAS參數(shù) Eg.自動(dòng)駕駛出租車 性能度量 環(huán)境 執(zhí)行器 傳感器,任務(wù)環(huán)境,Eg.自動(dòng)駕駛出租車 性能度量:安全性,快速性,交通違規(guī),舒
4、適度,利潤(rùn) 環(huán)境:馬路,其他交通工具,行人,乘客 執(zhí)行器:方向盤,加速油門,剎車,語(yǔ)音合成器 傳感器:攝像頭,紅外或聲納,速度表,GPS,鍵盤,麥克風(fēng),任務(wù)環(huán)境, Environment: Patient, hospital, staff Actuators: Screen display (questions, tests, diagnoses, treatments, referrals) Sensors: Keyboard (entry of symptoms, findings, patients answers),Eg.醫(yī)療診斷系統(tǒng) 性能度量:病人的健康性,病人花費(fèi) 環(huán)境:病人,醫(yī)院
5、,工作人員 執(zhí)行器:顯示屏(詢問(wèn),測(cè)試,診斷,治療方案) 傳感器:鍵盤(輸入癥狀,現(xiàn)場(chǎng)檢測(cè),病人的回答),任務(wù)環(huán)境,14,Eg.挑揀零件機(jī)器人 性能度量:正確挑揀的零件所占的百分比 環(huán)境:零件傳送帶,容器 執(zhí)行器:機(jī)器人手臂和手 傳感器:攝像頭,關(guān)節(jié)感知器,任務(wù)環(huán)境,15,Eg.交互式英語(yǔ)教學(xué)者 性能度量:最大化學(xué)生成績(jī) 環(huán)境:學(xué)生 執(zhí)行器:顯示屏(練習(xí)題,建議,正確答案) 傳感器:鍵盤,環(huán)境的性質(zhì),16,完全可觀察的 vs.部分可觀察的 一個(gè)agent的傳感器在每個(gè)時(shí)間點(diǎn)上都能獲取環(huán)境的完整狀態(tài) 一個(gè)agent的傳感器在每個(gè)時(shí)間點(diǎn)上都能獲取環(huán)境的部分狀態(tài) 真空洗塵器?自動(dòng)駕駛汽車? 單age
6、nt vs.多agent 單agent獨(dú)自運(yùn)行 eg.字謎游戲 多agent同時(shí)運(yùn)行 eg.國(guó)際象棋 國(guó)際象棋 vs. 駕駛出租車?,環(huán)境的性質(zhì),確定的 vs.隨機(jī)的 環(huán)境的下一個(gè)狀態(tài)完全取決于當(dāng)前狀態(tài)和agent執(zhí)行的動(dòng)作 部分可觀察? 出租車駕駛?真空吸塵器? 片段式的 vs. 延續(xù)式的 agent的經(jīng)歷被分成一個(gè)個(gè)原子片段,在每個(gè)片段中agent感知信息并完成單個(gè)行動(dòng),下一個(gè)片段不依賴于以前的片段 檢查次品零件的機(jī)器人?國(guó)際象棋?,環(huán)境的性質(zhì),18,靜態(tài)的 vs. 動(dòng)態(tài)的 環(huán)境在agent計(jì)算的時(shí)候不會(huì)變化(vs.會(huì)變化) 半動(dòng)態(tài)的:環(huán)境本身不變化但agent的性能評(píng)價(jià)隨時(shí)間變化 出租車
7、,國(guó)際象棋,填字游戲? 離散的 vs.連續(xù)的 環(huán)境的狀態(tài),時(shí)間的處理方式以及agent的感知信息和行動(dòng)都有離散/連續(xù)之分 國(guó)際象棋,出租車駕駛?,環(huán)境的性質(zhì),環(huán)境的性質(zhì)決定了agent的設(shè)計(jì) 最難處理的情況: 部分可觀察的,隨機(jī)的,連續(xù)的,動(dòng)態(tài)的,延續(xù)式的,多agent的,Agent函數(shù)和程序,一個(gè)agent用agent函數(shù)來(lái)表示 agent函數(shù)將感知數(shù)據(jù)序列映射為行為 Agent程序 以傳感器得到的當(dāng)前感知信息為輸入 以執(zhí)行器的行動(dòng)為輸出 僅僅以當(dāng)前感知為輸入而不是以整個(gè)歷史感知為輸入,Agent的表驅(qū)動(dòng)方法,缺點(diǎn) 表太大 創(chuàng)建表時(shí)間長(zhǎng) 非自主性,需人工填寫 即使能夠?qū)W習(xí),也需要很長(zhǎng)的時(shí)間,
8、Agent的類型,四種基本的類型 簡(jiǎn)單反射agent 基于模型的反射agent 基于目標(biāo)的agent 基于效用的agent,真空吸塵器的Agent程序,簡(jiǎn)單反射的agent,基于當(dāng)前的感知選擇行動(dòng),不關(guān)注感知?dú)v史,簡(jiǎn)單反射的agent,環(huán)境是完全可觀察的還是部分可觀察的?,Eg. 真空吸塵器問(wèn)題,剎車問(wèn)題,基于模型的反射agent,Agent根據(jù)感知?dú)v史維持內(nèi)部狀態(tài) Agent隨時(shí)更新內(nèi)部狀態(tài)信息,基于模型的反射agent,基于目標(biāo)的agent,除了根據(jù)感知信息之外,還要根據(jù)目標(biāo)信息來(lái)選擇行動(dòng) 效率比較低,需要推理 搜索和規(guī)劃算法,基于目標(biāo)的agent,基于效用的agent,當(dāng)達(dá)到目標(biāo)的行為有很多種的時(shí)候,需要考慮效率 環(huán)境是部分可觀察的和隨機(jī)的,不確定下的決策過(guò)程可以通過(guò)基于效用的agent來(lái)實(shí)現(xiàn)。 效用的作用 多目標(biāo)相沖突時(shí) 多目標(biāo)在不確定環(huán)境中 一個(gè)目標(biāo)有多種行為可以達(dá)到時(shí),基于效用的agent,學(xué)習(xí)agent
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 居家辦公期間管理辦法
- 福建救助分類管理辦法
- 工地監(jiān)控安裝管理辦法
- 室內(nèi)施工電梯管理辦法
- 廣西大學(xué)疫情管理辦法
- 徐州辦公用品管理辦法
- 工會(huì)小組經(jīng)費(fèi)管理辦法
- 城市煙花售賣管理辦法
- 客戶溝通客戶管理辦法
- 學(xué)校物業(yè)考核管理辦法
- 中國(guó)當(dāng)代文學(xué)專題-003-國(guó)開機(jī)考復(fù)習(xí)資料
- 先進(jìn)集體申報(bào)表
- 酒店工程部考核表
- 工程塑料 第六章聚甲醛
- 模切設(shè)備日常點(diǎn)檢表
- 10kV配電變壓器缺相運(yùn)行分析
- YY_T 0681.2-2010無(wú)菌醫(yī)療器械包裝試驗(yàn)方法 第2部分:軟性屏障材料的密封強(qiáng)度
- 《音樂(lè)樂(lè)理常識(shí)大全》ppt課件
- 《天窗》課內(nèi)閱讀及答案
- 專注力訓(xùn)練課程-1到10節(jié)訓(xùn)練內(nèi)容
- 公司售后服務(wù)管理制度及工作流程(完整版)
評(píng)論
0/150
提交評(píng)論