版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第二章
智能Agent
內(nèi)容提要Agents和環(huán)境理性Agent環(huán)境的性質(zhì)Agent的類型與構(gòu)造AgentAgent經(jīng)過感知器感知環(huán)境并經(jīng)過執(zhí)行器對所處的環(huán)境產(chǎn)生影響人類Agent眼睛,耳朵為感知器手,腳,聲道為執(zhí)行器機(jī)器人Agent攝像頭,紅外距測儀為感知器馬達(dá)為執(zhí)行器Agent和環(huán)境Agent函數(shù)將任何感知?dú)v史數(shù)據(jù)映射為行為:Agent程序經(jīng)過在物理系統(tǒng)上運(yùn)轉(zhuǎn)來實(shí)現(xiàn)Agent函數(shù)Agent=體系構(gòu)造+程序真空吸塵器世界感知器:地點(diǎn)和內(nèi)容〔eg.[A,Dirty]〕行為:向左,向右,洗塵,無操作真空吸塵器世界理性Agent理性agent:對于每一能夠的感知數(shù)據(jù)序列,一個理性的agent應(yīng)該采取一個行為以到達(dá)最大的性能。理性判別的4個要素性能度量先驗(yàn)知識可以完成的行動截至到此刻的感知序列理性Agent一個Agent應(yīng)該根據(jù)它感知的信息和它可以進(jìn)展的行為而做正確的事情正確的行為將使得Agent可以獲得最大的勝利性能度量:一個客觀的規(guī)范來評價Agent的行為的勝利性Eg.真空器agent的性能度量可以是它清洗區(qū)域的數(shù)量,破費(fèi)的時間,耗費(fèi)的能量,產(chǎn)生的噪音等等Eg.真空洗塵器8個小時內(nèi)清理的灰塵總量來度量性能?以行為來度量性能不如以結(jié)果來度量性能理性Agent全知:明確知道它的行動產(chǎn)生的實(shí)踐結(jié)果并且作出相應(yīng)的動作理性不等同于全知(知的知識都是有限的)理性不等于完美:理性是使期望的性能最大化完美是使實(shí)踐的性能最大化理性Agent理性agent可以進(jìn)展信息搜集。理性的agent應(yīng)該具有自主性,可以進(jìn)展學(xué)習(xí)從環(huán)境的感知信息中根據(jù)歷史閱歷來學(xué)習(xí)義務(wù)環(huán)境義務(wù)環(huán)境:包括性能(Performance),環(huán)境(Environment),agent的執(zhí)行器(Actuators)和傳感器(Sensors),英文縮寫為PEAS對于每一個智能agent,必需闡明其PEAS參數(shù)Eg.自動駕駛出租車性能度量環(huán)境執(zhí)行器傳感器義務(wù)環(huán)境Eg.自動駕駛出租車性能度量:平安性,快速性,交通違規(guī),溫馨度,利潤環(huán)境:馬路,其他交通工具,行人,乘客執(zhí)行器:方向盤,加速油門,剎車,語音合成器傳感器:攝像頭,紅外或聲納,速度表,GPS,鍵盤,麥克風(fēng)義務(wù)環(huán)境Environment:Patient,hospital,staffActuators:Screendisplay(questions,tests,diagnoses,treatments,referrals)Sensors:Keyboard(entryofsymptoms,findings,patient'sanswers)Eg.醫(yī)療診斷系統(tǒng)性能度量:病人的安康性,病人破費(fèi)環(huán)境:病人,醫(yī)院,任務(wù)人員執(zhí)行器:顯示屏(訊問,測試,診斷,治療方案)傳感器:鍵盤(輸入病癥,現(xiàn)場檢測,病人的回答)義務(wù)環(huán)境14Eg.挑揀零件機(jī)器人性能度量:正確挑揀的零件所占的百分比環(huán)境:零件傳送帶,容器執(zhí)行器:機(jī)器人手臂和手傳感器:攝像頭,關(guān)節(jié)感知器義務(wù)環(huán)境15Eg.交互式英語教學(xué)者性能度量:最大化學(xué)生成果環(huán)境:學(xué)生執(zhí)行器:顯示屏(練習(xí)題,建議,正確答案)傳感器:鍵盤環(huán)境的性質(zhì)16完全可察看的vs.部分可察看的一個agent的傳感器在每個時間點(diǎn)上都能獲取環(huán)境的完好形狀一個agent的傳感器在每個時間點(diǎn)上都能獲取環(huán)境的部分形狀真空洗塵器?自動駕駛汽車?單agentvs.多agent單agent單獨(dú)運(yùn)轉(zhuǎn)eg.字謎游戲多agent同時運(yùn)轉(zhuǎn)eg.國際象棋國際象棋vs.駕駛出租車?環(huán)境的性質(zhì)確定的vs.隨機(jī)的環(huán)境的下一個形狀完全取決于當(dāng)前形狀和agent執(zhí)行的動作部分可察看?出租車駕駛?真空吸塵器?片段式的vs.延續(xù)式的agent的閱歷被分成一個個原子片段,在每個片段中agent感知信息并完成單個行動,下一個片段不依賴于以前的片段檢查次品零件的機(jī)器人?國際象棋?環(huán)境的性質(zhì)18靜態(tài)的vs.動態(tài)的環(huán)境在agent計(jì)算的時候不會變化(vs.會變化)半動態(tài)的:環(huán)境本身不變化但agent的性能評價隨時間變化出租車,國際象棋,填字游戲?離散的vs.延續(xù)的環(huán)境的形狀,時間的處置方式以及agent的感知信息和行動都有離散/延續(xù)之分國際象棋,出租車駕駛?環(huán)境的性質(zhì)環(huán)境的性質(zhì)決議了agent的設(shè)計(jì)最難處置的情況:部分可察看的,隨機(jī)的,延續(xù)的,動態(tài)的,延續(xù)式的,多agent的Agent函數(shù)和程序一個agent用agent函數(shù)來表示agent函數(shù)將感知數(shù)據(jù)序列映射為行為Agent程序以傳感器得到的當(dāng)前感知信息為輸入以執(zhí)行器的行動為輸出僅僅以當(dāng)前感知為輸入而不是以整個歷史感知為輸入Agent的表驅(qū)動方法缺陷表太大創(chuàng)建表時間長非自主性,需人工填寫即使可以學(xué)習(xí),也需求很長的時間Agent的類型四種根本的類型簡單反射agent基于模型的反射agent基于目的的agent基于成效的agent真空吸塵器的Agent程序簡單反射的agent基于當(dāng)前的感知選擇行動,不關(guān)注感知?dú)v史簡單反射的agent環(huán)境是完全可察看的還是部分可察看的?Eg.真空吸塵器問題,剎車問題基于模型的反射agentAgent根據(jù)感知?dú)v史維持內(nèi)部形狀A(yù)gent隨時更新內(nèi)部形狀信息基于模型的反射agent基于目的的agent除了根據(jù)感知信息之外,還要根據(jù)目的信息來選擇行動效率比較低,需求推理搜索和規(guī)劃算法基于目的的agent基于成效的agent當(dāng)?shù)竭_(dá)目的的行為有很多種的時候,需求思索效率環(huán)境是部分可察看的和隨機(jī)的,不確定下的決策過程可以經(jīng)過基于成效的agent來實(shí)現(xiàn)。成效的作用多目的相沖突時多目的在不確定環(huán)境中一個目的有多種行為可以到達(dá)時基于成效的agent學(xué)習(xí)agent學(xué)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度國際環(huán)保技術(shù)獨(dú)家代理銷售合同范本
- 2025年度會展活動現(xiàn)場互動與娛樂服務(wù)合同范本
- 信息技術(shù)外包服務(wù)合同(2024年)
- 2025年度專業(yè)論壇會務(wù)人員服務(wù)與現(xiàn)場協(xié)調(diào)合同
- 二零二五年度拆除工程拆除物殘值回收合同4篇
- 會員制俱樂部體檢服務(wù)合同20243篇
- 2025年度玉米產(chǎn)業(yè)鏈投融資合作合同
- 2025年度環(huán)保項(xiàng)目合同變更協(xié)議參考
- 2025年車輛改裝及性能提升服務(wù)合同范本4篇
- 2025年度酒店客房用品租賃購銷合同范本
- 人教版PEP版小學(xué)英語三年級下冊Unit 4 Healthy food Part A課件
- 2024年陜西省中考道德與法治真題(A卷)(原卷版)
- (2024)湖北省公務(wù)員考試《行測》真題及答案解析
- 中小學(xué)校食品安全與膳食經(jīng)費(fèi)管理工作指引
- 電商平臺客服人員績效考核手冊
- 04S519小型排水構(gòu)筑物(含隔油池)圖集
- YB∕T 4146-2016 高碳鉻軸承鋼無縫鋼管
- 多圖中華民族共同體概論課件第十三講先鋒隊(duì)與中華民族獨(dú)立解放(1919-1949)根據(jù)高等教育出版社教材制作
- 高考英語單詞3500(亂序版)
- 《社區(qū)康復(fù)》課件-第五章 脊髓損傷患者的社區(qū)康復(fù)實(shí)踐
評論
0/150
提交評論