人工智能算法簡介_第1頁
人工智能算法簡介_第2頁
人工智能算法簡介_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

人工智能算法簡介

與時(shí)代同頻如果你想學(xué)習(xí)人工智能算法,那么你的準(zhǔn)備知識(shí)應(yīng)該包括一些編程知識(shí),線性代數(shù)和對概率的理解.然而今天我們的主題不在這里,我們要給大家簡要介紹人工智能的能做什么事情.人工智能的范圍非常廣泛,從人工智能的歷史,搜索算法的建立,設(shè)計(jì)游,解決游戲難題,到限制條件問題都值得學(xué). 機(jī)器學(xué)習(xí)算法是人工智能里的核心人工智能可廣泛應(yīng)用在自然語言處理機(jī)器人學(xué)機(jī)器視覺語音分析量化交易等等領(lǐng)域.用語言編程來解決人工智能問題是一個(gè)值得學(xué)習(xí)的技術(shù).下面分別介紹一下各種常見算法.最基本的算法就是搜索有許多中搜索方法可以使用比如盲目搜(uninformedsearch), 提示性搜索(又啟發(fā)性搜索),對抗搜索(游戲)等.第二類話題就是馬科夫決策過程和強(qiáng)化學(xué)習(xí).它們有一系列的應(yīng)用,如自然語言處理,機(jī)器人,機(jī)器視覺等. 現(xiàn)在我們一一討論人工智能里的各個(gè)話題.先來看理性智能代理機(jī).F(x),該函數(shù)從感知到的環(huán)境映射到一個(gè)作用在環(huán)境上的動(dòng)作measure)最大化.人工智能(AI)在給定的計(jì)算條件下,使得性能度量達(dá)到最大化.這就是的目的.要使得性能度量最大,可以從硬件和軟件兩方面優(yōu)化改進(jìn),我們這里只討論軟件方面.searchagents終點(diǎn),找出一條路線使得我們能從起點(diǎn)到達(dá)終點(diǎn).代理會(huì)思考為了達(dá)到目的該如何做.代理要做的就是定義出到達(dá)目標(biāo)點(diǎn)的動(dòng)作或動(dòng)作序列(路徑).一條路徑會(huì)有不同的代價(jià)和深度(此處指的是通過該路徑找到的解在搜索樹中的深度). 最常見搜索方法可分為有兩大類.盲目搜索并不用某領(lǐng)域的知識(shí),它包括的技術(shù)有廣度優(yōu)先搜索,深度優(yōu)先搜索,均勻代價(jià)搜索等.啟發(fā)式搜索運(yùn)用了一些如何更快地到達(dá)目標(biāo)的經(jīng)驗(yàn)法則或啟發(fā)式信息,這類搜索法包括貪婪搜索法, A*搜索法,等等. 搜索算法的例子包括八皇后問題.八皇后問題是指,我們在64個(gè)格子的國際象棋棋盤上適當(dāng)?shù)胤胖茫競€(gè)皇后,使得它們橫向,縱向,對角都不"共線".是路線搜索.給定包含一些城市的地圖,地圖可以用圖結(jié)構(gòu)來表示:城市用結(jié)點(diǎn)表示,城市之間的可能的路線用線表與時(shí)代同頻示.兩座城市之間的距離標(biāo)記在它們的連線上.假設(shè)你想要從北京到馬爾代夫.要達(dá)到此目的,你有不同的路線可走.搜索代理的目的就是為了探索這些可能性,并找出最好的路線.不同的路線需要不同的花費(fèi),花費(fèi)可以用這些連線的長度(比如,單位為千米的數(shù)) 這里,搜索代理的角色其實(shí)就是找到從北京到馬爾代夫的路線同時(shí)找出最好的路線.AIAI解決.象棋以及智力問答競賽等等.基本思想就是設(shè)計(jì)代理來玩游戲,并且與對手對抗.這里面的重要概念包括**minimax算法**,**alphabetapruning**and**隨機(jī)游戲**. 這里略過.AITomRiccio所說,機(jī)器學(xué)習(xí)是關(guān)于如何創(chuàng)建能從數(shù)據(jù)和觀測中提高我們的經(jīng)驗(yàn)的計(jì)算機(jī)程序.心.機(jī)器學(xué)習(xí)主要可分為監(jiān)督學(xué)習(xí),非監(jiān)督學(xué)習(xí),聚類,降維和強(qiáng)化學(xué)習(xí)等.當(dāng)你有標(biāo)簽時(shí)那么你在做的就是監(jiān)督學(xué)習(xí)這些標(biāo)簽可以是任意連續(xù)的數(shù)值也可以是離散的(如文本果標(biāo)簽只能取兩個(gè)值,那么我們就在討論二進(jìn)制分類.我們想要建立的是一個(gè)函數(shù),給定一個(gè)輸入集合或是實(shí)例的描述,得出輸出集. 例如,假設(shè)我們有銀行顧客的信息:他們的年齡,性別,職位,工資等. 對每顧客,我們有一個(gè)標(biāo)簽:是否有信用卡.又如,電子郵件是否是垃圾郵件也屬于標(biāo)簽的例子.這樣例子還有很多. 因此,我們有所謂的正例子和負(fù)例子.它們可以分別用1,0表示.如何找出分開這兩類特征的邊界往往是這類問題的目標(biāo).這是監(jiān)督學(xué)習(xí)的典型例子.因?yàn)橐呀?jīng)告訴了我們誰是正例子,誰是負(fù)例子了,所以稱之為監(jiān)督學(xué)習(xí).監(jiān)督學(xué)習(xí)包括分類,k近鄰預(yù)測,神經(jīng)網(wǎng)絡(luò),線性回歸,boosting等等方法.第二類學(xué)習(xí),就是非監(jiān)督學(xué)習(xí)(unsupervised). 非監(jiān)督學(xué)習(xí)中,我們不必為實(shí)例做標(biāo)簽. 也就是說,我們數(shù)據(jù)集中的實(shí)例是沒有標(biāo)簽的.例如,我們有人口或顧客的數(shù)據(jù),卻沒有任何類型的標(biāo)簽與之相聯(lián)系.因此,這里的要解決的問題就是給定這些數(shù)據(jù)點(diǎn)我們能否找出這些實(shí)例的數(shù)據(jù)點(diǎn)的聚類(clusters)嗎? 我們要尋一個(gè)函數(shù)F用以把輸入集合X映射到聚類的集合.這完全是非監(jiān)督的算法.關(guān)于非監(jiān)督學(xué)習(xí),我們有很多不同的方法來實(shí)現(xiàn)之.最主要的為K均值聚類.約束問題其實(shí)也是搜索問題,它不關(guān)注搜索的路徑,而只關(guān)心目標(biāo).例如一個(gè)八皇后問題游戲. 一般地,題用變量來表示,而不是用態(tài)來表示.約束問題(constraintsatisfactionproblem)的典型例子是數(shù)獨(dú)游戲(Sudoku).例如,在一個(gè)9行9列的格子盤中,橫向一排格子我們稱為一行,縱向的一排格子稱為一列.要達(dá)與時(shí)代同頻9的數(shù)字,各列亦如此,且在9個(gè)3X319CSP3X319尋找為變量賦值的方法,以滿足這些約束條件.人工智能的又一個(gè)重要領(lǐng)域是邏輯代理.在**邏輯代理**中,邏輯被用來構(gòu)建我們所在的世界的模型.propositionallogic,并且,一階邏輯有一個(gè)固定的語法.通過句子的邏輯表達(dá)式,我們用符號(hào)和連接詞(connectives)來為世界建立模型.Prolog在強(qiáng)化學(xué)習(xí)中,我們設(shè)計(jì)代理機(jī)在隨機(jī)或特定環(huán)境中演化.代理從強(qiáng)化或延遲獎(jiǎng)勵(lì)中學(xué)習(xí).它是除監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)之外的又一類學(xué)習(xí).它是一類用于在輸出結(jié)果為隨機(jī)值的決策問題中的學(xué)習(xí)方法,連續(xù)計(jì)劃,學(xué)習(xí)并影響其環(huán)境的代理機(jī).強(qiáng)化學(xué)習(xí)的驅(qū)動(dòng)力是最大化

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論