版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
支持向量機(jī)課件目前一頁(yè)\總數(shù)二十九頁(yè)\編于二點(diǎn)支持向量機(jī),一種線性和非線性數(shù)據(jù)有前途的新劃分類(lèi)方法。巧妙利用向量?jī)?nèi)積的回旋,通過(guò)將非線性核函數(shù)將問(wèn)題變?yōu)楦呔S特征空間與低維輸入空間的相互轉(zhuǎn)換,解決了數(shù)據(jù)挖掘中的維數(shù)災(zāi)難。由于計(jì)算問(wèn)題最終轉(zhuǎn)化為凸二次規(guī)劃問(wèn)題,因此挖掘算法是無(wú)解或有全局最優(yōu)解。目前二頁(yè)\總數(shù)二十九頁(yè)\編于二點(diǎn)支持向量機(jī)定義所謂支持向量機(jī),顧名思義,分為兩個(gè)部分了解:一,什么是支持向量(簡(jiǎn)單來(lái)說(shuō),就是支持或支撐平面上把兩類(lèi)類(lèi)別劃分開(kāi)來(lái)的超平面的向量點(diǎn))二,這里的“機(jī)(machine,機(jī)器)”便是一個(gè)算法。在機(jī)器學(xué)習(xí)領(lǐng)域,常把一些算法看做是一個(gè)機(jī)器,如分類(lèi)機(jī)(當(dāng)然,也叫做分類(lèi)器),而支持向量機(jī)本身便是一種監(jiān)督式學(xué)習(xí)的方法,它廣泛的應(yīng)用于統(tǒng)計(jì)分類(lèi)以及回歸分析中。目前三頁(yè)\總數(shù)二十九頁(yè)\編于二點(diǎn)SVM的描述目標(biāo):找到一個(gè)超平面,使得它能夠盡可能多的將兩類(lèi)數(shù)據(jù)點(diǎn)正確的分開(kāi),同時(shí)使分開(kāi)的兩類(lèi)數(shù)據(jù)點(diǎn)距離分類(lèi)面最遠(yuǎn)。解決方法:構(gòu)造一個(gè)在約束條件下的優(yōu)化問(wèn)題,具體的說(shuō)是一個(gè)約束二次規(guī)劃問(wèn)題(constrainedquadraticprograming),求解該問(wèn)題,得到分類(lèi)器。目前四頁(yè)\總數(shù)二十九頁(yè)\編于二點(diǎn)概述目前五頁(yè)\總數(shù)二十九頁(yè)\編于二點(diǎn)1.線性可分情形目前六頁(yè)\總數(shù)二十九頁(yè)\編于二點(diǎn)線性可分情形最大邊緣超平面(MMH)邊緣:從超平面到其邊緣的側(cè)面的最短距離等于到其邊緣的另一個(gè)側(cè)面的最短距離,邊緣側(cè)面平行于超平面目前七頁(yè)\總數(shù)二十九頁(yè)\編于二點(diǎn)分類(lèi)面與邊界距離(margin)的數(shù)學(xué)表示:分類(lèi)超平面表示為:Class1Class2m數(shù)學(xué)語(yǔ)言描述目前八頁(yè)\總數(shù)二十九頁(yè)\編于二點(diǎn)一、線性可分的支持向量(分類(lèi))機(jī)首先考慮線性可分情況。設(shè)有如下兩類(lèi)樣本的訓(xùn)練集:線性可分情況意味著存在超平面使訓(xùn)練點(diǎn)中的正類(lèi)和負(fù)類(lèi)樣本分別位于該超平面的兩側(cè)。如果能確定這樣的參數(shù)對(duì)(w,b)的話,就可以構(gòu)造決策函數(shù)來(lái)進(jìn)行識(shí)別新樣本。目前九頁(yè)\總數(shù)二十九頁(yè)\編于二點(diǎn)線性可分的支持向量(分類(lèi))機(jī)問(wèn)題是:這樣的參數(shù)對(duì)(w,b)有許多。解決的方法是采用最大間隔原則。最大間隔原則:選擇使得訓(xùn)練集D對(duì)于線性函數(shù)(w·x)+b的幾何間隔取最大值的參數(shù)對(duì)(w,b),并由此構(gòu)造決策函數(shù)。在規(guī)范化下,超平面的幾何間隔為于是,找最大幾何間隔的超平面表述成如下的最優(yōu)化問(wèn)題:(1)目前十頁(yè)\總數(shù)二十九頁(yè)\編于二點(diǎn)線性可分的支持向量(分類(lèi))機(jī)
為求解問(wèn)題(1),使用Lagrange乘子法將其轉(zhuǎn)化為對(duì)偶問(wèn)題。于是引入Lagrange函數(shù):其中,稱(chēng)為L(zhǎng)agrange乘子。首先求Lagrange函數(shù)關(guān)于w,b的極小值。由極值條件有:得到:(2)(3)(4)目前十一頁(yè)\總數(shù)二十九頁(yè)\編于二點(diǎn)線性可分的支持向量(分類(lèi))機(jī)將(3)式代入Lagrange函數(shù),并利用(4)式,則原始的優(yōu)化問(wèn)題轉(zhuǎn)化為如下的對(duì)偶問(wèn)題(使用極小形式):這是一個(gè)凸二次規(guī)劃問(wèn)題有唯一的最優(yōu)解(5)求解問(wèn)題(5),得。則參數(shù)對(duì)(w,b)可由下式計(jì)算:目前十二頁(yè)\總數(shù)二十九頁(yè)\編于二點(diǎn)線性可分的支持向量(分類(lèi))機(jī)
支持向量:稱(chēng)訓(xùn)練集D中的樣本xi為支持向量,如果它對(duì)應(yīng)的i*>0。
根據(jù)原始最優(yōu)化問(wèn)題的KKT條件,有
于是,支持向量正好在間隔邊界上
于是,得到如下的決策函數(shù):目前十三頁(yè)\總數(shù)二十九頁(yè)\編于二點(diǎn)幾何意義:超平面法向量是支持向量的線性組合。幾何意義a6=1.4Class1Class2a1=0.8a2=0a3=0a4=0a5=0a7=0a8=0.6a9=0a10=0目前十四頁(yè)\總數(shù)二十九頁(yè)\編于二點(diǎn)對(duì)于線性不可分的樣本怎么辦?非線性可分情形如何找到正確的分類(lèi)曲線和正確的超平面對(duì)此類(lèi)情況分類(lèi)?目前十五頁(yè)\總數(shù)二十九頁(yè)\編于二點(diǎn)非線性可分情形關(guān)鍵點(diǎn):把xi
變換到高維的特征空間為什么要變換?通過(guò)加入一個(gè)新的特征xi,使得樣本變成線性可分的,此時(shí)特征空間維數(shù)變高Transformx(x)目前十六頁(yè)\總數(shù)二十九頁(yè)\編于二點(diǎn)例子ax12+bx22=1[w]1z1+[w]2z2
+[w]3z3+b=0目前十七頁(yè)\總數(shù)二十九頁(yè)\編于二點(diǎn)設(shè)訓(xùn)練集,其中假定可以用平面上的二次曲線來(lái)劃分:現(xiàn)考慮把2維空間映射到6維空間的變換上式可將2維空間上二次曲線映射為6維空間上的一個(gè)超平面:非線性分類(lèi)目前十八頁(yè)\總數(shù)二十九頁(yè)\編于二點(diǎn)可見(jiàn),只要利用變換,把x
所在的2維空間的兩類(lèi)輸入點(diǎn)映射x所在的6維空間,然后在這個(gè)6維空間中,使用線性學(xué)習(xí)機(jī)求出分劃超平面:最后得出原空間中的二次曲線:非線性分類(lèi)目前十九頁(yè)\總數(shù)二十九頁(yè)\編于二點(diǎn)如何選擇到較高維空間的非線性映射?給定的檢驗(yàn)元組,必須計(jì)算與每個(gè)支持向量的點(diǎn)積,出現(xiàn)形如可以引入核函數(shù)(內(nèi)積的回旋)來(lái)替代目前二十頁(yè)\總數(shù)二十九頁(yè)\編于二點(diǎn)需要求解的最優(yōu)化問(wèn)題非線性分類(lèi)最后得到?jīng)Q策函數(shù)或?yàn)榇耍M(jìn)函數(shù)目前二十一頁(yè)\總數(shù)二十九頁(yè)\編于二點(diǎn)實(shí)現(xiàn)非線性分類(lèi)的思想給定訓(xùn)練集后,決策函數(shù)僅依賴(lài)于而不需要再考慮非線性變換如果想用其它的非線性分劃辦法,則可以考慮選擇其它形式的函數(shù),一旦選定了函數(shù),就可以求解最優(yōu)化問(wèn)題目前二十二頁(yè)\總數(shù)二十九頁(yè)\編于二點(diǎn)實(shí)現(xiàn)非線性分類(lèi)的思想其中解得,而決策函數(shù)目前二十三頁(yè)\總數(shù)二十九頁(yè)\編于二點(diǎn)目前研究最多的核函數(shù)主要有三類(lèi):核函數(shù)的選擇多項(xiàng)式內(nèi)核得到q階多項(xiàng)式分類(lèi)器包含一個(gè)隱層的多層感知器,隱層節(jié)點(diǎn)數(shù)是由算法自動(dòng)確定Sigmoid內(nèi)核每個(gè)基函數(shù)中心對(duì)應(yīng)一個(gè)支持向量,它們及輸出權(quán)值由算法自動(dòng)確定高斯徑向基函數(shù)內(nèi)核RBF目前二十四頁(yè)\總數(shù)二十九頁(yè)\編于二點(diǎn)幾個(gè)典型的核函數(shù)目前二十五頁(yè)\總數(shù)二十九頁(yè)\編于二點(diǎn)核的比較目前二十六頁(yè)\總數(shù)二十九頁(yè)\編于二點(diǎn)現(xiàn)有5個(gè)一維數(shù)據(jù)x1=1,x2=2,x3=4,x4=5,x5=6,其中1,2,6為class1,4,5為class2
y1=1,y2=1,y3=-1,y4=-1,y5=1選擇polynomialkernelofdegree2K(x,y)=(xy+1)2C=100求解ai(i=1,…,5)12456例子目前二十七頁(yè)\總數(shù)二十九頁(yè)\編于二點(diǎn)例子通過(guò)二次規(guī)劃求解,得到支
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 氣候變化下農(nóng)業(yè)生態(tài)系統(tǒng)的適應(yīng)性調(diào)整研究進(jìn)展
- 物聯(lián)網(wǎng)技術(shù)在智能家居生態(tài)圈的應(yīng)用前景
- 國(guó)慶節(jié)秋天主題活動(dòng)方案
- 現(xiàn)代辦公樓電力維護(hù)成本深度剖析
- 現(xiàn)代物流技術(shù)與醫(yī)療行業(yè)互補(bǔ)與共進(jìn)
- Unit 4 Friends Forever Understanding ideas 說(shuō)課稿-2024-2025學(xué)年高中英語(yǔ)外研版(2019)必修第一冊(cè)001
- 2023八年級(jí)物理上冊(cè) 第四章 在光的世界里第6節(jié) 神奇的眼睛說(shuō)課稿(新版)教科版
- 6《觀察土壤》說(shuō)課稿-2023-2024學(xué)年科學(xué)四年級(jí)下冊(cè)教科版
- 2023二年級(jí)語(yǔ)文上冊(cè) 第八單元 24 風(fēng)娃娃說(shuō)課稿 新人教版
- 18《文言文二則 鐵杵成針》(說(shuō)課稿)2023-2024學(xué)年-統(tǒng)編版四年級(jí)語(yǔ)文下冊(cè)
- 2025年度院感管理工作計(jì)劃(后附表格版)
- 勵(lì)志課件-如何做好本職工作
- 化肥銷(xiāo)售工作計(jì)劃
- 2024浙江華數(shù)廣電網(wǎng)絡(luò)股份限公司招聘精英18人易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 2024年山東省濟(jì)南市中考英語(yǔ)試題卷(含答案解析)
- 2024年社區(qū)警務(wù)規(guī)范考試題庫(kù)
- 2025中考英語(yǔ)作文預(yù)測(cè):19個(gè)熱點(diǎn)話題及范文
- 暑假作業(yè) 10 高二英語(yǔ)完形填空20篇(原卷版)-【暑假分層作業(yè)】2024年高二英語(yǔ)暑假培優(yōu)練(人教版2019)
- 2024年建筑業(yè)10項(xiàng)新技術(shù)
- 語(yǔ)文七年級(jí)下字帖打印版
- 螺栓扭緊力矩表
評(píng)論
0/150
提交評(píng)論