計(jì)算機(jī)視覺應(yīng)用開發(fā)課件:基于遷移學(xué)習(xí)的圖像識(shí)別_第1頁(yè)
計(jì)算機(jī)視覺應(yīng)用開發(fā)課件:基于遷移學(xué)習(xí)的圖像識(shí)別_第2頁(yè)
計(jì)算機(jī)視覺應(yīng)用開發(fā)課件:基于遷移學(xué)習(xí)的圖像識(shí)別_第3頁(yè)
計(jì)算機(jī)視覺應(yīng)用開發(fā)課件:基于遷移學(xué)習(xí)的圖像識(shí)別_第4頁(yè)
計(jì)算機(jī)視覺應(yīng)用開發(fā)課件:基于遷移學(xué)習(xí)的圖像識(shí)別_第5頁(yè)
已閱讀5頁(yè),還剩10頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

基于遷移學(xué)習(xí)

的圖像識(shí)別案例描述01任務(wù)案例分析02任務(wù)案例實(shí)施03任務(wù)學(xué)習(xí)目標(biāo)掌握調(diào)用圖像分類的卷積神經(jīng)網(wǎng)絡(luò)的預(yù)訓(xùn)練模型對(duì)預(yù)訓(xùn)練模型進(jìn)行微調(diào)使用微調(diào)后的預(yù)訓(xùn)練模型對(duì)cifar-10數(shù)據(jù)進(jìn)行訓(xùn)練分類1案例描述1案例描述將學(xué)習(xí)如何使用預(yù)訓(xùn)練的VGG-16和ResNet50來實(shí)現(xiàn)cifar-10數(shù)據(jù)集的分類。2案例分析2案例分析加載數(shù)據(jù)部分同上一個(gè)案例,只需把數(shù)據(jù)輸入到預(yù)訓(xùn)練的VGG-16或者ResNet50中。VGG-16的網(wǎng)絡(luò)結(jié)構(gòu)為右側(cè)圖綠色欄所示,其中block1中有2個(gè)包含64個(gè)卷積核的卷積層,block2包含2個(gè)128個(gè)卷積核的卷積層,block3有3個(gè)包含256個(gè)卷積核的卷積層,block4有3個(gè)包含512個(gè)卷積核的卷積層,block5有3個(gè)包含512個(gè)卷積核的卷積層,加上2個(gè)包含4096個(gè)神經(jīng)元的全連接層和1個(gè)包含1000個(gè)神經(jīng)元的全連接層。2案例分析ResNet有2個(gè)基本的block,一個(gè)是identityblock,輸入和輸出的維度是一樣的,所以可以串聯(lián)多個(gè);另外一個(gè)基本block是convblock,輸入和輸出的維度是不一樣的,所以不能連續(xù)串聯(lián),它的作用本來就是為了改變特征向量的維度。convblockidentityblock2案例分析ResNet50網(wǎng)絡(luò)結(jié)構(gòu)中block_sizes=[3,4,6,3]指的是stage1(firstpool)之后的4個(gè)layer的block數(shù),分別對(duì)應(yīng)res2,res3,res4,res5,每一個(gè)layer的第一個(gè)block在shortcut上做conv+BN,即convblock。3案例實(shí)施3案例實(shí)施1.導(dǎo)庫(kù)在Keras里面提供了許多在ImageNet上的預(yù)訓(xùn)練模型,VGG-16和ResNet50就是其中的預(yù)訓(xùn)練模型,可以通過fromtensorflow.keras.applicationsimportVGG16和fromtensorflow.keras.applications.resnet50importResNet50引入VGG-16模型和RseNet50模型。調(diào)用VGG-16模型和RseNet50模型分別使用VGG16(include_top=True,weights=‘imagenet’,input_tensor=None,input_shape=None,pooling=None,classes=1000,classifier_activation=‘softmax’)和ResNet50(include_top=True,weights=‘imagenet’,input_tensor=None,input_shape=None,pooling=None,classes=1000)函數(shù)來加載預(yù)訓(xùn)練模型,其中兩個(gè)模型中使用參數(shù)基本一致。3案例實(shí)施include_top:是否保留頂層的3個(gè)全連接網(wǎng)絡(luò);weights:None代表隨機(jī)初始化,即選擇不加載預(yù)訓(xùn)練權(quán)重。‘imagenet’代表加載預(yù)訓(xùn)練權(quán)重;input_tensor:可填入Kerastensor作為模型的圖像輸出tensor;input_shape:可選,僅當(dāng)include_top=False有效,應(yīng)為長(zhǎng)為3的tuple,指明輸入圖片的shape,圖片的寬高必須大于48,如(200,200,3);pooling:當(dāng)include_top=False時(shí),該參數(shù)指定了池化方式。None代表不池化,最后一個(gè)卷積層的輸出為4D張量?!產(chǎn)vg’代表全局平均池化,‘max’代表全局最大值池化;classes:可選,圖片分類的類別數(shù),僅當(dāng)include_top=True并且不加載預(yù)訓(xùn)練權(quán)重時(shí)可用;返回值:Keras模型對(duì)象。3案例實(shí)施2.加載數(shù)據(jù)(train_images,train_labels),(test_images,test_labels)=datasets.cifar10.load_data()3.使用預(yù)訓(xùn)練的VGG-16模型或者ResNet50模型#使用VGG-16模型base_model=VGG16(include_top=False,pooling='avg',input_shape=(32,32,3))#使用RseNet50模型#base_model=ResNet50(include_top=False,pooling='avg',input_shape=(32,32,3))forlayerinbase_model.layers:layer.trainable=False3案例實(shí)施4.編譯并訓(xùn)練pile(optimizer='adam',

loss='sparse_categorical_crossentropy',

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論