PyTorch與深度學習實戰(zhàn) 課件第3-5章 PyTorch深度學習基礎(chǔ)、手寫漢字識別、文本生成

上傳人：q*** IP屬地：山東上傳時間：2023-11-15 格式：PPTX 頁數(shù)：143 大?。?.32MB 積分：25 舉報 版權(quán)申訴

PyTorch與深度學習實戰(zhàn) 課件第3-5章 PyTorch深度學習基礎(chǔ)、手寫漢字識別、文本生成_第2頁

PyTorch與深度學習實戰(zhàn) 課件第3-5章 PyTorch深度學習基礎(chǔ)、手寫漢字識別、文本生成_第3頁

PyTorch與深度學習實戰(zhàn) 課件第3-5章 PyTorch深度學習基礎(chǔ)、手寫漢字識別、文本生成_第4頁

PyTorch與深度學習實戰(zhàn) 課件第3-5章 PyTorch深度學習基礎(chǔ)、手寫漢字識別、文本生成_第5頁

已閱讀5頁，還剩138頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

第3章

PyTorch深度學習基礎(chǔ)13.2

循環(huán)神經(jīng)網(wǎng)絡(luò)目錄3.1卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)23.3生成對抗網(wǎng)絡(luò)31.LeNet52.AlexNet3.

VGGNet4.

GoogLeNet5.

ResNet3.1卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)3.1.1

常用卷積神經(jīng)網(wǎng)絡(luò)算法及其結(jié)構(gòu)1.LeNet5

LeNet5是楊立昆（YannLeCun）在1998年設(shè)計的用于手寫數(shù)字識別的卷積神經(jīng)網(wǎng)絡(luò)，當年大多數(shù)銀行就是用LeNet5來識別支票上面的手寫數(shù)字的，是早期卷積神經(jīng)網(wǎng)絡(luò)中最有代表性的實驗系統(tǒng)之一。LeNet5共有7層（不包括輸入層），每層都包含不同數(shù)量的訓練參數(shù)，其網(wǎng)絡(luò)結(jié)構(gòu)如圖所示。3.1卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)3.1.1

常用卷積神經(jīng)網(wǎng)絡(luò)算法及其結(jié)構(gòu)2.AlexNet

AlexNet于2012年由阿萊克斯·克里澤夫斯基（AlexKrizhevsky），伊爾亞?蘇茨克維（IlyaSutskever）和杰弗里·辛頓（GeoffreyHinton）等人提出，并贏得了2012屆圖像識別大賽的冠軍，使得CNN成為在圖像分類上的核心算法模型。AlexNet網(wǎng)絡(luò)一共分為11層，含5個卷積層以及3個全連接層，除此之外還有3個池化層。在每一個卷積層中包含了激活函數(shù)RELU以及局部響應歸一化（LRN）處理，然后經(jīng)過降采樣（池化處理）。其網(wǎng)絡(luò)結(jié)構(gòu)如圖所示。3.1卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)3.1.1

常用卷積神經(jīng)網(wǎng)絡(luò)算法及其結(jié)構(gòu)2.AlexNet

圖中輸入的圖片尺寸為256×256，然后對輸入的圖片進行隨機裁剪得到227×227大小的圖片，將圖片輸入進網(wǎng)絡(luò)中，最后得到1000個分布區(qū)間為(0,1)的數(shù)的輸出，代表輸入樣本的所屬類別的概率。3.1卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)3.1.1

常用卷積神經(jīng)網(wǎng)絡(luò)算法及其結(jié)構(gòu)3.

VGGNet

VGGNet（VisualGeometryGroup）于2014年由牛津大學的凱倫·西蒙揚（KarenSimonyan）和安德魯·齊瑟曼（AndrewZisserman）提出，主要特點是“簡潔與深度”。簡潔是指它的結(jié)構(gòu)一律采用步長（stride）為1的3×3的卷積核（filter），以及步長為2的2×2的最大池化（MaxPooling），深度則是因為VGGNet能夠達到19層。

VGGNet一共有6種不同的網(wǎng)絡(luò)結(jié)構(gòu)，每種結(jié)構(gòu)都含有5組卷積，每組卷積都使用3×3的卷積核，每組卷積后進行一個2×2的最大池化，然后是3個全連接層。VGGNet的示意圖如圖所示，其中網(wǎng)絡(luò)結(jié)構(gòu)D就是著名的VGG16，網(wǎng)絡(luò)結(jié)構(gòu)E就是著名的VGG19。3.1卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)3.1.1

常用卷積神經(jīng)網(wǎng)絡(luò)算法及其結(jié)構(gòu)3.

VGGNetVGGNet在訓練時，先訓練級別A的簡單網(wǎng)絡(luò)，再復用A網(wǎng)絡(luò)的權(quán)重來初始化后面的復雜模型，加快訓練收斂的速度。在預測時，VGGNet采用Multi-Scale（多尺幅目標檢測）的方法，先將圖像的尺寸變換為Q，并將變換后的圖片輸入卷積網(wǎng)絡(luò)計算；然后在最后一個卷積層使用滑窗的方式進行分類預測，將不同窗口的分類結(jié)果平均，并將不同尺寸Q的結(jié)果平均后得到最后結(jié)果，能夠提高圖片數(shù)據(jù)的利用率并提升預測準確率。并且在訓練過程中，VGGNet也使用了Multi-Scale的方法做數(shù)據(jù)增強，將原始圖像縮放到不同尺寸S，然后再隨機裁切成224×224的圖片增加數(shù)據(jù)量，防止模型過擬合。3.1卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)3.1.1

常用卷積神經(jīng)網(wǎng)絡(luò)算法及其結(jié)構(gòu)4.

GoogLeNet

GoogLeNet是2014年由克里斯提·魯布托（ChristianLouboutin）提出的一種全新的深度學習網(wǎng)絡(luò)結(jié)構(gòu)，在這之前的AlexNet、VGG等結(jié)構(gòu)都是通過增大網(wǎng)絡(luò)的深度（層數(shù)）來獲得更好的訓練效果，但層數(shù)的增加會帶來很多負作用，如過擬合、梯度消失、梯度爆炸等。網(wǎng)絡(luò)寬度（inception）則從另一種角度來提升訓練結(jié)果，能更高效地利用計算資源，在相同的計算量下能提取到更多的特征。GoogLeNet的inception結(jié)構(gòu)如圖所示。3.1卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)3.1.1

常用卷積神經(jīng)網(wǎng)絡(luò)算法及其結(jié)構(gòu)5.

ResNet

隨著層數(shù)的增加，CNN的效果會遇到瓶頸，甚至會不增反降。ResNet于2015年由微軟亞洲研究院的學者們提出，主要是為了解決這個問題，幫助訓練更深的網(wǎng)絡(luò)。ResNet引入了一個殘差塊（residualblock）的結(jié)構(gòu)，如圖所示。3.1卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)3.1.1

常用卷積神經(jīng)網(wǎng)絡(luò)算法及其結(jié)構(gòu)1.卷積層2.池化層3.

全連接層4.

歸一化層5.

丟棄層3.1卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)3.1.2