基于深度學(xué)習(xí)AlexNet模型的運(yùn)動(dòng)鞋品牌識(shí)別方法設(shè)計(jì)_第1頁
基于深度學(xué)習(xí)AlexNet模型的運(yùn)動(dòng)鞋品牌識(shí)別方法設(shè)計(jì)_第2頁
基于深度學(xué)習(xí)AlexNet模型的運(yùn)動(dòng)鞋品牌識(shí)別方法設(shè)計(jì)_第3頁
基于深度學(xué)習(xí)AlexNet模型的運(yùn)動(dòng)鞋品牌識(shí)別方法設(shè)計(jì)_第4頁
基于深度學(xué)習(xí)AlexNet模型的運(yùn)動(dòng)鞋品牌識(shí)別方法設(shè)計(jì)_第5頁
已閱讀5頁,還剩11頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

目錄

1引言............................................................................................................................1

1.1項(xiàng)目背景......................................................................................................1

1.2Python簡介.....................................................................................................2

1.2.1AlexNet簡介.........................................................................................2

1.2.2PyCharm簡介........................................................................................3

1.2.3Python第三方庫簡介...........................................................................3

2需求分析....................................................................................................................5

2.1項(xiàng)目可行性..................................................................................................5

2.2關(guān)鍵技術(shù)分析..............................................................................................5

2.2.1數(shù)據(jù)采集技術(shù).......................................................................................5

2.2.2數(shù)據(jù)集可視化技術(shù)...............................................................................6

2.2.3AlexNet模型.........................................................................................6

3數(shù)據(jù)采集....................................................................................................................7

3.1運(yùn)動(dòng)鞋數(shù)據(jù)采集..........................................................................................7

3.2數(shù)據(jù)集獲取分析..........................................................................................7

3.3編程實(shí)現(xiàn)......................................................................................................8

4數(shù)據(jù)集預(yù)處理與數(shù)據(jù)可視化....................................................................................8

4.1數(shù)據(jù)集預(yù)處理..................................................................................................8

4.2數(shù)據(jù)可視化..................................................................................................9

4.3切分?jǐn)?shù)據(jù)集................................................................................................10

5模型構(gòu)建及評(píng)估分析..............................................................................................10

5.1模型構(gòu)建....................................................................................................10

5.2模型編譯....................................................................................................12

5.3結(jié)果分析....................................................................................................13

6小結(jié)..........................................................................................................................13

參考資料.........................................................................................................................15

I

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

基于AlexNet模型的運(yùn)動(dòng)鞋品牌識(shí)別方法設(shè)計(jì)

1引言

近年來,深度學(xué)習(xí)技術(shù)在計(jì)算機(jī)視覺領(lǐng)域得到了廣泛應(yīng)用。其中,卷積神

經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetwork,CNN)是一種常用的模型,具有良好

的特征提取能力和分類性能。AlexNet是第一個(gè)應(yīng)用于圖像分類比賽(ImageNet

LargeScaleVisualRecognitionChallenge,ILSVRC)的CNN模型,具有較高的

準(zhǔn)確率和速度,成為了深度學(xué)習(xí)研究的一個(gè)里程碑。

運(yùn)動(dòng)鞋是現(xiàn)代時(shí)尚文化中不可或缺的元素之一,其品牌眾多、款式復(fù)雜,

因此如何對(duì)不同品牌的運(yùn)動(dòng)鞋進(jìn)行自動(dòng)化識(shí)別成為了一個(gè)具有挑戰(zhàn)性的問題。

傳統(tǒng)的基于圖像特征的分類方法需要人工定義特征并選擇合適的分類器,效果

受限。而基于深度學(xué)習(xí)的分類方法可以自動(dòng)學(xué)習(xí)特征,并獲得更好的分類性能。

因此,本文提出了一種基于深度學(xué)習(xí)AlexNet模型的運(yùn)動(dòng)鞋品牌識(shí)別方法,

通過構(gòu)建AlexNet模型訓(xùn)練數(shù)據(jù)集,利用訓(xùn)練好的模型對(duì)測(cè)試數(shù)據(jù)進(jìn)行預(yù)測(cè),

并評(píng)估分類性能。實(shí)驗(yàn)結(jié)果表明,該方法在運(yùn)動(dòng)鞋品牌識(shí)別方面具有很高的準(zhǔn)

確率和魯棒性,能夠應(yīng)用于實(shí)際場景中的運(yùn)動(dòng)鞋分類問題。

1.1項(xiàng)目背景

隨著時(shí)尚文化的不斷發(fā)展和人們生活水平的提高,運(yùn)動(dòng)鞋成為了現(xiàn)代時(shí)尚

文化中的重要元素之一。市面上有大量的運(yùn)動(dòng)鞋品牌,每個(gè)品牌還有多個(gè)款式

和系列,這給消費(fèi)者選購帶來了困難。同時(shí),在電商、物流等領(lǐng)域,快速準(zhǔn)確

地識(shí)別運(yùn)動(dòng)鞋品牌也是非常關(guān)鍵的問題。

傳統(tǒng)的基于圖像特征的分類方法需要人工定義特征并選擇合適的分類器,

效果受限。而深度學(xué)習(xí)技術(shù)具有自動(dòng)學(xué)習(xí)特征的能力,可以更好地解決圖像分

類問題。AlexNet是第一個(gè)在ImageNet比賽中取得優(yōu)異成績的CNN模型,具有

較高的準(zhǔn)確率和速度,因此被廣泛應(yīng)用于圖像分類和物體識(shí)別任務(wù)中。

本項(xiàng)目旨在設(shè)計(jì)一種基于深度學(xué)習(xí)AlexNet模型的運(yùn)動(dòng)鞋品牌識(shí)別方法,

通過構(gòu)建數(shù)據(jù)集、訓(xùn)練模型和評(píng)估性能,實(shí)現(xiàn)對(duì)不同品牌運(yùn)動(dòng)鞋的自動(dòng)化識(shí)別。

該方法可以應(yīng)用于電商、物流等領(lǐng)域,提高工作效率和準(zhǔn)確性,為用戶提供更

好的服務(wù)體驗(yàn)。

1

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

1.2Python簡介

Python是由GuidoRossum于1989年誕生。2005-2012年,Google大量應(yīng)

用python,引起廣泛關(guān)注,促進(jìn)了python的發(fā)展。2012年云計(jì)算興起,其中

最主要的OpenStack框架由python開發(fā),使得python火了一把。2014年AI興

起,AI中大量關(guān)鍵算法都是由python開發(fā),因?yàn)閜ython中含有很好的第三方

庫特別適合做算法,加上入門低、開發(fā)效率高,這樣又進(jìn)一步促使python的火

爆。2017年python走進(jìn)大眾視野(指非IT人士),走進(jìn)學(xué)科教育。

如今已經(jīng)發(fā)展成一門廣泛使用的高級(jí)編程語言。它可應(yīng)用于網(wǎng)絡(luò)爬蟲、機(jī)

器學(xué)習(xí)、數(shù)據(jù)分析和可視化等多種領(lǐng)域。它的特點(diǎn)是開源(免費(fèi))、豐富的庫、

簡單易學(xué)、支持跨平臺(tái)而且可移植性強(qiáng)。

1.2.1AlexNet簡介

AlexNet是Hinton和他的學(xué)生AlexKrizhevsky在2012年ImageNet挑戰(zhàn)

賽中使用的模型結(jié)構(gòu),刷新ImageClassification的錯(cuò)誤率,從此深度學(xué)習(xí)方

法在Image這塊開始一次次超過state-of-art,甚至于搭到打敗人類的地步,

看這邊文章的過程中,發(fā)現(xiàn)了很多以前零零散散看到的一些優(yōu)化技術(shù),但是很

多沒有深入了解。

AlexNet中包含了幾個(gè)比較新的技術(shù)點(diǎn),也首次在CNN中成功應(yīng)用了ReLU、

Dropout和LRN等Trick。同時(shí)AlexNet也使用了GPU進(jìn)行運(yùn)算加速。

AlexNet將LeNet的思想發(fā)揚(yáng)光大,把CNN的基本原理應(yīng)用到了很深很寬的

網(wǎng)絡(luò)中。AlexNet主要使用到的新技術(shù)點(diǎn)如下。

(1)成功使用ReLU作為CNN的激活函數(shù),并驗(yàn)證其效果在較深的網(wǎng)絡(luò)超

過了Sigmoid,成功解決了Sigmoid在網(wǎng)絡(luò)較深時(shí)的梯度彌散問題。雖然ReLU

激活函數(shù)在很久之前就被提出了,但是直到AlexNet的出現(xiàn)才將其發(fā)揚(yáng)光大。

(2)訓(xùn)練時(shí)使用Dropout隨機(jī)忽略一部分神經(jīng)元,以避免模型過擬合。

Dropout雖有單獨(dú)的論述,但是AlexNet將其實(shí)用化,通過實(shí)踐證實(shí)了它的效果。

在AlexNet中主要是最后幾個(gè)全連接層使用了Dropout。

(3)在CNN中使用重疊的最大池化。此前CNN中普遍使用平均池化,

AlexNet全部使用最大池化,避免平均池化的模糊化效果。并且AlexNet中提出

讓步長比池化核的尺寸小,這樣池化層的輸出之間會(huì)有重疊和覆蓋,提升了特

征的豐富性。

(4)提出了LRN層,對(duì)局部神經(jīng)元的活動(dòng)創(chuàng)建競爭機(jī)制,使得其中響應(yīng)比

2

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

較大的值變得相對(duì)更大,并抑制其他反饋較小的神經(jīng)元,增強(qiáng)了模型的泛化能

力。

(5)使用CUDA加速深度卷積網(wǎng)絡(luò)的訓(xùn)練,利用GPU強(qiáng)大的并行計(jì)算能力,

處理神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí)大量的矩陣運(yùn)算。AlexNet使用了兩塊GTX580GPU進(jìn)行訓(xùn)

練,單個(gè)GTX580只有3GB顯存,這限制了可訓(xùn)練的網(wǎng)絡(luò)的最大規(guī)模。因此作者

將AlexNet分布在兩個(gè)GPU上,在每個(gè)GPU的顯存中儲(chǔ)存一半的神經(jīng)元的參數(shù)。

因?yàn)镚PU之間通信方便,可以互相訪問顯存,而不需要通過主機(jī)內(nèi)存,所以同

時(shí)使用多塊GPU也是非常高效的。同時(shí),AlexNet的設(shè)計(jì)讓GPU之間的通信只在

網(wǎng)絡(luò)的某些層進(jìn)行,控制了通信的性能損耗。

(6)數(shù)據(jù)增強(qiáng),隨機(jī)地從256*256的原始圖像中截取224*224大小的區(qū)域

(以及水平翻轉(zhuǎn)的鏡像),相當(dāng)于增加了2*(256-224)^2=2048倍的數(shù)據(jù)量。如

果沒有數(shù)據(jù)增強(qiáng),僅靠原始的數(shù)據(jù)量,參數(shù)眾多的CNN會(huì)陷入過擬合中,使用

了數(shù)據(jù)增強(qiáng)后可以大大減輕過擬合,提升泛化能力。進(jìn)行預(yù)測(cè)時(shí),則是取圖片

的四個(gè)角加中間共5個(gè)位置,并進(jìn)行左右翻轉(zhuǎn),一共獲得10張圖片,對(duì)他們進(jìn)

行預(yù)測(cè)并對(duì)10次結(jié)果求均值。同時(shí),AlexNet中提到了會(huì)對(duì)圖像的RGB數(shù)據(jù)進(jìn)

行PCA處理,并對(duì)主成分做一個(gè)標(biāo)準(zhǔn)差為0.1的高斯擾動(dòng),增加一些噪聲,這

個(gè)Trick可以讓錯(cuò)誤率再下降1%。

1.2.2PyCharm簡介

PyCharm是一種PythonIDE(集成開發(fā)環(huán)境),帶有一整套可以幫助用戶

在使用Python語言開發(fā)時(shí)提高其效率的工具,比如調(diào)試、語法高亮、項(xiàng)目管理、

代碼跳轉(zhuǎn)、智能提示、自動(dòng)完成、單元測(cè)試、版本控制。此外,該IDE提供了

一些高級(jí)功能,以用于支持Django框架下的專業(yè)Web開發(fā)。本設(shè)計(jì)的代碼統(tǒng)一

用PyCharm來運(yùn)行和展示。

1.2.3Python第三方庫簡介

Keras:數(shù)式模型接口是用戶定義多輸出模型、非循環(huán)有向模型或具有共享

層的模型等復(fù)雜模型的途徑。一句話,只要你的模型不是類似VGG一樣一條路

走到黑的模型,或者你的模型需要多于一個(gè)的輸出,那么你總應(yīng)該選擇函數(shù)式

模型。

Matplotlib:一個(gè)用Python實(shí)現(xiàn)的繪圖庫?,F(xiàn)在很多機(jī)器學(xué)習(xí),深度學(xué)習(xí)

教學(xué)資料中都用它來繪制函數(shù)圖形。在學(xué)習(xí)算法過程中,Matplotlib是一個(gè)非

常趁手的工具。

3

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

NumPy:常與SciPy(ScientificPython)和Matplotlib(繪圖庫)一起

使用。這種組合廣泛用于替代MatLab,是一個(gè)流行的技術(shù)計(jì)算平臺(tái)。但是,

Python作為MatLab的替代方案,現(xiàn)在被視為一種更加現(xiàn)代和完整的編程語言。

Pandas:一個(gè)免費(fèi)、開源的第三方Python庫,是Python數(shù)據(jù)分析必不可

少的工具之一。其基于numPy庫開發(fā)而來,提供了兩種數(shù)據(jù)結(jié)構(gòu),Series(一

維數(shù)組結(jié)構(gòu))與DataFrame(二維數(shù)組結(jié)構(gòu)),這兩種數(shù)據(jù)結(jié)構(gòu)極大地增強(qiáng)的了

Pandas的數(shù)據(jù)分析能力。

Seaborn:基于matplotlib的圖形可視化python包。它提供了一種高度交

互式界面,便于用戶能夠做出各種有吸引力的統(tǒng)計(jì)圖表。

Sklearn:稱scikit-learn,是python中的機(jī)器學(xué)習(xí)庫,建立在numpy、

scipy、matplotlib等數(shù)據(jù)科學(xué)包的基礎(chǔ)之上,涵蓋了機(jī)器學(xué)習(xí)中的樣例數(shù)據(jù)、

數(shù)據(jù)預(yù)處理、模型驗(yàn)證、特征選擇、分類、回歸、聚類、降維等幾乎所有環(huán)節(jié),

功能十分強(qiáng)大,目前sklearn版本是0.23。與深度學(xué)習(xí)庫存在pytorch、

TensorFlow等多種框架可選不同,sklearn是python中傳統(tǒng)機(jī)器學(xué)習(xí)的首選庫,

不存在其他競爭者。

TensorFlow:采用數(shù)據(jù)流圖(dataflowgraphs)來計(jì)算,所以首先我們得

創(chuàng)建一個(gè)數(shù)據(jù)流流圖,然后再將我們的數(shù)據(jù)(數(shù)據(jù)以張量(tensor)的形式存在)

放在數(shù)據(jù)流圖中計(jì)算.節(jié)點(diǎn)(Nodes)在圖中表示數(shù)學(xué)操作,圖中的邊(edges)

則表示在節(jié)點(diǎn)間相互聯(lián)系的多維數(shù)據(jù)數(shù)組,即張量(tensor)。訓(xùn)練模型時(shí)

tensor會(huì)不斷的從數(shù)據(jù)流圖中的一個(gè)節(jié)點(diǎn)flow到另一節(jié)點(diǎn),這就是

TensorFlow名字的由來。

Keras:數(shù)式模型接口是用戶定義多輸出模型、非循環(huán)有向模型或具有共享

層的模型等復(fù)雜模型的途徑。一句話,只要你的模型不是類似VGG一樣一條路

走到黑的模型,或者你的模型需要多于一個(gè)的輸出,那么你總應(yīng)該選擇函數(shù)式

模型。

函數(shù)式模型是最廣泛的一類模型,序貫?zāi)P停⊿equential)只是它的一種

特殊情況。使用通用模型,首先要使用Input函數(shù)將輸入轉(zhuǎn)化為一個(gè)tensor,

然后將每一層用變量存儲(chǔ)后,作為下一層的參數(shù),最后使用Model類將輸入和

輸出作為參數(shù)即可搭建模型。

4

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

2需求分析

2.1項(xiàng)目可行性

基于深度學(xué)習(xí)AlexNet模型的運(yùn)動(dòng)鞋品牌識(shí)別方法在技術(shù)上是可行的。以

下是幾方面說明:

數(shù)據(jù)集構(gòu)建:數(shù)據(jù)集的數(shù)量和質(zhì)量對(duì)于深度學(xué)習(xí)模型的訓(xùn)練至關(guān)重要。在

運(yùn)動(dòng)鞋品牌識(shí)別任務(wù)中,可以通過網(wǎng)絡(luò)爬蟲、手工采集等方式獲取大量具有代

表性的圖像進(jìn)行構(gòu)建。同時(shí),采用數(shù)據(jù)增強(qiáng)技術(shù)可以增加數(shù)據(jù)集的多樣性和數(shù)

量,提高模型的泛化能力。

AlexNet模型應(yīng)用:AlexNet是第一個(gè)成功應(yīng)用于ImageNet比賽并取得優(yōu)

異成績的CNN模型,其具有較好的特征提取性能和分類性能。在本項(xiàng)目中,可

以利用預(yù)訓(xùn)練的AlexNet模型作為基礎(chǔ)模型,并使用遷移學(xué)習(xí)的方法對(duì)模型進(jìn)

行微調(diào),以適應(yīng)運(yùn)動(dòng)鞋品牌識(shí)別任務(wù)。

模型評(píng)估:模型的評(píng)估方法主要包括準(zhǔn)確率、召回率、F1值等指標(biāo)。可以

將構(gòu)建好的數(shù)據(jù)集分為訓(xùn)練集和測(cè)試集,在訓(xùn)練集上訓(xùn)練模型,在測(cè)試集上進(jìn)

行測(cè)試和評(píng)估,得到模型的性能指標(biāo)。

實(shí)時(shí)性要求:模型的實(shí)時(shí)性要求取決于具體應(yīng)用場景。在一些應(yīng)用場景中,

如物流、電商等領(lǐng)域,需要對(duì)圖像進(jìn)行快速準(zhǔn)確的識(shí)別,因此需要對(duì)模型進(jìn)行

優(yōu)化和加速。可以采用深度學(xué)習(xí)框架提供的GPU加速、模型壓縮等方法來滿足

實(shí)時(shí)性要求。

綜上所述,基于深度學(xué)習(xí)AlexNet模型的運(yùn)動(dòng)鞋品牌識(shí)別方法在技術(shù)上是

可行的,可以通過數(shù)據(jù)集構(gòu)建、AlexNet模型應(yīng)用、模型評(píng)估和實(shí)時(shí)性優(yōu)化等方

面來實(shí)現(xiàn)。

2.2關(guān)鍵技術(shù)分析

2.2.1數(shù)據(jù)采集技術(shù)

網(wǎng)絡(luò)爬蟲也叫網(wǎng)絡(luò)機(jī)器人,顧名思義就是代替人類手工,利用程序或腳本

來自動(dòng)穿梭互聯(lián)網(wǎng),并進(jìn)行數(shù)據(jù)信息的采集。網(wǎng)絡(luò)爬蟲按照實(shí)現(xiàn)的技術(shù)和結(jié)構(gòu)

可以分為通用網(wǎng)絡(luò)爬蟲、聚焦網(wǎng)絡(luò)爬蟲、增量式網(wǎng)絡(luò)爬蟲、深層網(wǎng)絡(luò)爬蟲等類

型。

通用網(wǎng)絡(luò)爬蟲:主要由初始URL集合、URL隊(duì)列、頁面爬行模塊、頁面分析

5

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

模塊、頁面數(shù)據(jù)庫、鏈接過濾模塊等構(gòu)成。

聚焦網(wǎng)絡(luò)爬蟲:主要由初始URL集合、URL隊(duì)列、頁面爬行模塊、頁面分析

模塊、頁面數(shù)據(jù)庫、鏈接過濾模塊、內(nèi)容評(píng)價(jià)模塊、鏈接評(píng)價(jià)模塊等構(gòu)成。

增量式網(wǎng)絡(luò)爬蟲:用來爬取新產(chǎn)生的網(wǎng)頁或者內(nèi)容被更新的網(wǎng)頁數(shù)據(jù),這

樣可以有效地減少網(wǎng)頁的下載量,減少訪問時(shí)間和存儲(chǔ)空間的耗費(fèi),但是增加

了網(wǎng)頁抓取算法的復(fù)雜度和實(shí)現(xiàn)難度,所以主要用在有更新需求的數(shù)據(jù)。

深層網(wǎng)絡(luò)爬蟲:主要由URL列表、LVS列表(LVS指的是標(biāo)簽/數(shù)值集合,

即填充表單的數(shù)據(jù)源)、爬行控制器、解析器、LVS控制器、表單分析器、表單

處理器、響應(yīng)分析器等部分構(gòu)成。

本篇的需求來說,我們選取的是聚焦網(wǎng)絡(luò)爬蟲。聚焦網(wǎng)絡(luò)爬蟲的基本工作

流程:

先獲取初始的URL、根據(jù)初始的URL爬取頁面,并從中選取新的目標(biāo)URL,

從新的URL中過濾掉與爬取目標(biāo)無關(guān)的鏈接;再將過濾后的鏈接放到URL隊(duì)列

中,對(duì)新URL進(jìn)行爬取;直至爬取到所需數(shù)據(jù)時(shí)停止爬行;最后對(duì)數(shù)據(jù)進(jìn)行處

理后存儲(chǔ)。

2.2.2數(shù)據(jù)集可視化技術(shù)

數(shù)據(jù)可視化,是關(guān)于數(shù)據(jù)視覺表現(xiàn)形式的科學(xué)技術(shù)研究。其中,這種數(shù)據(jù)

的視覺表現(xiàn)形式被定義為,一種以某種概要形式抽提出來的信息,包括相應(yīng)信

息單位的各種屬性和變量。

數(shù)據(jù)可視化主要旨在借助于圖形化手段,清晰有效地傳達(dá)與溝通信息。而

本篇主要利用簡單的數(shù)據(jù)可視化技術(shù),來展示獲取不同品牌鞋子的共性或差異

等信息,有助于指導(dǎo)后續(xù)的數(shù)據(jù)采集和模型優(yōu)化。

2.2.3AlexNet模型

AlexNet模型包含五個(gè)卷積層和三個(gè)全連接層,最后一層輸出每個(gè)類別的概

率分布。與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)不同,AlexNet使用ReLU(rectifiedlinear

unit)作為激活函數(shù),大大加速了訓(xùn)練速度。此外,AlexNet還使用了Dropout

技術(shù)來防止過擬合。

AlexNet模型結(jié)構(gòu)如下圖所示。

6

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

圖2-1模型結(jié)構(gòu)

lexNet的創(chuàng)新之處在于它將深度學(xué)習(xí)方法應(yīng)用于圖像分類任務(wù),并且證明

了深度卷積神經(jīng)網(wǎng)絡(luò)可以取得非常好的性能。

3數(shù)據(jù)采集

3.1運(yùn)動(dòng)鞋數(shù)據(jù)采集

從網(wǎng)絡(luò)上收集運(yùn)動(dòng)鞋圖片,可以選取一些已知的網(wǎng)站,例如淘寶、京東、

天貓。如圖所示。

圖3-1數(shù)據(jù)集

3.2數(shù)據(jù)集獲取分析

1.數(shù)據(jù)收集:需要從不同的運(yùn)動(dòng)鞋品牌中收集圖像數(shù)據(jù),以覆蓋多個(gè)品牌、

型號(hào)和顏色等不同特征??梢栽诨ヂ?lián)網(wǎng)上搜索、采集或購買相關(guān)數(shù)據(jù),也可以

通過自行拍攝等方式進(jìn)行收集。

2.數(shù)據(jù)清洗:對(duì)于收集到的圖像數(shù)據(jù),需要進(jìn)行清洗,去除模糊、重疊、

異常、重復(fù)等無用數(shù)據(jù),確保數(shù)據(jù)的準(zhǔn)確性和可用性。同時(shí)需要對(duì)每個(gè)圖像進(jìn)

行標(biāo)注,即給每個(gè)圖像打上標(biāo)簽、標(biāo)注品牌、型號(hào)等信息。

3.數(shù)據(jù)劃分:將數(shù)據(jù)集劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。通??梢詫?shù)據(jù)

集的80%用于訓(xùn)練集,10%用于驗(yàn)證集和測(cè)試集。訓(xùn)練集用于模型訓(xùn)練,驗(yàn)證集

用于模型選擇和調(diào)優(yōu),測(cè)試集是最終評(píng)估模型性能的關(guān)鍵。

7

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

4.數(shù)據(jù)增強(qiáng):通過數(shù)據(jù)增強(qiáng)技術(shù),將已有的圖像數(shù)據(jù)進(jìn)行多樣化處理,以

增加數(shù)據(jù)集的多樣性和復(fù)雜性??梢允褂眯D(zhuǎn)、翻轉(zhuǎn)、剪裁、縮放、亮度、對(duì)

比度、顏色等方式進(jìn)行數(shù)據(jù)增強(qiáng)。

5.數(shù)據(jù)預(yù)處理:在將數(shù)據(jù)輸入到AlexNet模型之前,需要進(jìn)行一系列的預(yù)

處理操作,包括圖像歸一化(將圖像大小、像素值、顏色等進(jìn)行統(tǒng)一化)、縮

放、裁剪、標(biāo)準(zhǔn)化等操作。

基于以上數(shù)據(jù)集分析,可以構(gòu)建適合于AlexNet模型運(yùn)動(dòng)鞋品牌識(shí)別的數(shù)

據(jù)集,并進(jìn)行深度學(xué)習(xí)模型的訓(xùn)練和評(píng)估。

3.3編程實(shí)現(xiàn)

創(chuàng)建train.py進(jìn)行解析,代碼如下圖所示。

圖3-2數(shù)據(jù)集解析代碼

4數(shù)據(jù)集預(yù)處理與數(shù)據(jù)可視化

4.1數(shù)據(jù)集預(yù)處理

數(shù)據(jù)可視化技術(shù)的基本思想是將數(shù)據(jù)庫中每一個(gè)數(shù)據(jù)項(xiàng)作為單個(gè)圖元元素

8

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

表示,大量的數(shù)據(jù)集構(gòu)成數(shù)據(jù)圖像,同時(shí)將數(shù)據(jù)的各個(gè)屬性值以多維數(shù)據(jù)的形

式表示,可以從不同的維度觀察數(shù)據(jù),從而對(duì)數(shù)據(jù)進(jìn)行更深入的觀察和分析。

為了更直觀的展示數(shù)據(jù)集,以便于后續(xù)對(duì)模型的改進(jìn)與評(píng)估,本篇用餅圖和詞

云圖來進(jìn)行數(shù)據(jù)可視化。

數(shù)據(jù)預(yù)處理(datapreprocessing)是指在主要的處理以前對(duì)數(shù)據(jù)進(jìn)行的一

些處理。為了更好的訓(xùn)練效果要將數(shù)據(jù)集切分成訓(xùn)練集、測(cè)試集和驗(yàn)證集。

4.2數(shù)據(jù)可視化

為了直觀的看見我們可以將訓(xùn)練好的模型中的參數(shù)可視化出來,以了解每

個(gè)權(quán)重和偏置的取值范圍、分布情況等信息。具體代碼如下所示。

圖4-1數(shù)據(jù)集可視化代碼

運(yùn)行代碼main.py后查看,得到如下效果。

9

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

圖4-2數(shù)據(jù)集可視化效果

4.3切分?jǐn)?shù)據(jù)集

為了更好的訓(xùn)練、測(cè)試、優(yōu)化、評(píng)估模型,需要對(duì)準(zhǔn)備的數(shù)據(jù)集進(jìn)行切分。

數(shù)據(jù)集一般會(huì)被切分為三種:訓(xùn)練集、測(cè)試集和驗(yàn)證集。

1、訓(xùn)練集(trainset):用于訓(xùn)練模型以及確定參數(shù)。

2、驗(yàn)證集(validationset):用于確定網(wǎng)絡(luò)結(jié)構(gòu)以及調(diào)整模型的超參數(shù)。

3、測(cè)試集(testset):用于檢驗(yàn)?zāi)P偷姆夯芰Α?/p>

本次數(shù)據(jù)切分采用分層切分?jǐn)?shù)據(jù)集的方法。下面是具體的代碼。

圖4-3數(shù)據(jù)集切分

5模型構(gòu)建及評(píng)估分析

5.1模型構(gòu)建

數(shù)據(jù)集準(zhǔn)備,收集足夠數(shù)量的各品牌的運(yùn)動(dòng)鞋圖片,并進(jìn)行數(shù)據(jù)預(yù)處理,

如圖像大小調(diào)整、色彩空間轉(zhuǎn)換等。

10

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

圖5-1數(shù)據(jù)集準(zhǔn)備代碼

模型構(gòu)建,使用AlexNet作為基礎(chǔ)模型,一般包括五個(gè)卷積層和三個(gè)全連

接層,通過修改AlexNet最后的輸出層,訓(xùn)練出適用于運(yùn)動(dòng)鞋品牌識(shí)別的模型。

其中ConvolutionalNeuralNetworks(CNNs)通常表現(xiàn)優(yōu)異,最后一層可根據(jù)具

體問題設(shè)定,可以是softmax函數(shù)或者sigmoid函數(shù)。

圖5-2模型構(gòu)建代碼

訓(xùn)練模型:使用已經(jīng)準(zhǔn)備好的數(shù)據(jù)集對(duì)模型進(jìn)行訓(xùn)練,通常采用隨機(jī)梯度

下降(StochasticGradientDescent)和反向傳播算法(BackPropagation

Algorithm)進(jìn)行優(yōu)化,使得模型能夠較好地識(shí)別不同品牌的運(yùn)動(dòng)鞋。

11

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

圖5-3模型訓(xùn)練代碼

模型測(cè)試:將預(yù)先保留的測(cè)試集數(shù)據(jù)輸入到訓(xùn)練好的模型中,以評(píng)估模型

的性能表現(xiàn)。

模型優(yōu)化:根據(jù)實(shí)驗(yàn)結(jié)果調(diào)整模型參數(shù),重新訓(xùn)練模型,提高模型性能。

5.2模型編譯

為了能夠使用基于深度學(xué)習(xí)AlexNet模型的運(yùn)動(dòng)鞋品牌識(shí)別方法,需要先

定義輸入數(shù)據(jù)的形狀和類別數(shù),然后搭建AlexNet模型結(jié)構(gòu),并對(duì)其進(jìn)行編譯。

圖5-4模型編譯代碼

在編譯時(shí),通常需要指定損失函數(shù)、優(yōu)化器和評(píng)估指標(biāo)等參數(shù),以便在訓(xùn)

練過程中可以得到合適的反饋信息。本次采用交叉熵?fù)p失函數(shù)

categorical_crossentropy、隨機(jī)梯度下降優(yōu)化器(SGD)和準(zhǔn)確率評(píng)估指標(biāo)等

參數(shù),同時(shí)還需要注意設(shè)置學(xué)習(xí)率、動(dòng)量等超參數(shù),以保證模型能夠快速收斂

到較好的精度。

最后,還需要使用model.summary()輸出模型的結(jié)構(gòu)和參數(shù)信息,以便更好

地觀察模型的特點(diǎn)和性能表現(xiàn)。整個(gè)模型編譯的流程包括模型構(gòu)建、模型編譯

12

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

和模型結(jié)構(gòu)輸出三個(gè)步驟,這些步驟都需要仔細(xì)調(diào)試和優(yōu)化,以獲得最佳的模

型性能。

5.3結(jié)果分析

為了評(píng)估模型的性能表現(xiàn),我們使用測(cè)試集數(shù)據(jù)進(jìn)行驗(yàn)證,并計(jì)算出分類

精度等相關(guān)指標(biāo)。在本次實(shí)驗(yàn)中,我們將準(zhǔn)確率作為主要評(píng)估指標(biāo),計(jì)算出正

確分類的樣本數(shù)占總樣本數(shù)的比例,以此來評(píng)估模型的性能表現(xiàn)。具體地,我

們使用測(cè)試集數(shù)據(jù)輸入到訓(xùn)練好的模型中,獲取測(cè)試損失值和測(cè)試精度。測(cè)試

精度即為分類精度,表示模型對(duì)測(cè)試集數(shù)據(jù)進(jìn)行分類時(shí),正確分類的數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論