基于深度學(xué)習(xí)VGG模型的手勢(shì)識(shí)別方法設(shè)計(jì)_第1頁(yè)
基于深度學(xué)習(xí)VGG模型的手勢(shì)識(shí)別方法設(shè)計(jì)_第2頁(yè)
基于深度學(xué)習(xí)VGG模型的手勢(shì)識(shí)別方法設(shè)計(jì)_第3頁(yè)
基于深度學(xué)習(xí)VGG模型的手勢(shì)識(shí)別方法設(shè)計(jì)_第4頁(yè)
基于深度學(xué)習(xí)VGG模型的手勢(shì)識(shí)別方法設(shè)計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩13頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

目錄

1引言............................................................................................................................1

1.1項(xiàng)目背景......................................................................................................1

1.2開發(fā)環(huán)境與工具..........................................................................................1

1.2.1Python簡(jiǎn)介..........................................................................................1

1.2.2Keras簡(jiǎn)介............................................................................................2

1.2.3PyCharm簡(jiǎn)介........................................................................................2

1.2.4VGG網(wǎng)絡(luò)結(jié)構(gòu)........................................................................................2

1.2.5Python第三方庫(kù)簡(jiǎn)介..........................................................................4

2需求分析....................................................................................................................5

2.1可行性需求分析..............................................................................................5

2.2數(shù)據(jù)可視化技術(shù)..............................................................................................5

3數(shù)據(jù)采集....................................................................................................................6

3.1數(shù)據(jù)集采集功能分析..................................................................................6

3.2數(shù)據(jù)集需求分析..........................................................................................6

3.3數(shù)據(jù)集獲取分析..........................................................................................7

3.4編程實(shí)現(xiàn)......................................................................................................7

4數(shù)據(jù)集處理................................................................................................................7

4.1數(shù)據(jù)預(yù)處理..................................................................................................7

4.2切分訓(xùn)練集和測(cè)試集..................................................................................8

5模型構(gòu)建及保存........................................................................................................9

5.1模型構(gòu)建......................................................................................................9

5.1.1構(gòu)建數(shù)據(jù)生成器...................................................................................9

5.1.2數(shù)據(jù)可視化...........................................................................................9

5.2模型編譯....................................................................................................10

5.2.1優(yōu)化器設(shè)置.........................................................................................11

5.2.2損失函數(shù)設(shè)置.....................................................................................12

5.3VGG16模型擬合.............................................................................................12

I

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

5.3.1模型擬合.............................................................................................12

5.3.2Batch_size設(shè)置................................................................................12

5.3.3模型保存.............................................................................................13

5.4模型部署....................................................................................................13

5.4.1系統(tǒng)前端設(shè)計(jì).....................................................................................13

6小結(jié)..........................................................................................................................14

參考資料.........................................................................................................................16

II

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

基于深度學(xué)習(xí)VGG模型的手勢(shì)識(shí)別方法設(shè)計(jì)

1引言

近年來(lái)人工智能服務(wù),人與機(jī)器的交互方式在不斷變化。比如,鼠標(biāo)鍵盤

的交互方式在某些領(lǐng)域被語(yǔ)音識(shí)別交互和觸屏交互。然后如果通過(guò)肢體語(yǔ)言進(jìn)

行和機(jī)器的交互會(huì)使效率得到巨大的提升。隨著科技的發(fā)展,對(duì)手勢(shì)識(shí)別技術(shù)

的研究已經(jīng)成為熱口課題,基于手勢(shì)識(shí)別技術(shù)的應(yīng)用也開始滲透到人們生活的

方方面面,這是一項(xiàng)技術(shù)走向成熱的標(biāo)志。同時(shí),手勢(shì)識(shí)別技術(shù)無(wú)論是在手勢(shì)

樣本的采集,還是手勢(shì)設(shè)計(jì)上都有自己的優(yōu)勢(shì),手勢(shì)識(shí)別的深入研究有著很重

要的意義。

1.1項(xiàng)目背景

在過(guò)去幾十年中,計(jì)算機(jī)技術(shù)飛速發(fā)展,在各行各業(yè)中,計(jì)算機(jī)都給人們

帶來(lái)便捷,人們己經(jīng)與計(jì)算機(jī)密不可分,其中,人與計(jì)算機(jī)的信息交互是必不

可缺的一步。人機(jī)交互最常見(jiàn)模式是依賴于簡(jiǎn)單的機(jī)械裝置,即鍵盤和鼠標(biāo),

真他的還有諸如觸摸屏等。盡管上述交互方式廣泛存在于人們的日常生活中并

被熟練使用,我們還是不禁要想,是否還有更自然,更符合人類習(xí)慣的人機(jī)交

互方式,其中一種主流趨勢(shì)就是手勢(shì)識(shí)別技術(shù)。

本項(xiàng)目是針對(duì)通過(guò)手勢(shì)和機(jī)器交互大大提升工作效率,讓手勢(shì)取代傳統(tǒng)的

敲擊鍵盤或點(diǎn)擊鼠標(biāo)作為輸入來(lái)控制自己的計(jì)算機(jī),能夠使人與機(jī)器之間的交

互濕得更加智能化、自然化,而且可將人們?cè)谌粘I钪兴@得的經(jīng)驗(yàn),直接

運(yùn)用到交互活動(dòng)中,能夠充分提高虛擬世界中的可操作性,并且可在虛擬世界

中完成更加復(fù)雜的任務(wù)。

1.2開發(fā)環(huán)境與工具

1.2.1Python簡(jiǎn)介

Python是在20世紀(jì)80年代由GuidoRossum創(chuàng)造的。

隨著時(shí)代的發(fā)展,計(jì)算機(jī)越來(lái)越強(qiáng)大編程語(yǔ)言的多樣化Python逐漸走入大

眾的視野,在2005至2012年,谷歌公司大量應(yīng)用Python進(jìn)行程序設(shè)計(jì),引起

廣泛關(guān)注,從而大大促進(jìn)了python的發(fā)展。

在2012年云計(jì)算的興起,其中最主要的OpenStack框架由Python開發(fā),

1

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

使得Python的熱度得到空前的高漲。在2014年AI興起,在AI中大量關(guān)鍵算

法都是由python開發(fā),因?yàn)閜ython中含有非常好的第三方庫(kù)特別適合用于算

法設(shè)計(jì),其次則是入門低、開發(fā)效率較高,因此又進(jìn)一步促使python的火爆。

2017年python正式走進(jìn)大眾視野,走進(jìn)學(xué)科教育。

現(xiàn)如今已經(jīng)發(fā)展成為一門廣泛使用的高級(jí)編程語(yǔ)言。它可應(yīng)用于網(wǎng)絡(luò)爬蟲、

機(jī)器學(xué)習(xí)、數(shù)據(jù)分析和可視化等多種領(lǐng)域。它的優(yōu)點(diǎn)是開源(免費(fèi))、豐富的

庫(kù)、簡(jiǎn)單易上手、支持跨平臺(tái)而且可移植性較強(qiáng)。

1.2.2Keras簡(jiǎn)介

Kears是一個(gè)用python編寫的高級(jí)深度學(xué)習(xí)程序庫(kù),它支持

TensorFlow,CNTk或者二者結(jié)合作為后端運(yùn)行,能夠?qū)崿F(xiàn)CPU和GPU的無(wú)縫切換。

Kears對(duì)于初學(xué)者來(lái)說(shuō)門檻比較低,很容易上手。它的開發(fā)重點(diǎn)是支持快速的實(shí)

驗(yàn)開發(fā),并能夠以最小的時(shí)延把你的想法轉(zhuǎn)換為實(shí)驗(yàn)結(jié)果,是做好研究的關(guān)鍵。

Kears在代碼的結(jié)構(gòu)上是由面向?qū)ο蠓椒ň帉懙模耆K化并且具有可拓

展性。Kears提供了多種引擎,比如Theano和TensorFlow這兩種引擎,Kears

的開發(fā)者需要的是專注于模型的建立。Kears支持現(xiàn)代人工智能領(lǐng)域的主流算法,

這其中就包括了饋結(jié)構(gòu)以及遞歸結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)。Kears所提供的AIP一致的簡(jiǎn)

介,能大大減少應(yīng)用下用戶的工作量,與此同Kears時(shí)還提供具有實(shí)踐意義的

bug反饋功能。

1.2.3PyCharm簡(jiǎn)介

PyCharm是一款PythonIDE,其帶有一整套可以幫助用戶在使用Python語(yǔ)

言開發(fā)時(shí)提高其效率的工具,比如,調(diào)試、語(yǔ)法高亮、Project管理、代碼跳

轉(zhuǎn)、智能提示、自動(dòng)完成、單元測(cè)試、版本控制等等。此外,該IDE提供了一

些高級(jí)功能,以用于支持Django框架下的專業(yè)Web開發(fā)。

1.2.4VGG網(wǎng)絡(luò)結(jié)構(gòu)

“VGG”代表了牛津大學(xué)的OxfordVisualGeometryGroup,是由DeepMind

公司共同研發(fā)的一種深度卷積神經(jīng)網(wǎng)絡(luò)。

VGG模型在2014年ILSVRC競(jìng)賽獲得第二名,雖然輸給了GoogLeNet,但是

VGG模型在多個(gè)遷移學(xué)習(xí)任務(wù)中的表現(xiàn)中要優(yōu)于GoogLeNet。在從圖像中提取

CNN特征,VGG模型是首選的算法。它的缺點(diǎn)則是參數(shù)過(guò)多,需要大量的存儲(chǔ)空

間。

2

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

VGG流傳最為廣泛的兩種結(jié)構(gòu)是VGG16和VGG19,兩者并沒(méi)有本質(zhì)上的區(qū)別,

只是網(wǎng)絡(luò)深度不同,分別是16層和19層。

圖1-1VGG的概述圖

如圖1-1所示,VGG包含了5組卷積操作。每組卷積后進(jìn)行一個(gè)2*2的最大

池化操作,最后是三個(gè)全連接層。

多種VGG網(wǎng)絡(luò)設(shè)計(jì)都很統(tǒng)一,都有相同的224*224*3的input+5個(gè)maxpool

層+3層fc全連接層。

輸入層:輸入為224*224*3三通道的圖像。

第一組卷積層:輸入為224*224*3,經(jīng)過(guò)64個(gè)kernelsize為3*3*3的卷

積后得到了shape為224*224*64的卷積層

第二層池化層:輸入為224*224*64,經(jīng)過(guò)的減半池化后得到尺寸為

112*112*64的池化層

第三層卷積層:輸入為112*112*64,經(jīng)過(guò)128個(gè)3*3*64的卷積后得到

112*112*128的卷積層。

3

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

第四層池化層:輸入為112*112*128,經(jīng)過(guò)減半池化后得到尺寸為

56*56*128的池化層。

第五層卷積層:輸入為56*56*128,經(jīng)256個(gè)3*3*128的卷積后得到56×

56*256的卷積層。

第六層池化層:輸入為56*56*256,經(jīng)過(guò)池化后得到28*28*256的池化層。

第七層卷積層:輸入為28*28*256,經(jīng)過(guò)512個(gè)3*3*256的卷積后得到

28*28*512的卷積層。

第八層池化層:輸入為28*28*512,經(jīng)過(guò)池化后得到14*14*512的池化層。

第九層卷積層:輸入尺寸為14*14*512,經(jīng)過(guò)512個(gè)3*3*512的卷積,得到

14*14*512的卷積層

第十層池化層:輸入為14*14*512,經(jīng)過(guò)池化后得到7*7*512的池化層。

全連接:最后三個(gè)連接層的神經(jīng)元分別為4096,4096,1000,最后全連接

層啟用的softmax輸出1000個(gè)分類

VGG網(wǎng)絡(luò)結(jié)構(gòu)如圖1-2。

圖1-2VGG網(wǎng)絡(luò)結(jié)構(gòu)圖

1.2.5Python第三方庫(kù)簡(jiǎn)介

Requests:requests是基于python開發(fā)的用于處理HTTP請(qǐng)求的第三方,

它最大的有點(diǎn)在于程序編寫過(guò)程更加接近正常URL訪問(wèn)過(guò)程。Requests與

urllib標(biāo)準(zhǔn)庫(kù)相比,它不僅使用方便,而且節(jié)約大量的工作。

BeautifulSoup:BeautifulSoup主要功能是從網(wǎng)頁(yè)爬取數(shù)據(jù),它提供一些

簡(jiǎn)單的python函數(shù)用于處理導(dǎo)航、搜索、修改分析樹等功能。XML和HTML的解

析庫(kù),可以對(duì)XML和HTML格式進(jìn)行解析,從中提取相關(guān)信息;還可以對(duì)所提供

的任何格式進(jìn)行相關(guān)的數(shù)據(jù)爬取,而且對(duì)它進(jìn)行樹形解析。

matplotlib:Matplotlib是一個(gè)Python的2D繪圖庫(kù),其中包括折線圖、

條形圖、扇形圖、散點(diǎn)圖、直方圖等。

statsmodels:統(tǒng)計(jì)建模。

4

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

wordcloud、scipy、jieba:生成中文詞云的。

pylab:設(shè)置畫圖能顯示中文。

pyecharts:繪圖。

2需求分析

2.1可行性需求分析

1.技術(shù)可行性

Python編程語(yǔ)言通俗易懂、是一種動(dòng)態(tài)的面對(duì)對(duì)象的腳本語(yǔ)言。這讓它對(duì)

于爬蟲領(lǐng)域有著巨大的優(yōu)勢(shì),是當(dāng)前爬蟲的首選語(yǔ)言。本項(xiàng)目便是利用python

采集數(shù)據(jù),通過(guò)python第三方庫(kù)進(jìn)行數(shù)據(jù)分析、與數(shù)據(jù)可視化的展示。Tableau

是一款對(duì)人操作十分友好的軟件,利用它對(duì)數(shù)據(jù)可視化進(jìn)行展示和分析也十分

便捷。

2.項(xiàng)目可行性

手勢(shì)識(shí)別技術(shù)的發(fā)展有著優(yōu)秀的前景,通過(guò)手勢(shì)識(shí)別可以與各種智能設(shè)備

交互效率提升巨大。甚至可以說(shuō)手勢(shì)識(shí)別會(huì)成為VR,AR頭顯示的主流交互方

式。

2.2數(shù)據(jù)可視化技術(shù)

數(shù)據(jù)可視化技術(shù)采用的是python第三方庫(kù)matplotlib,matplotlib是Python

科學(xué)計(jì)算中使用最多的一個(gè)可視化庫(kù),功能豐富,提供了非常多的可視化方案,

基本能夠滿足各種場(chǎng)景下的數(shù)據(jù)可視化需求。但功能豐富從另一方面來(lái)說(shuō)也意

味著概念、方法、參數(shù)繁多,讓許多新手望而卻步。

matplotlib設(shè)計(jì)原則就是追求對(duì)每一個(gè)圖表細(xì)節(jié)的完全控制,所以matplotlib

源碼中各種對(duì)象很多,甚至各對(duì)象間相互應(yīng)用,錯(cuò)綜復(fù)雜,對(duì)同一個(gè)對(duì)象的設(shè)

置經(jīng)??梢哉{(diào)用不同的方法來(lái)實(shí)現(xiàn),這是matplotlib入門難的原因之一。

matplotlib其實(shí)提供了兩類接口實(shí)現(xiàn)作圖。第一類基于狀態(tài)的接口,就是上

文中提到的pyplot進(jìn)行作圖,這類接口對(duì)matplotlib中更加底層的對(duì)象進(jìn)行封裝,

以仿MATLAB作圖風(fēng)格的方式讓作圖更加簡(jiǎn)單方便。至于為什么叫基于狀態(tài),

pyplot所有作圖動(dòng)作都是默認(rèn)在當(dāng)前出于激活的元素上進(jìn)行,要切換到其他元素

作圖,就要使另一元素激活。第二類接口是基于對(duì)象的接口,這種方法是使用

你想對(duì)象的方法來(lái)作圖,認(rèn)為圖形中每一個(gè)元素都是一種對(duì)象,通過(guò)調(diào)用更加

5

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

底層對(duì)象來(lái)實(shí)現(xiàn)作圖。這種方法代碼量更多,但是讓用戶對(duì)matplotlib圖形的構(gòu)

成有了更深的認(rèn)識(shí),也讓用戶對(duì)圖形的每一個(gè)元素有更強(qiáng)的掌控力。項(xiàng)目的可

視化代碼如圖2-1所示。

圖2-1數(shù)據(jù)可視化技術(shù)代碼

3數(shù)據(jù)采集

3.1數(shù)據(jù)集采集功能分析

此次項(xiàng)目的數(shù)據(jù)集部分來(lái)源于攝像頭拍攝獲得,另外通過(guò)爬蟲在網(wǎng)站上獲

取。本次爬取百度網(wǎng),主要獲得了各種簡(jiǎn)單手勢(shì)圖片,在爬取的各種手勢(shì)圖片

中,選取較為簡(jiǎn)單的幾種作為本次項(xiàng)目的數(shù)據(jù)集。

3.2數(shù)據(jù)集需求分析

打開谷歌瀏覽器,在搜索欄中輸入關(guān)鍵字:手勢(shì)圖片,觀察圖3-1,其中URL

為:/sucai/***************/.html。翻頁(yè)觀察網(wǎng)址變

化,發(fā)現(xiàn)URL最末端的數(shù)字變化。

6

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

圖3-1圖片網(wǎng)絡(luò)頁(yè)面

3.3數(shù)據(jù)集獲取分析

選擇開發(fā)者工具,打開開發(fā)者工具,按快捷鍵ctrl+shitf+c,呼出定位鼠標(biāo),

選擇一張圖片,在右側(cè)的開發(fā)者工具欄中觀察所選圖片所在網(wǎng)頁(yè)結(jié)構(gòu),找到<img

src=*****>的位置,方便后續(xù)對(duì)爬取的網(wǎng)頁(yè)數(shù)據(jù)進(jìn)行解析獲取到該圖片的地,

從而實(shí)現(xiàn)圖片爬取操作。

圖3-2圖片網(wǎng)絡(luò)頁(yè)面

3.4編程實(shí)現(xiàn)

導(dǎo)入所需要用到的庫(kù)如圖3-3

圖3-3導(dǎo)入所需要庫(kù)頁(yè)面

由于對(duì)于網(wǎng)頁(yè)的維護(hù),各大網(wǎng)站都有對(duì)爬蟲的攔截,所需我們需要設(shè)置請(qǐng)

求頭偽裝成瀏覽器訪問(wèn)服務(wù)器,定義img_data存放所有通過(guò)爬蟲獲取到的圖片。

4數(shù)據(jù)集處理

4.1數(shù)據(jù)預(yù)處理

爬蟲獲取的數(shù)據(jù),并非一定是完整而正確的,一般來(lái)說(shuō)通過(guò)網(wǎng)絡(luò)爬蟲在網(wǎng)

絡(luò)上獲取的文字信息大多數(shù)會(huì)出現(xiàn)數(shù)據(jù)缺失的情況,或者出現(xiàn)數(shù)據(jù)中產(chǎn)生無(wú)效

值的情況,相對(duì)于文字信息來(lái)說(shuō),圖片信息則不會(huì)有以上的情況,但也并非能

直接進(jìn)行使用,這就需要按情況而論。

7

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

在網(wǎng)絡(luò)上獲取的圖片大小不一,而且許多獲取到的手勢(shì)圖片并不是我們所

需要的,而本次項(xiàng)目訓(xùn)練模型需要用到的圖片尺寸大小都要一致,所以需要對(duì)

圖片進(jìn)行歸一化處理,使得所有圖片滿足本次項(xiàng)目用到模型的需求。

如圖4-1所示完成了對(duì)圖片的操作后,分出各種手勢(shì)圖片存放于對(duì)應(yīng)的文

件夾:

圖4-1導(dǎo)入所需庫(kù)頁(yè)面

4.2切分訓(xùn)練集和測(cè)試集

本次項(xiàng)目采用的數(shù)據(jù)主要是手勢(shì)圖片,通過(guò)之前的操作已經(jīng)完成了圖片的

爬取和分類操作。通過(guò)代碼對(duì)所需圖片類的圖片隨機(jī)進(jìn)行選擇,將其劃分為test

(測(cè)試集)train(訓(xùn)練集)如圖4-2所示

訓(xùn)練集:用于模型訓(xùn)練,在訓(xùn)練過(guò)程中更新模型參數(shù)。

測(cè)試集:對(duì)最終篩選出來(lái)模型的泛化能力進(jìn)行評(píng)價(jià)。

圖4-2測(cè)試集訓(xùn)練集頁(yè)面

8

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

5模型構(gòu)建及保存

5.1模型構(gòu)建

5.1.1構(gòu)建數(shù)據(jù)生成器

數(shù)據(jù)生成器(generator):數(shù)據(jù)生成器是一個(gè)隨機(jī)讀取文件的過(guò)程,隨著

數(shù)據(jù)的增多,特別是圖片,數(shù)據(jù)生成器的作用是輸入的數(shù)據(jù)太大,無(wú)法一次放

入內(nèi)存中的時(shí)候,就需要一個(gè)batch的讀取。

代碼實(shí)現(xiàn),首先導(dǎo)入Keras包如圖5-1所示。

圖5-1導(dǎo)入Keras包

編寫數(shù)據(jù)生成器如5-2所示。

圖5-2構(gòu)建數(shù)據(jù)生成器

過(guò)程描述:每次從設(shè)置文件夾中取出batch_size張圖片進(jìn)行處理。對(duì)其中

的每張圖片按照data_gen中的定義都除以255并實(shí)現(xiàn)全部五種增強(qiáng)操作,然后

大小變?yōu)椋↖MSIZE,IMSIZE)。

5.1.2數(shù)據(jù)可視化

通過(guò)構(gòu)建數(shù)據(jù)生成器的操作后最好進(jìn)行一個(gè)數(shù)據(jù)可視化,將圖片屬于顯示

出來(lái)一部分。數(shù)據(jù)可視化需要用到最關(guān)鍵的包是matplotlib包,上文有過(guò)相關(guān)

介紹,這里不在贅述。代碼實(shí)現(xiàn)后的效果圖如圖5-3所示:

9

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

圖5-3數(shù)據(jù)可視化頁(yè)面

5.2模型編譯

本次采用的模型是深度學(xué)習(xí)這門課程中所學(xué)過(guò)的VGG16,在模型構(gòu)建完成后

可以通過(guò)model.summary()獲取VGG16的模型概要表,如圖5-4所示。

10

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

圖5-4VGG16的模型概要表

5.2.1優(yōu)化器設(shè)置

如圖5-5所示優(yōu)化器采用的是Adam。

11

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

圖5-5優(yōu)化器設(shè)置

5.2.2損失函數(shù)設(shè)置

損失函數(shù)設(shè)置為categorical_crossentropy。

圖5-6損失函數(shù)器設(shè)置

5.3VGG16模型擬合

5.3.1模型擬合

本次模型編譯主要采用的是model_pile方法,由于對(duì)于手勢(shì)識(shí)

別,實(shí)際上是對(duì)多種相同類型不同圖片的手勢(shì)進(jìn)行分類訓(xùn)練,所以這是屬于一

個(gè)分類問(wèn)題,所以我們需要采用的損失函數(shù)為categorical_crossentropy,采

用Adam優(yōu)化算法,需要監(jiān)控預(yù)測(cè)精度,所以定義metrics為accuracy。

本次模型擬合主要采用的是model_vgg16.fit方法,在此過(guò)程中出現(xiàn)過(guò)一

些誤差,經(jīng)過(guò)查錯(cuò)發(fā)現(xiàn)是epochs和batch_size設(shè)置的問(wèn)題,根據(jù)自身電腦內(nèi)

存情況設(shè)置,設(shè)置太小會(huì)導(dǎo)致結(jié)果不夠精確,設(shè)置太大則直接內(nèi)存報(bào)錯(cuò)導(dǎo)致運(yùn)

行失敗。代碼實(shí)現(xiàn)如圖5-7所示。

圖5-7模型編譯和模型擬合

5.3.2Batch_size設(shè)置

如圖5-8所示,Batch_size設(shè)置如下。

12

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

圖5-8batch_seize設(shè)置

5.3.3模型保存

在保存模型之前需要進(jìn)行模型測(cè)試,選擇幾張符合要求的手勢(shì)圖片進(jìn)行測(cè)

試,最后再將模型保存完成最后的操作。代碼實(shí)現(xiàn)如圖5-9所示。

圖5-9模型保存

5.4模型部署

5.4.1系統(tǒng)前端設(shè)計(jì)

使用python編寫的手勢(shì)識(shí)別系統(tǒng)前端,可通過(guò)加載圖片或者打開攝像頭實(shí)

現(xiàn)手勢(shì)獲取操作。

13

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

圖5-10前端界面

6小結(jié)

時(shí)代發(fā)展迅速,隨著計(jì)算機(jī)科技的提高,人工智能與大數(shù)據(jù)時(shí)代到來(lái)了。

運(yùn)用海量數(shù)據(jù)通過(guò)深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)不斷優(yōu)化的算法大數(shù)據(jù)技術(shù)將與人工智

能技術(shù)更緊密地結(jié)合,手勢(shì)識(shí)別是人工智能范疇中

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論