淺談機(jī)器學(xué)習(xí)在視頻智能識(shí)別中的實(shí)踐_第1頁
淺談機(jī)器學(xué)習(xí)在視頻智能識(shí)別中的實(shí)踐_第2頁
淺談機(jī)器學(xué)習(xí)在視頻智能識(shí)別中的實(shí)踐_第3頁
淺談機(jī)器學(xué)習(xí)在視頻智能識(shí)別中的實(shí)踐_第4頁
免費(fèi)預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、    淺談機(jī)器學(xué)習(xí)在視頻智能識(shí)別中的實(shí)踐    張本茂 李森森摘 要 近年來,先進(jìn)科學(xué)技術(shù)的發(fā)展推動(dòng)了社會(huì)和行業(yè)發(fā)展,越來越多的科學(xué)技術(shù)逐漸得到了開發(fā)和使用,而機(jī)器學(xué)習(xí)作為一種智能化科技手段,成為人們關(guān)注的熱點(diǎn)和焦點(diǎn)內(nèi)容。目前,在很多領(lǐng)域內(nèi)都對(duì)機(jī)器學(xué)習(xí)實(shí)現(xiàn)了運(yùn)用,盡管視頻識(shí)別比圖像識(shí)別難度更大,機(jī)器學(xué)習(xí)依然實(shí)現(xiàn)了對(duì)視頻的智能識(shí)別效果。下面,本文就針對(duì)機(jī)器學(xué)習(xí)在視頻智能識(shí)別中的實(shí)踐進(jìn)行分析,希望對(duì)相關(guān)工作研究提供參考。關(guān)鍵詞 機(jī)器學(xué)習(xí);視頻識(shí)別;智能識(shí)別;實(shí)踐應(yīng)用前言視頻是一種連續(xù)性動(dòng)態(tài)化圖片集合狀態(tài),而想要實(shí)現(xiàn)對(duì)視頻圖像有效識(shí)別,對(duì)識(shí)別系統(tǒng)的性能要求是

2、很高的,而在很多領(lǐng)域內(nèi)都需要使用到視頻圖像的識(shí)別技術(shù),且他們一般都是通過人工方式完成,距離智能識(shí)別的目標(biāo)還比較遠(yuǎn)。而基于機(jī)器學(xué)習(xí),就借助智能化的手段能夠?qū)崿F(xiàn)對(duì)視頻智能化的識(shí)別效果,但在實(shí)際的運(yùn)用中還處在探索和改進(jìn)階段,而機(jī)器學(xué)習(xí)如何在視頻智能識(shí)別中進(jìn)行實(shí)踐應(yīng)用,就是本文主要研究的內(nèi)容。1視頻智能識(shí)別中機(jī)器學(xué)習(xí)研究背景新時(shí)期環(huán)境下,人們對(duì)人工智能技術(shù)的研究十分關(guān)注,而機(jī)器學(xué)習(xí)就是一種人工智能技術(shù)的手段,通過機(jī)器學(xué)習(xí)能夠?qū)崿F(xiàn)對(duì)諸多領(lǐng)域工作的完成,其中借助機(jī)器學(xué)習(xí)進(jìn)行圖像識(shí)別已經(jīng)在生活中得到了普遍的應(yīng)用。如借助遙感影像對(duì)房屋和道路等識(shí)別、按照快遞單號(hào)對(duì)快遞實(shí)現(xiàn)分揀和遞送、借助違章拍攝的視頻對(duì)違章車輛

3、的車牌號(hào)碼實(shí)現(xiàn)識(shí)別等1。目前,物聯(lián)網(wǎng)的技術(shù)得到逐漸發(fā)展和應(yīng)用普及,在城市內(nèi)所設(shè)置監(jiān)察點(diǎn)都進(jìn)行各類的攝像頭布設(shè),來供不同的單位以及部門進(jìn)行數(shù)據(jù)的調(diào)用和分析,來推動(dòng)智慧城市建設(shè)和發(fā)展;同時(shí)互聯(lián)網(wǎng)環(huán)境內(nèi)存在大量的視頻資源,這類視頻資源各種各樣,對(duì)網(wǎng)站視頻審核存在很大的難度。而借助機(jī)器學(xué)習(xí)就能夠有效實(shí)現(xiàn)目標(biāo)的識(shí)別,現(xiàn)階段識(shí)別對(duì)象已經(jīng)從像素向圖像延伸,視頻作為大量圖像連續(xù)性時(shí)間狀態(tài)下所產(chǎn)生的動(dòng)態(tài)化信息,被當(dāng)作計(jì)算機(jī)的視覺里暗物質(zhì)類型,其不能和圖片一樣達(dá)到便捷搜索的目的,也不能像圖片將像素單做基本單元實(shí)施像素灰度的差異性分析和識(shí)別,所以視頻的智能識(shí)別具有很大的挑戰(zhàn),需要繼續(xù)進(jìn)行研究和實(shí)踐探索2。2機(jī)器學(xué)習(xí)

4、在視頻智能識(shí)別中的實(shí)踐在人工智能研究中,機(jī)器學(xué)習(xí)占據(jù)著核心位置,它主要是對(duì)計(jì)算機(jī)如何對(duì)人類學(xué)習(xí)的行為實(shí)施模擬和實(shí)現(xiàn),獲取新知識(shí)和技能,并對(duì)已有知識(shí)的結(jié)構(gòu)重新進(jìn)行組織,實(shí)現(xiàn)對(duì)自身性能的不斷改善。它不再嚴(yán)格按照人員操作的步驟死板地進(jìn)行工作的完成,用戶僅僅輸入相應(yīng)數(shù)據(jù)和參數(shù),則機(jī)器學(xué)習(xí)就能夠按照內(nèi)在的機(jī)制實(shí)現(xiàn)智能化地運(yùn)行和計(jì)算,且給出相應(yīng)的分析結(jié)果,因此機(jī)器學(xué)習(xí)其實(shí)已經(jīng)具備人類一定程度對(duì)事情處理的能力3。由于視頻數(shù)據(jù)和圖片數(shù)據(jù)對(duì)比,呈現(xiàn)出動(dòng)態(tài)化、海量化和實(shí)時(shí)化特點(diǎn),它是大數(shù)據(jù)重要的對(duì)象,借助機(jī)器學(xué)習(xí)能夠?qū)A恳曨l數(shù)據(jù)資源實(shí)現(xiàn)高效和高精度的識(shí)別,這也是大數(shù)據(jù)技術(shù)研究中的重點(diǎn)內(nèi)容。通過機(jī)器學(xué)習(xí)對(duì)視頻實(shí)現(xiàn)

5、智能識(shí)別,主要原理是使用機(jī)器學(xué)習(xí)的算法來對(duì)視頻資源內(nèi)的對(duì)象相應(yīng)訓(xùn)練樣本實(shí)施模擬性訓(xùn)練,建立出符合智能化識(shí)別精度標(biāo)準(zhǔn)的學(xué)習(xí)模型類型,將已經(jīng)訓(xùn)練完成的模型當(dāng)作核心,對(duì)需要識(shí)別的視頻數(shù)據(jù)實(shí)施模型的實(shí)踐以及推理,從而從視頻的數(shù)據(jù)內(nèi)實(shí)現(xiàn)對(duì)目標(biāo)對(duì)象的快速準(zhǔn)確檢測(cè)和識(shí)別4。在現(xiàn)階段國際it企業(yè)都在加大對(duì)視頻的智能識(shí)別相關(guān)工作的研究,而谷歌所公布的新型機(jī)器學(xué)習(xí)平臺(tái)api,它能夠?qū)σ曨l內(nèi)物體實(shí)現(xiàn)自動(dòng)識(shí)別效果,相關(guān)開發(fā)者在視頻的內(nèi)部開發(fā)出對(duì)目標(biāo)偵測(cè)的程序,將視頻轉(zhuǎn)變?yōu)槟軌蛩阉骱桶l(fā)現(xiàn)的動(dòng)態(tài)視頻。借助動(dòng)詞或者名詞對(duì)此類目標(biāo)對(duì)象代表,如“跑”和“狗”等,后實(shí)施搜索就能夠?qū)⒁曨l內(nèi)相應(yīng)信息實(shí)現(xiàn)有效提取5。在此api平臺(tái)中,

6、其工作的原理主要是在服務(wù)和應(yīng)用間設(shè)置相應(yīng)橋梁,把新的api和谷歌云的機(jī)器學(xué)習(xí)平臺(tái)實(shí)施連接,此平臺(tái)發(fā)揮計(jì)算功能;并且此api還能夠把完成注釋后的視頻在谷歌的云存儲(chǔ)內(nèi)存儲(chǔ)。通過谷歌的新型api所開發(fā)出應(yīng)用的程序,具備特殊性的功能,能夠讓終端的用戶對(duì)視頻內(nèi)目標(biāo)實(shí)現(xiàn)便捷的搜索;同時(shí)用戶能夠在視頻的文件內(nèi)對(duì)每個(gè)瞬間實(shí)現(xiàn)搜索,對(duì)事件查找和意義的探尋;此api平臺(tái)還能夠使用戶于視頻內(nèi)進(jìn)行名詞實(shí)體的確定,對(duì)視頻內(nèi)目標(biāo)對(duì)象出現(xiàn)時(shí)間和出現(xiàn)頻率實(shí)施確定,另外還能夠?qū)σ曨l和照片內(nèi)每一幀相關(guān)的信息檢索,實(shí)現(xiàn)了對(duì)信號(hào)以及噪音的有效分離效果。使用api平臺(tái)來對(duì)某動(dòng)物案例實(shí)施智能識(shí)別的演示,對(duì)案例的演示中,于mp4的視頻文件

7、內(nèi)進(jìn)行動(dòng)物的搜索,文件的時(shí)長約是1.5min。api平臺(tái)會(huì)生成相應(yīng)的標(biāo)簽,如動(dòng)物園、動(dòng)物、旅游、陸生的動(dòng)物和自然等。此api能夠?qū)σ曨l的場(chǎng)景進(jìn)行偵測(cè),如在相同演示的視頻內(nèi),借助此api平臺(tái)發(fā)現(xiàn)了場(chǎng)景出現(xiàn)48次變化,其能夠?qū)ψ兓瘜?shí)現(xiàn)實(shí)時(shí)性偵測(cè),在場(chǎng)景出現(xiàn)變化時(shí)對(duì)目標(biāo)物進(jìn)行標(biāo)簽的標(biāo)貼;其中有一幕顯示出老虎的場(chǎng)景,則api的平臺(tái)就產(chǎn)生7種類型標(biāo)簽的標(biāo)注;還有一幕是關(guān)于動(dòng)物園進(jìn)行標(biāo)志,此系統(tǒng)產(chǎn)生兩種類型的標(biāo)簽,此類標(biāo)簽實(shí)時(shí)產(chǎn)生,這也體現(xiàn)出視頻的智能識(shí)別具有的功能和特征。借助api平臺(tái),用戶能夠使用工具對(duì)視頻內(nèi)目標(biāo)實(shí)施搜索,和文檔搜索相似,且對(duì)視頻內(nèi)目標(biāo)實(shí)施搜索和識(shí)別的準(zhǔn)確定和效率性都十分高。3結(jié)束語綜上所述,機(jī)器學(xué)習(xí)是人工智能技術(shù)的重要體現(xiàn),它在視頻智能識(shí)別具有顯著的應(yīng)用價(jià)值,為了更好促進(jìn)其在視頻智能識(shí)別中的應(yīng)用且提高其應(yīng)用的效果,還需要對(duì)其技術(shù)進(jìn)行不斷地實(shí)踐探索,來更好推動(dòng)行業(yè)應(yīng)用和發(fā)展。參考文獻(xiàn)1 楊永吉,史麗娟,趙劍,等.基于機(jī)器學(xué)習(xí)的視頻表情識(shí)別研究j.無線互聯(lián)科技,2018,134(10):150-152.2 盧旻昊,邱文嘉,董小舒.基于特征點(diǎn)篩選的實(shí)時(shí)視頻拼接算法j.指揮信息系統(tǒng)與技術(shù),2018,9(2):85-88.3 屠要峰,吉鋒,文韜.機(jī)器學(xué)習(xí)在大視頻運(yùn)維中的應(yīng)用j.中興通訊技術(shù),2017,23(4):1-8.4

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論