信息技術 第二冊(五年制高職)教案 9.2.4 計算機視覺關鍵技術_第1頁
信息技術 第二冊(五年制高職)教案 9.2.4 計算機視覺關鍵技術_第2頁
信息技術 第二冊(五年制高職)教案 9.2.4 計算機視覺關鍵技術_第3頁
信息技術 第二冊(五年制高職)教案 9.2.4 計算機視覺關鍵技術_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

.2.4計算機視覺關鍵技術計算機視覺關鍵技術主要包括以下幾個方面:圖像處理技術包括圖像增強、圖像濾波、邊緣檢測、特征提取等技術,用于對圖像進行預處理和增強,如圖1、圖2所示。圖1圖像增強前后對比效果圖2圖像邊緣檢測圖像分類圖像分類是指對圖像中所包含的物體進行分類,一般分類物體為圖像的主體,解決圖片是什么的問題。圖像分類可以分為兩個步驟:訓練和測試。在訓練階段,計算機會從已知類別的圖像中學習并構建一個分類模型,該模型可以將不同的圖像分為不同的類別。在測試階段,計算機會使用該模型對未知圖像類別進行預測,并提供預測的置信度,如圖3所示。圖3百度AI平臺蔬菜的圖像分類識別目標檢測目標檢測任務是找出圖像或視頻中人們感興趣的物體,并同時檢測出它們的位置和大小。不同于圖像分類任務,目標檢測不僅要解決分類問題,還要解決定位問題。如圖4所示,即要定位出人、馬、狗的位置,還需要依據圖像內容進行分類識別。圖4目標檢測圖像分割也稱語義分割,是指將一幅圖像分成多個區(qū)域,使每個區(qū)域內具有相似的特征。通常情況下,圖像分割可以分為兩類:基于區(qū)域的分割和基于邊緣的分割?;趨^(qū)域的分割是將圖像分成不同的區(qū)域,每個區(qū)域具有相似的顏色、紋理、亮度等特征?;谶吘壍姆指钍菍D像分成不同的區(qū)域,每個區(qū)域由圖像中的邊緣構成。如一張“人駕駛摩托車行駛在林間小道上”的圖片,除了識別人、道路、汽車、樹木等之外,我們還必須確定每個物體的邊界。因此,與分類不同,我們需要用模型對圖像密集的像素進行預測。實例分割在語義分割的基礎上,將多個重疊物體和不同背景的復雜景象進行分類,比如語義分割中,識別出圖像中這一片區(qū)域是人,這一片區(qū)域是車,但在實例分割中,會在人的區(qū)域中識別出有5個人,分別用不同顏色來標記,車的區(qū)域有3輛車,分別用不同顏色來標記。在實例分割中,我們不僅需要將這些不同的對象進行分類,而且還要確定對象的邊界、差異和彼此之間的關系,如圖5所示。(a)原圖(b)語義分割(c)實例分割圖5語義分割和實例分割視頻分類與圖像分類不同的是,視頻分類的對象不再是靜止的圖像,而是一個由多幀圖像構成的、包含語音數(shù)據、包含運動信息等的視頻對象,因此理解視頻需要獲得更多的上下文信息,不僅要理解每幀圖像是什么、包含什么,還需要結合不同幀,知道上下文的關聯(lián)信息。人體關鍵點檢測通過人體關鍵節(jié)點的組合和追蹤來識別人的運動和行為,對于描述人體姿態(tài),預測人體行為至關重要,如圖6所示。圖6人體關鍵點檢測目標跟蹤是指在特定場景跟蹤某一個或多個特定感興趣對象的過程。目標跟蹤與目標檢測類似,都是在圖像中檢測感興趣物體。二者的區(qū)別在于,目標檢測只對單幀圖像進行目標定位,而目標跟蹤是處理連續(xù)多幀圖像。以上關鍵技術是計算機視覺領域的核心

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論