




已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
基于人工智能算法的圖像識別與生成 摘要 本次報告的工作是利用 PCA SVM 以及人工 神經網絡 ANN 實現(xiàn)對人臉的特征提取 分類和預測 然后利用 GAN 生成對抗網絡 實現(xiàn)對手寫數字的生成 并用 SVM 做預測 驗證生成效果 本次報告采用的數據源自劍橋大學的 ORL 人臉數據庫 其中包含 40 個人共 400 張人臉圖像 關鍵詞 人工智能 圖像識別 數據 中圖分類號 TP18 文獻標識碼 A 文章編號 1009 3044 2018 13 0173 02 1 PCA 降維 PCA principal components analysis 即主成分分析 又稱主分量分析 旨在利用降維的思想 把多指標轉化為 少數幾個綜合指標 首先我們給出了數據庫的平均臉的圖像 并利用 PCA 對人臉降維 通過改變降低到的維度研究了保留維度的多 少帶來的影響 最后給出了每一個維度的特征臉圖像 討 論了每一個維度所能夠代表的人臉信息 1 1 平均臉 首先 我們將數據庫中 400 張人臉按行存儲到一個矩 陣中 即每一行為一張人臉 10304 像素 每張人臉共 10304 維特征 我們對每一個維度去平均 構成一個新的行 向量 這就是平均臉 平均臉反映了數據庫中 400 張人臉的平均特征 可以 看清人臉的輪廓 但無法識別人臉的局部細節(jié) 1 2 降低至不同維度時還原臉的情況 從左到右從上到下依次是同一張臉降低至 10 30 50 100 200 250 300 350 400 的圖像 可 以看到 隨著保留維數的增多 圖像越清晰 與原圖的差 異越小 1 3 提取單一維度的特征做還原 為了研究不同維度所代表的人臉的信息 我們把 PCA 之后的每一個特征向量單獨提取出來對人臉做還原 還原 的時候不加入平均臉并且做直方圖均衡化 結果如下 每一張圖像下方的數字代表了 PCA 之后按特征值從大 到小排序的順序 比如第一張圖代表 PCA 之后最大特征值 所對應的特征向量還原出的人臉 特征累積圖的縱坐標代表了所保留的特征占總特征的 比例 它是這樣計算出來的 假設保留 k 維信息 則縱坐 標值為這 k 個特征值的和除以總的 400 400 10304 的矩陣 最多有 400 個非零特征值 個特征值的和 從圖 4 可以看出 當保留維數為 100 維時 即能保留 人臉 90 的信息 而之后隨著保留維數的增多 保留信息 的增多變緩 同樣的結論也可由提取每個維度所代表的特征獲得 從前到后觀察實驗所得的圖像 我們可以發(fā)現(xiàn) 人臉變得 越來越模糊 到 100 維以后已經分辨不清人臉了 這就說 明前面的維度反映了大眾臉的特征 而越往后面的維度則 反映不同人臉的細節(jié) 比如頭發(fā)長短等等 以及圖片噪聲 2 SVM 對人臉分類 SVM 支持向量機 是 Corinna Cortes 和 Vapnik 等于 1995 年首先提出的 在機器學習中 支持向量機是與相關 的學習算法有關的監(jiān)督學習模型 可以分析數據 識別模 式 用于分類和回歸分析 2 1 制作多分類器 用 PCA 對人臉降維以后 我們用 SVM 將 400 張人臉 進行分類 我們取每個人的前五張照片合并起來共 200 張 作為訓練集 每個人后五張照片合并起來共 200 張作為測 試集 40 個人即有 40 個標簽 也就是有 40 類 但 SVM 只 能作二分類器 因此我們利用二分類器生成多分類器 基 本思想是制作 C 40 2 個一對一分類器 也就是每兩個 類別一個 每一張照片都分別用所有一對一分類器分類 分類結果存儲到投票矩陣中 分類結果就是投票矩陣中數 字最大的那個 分類前 我們還需對 PCA 后的數據進行歸一化處理 將圖像矩陣的每一個元素映射到 1 1 之間 2 2 參數選擇及程序結果 1 分類數據 每人取前五張做訓練 后五張做測試 不加入自己的人臉 SVM 參數設定 k 75 PCA 降至 75 維 Sigma 30 c 15 預測準確率 accuracy 0 8950 2 每人取前五張做訓練 后五張做測試 加入自己的 人臉 SVM 參數同上 預測準確率 accuracy 0 8585 我們發(fā)現(xiàn) 當加入自己拍攝的人臉圖像后 預測準確 率有一定的下降 這可能是由于拍照時的光線 角度等造 成的 3 ANN 對人臉分類 人工神經網絡 Artificial Neural Networks 簡寫為 ANNs 也簡稱為神經網絡 NNs 或稱作連接模型 Connection Model 它是一種模仿動物神經網絡行為特 征 進行分布式并行信息處理的算法數學模型 這種網絡 依靠系統(tǒng)的復雜程度 通過調整內部大量節(jié)點之間相互連 接的關系 從而達到處理信息的目的 為了方便與 SVM 的結果作比對 ANN 的訓練集和測 試集與 SVM 相同 并且不加入自己人臉 3 1 ANN 結果及與 SVM 分類比較 ANN 分類結果 ANN 參數設定為 1 個隱層 含 200 個神經元 學習率 1 dropout fraction 0 5 激活函數 sigmoid L2 正則 0 0001 epoch 200 batchsize 50 分類錯誤率 即分類準確率 accuracy 為 93 5 驗過程中可以發(fā)現(xiàn) 通過對神經網絡多個參數的調節(jié) 準確率的變化是很復雜的 最終的 93 5 的準確率應該還有 上升的空間 參數還待進一步調整 與 SVM 比較 起來 ANN 準確率更高 但分析表明 對于本次報告所采 用的數據庫 ANN 和 SVM 的準確度不會有太大差異 因 此 SVM 的參數或許還可以進一步優(yōu)化 4 GAN 生成手寫數字 生成對抗網絡 GAN 是一種深度學習模型 是近年 來復雜分布上無監(jiān)督學習最具前景的方法之一 模型通過 框架中 至少 兩個模塊 生成模型 Generative Model 和判別模型 Discriminative Model 的互相博弈學習產生相 當好的輸出 原始 GAN 理論中 并不要求 G 和 D 都是 神經網絡 只需要是能擬合相應生成和判別的函數即可 但實用中一般均使用深度神經網絡作為 G 和 D 在下面的工作中 我們利用已有的手寫數字 0 9 圖 片 60000 張用于訓練 10000 張用于測試 對生成對抗 網絡 GAN 進行訓練并生成手寫數字 每個數字提取 5000 個樣本作為訓練集 最后用 SVM 對電腦生成的手寫數 字分類 看是否能 騙過 分類器 4 1 參數設定及程序結果 首先 我們選取一個想要生成的手寫字體 將已有數 據中所有該字體挑出并取前 5000 個作為訓練集 參數設定 生成器 generator 輸入層 隱層和輸出 層分別有 100 512 784 個神經元 識別器 discriminator 輸入層 隱層和輸出層分別 有 784 200 1 個神經元 學習率 0 01 Batchsize 50 更新判別器時的迭代次數設為 1 生成訓練集 load mnist uint8 classify num 9 classify matrix zeros 1 10 classify matrix classify num 1 1 choose zeros size train x 1 1 for i 1 size train x 1 if train y i classify matrix choose i choose i 1 end end choose logical choose train x train x choose train x train x 1 5000 train x double reshape train x 5000 28 28 255 train x permute train x 1 3 2 train x reshape train x 5000 784 生成器損失雖然不是很低 但是最終基本穩(wěn)定 4 2 SVM 對生成手寫數字做分類 我們用 GAN 分別生成 0 到 9 的手寫數字 將生成的圖 片作為測試集用 SVM 做分類 看是否能分到正確的類別 Result 是 SVM 中的投票矩陣 投票數最多的一個的序 號減一即為所分到的類別 數字 0 9 這里的 SVM 別于 前面所討論的人臉識別的 SVM 它是由 45 個 C 10 2 一對一分類器生成的多分類器 可以看到 每一個由 GAN 生成的手寫數字均被 SVM 分到了正確的類別 如此可見 GAN 實在強大 5 總結 運用 PCA 對原始數據進行降維 不僅能夠保留原始的 主要信息 而且可以
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025餐飲服務承包經營合同樣本
- 導尿病人護理要點與流程
- 苗族女孩創(chuàng)意美術課件
- 2025年壓力容器管理人員試題
- 學生會權益部工作總結模版
- 2025年2月高一下學期入學考試生物試題總結模版
- 小學書法進校園活動總結模版
- 合同管理工作總結模版
- 新質生產力策略
- 浙江省衢州市五校聯(lián)盟2024-2025學年高二下學期期中聯(lián)考試題 地理 PDF版含答案
- 建設工程質量管理手冊范本
- 中國文化遺產資料長城100字
- 高中生物選擇性必修1基礎背誦 課件
- 中醫(yī)適宜技術操作規(guī)程及評分標準
- 2023-2024學年貴州省六盤水市小學語文六年級期末提升測試題詳細參考答案解析
- 江蘇南通軌道交通集團有限公司運營分公司社會招聘工作人員考試真題及答案2022
- 頸椎JOA腰椎JOA 評分-表格-日本骨科協(xié)會評估治療
- 人工智能時代小學勞動教育的現(xiàn)實困境與突破路徑 論文
- 野生動物管理學智慧樹知到答案章節(jié)測試2023年東北林業(yè)大學
- 國際友人在中國智慧樹知到答案章節(jié)測試2023年西北大學
- 函數的零點與方程的解(說課稿)
評論
0/150
提交評論