版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
人工智能應用展學習目標—8.1—知識目標了解人工智能在圖像領(lǐng)域的應用了解人工智能在語言和語音方面的應用了解遷移學習的基本原理了解生成對抗網(wǎng)絡的基本原理理解推薦系統(tǒng)的基本原理展廳服務機器人—8.2—8.2.1人臉識別機器人怎么識別這個人是誰呢?使用了人臉識別和語音交互技術(shù)。8.2.1人臉識別人臉識別的過程中有4個關(guān)鍵的步驟:人臉檢測、人臉對齊、人臉編碼和人臉匹配。人臉檢測的目的是尋找圖片中人臉的位置。當發(fā)現(xiàn)有人臉出現(xiàn)在圖片中時,不管這個臉是誰,都會標記出人臉的坐標信息,或者將人臉切割出來。人臉檢測同一個人會有的姿態(tài)和表情,即使這個人大笑或者大哭我們也可以識別出來。機器要做到這一點,就需要將人臉圖像都變換到一個統(tǒng)一的角度和姿態(tài),這就是人臉對齊,如圖所示。它的原理是找到人臉的若干個關(guān)鍵點,將人臉盡可能變換到標準人臉。人臉對齊人臉編碼經(jīng)過前兩步之后,人臉圖像的像素值會被轉(zhuǎn)換成一串數(shù)字(向量)。理想情況下,一個人臉會對應類似的一串數(shù)字(向量),如圖所示。每個人臉都有了對應的一串數(shù)字,我們就可以根據(jù)這一串數(shù)字計算出最匹配的兩串數(shù)字,從而找出某張圖片對應的那個人是誰,如圖所示。人臉匹配8.2.2語音交互語音交互指的是人類與設(shè)備通過自然語音進行信息的交互。使用自動語音識別技術(shù)(ASR)將語音轉(zhuǎn)換為對應的指令文本通過自然語言處理(NLP)將此文本轉(zhuǎn)換為對應的機器可以理解的語言。使用內(nèi)置的各項功能,處理用戶的指令,最后通過使用語音合成技術(shù),回復用戶。人物動漫化—8.3—計算機將人物照片轉(zhuǎn)化成動漫卡通形象采用的是生成對抗網(wǎng)絡技術(shù)
8.3.1生成對抗網(wǎng)絡核心思想生成對抗網(wǎng)絡是由Goodfellow于2014年提出的一種生成模型,其核心思想是“零和博弈”。8.3.2生成模型和判別模型生成對抗網(wǎng)絡模型主要包括兩部分:生成模型和判別模型。生成模型是指我們可以根據(jù)任務、通過模型訓練輸入的數(shù)據(jù)生成文字、圖像、視頻等數(shù)據(jù),類似上述籃球運動員不斷訓練的過程。判別模型會對生成模型生成的圖像等數(shù)據(jù)進行判斷,判斷其是否是真實的訓練數(shù)據(jù),類似上述籃球教練不斷判斷運動員訓練效果的過程。智能音樂創(chuàng)作—8.4—人工智能創(chuàng)作音樂也是借助深度學習來實現(xiàn)的。
典型的人工智能創(chuàng)作音樂是借助深度學習來實現(xiàn)的,和AlphaGo有著很大的相似之處。借助大量的原始音樂素材,從熱門舞曲到經(jīng)典的輕音樂,深度學習的長短期記憶網(wǎng)絡算法(LSTM)通過分析,找到其中潛在的模式,進而學習到節(jié)奏、長度及音符之間的關(guān)系,然后就可以寫出自己的旋律8.4.1人工智能如何創(chuàng)作音樂事實上,任何音樂都是從隨機選擇聲音并將它們組合成一段旋律開始的。早在1787年,莫扎特就提出了一個骰子游戲目的就是隨機地進行聲音選擇。他手工創(chuàng)作了近272個音調(diào),然后,根據(jù)兩個骰子的總和來選擇一個音調(diào)。8.4.2什么是自動音樂生成
8.4.3怎樣利用深度學習實現(xiàn)自動音樂生成利用人工智能創(chuàng)作的音樂,可能是為我們每一個人量身創(chuàng)作的,比如可能參考你的音樂偏好、身體習慣甚至心跳數(shù)據(jù),等等。采用深度學習的方法創(chuàng)作音樂,也是通過大量的音樂數(shù)據(jù)進行模型訓練,之后采用訓練好的模型自動生成音樂。
8.4.3怎樣利用深度學習實現(xiàn)自動音樂生成利用人工智能創(chuàng)作的音樂,可能是為我們每一個人量身創(chuàng)作的,比如可能參考你的音樂偏好、身體習慣甚至心跳數(shù)據(jù),等等。采用深度學習的方法創(chuàng)作音樂,也是通過大量的音樂數(shù)據(jù)進行模型訓練,之后采用訓練好的模型自動生成音樂。遷移學習—8.5—遷移學習概述遷移學習就是把已經(jīng)訓練好的模型參數(shù)遷移到新的模型中來幫助新模型訓練??紤]到大部分數(shù)據(jù)或任務是存在相關(guān)性的,所以通過遷移學習,我們可以將已經(jīng)學到的模型參數(shù)通過某種方式來分享給新模型,從而加快并優(yōu)化模型的學習效率,不用像大多數(shù)網(wǎng)絡那樣從零學習了。8.5.2深度學習和遷移學習結(jié)合深度學習需要大量的高質(zhì)量標注數(shù)據(jù),預訓練然后微調(diào)模型是現(xiàn)在深度學習中一個非常流行的技巧,以圖像識別領(lǐng)域為例,很多時候會選擇預訓練的ImageNet對模型進行初始化。自動駕駛技術(shù)—8.6—8.6.1自動駕駛級別自動駕駛汽車的自動化程度分為6個等級8.6.2自動駕駛原理自動駕駛汽車的核心是感知能力,它有4種不同視野的眼睛,包括無線雷達、激光雷達、超聲波雷達和攝像頭,通過它們能得到不同的視野。在定位方面自動駕駛汽車使用GPS與慣性策略裝置,再加上高精電子地圖就能夠?qū)崿F(xiàn)非常精準的定位。探測器自動駕駛汽車需要安裝多種探測器,比如激光雷達,即激光探測及測距系統(tǒng),超聲波雷達、GPS、攝像頭等。自動駕駛汽車攝像頭捕獲的鏡頭通過深度學習能夠識別出圖像中包含的物體,比如行人、行車、交通路標等路徑規(guī)劃路徑規(guī)劃主要解決的問題是找到一條最快最安全的從起點到終點的路徑,路徑規(guī)劃中有很多成熟的算法,比如Dijkstra算法、RRT算法等。自動駕駛汽車的路徑規(guī)劃需要考慮多種因素的影響,比如車禍路道、交通擁堵等。推薦系統(tǒng)—8.7—8.7.1推薦系統(tǒng)概述推薦系統(tǒng)通常可以根據(jù)用戶偏好、商品特征、用戶—商品交易和其他環(huán)境因素(如時間、季節(jié)、位置等)生成推薦結(jié)果。所推薦的物品可以包括電影、書籍、餐廳、新聞條目,等等。8.7.2購物車推薦系統(tǒng)在人工智能應用展中積聚了大量的紀念品交易數(shù)據(jù),我們從各個顧客的購物車中,會發(fā)現(xiàn)買了啤酒的顧客,也很可能買尿不濕。商家可以使用這種有價值的信息來支持各種商業(yè)中的實際應用,如市場促銷、庫存管理和顧客關(guān)系管理,等等。本章小結(jié)—8.9—本章通過人工智能應用展對目前人工智能的相關(guān)應用做了一個概述,介紹了人工智能在圖像、自然語言、音樂、自動駕駛等方面的應用,開拓了同學們的視野和思路,了解人工智能可以應用在工作和生
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 工會采買蛋糕卡合同3篇
- 教育圖書購銷合同
- 政府委托采購合同的變更3篇
- 教育宣傳單設(shè)計印刷合同3篇
- 教育機構(gòu)綠化養(yǎng)護合同3篇
- 提前解除租房合同范本3篇
- 教育培訓行業(yè)工作協(xié)議3篇
- 工業(yè)園租賃合同格式打印打印生成3篇
- 排水招投標解析3篇
- 文明建設(shè)責任書3篇
- 人教版三年級下冊數(shù)學期中測試卷含答案(新)
- 16J914-1 公用建筑衛(wèi)生間
- 有限空間作業(yè)審批表格模板
- 春節(jié)人員流失預控方案
- 2019年日照市專業(yè)人員繼續(xù)教育答案(更新全)
- XX集團公司“揭榜掛帥”實施辦法
- 小學少先隊活動課贛教三年級上冊主題一唱響嘹亮的隊歌勇敢前進
- 《穿井得一人》《桑中生李》閱讀練習及答案
- “大綜合一體化”行政執(zhí)法改革工作自查報告
- (3)110KV配電裝置安裝單位工程質(zhì)量驗收評定表1
- 課程設(shè)計之年產(chǎn)90000噸丙酮水連續(xù)精餾塔的設(shè)計
評論
0/150
提交評論