




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
信息技術(shù)拓展模塊5人工智能拓展模塊5人工智能學(xué)習(xí)目標(biāo)(1)了解人工智能的概念、基本特征和社會價值。(2)了解人工智能的發(fā)展歷程、發(fā)展趨勢,以及在互聯(lián)網(wǎng)及各傳統(tǒng)行業(yè)中的典型應(yīng)用。
(3)熟悉機(jī)器學(xué)習(xí)的基本原理、開發(fā)流程和開發(fā)步驟。(4)了解人工智能涉及的核心技術(shù)及部分算法,能使用人工智能相關(guān)應(yīng)用解決實(shí)際問題。(5)熟悉人工智能技術(shù)應(yīng)用的開發(fā)框架、集成開發(fā)環(huán)境以及各種開發(fā)平臺,了解其特點(diǎn)和適用范圍。(6)能辨析人工智能在社會應(yīng)用中面臨的倫理、道德和法律問題。5.1認(rèn)識人工智能015.1認(rèn)識人工智能5.1.1什么是人工智能?1.定義:人工智能(英文縮寫為AI)是研究如何應(yīng)用機(jī)器(主要是計(jì)算機(jī))來模擬人類某些智能行為的基本理論、方法和技術(shù)。說明:
(1)人工智能試圖通過研究人類智能活動的規(guī)律生產(chǎn)出一種新的能以人的智能相似的方式做出反應(yīng)的智能機(jī)器。(2)智能機(jī)器能夠通過機(jī)器視覺、機(jī)器聽覺、機(jī)器觸覺、機(jī)器嗅覺、人機(jī)交互等方式來認(rèn)識周圍的環(huán)境和需要解決的問題,能夠像人一樣判斷、推理、學(xué)習(xí)、預(yù)測、證明,能夠根據(jù)要達(dá)到的目標(biāo)進(jìn)行決策或采取相應(yīng)的行動。(3)本質(zhì):人工智能是對人類思維信息過程的模擬,其主要目的是賦予機(jī)器特有的視聽說動及大腦抽象思維能力。5.1認(rèn)識人工智能2.人工智能同人類智能的區(qū)別(1)人工智能以軟件代碼為基礎(chǔ),代碼的運(yùn)行依賴于計(jì)算機(jī)技術(shù),人工智能屬于無意識的、機(jī)械的物理過程;而人類智能以大腦為核心,大腦的運(yùn)行依賴于復(fù)雜的生命系統(tǒng),人類智能主要是生理和心理的過程。(2)人工智能沒有情感、意識及道德判斷,也沒有人類意識所特有的、能動的創(chuàng)造能力;而人類智能有豐富多樣的心理結(jié)構(gòu)和情緒,有強(qiáng)烈的自我約束的價值觀,也有很強(qiáng)的自主意識和創(chuàng)新能力。(3)人工智能只能執(zhí)行某一個具體的任務(wù),一個智能體只能掌握一種能力;而人類智能可以執(zhí)行各種各樣的任務(wù),人的大腦可以同時擁有面向很多不同任務(wù)的分析和處理能力。(4)人工智能只會朝著一個目標(biāo)前進(jìn),它不具備為自己設(shè)定目標(biāo)、改變目標(biāo)的能力;而人類智能不但每一個步驟都需要人自己去設(shè)定目標(biāo),為下一步驟的執(zhí)行創(chuàng)造條件,而且能夠及時根據(jù)現(xiàn)實(shí)情況靈活調(diào)整目標(biāo)。5.1認(rèn)識人工智能3.圖靈測試如果一個人和一臺機(jī)器作為測試對象與測試者隔開,測試者只能通過類似終端的文本設(shè)備向測試對象隨意提問,然后根據(jù)測試對象給出的答案判別哪個是真人,哪個是機(jī)器。經(jīng)過多輪問答后,如果機(jī)器能夠讓平均每個測試者做出超過30%的誤判,那么這臺機(jī)器就通過了測試,并被認(rèn)為具有類似人類的智能。
圖靈測試提示我們應(yīng)該更加注重智能的外在功能性表現(xiàn),通過工程技術(shù)為機(jī)器賦予智能。5.1
認(rèn)識人工智能弱人工智能機(jī)器可以通過編程展現(xiàn)出某些人類智能的水平,它只是針對特定領(lǐng)域、執(zhí)行特定任務(wù)的人工智能。強(qiáng)人工智能可以模仿人類的智能或行為,具有學(xué)習(xí)和應(yīng)用其智能來解決任何問題的能力,能夠勝任任何由人所能完成的智力性工作。超人工智能不僅能全面模仿和理解人類的智能,而且能在科學(xué)創(chuàng)造力、通識和社交能力等每一方面都遠(yuǎn)勝于人類智能。4.智能水平5.1
認(rèn)識人工智能第三,機(jī)器智能具有感知環(huán)境、產(chǎn)生反應(yīng)的能力。
第四,機(jī)器智能擁有學(xué)習(xí)和適應(yīng)能力,可以演化迭代。
第二,機(jī)器智能本質(zhì)上體現(xiàn)為計(jì)算,基礎(chǔ)是數(shù)據(jù)。
第一,機(jī)器智能由人類設(shè)計(jì)并為人類服務(wù)。
人工智能的基本特征5.1
認(rèn)識人工智能第一,機(jī)器智能由人類設(shè)計(jì)并為人類服務(wù)。
人工智能主要研究領(lǐng)域利用計(jì)算機(jī)技術(shù)來分析、理解和生成自然語言,從而實(shí)現(xiàn)人與計(jì)算機(jī)之間用自然語言進(jìn)行信息交流的目的自然語言處理專門研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為的科學(xué),其目的是讓機(jī)器能像人一樣具有學(xué)習(xí)的能力機(jī)器學(xué)習(xí)將人工智能技術(shù)應(yīng)用于機(jī)器人,使機(jī)器人具有感知、思考和行動能力智能機(jī)器人運(yùn)用計(jì)算機(jī)來感知、加工、理解客觀世界中三維場景,目標(biāo)是使計(jì)算機(jī)能像人那樣通過視覺觀察和理解世界計(jì)算機(jī)視覺知識工程就是以知識為處理對象,研究如何用機(jī)器實(shí)現(xiàn)知識的獲取、表示、推理和決策,其目標(biāo)是構(gòu)造出高效的知識處理系統(tǒng)知識工程語音識別是讓機(jī)器通過識別和理解把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)文字的過程;語音合成是讓機(jī)器通過規(guī)則和理解將任意的文本轉(zhuǎn)換成標(biāo)準(zhǔn)流暢的語音輸出語音識別與合成5.1認(rèn)識人工智能--主要研究領(lǐng)域(機(jī)器學(xué)習(xí))(1)深度學(xué)習(xí)深度學(xué)習(xí)所研究的深度神經(jīng)網(wǎng)絡(luò)本質(zhì)上是層數(shù)較多的人工神經(jīng)網(wǎng)絡(luò),它能夠發(fā)現(xiàn)高維數(shù)據(jù)中的復(fù)雜規(guī)律,取得比傳統(tǒng)機(jī)器學(xué)習(xí)方法更好的效果,解決了很多復(fù)雜的模式識別難題,在智能搜索、數(shù)據(jù)挖掘、計(jì)算機(jī)視覺、自然語言處理、語音識別,推薦和個性化等眾多領(lǐng)域里取得了巨大成果,部分應(yīng)用研究成果已轉(zhuǎn)化為產(chǎn)品被廣泛使用。(2)強(qiáng)化學(xué)習(xí)讓智能體與外界環(huán)境進(jìn)行交互進(jìn)而學(xué)到最優(yōu)控制策略。強(qiáng)化學(xué)習(xí)是AlphaGo等人工智能軟件的核心技術(shù),可用于計(jì)算機(jī)博弈、機(jī)器人控制、汽車智能駕駛、人機(jī)對話、過程優(yōu)化決策與控制等領(lǐng)域,被認(rèn)為是通向高級人工智能的重要途徑,目前受到學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注。5.1認(rèn)識人工智能--主要研究領(lǐng)域(知識工程)(1)專家系統(tǒng)專家系統(tǒng)是一種在特定領(lǐng)域內(nèi)具有專家水平解決復(fù)雜問題的智能計(jì)算機(jī)軟件系統(tǒng),它將專業(yè)領(lǐng)域的專家知識收集并存儲在系統(tǒng)中,然后運(yùn)用這些知識通過搜索、推理來解決某些專業(yè)領(lǐng)域的問題。知識工程廣泛應(yīng)用于專家系統(tǒng)、機(jī)器定理證明、聊天機(jī)器人、智能搜索和知識圖譜等領(lǐng)域。(2)知識圖譜知識圖譜是一種大規(guī)模語義網(wǎng)絡(luò),它把不同種類的信息連接在一起形成一個關(guān)系網(wǎng)絡(luò),利用關(guān)系網(wǎng)絡(luò)描述真實(shí)世界中存在的各種實(shí)體和概念以及他們之間的相互關(guān)系,從而可以從關(guān)系的角度去分析問題,進(jìn)而可以實(shí)現(xiàn)知識的快速搜索和推理。5.1認(rèn)識人工智能--主要研究領(lǐng)域(自然語言處理)自然語言理解:主要研究如何使計(jì)算機(jī)理解自然語言的意義。自然語言生成:主要研究讓計(jì)算機(jī)以自然語言表達(dá)給定的信息。自然語言處理包括文本分類根據(jù)一段不定長的文本內(nèi)容來判斷文本相應(yīng)的類別。文本翻譯文本問答輿情監(jiān)測客服系統(tǒng)信息過濾自然語言處理技術(shù)應(yīng)用5.1認(rèn)識人工智能--主要研究領(lǐng)域(語音識別與合成)讓機(jī)器通過識別和理解把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)文字的過程,它與自然語言理解技術(shù)相結(jié)合,能讓機(jī)器聽懂人的聲音。語音識別、自然語言處理和語音合成等技術(shù)相互結(jié)合,使機(jī)器可以通過語音與人進(jìn)行交流。目前,語音識別和語音合成技術(shù)已經(jīng)達(dá)到實(shí)用化的程度并應(yīng)用到許多人機(jī)交互的場合。讓機(jī)器通過規(guī)則和理解將任意的文本轉(zhuǎn)換成標(biāo)準(zhǔn)流暢的語音輸出,從而讓機(jī)器能夠像人一樣開口說話。語音識別語音合成5.1認(rèn)識人工智能--主要研究領(lǐng)域(計(jì)算機(jī)視覺)計(jì)算機(jī)視覺就是使計(jì)算機(jī)能借助各種視覺傳感器獲取場景的圖像,從中感知和恢復(fù)三維環(huán)境中物體的幾何性質(zhì)、姿態(tài)結(jié)構(gòu)、運(yùn)動情況、相互關(guān)系等信息,并對客觀場景進(jìn)行識別、描述、解釋、判斷,或者將客觀場景變換成新的表示。目前,計(jì)算機(jī)視覺研究的主要任務(wù)包括圖像分類、目標(biāo)檢測和跟蹤、語義分割、人臉識別、文字識別、事件檢測和識別、幾何測量、3D重建、自動圖題、視覺問答等。其中,圖像分類、人臉識別、目標(biāo)檢測等任務(wù)的計(jì)算機(jī)視覺算法在性能上已經(jīng)逼近甚至超越了普通人類的視覺能力。目標(biāo)檢測目標(biāo)跟蹤語義分割5.1認(rèn)識人工智能--主要研究領(lǐng)域(智能機(jī)器人)機(jī)器人是一種能夠通過編程和自動控制來執(zhí)行各種任務(wù)的高度靈活的自動化機(jī)器。人工智能要實(shí)現(xiàn)學(xué)習(xí)、感知、語言理解、推理、規(guī)劃等智能任務(wù),機(jī)器人是一個理想的載體。近些年來,智能機(jī)器人得到飛速發(fā)展,其代表性的成果有波士頓動力公司研制的四足大狗機(jī)器人,本田公司研制的仿人機(jī)器人阿西莫,深圳市優(yōu)必選科技公司研發(fā)的大型仿人服務(wù)機(jī)器人WalkerX等等,目前,智能機(jī)器人已廣泛應(yīng)用于工業(yè)制造、農(nóng)業(yè)種植、物流運(yùn)輸、醫(yī)療診治、電信運(yùn)營、金融服務(wù)、教育、娛樂等領(lǐng)域。四足大狗機(jī)器人仿人機(jī)器人阿西莫大型仿人服務(wù)機(jī)器人WalkerX5.1認(rèn)識人工智能1.替代人類勞動,解放勞動生產(chǎn)力2.提高醫(yī)療水平,造福人類3.精準(zhǔn)決策,提升社會治理能力5.解決人類面臨的嚴(yán)重問題6.探索未知,認(rèn)識自然與社會規(guī)律4.改善生存條件,為人類提供安全環(huán)境7.改變生活方式,優(yōu)化生活品質(zhì)人工智能的社會價值5.1認(rèn)識人工智能人工智能發(fā)展歷程起步發(fā)展階段遇冷時期復(fù)興階段時間19702020201020001990198019601956熱度低潮時期平穩(wěn)發(fā)展階段高速發(fā)展階段人工智能誕生機(jī)器定理證明感知機(jī)通用問題求解第一個專家系統(tǒng)目標(biāo)落空資助停止遭遇基礎(chǔ)性障礙專家系統(tǒng)遍地開花XCON系統(tǒng)獲得成功反向傳播算法推出第五代計(jì)算機(jī)計(jì)劃失敗專家系統(tǒng)存在問題顯現(xiàn)研發(fā)經(jīng)費(fèi)投入縮減IBM“深藍(lán)”戰(zhàn)勝人類國際象棋冠軍轉(zhuǎn)向解決具體問題語音識別指紋識別網(wǎng)頁搜索問答系統(tǒng)智能機(jī)器人辛頓等提出深度學(xué)習(xí)并成功研發(fā)出AlexNetGoogle推出無人駕駛汽車人臉識別、語音識別達(dá)到或超過人類水平AlphaGo戰(zhàn)勝人類圍棋世界冠軍………………………………寒冬初冬初秋初春復(fù)蘇爆發(fā)5.1認(rèn)識人工智能--人工智能發(fā)展歷程人工智能誕生關(guān)于達(dá)特茅斯夏季人工智能研究項(xiàng)目的一項(xiàng)提議:我們提議于1956年夏天在達(dá)特茅斯學(xué)院舉行一次為期兩個月10人參加的人工智能研討會。這次研討會的主題是一項(xiàng)假設(shè)的基礎(chǔ),即學(xué)習(xí)的每個方面或者智能的任何其他特征原則上都能夠被精確地描述到能夠用機(jī)器來模擬的程度。我們將試圖從抽象和概念上尋找如何制造機(jī)器來使用語言,解決目前只有人類才能解決的問題,以及能夠自我改進(jìn)。我們認(rèn)為,如果仔細(xì)選出一組科學(xué)家一起工作一夏天的話,將能夠在一個或多個問題上取得意義重大的進(jìn)展。
麥卡錫達(dá)特茅斯學(xué)院明斯基哈佛大學(xué)羅徹斯特IBM公司香農(nóng)貝爾電話實(shí)驗(yàn)室1955年8月31日5.1認(rèn)識人工智能--人工智能發(fā)展歷程第三次浪潮(1993至今)圖靈獎獲得者杰弗里?辛頓2006年,加拿大多倫多大學(xué)的科學(xué)家杰弗里·辛頓提出深度學(xué)習(xí)。2012年,辛頓帶領(lǐng)兩名學(xué)生利用卷積深度神經(jīng)網(wǎng)絡(luò)AlexNet將圖像分類錯誤率由26%降到15%并贏得2012年度ImageNet競賽第1名。2012年底,Google公司的GoogleX實(shí)驗(yàn)室推出了無人駕駛汽車,它采用照相機(jī)、雷達(dá)感應(yīng)器和激光測距機(jī)來“看”交通狀況,可以同時對數(shù)百個目標(biāo)保持監(jiān)測。2014年,由百度自然語言研究院研發(fā)的人工智能語言交互機(jī)器人小度首次亮相于江蘇衛(wèi)視的《芝麻開門》闖關(guān)節(jié)目,出色的表現(xiàn)贏得現(xiàn)場觀眾驚嘆不已。2015年,Microsoft研究院的何凱明等4位研究人員在卷積深度神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上研發(fā)出深度殘差網(wǎng)絡(luò),從而大幅提升了深度神經(jīng)網(wǎng)絡(luò)性能,錯誤率降低到3.6%,超越了人眼識別水平。
在深度神經(jīng)網(wǎng)絡(luò)持續(xù)改進(jìn)下,人臉識別、物體識別和語音識別的性能已達(dá)到或超過人類的水平。5.1認(rèn)識人工智能人工智能發(fā)展趨勢自主智能跨媒體混合智能綜合利用視覺、語言、聽覺、觸覺等感知信息,實(shí)現(xiàn)跨媒體分析推理從單個智能體向基于互聯(lián)網(wǎng)的群體智能轉(zhuǎn)變自主智能系統(tǒng)正成為人工智能的重要發(fā)展及應(yīng)用方向混合智能既包含人,又包含機(jī)器組件。人與機(jī)器可以相互交流,相互作用,互相促進(jìn),人機(jī)協(xié)同催生新型混合智能形態(tài)產(chǎn)業(yè)興旺隨著人工智能的全面應(yīng)用,人工智能的大規(guī)模商用必將使人工智能產(chǎn)業(yè)蓬勃發(fā)展群體智能5.1認(rèn)識人工智能在互聯(lián)網(wǎng)行業(yè)中的應(yīng)用(1)智能搜索引擎(2)智能推送(3)智能移動支付(4)智能客服在工業(yè)領(lǐng)域中的應(yīng)用(1)預(yù)測性維護(hù)(2)設(shè)備參數(shù)優(yōu)化(3)質(zhì)量檢測(4)倉儲物流在農(nóng)業(yè)領(lǐng)域中的應(yīng)用(1)現(xiàn)場監(jiān)測(2)評估農(nóng)作物和土壤(3)農(nóng)業(yè)機(jī)器人在安防領(lǐng)域中的應(yīng)用(1)識別人員(2)識別車輛(3)追蹤犯罪嫌疑人(4)智能樓宇(5)工業(yè)園區(qū)監(jiān)控人工智能的應(yīng)用領(lǐng)域謝謝大家!結(jié)束5.2機(jī)器學(xué)習(xí)基本原理與開發(fā)流程025.2機(jī)器學(xué)習(xí)基本原理與開發(fā)流程從形式上說,機(jī)器學(xué)習(xí)旨在從歷史數(shù)據(jù)中尋找一個特定輸入和預(yù)期輸出的功能函數(shù)f(x),該函數(shù)在機(jī)器學(xué)習(xí)領(lǐng)域又被稱為模型,它可以根據(jù)給定的輸入做出判斷或預(yù)測。
機(jī)器學(xué)習(xí)主要任務(wù)就是利用以往的經(jīng)驗(yàn)優(yōu)化系統(tǒng)自身的性能。從目前機(jī)器學(xué)習(xí)實(shí)踐角度看,以往的經(jīng)驗(yàn)通常是一批歷史數(shù)據(jù),系統(tǒng)自身往往是一個模型,機(jī)器學(xué)習(xí)的目標(biāo)就是要利用過去的歷史數(shù)據(jù)通過學(xué)習(xí)算法對模型進(jìn)行訓(xùn)練,使模型越來越符合數(shù)據(jù)中蘊(yùn)含的規(guī)律或規(guī)則,最終得出性能良好的問題解決模型。當(dāng)模型訓(xùn)練完成后,如果有新的數(shù)據(jù)輸入模型,模型就會做出判斷或者給出預(yù)測的結(jié)果,從而使機(jī)器獲得解決問題的能力。機(jī)器學(xué)習(xí)的基本原理機(jī)器學(xué)習(xí)中的模型模型的輸入輸出
5.2機(jī)器學(xué)習(xí)基本原理與開發(fā)流程機(jī)器學(xué)習(xí)建模過程機(jī)器學(xué)習(xí)的基本任務(wù):(1)如何找到一個函數(shù)來實(shí)現(xiàn)預(yù)期功能,這是一個建模問題;(2)如何找到一個評價標(biāo)準(zhǔn)來評價函數(shù)的好壞,這是一個評價問題;(3)如何快速找到性能最優(yōu)的函數(shù),這是一個優(yōu)化問題。
模型選擇
學(xué)習(xí)算法訓(xùn)練數(shù)據(jù)….
新數(shù)據(jù)“李飛飛”模型評估5.2機(jī)器學(xué)習(xí)基本原理與開發(fā)流程機(jī)器學(xué)習(xí)分類監(jiān)督學(xué)習(xí)利用一組已標(biāo)記的歷史數(shù)據(jù)來訓(xùn)練模型的方法無監(jiān)督學(xué)習(xí)
使用不帶標(biāo)記的數(shù)據(jù)來學(xué)習(xí)的方法聚類辛頓本吉奧楊樂昆辛頓聚類
1.確定目標(biāo)2.準(zhǔn)備數(shù)據(jù)3.選擇模型4.訓(xùn)練模型5.上線運(yùn)行5.2機(jī)器學(xué)習(xí)基本原理與開發(fā)流程機(jī)器學(xué)習(xí)項(xiàng)目開發(fā)流程與步驟(1)明確目標(biāo)(2)理解實(shí)際問題(3)判斷問題的性質(zhì)(4)確定性能要求(5)可行性分析(1)數(shù)據(jù)收集(2)數(shù)據(jù)探索(3)數(shù)據(jù)預(yù)處理(4)數(shù)據(jù)標(biāo)注(1)建立基準(zhǔn)(2)訓(xùn)練多種模型(3)評估并比較性能(4)調(diào)整功能與特征(5)選擇最合適模型(1)劃分?jǐn)?shù)據(jù)集(2)訓(xùn)練優(yōu)化模型(3)驗(yàn)證泛化能力(4)評估模型(1)模型集成(2)模型部署(3)模型監(jiān)控(4)模型維護(hù)流程步驟謝謝大家!結(jié)束5.3常用核心技術(shù)031.決策樹2.貝葉斯分類器3.人工神經(jīng)網(wǎng)絡(luò)4.卷積神經(jīng)網(wǎng)絡(luò)5.3.1決策樹
決策樹(decisiontree)模型是一種具有可解釋性的樹形機(jī)器學(xué)習(xí)模型,能夠從帶有噪音的小樣本數(shù)據(jù)中進(jìn)行學(xué)習(xí),適用于解決具有離散目標(biāo)值的監(jiān)督學(xué)習(xí)問題。根結(jié)點(diǎn)內(nèi)部結(jié)點(diǎn)或非葉子結(jié)點(diǎn)葉子結(jié)點(diǎn)邊5.3.1決策樹1.分類問題訓(xùn)練集實(shí)例學(xué)號輸入數(shù)據(jù)x標(biāo)簽y考試成績作業(yè)完成情況課上注意力出勤率學(xué)習(xí)狀態(tài)1優(yōu)秀按時完成分散高好2良好按時完成集中低好3優(yōu)秀不能完成分散高好4較差按時完成集中高好5良好按時完成一般高好6優(yōu)秀按時完成一般低好7優(yōu)秀按時完成集中低好8較差不能完成一般高差9較差按時完成一般低差10優(yōu)秀不能完成一般低差11良好不能完成一般高差12良好不能完成一般低差13較差不能完成分散高差14較差不能完成分散低差
所謂分類問題是根據(jù)已知樣本的某些特征,判斷一個新的樣本屬于哪種已知的樣本類。多元分類二分類N個樣本的訓(xùn)練集可以表示為集合D={(x1,y1),(x2,y2),?,(xn,yn)}
設(shè):X~輸入數(shù)據(jù)x所在空間Y~標(biāo)簽y所在空間
監(jiān)督學(xué)習(xí)目標(biāo):f:X→Y訓(xùn)練過程:調(diào)整模型f(x)自身參數(shù)訓(xùn)練結(jié)果:f(x)的近似模型。2.訓(xùn)練集5.3.1決策樹訓(xùn)練集實(shí)例學(xué)號特征向量x標(biāo)簽y考試成績作業(yè)完成情況課上注意力出勤率學(xué)習(xí)狀態(tài)1優(yōu)秀按時完成分散高好2良好按時完成集中低好3優(yōu)秀不能完成分散高好4較差按時完成集中高好5良好按時完成一般高好6優(yōu)秀按時完成一般低好7優(yōu)秀按時完成集中低好8較差不能完成一般高差9較差按時完成一般低差10優(yōu)秀不能完成一般低差11良好不能完成一般高差12良好不能完成一般低差13較差不能完成分散高差14較差不能完成分散低差特征取值范圍類別取值范圍類別類別值范圍(Y)學(xué)習(xí)狀態(tài){好,差}樣本表示(x=(a1,a2,a3,a4),y)(x=(優(yōu)秀,按時完成,一般,高),y=好)5.3.1決策樹人類完成分類任務(wù)的邏輯推理過程常??梢员怀橄鬄閷Ψ诸悓ο蟮囊幌盗刑卣鲗傩赃M(jìn)行測試的過程。從根結(jié)點(diǎn)到葉子結(jié)點(diǎn)的一條路徑代表了一個決策過程的測試序列,一個數(shù)據(jù)點(diǎn)從根結(jié)點(diǎn)進(jìn)入決策樹后,會根據(jù)其特征值選擇一條這樣的路徑,最終進(jìn)入某個葉結(jié)點(diǎn)代表的分類類別得到最終的分類結(jié)果。3.基本原理示例5.3.1決策樹4.基本算法輸出:以node為根結(jié)點(diǎn)的一棵決策樹5.3.1決策樹訓(xùn)練集計(jì)算示例
據(jù)此,選擇信息增益最大的特征“作業(yè)完成情況”作為根結(jié)點(diǎn)
信息熵是信息論中廣泛使用的一個度量標(biāo)準(zhǔn),它可以度量任意樣本集合中類別的“純度”。二分類信息熵計(jì)算公式:信息熵Ent(D)=-p1log2p1–p2log2p2其中:D代表一個集合;p1代表D中正例樣本的比例;p2代表D中反例樣本的比例;0log20定義為0信息增益
一個特征的信息增益就是使用這個特征劃分樣本集合而導(dǎo)致的信息熵降低程度
5.3.1決策樹測試和評估例:測試集T包含兩個測試數(shù)據(jù):T={(良好,按時完成,一般,低,好),(較差,不能完成,一般,低,差)}結(jié)論:
決策樹在這個小型測試集上達(dá)到了100%的正確率測試集中樣本格式:
(x=(a1,a2,a3,a4),y)5.3.2貝葉斯分類器
1.概率模型例如,對于學(xué)習(xí)狀態(tài)判斷問題,已知一個學(xué)生考試成績良好,能按時完成作業(yè),課上注意力一般,出勤率低,需要判斷其學(xué)習(xí)狀態(tài)。該問題可表達(dá)為以下形式:
P(學(xué)習(xí)狀態(tài)=好|(考試成績=良好,作業(yè)完成情況=按時完成,課上注意力=一般,出勤率=低))P(學(xué)習(xí)狀態(tài)=差|(考試成績=良好,作業(yè)完成情況=按時完成,課上注意力=一般,出勤率=低))(1)概率隨機(jī)事件出現(xiàn)的可能性大小,表示為P(A)。0.概率知識
(2)概率分布隨機(jī)變量取值的概率規(guī)律,即隨機(jī)變量各種可能結(jié)果發(fā)生的概率。(3)條件概率
條件概率是指事件A在另外一個事件B已經(jīng)發(fā)生條件下的發(fā)生概率,表示為P(A|B)。
條件概率P(y|x):表示已知x的情況下屬于某個分類y∈Y發(fā)生的概率有多大;分類器f(x):選擇能使P(y|x)最大的類別y,即在已知x的情況下選擇最有可能的類別y作為輸出結(jié)果分類器f(x)輸出:選取上面兩個條件概率較大者的學(xué)習(xí)狀態(tài)作為判斷結(jié)果。5.3.2貝葉斯分類器3.貝葉斯分類器
2.貝葉斯定理
根據(jù)貝葉斯定理
例:根據(jù)訓(xùn)練集樣本計(jì)算學(xué)習(xí)狀態(tài)為好和學(xué)習(xí)狀態(tài)為差的概率。
5.3.2貝葉斯分類器例:以下表為訓(xùn)練樣本集合,判斷一個考試成績良好、能按時完成作業(yè)、課上注意力一般、出勤率低的學(xué)生的學(xué)習(xí)狀態(tài)。
比較以上兩個計(jì)算結(jié)果,學(xué)習(xí)狀態(tài)好的計(jì)算結(jié)果更大,因此判定該學(xué)生的學(xué)習(xí)狀態(tài)為好。學(xué)號xy考試成績作業(yè)完成情況課上注意力出勤率學(xué)習(xí)狀態(tài)1優(yōu)秀按時完成分散高好2良好按時完成集中低好3優(yōu)秀不能完成分散高好4較差按時完成集中高好5良好按時完成一般高好6優(yōu)秀按時完成一般低好7優(yōu)秀按時完成集中低好8較差不能完成一般高差9較差按時完成一般低差10優(yōu)秀不能完成一般低差11良好不能完成一般高差12良好不能完成一般低差13較差不能完成分散高差14較差不能完成分散低差樸素貝葉斯分類器:
5.3.3人工神經(jīng)網(wǎng)絡(luò)1.神經(jīng)元
人工神經(jīng)網(wǎng)絡(luò)(英文縮寫ANN)是一個用大量結(jié)點(diǎn)(神經(jīng)元)經(jīng)廣泛連接構(gòu)成的復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu),它以數(shù)學(xué)模型模擬神經(jīng)元活動,是基于模仿大腦神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和功能而建立的一種信息處理系統(tǒng)。非線性函數(shù)f(u)5.3.3人工神經(jīng)網(wǎng)絡(luò)1.神經(jīng)元常用的激活函數(shù)5.3.3人工神經(jīng)網(wǎng)絡(luò)1.神經(jīng)元(1)神經(jīng)元數(shù)學(xué)模型既有逼近線性函數(shù)的能力,也有逼近非線性函數(shù)的能力,其應(yīng)用范圍非常大。(2)在構(gòu)造神經(jīng)網(wǎng)絡(luò)時,其神經(jīng)元的傳遞函數(shù)和轉(zhuǎn)換函數(shù)就已經(jīng)確定了,如果想要改變網(wǎng)絡(luò)輸出的大小,只能修改網(wǎng)絡(luò)神經(jīng)元的權(quán)重和閾值參數(shù),因此神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)就是改變神經(jīng)元中參數(shù)的過程。(3)當(dāng)訓(xùn)練一個神經(jīng)元的時候,就是在不斷地調(diào)整神經(jīng)元數(shù)學(xué)模型中的參數(shù),當(dāng)模型訓(xùn)練好以后,參數(shù)就確定下來了,因此,可以認(rèn)為一個模型學(xué)到的知識被儲存于這些參數(shù)中了。(5)對于回歸任務(wù)來說,訓(xùn)練神經(jīng)元相當(dāng)于尋找一條能夠擬合集合點(diǎn)的直線,使得集合點(diǎn)到直線的距離最短(誤差最?。?。(4)對于分類任務(wù)來說,訓(xùn)練神經(jīng)元相當(dāng)于尋找一個界限把不同類型的集合點(diǎn)分開,然后通過Sigmoid函數(shù)將其映射到0~1之間。5.3.3人工神經(jīng)網(wǎng)絡(luò)2.前饋神經(jīng)網(wǎng)絡(luò)(2)在人工神經(jīng)網(wǎng)絡(luò)中,神經(jīng)元處理單元可表示不同的對象,例如字母、像素、特征、概念或者一些有意義的抽象模式,而網(wǎng)絡(luò)自身通常都是對某種算法或者函數(shù)的逼近,也可能是對一種邏輯策略的表達(dá)。
前饋神經(jīng)網(wǎng)絡(luò)(英文縮寫FNN)是一種特殊的人工神經(jīng)網(wǎng)絡(luò),它采用單向結(jié)構(gòu),每一層包含若干個神經(jīng)元,每個神經(jīng)元只與前一層的神經(jīng)元相連,可以接收前一層神經(jīng)元的信號,并產(chǎn)生輸出信號給下一層神經(jīng)元。(1)前饋神經(jīng)網(wǎng)絡(luò)的第1層叫輸入層,最后一層叫輸出層,其他中間層叫隱藏層。前饋神經(jīng)網(wǎng)絡(luò)可以沒有隱藏層,也可以有一至多個隱藏層。整個網(wǎng)絡(luò)中無反饋,信號從輸入層向輸出層單向傳播,可用一個有向無環(huán)圖表示。(3)人工神經(jīng)網(wǎng)絡(luò)輸出可以根據(jù)實(shí)際問題設(shè)置1個、2個或多個輸出端。(4)前饋神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)簡單,應(yīng)用廣泛,它通過簡單非線性神經(jīng)元的復(fù)合映射,可獲得復(fù)雜的非線性處理能力,能夠逼近任意連續(xù)函數(shù),也可以表達(dá)復(fù)雜的邏輯策略。5.3.3人工神經(jīng)網(wǎng)絡(luò)3.前饋神經(jīng)網(wǎng)絡(luò)的訓(xùn)練
多層前饋神經(jīng)網(wǎng)絡(luò)可以看作是非線性復(fù)合函數(shù),它的學(xué)習(xí)過程就是將輸入沿著網(wǎng)絡(luò)結(jié)構(gòu)的方向一層一層的正向傳播直到輸出層,然后再根據(jù)輸出值和標(biāo)簽之間的誤差通過反向傳播算法(BP)對權(quán)重和閾值進(jìn)行更新。然后循環(huán)整個過程,直到滿足最大迭代次數(shù)或者在驗(yàn)證集上的錯誤率趨于平穩(wěn)。正向“虎”=?誤差反向推斷正向“狗”滿足要求5.3.4卷積神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)卷積神經(jīng)網(wǎng)絡(luò)(英文縮寫CNN)是一類基于卷積運(yùn)算的多層前饋神經(jīng)網(wǎng)絡(luò),它具有表征學(xué)習(xí)能力,能夠?qū)斎胄畔⑦M(jìn)行平移不變分類,特別適宜處理視覺方面的問題,是深度學(xué)習(xí)的代表模型之一。5.3.4卷積神經(jīng)網(wǎng)絡(luò)(1)
輸入層
卷積神經(jīng)網(wǎng)絡(luò)的輸入層可以處理多維數(shù)據(jù),最常見的是輸入層接收二維數(shù)組。如果是彩色圖像則需要3個二維數(shù)組,分別存放RGB三個通道的像素值,這樣就可以把1張彩色圖像存放到1個三維數(shù)組中。1個二維數(shù)組可以存放1個矩陣,1個矩陣可以表示1張黑白圖像。數(shù)組中的每個元素存放圖像對應(yīng)像素點(diǎn)的灰度值,0表示最暗,255表示最亮。5.3.4卷積神經(jīng)網(wǎng)絡(luò)
(2)卷積層卷積層的功能是對輸入數(shù)據(jù)進(jìn)行特征提取,其內(nèi)部包含多個卷積核,可以提取不同的特征。
④卷積運(yùn)算是指從輸入數(shù)據(jù)(被卷積圖像)的左上角開始,取一個與卷積核同樣大小的活動窗口(感受野),窗口中輸入數(shù)據(jù)與卷積核元素對應(yīng)起來相乘再相加,其計(jì)算結(jié)果放入新圖像對應(yīng)窗口的中心位置,然后,活動窗口向右移動一列并作同樣的運(yùn)算。以此類推,從左到右、從上到下依次運(yùn)算,即可得到一幅新的卷積圖像,這幅新圖像通常稱作特征圖。①1個卷積核類似于1個前饋神經(jīng)網(wǎng)絡(luò)的神經(jīng)元,組成卷積核的每個元素都對應(yīng)1個權(quán)重系數(shù)。②卷積層內(nèi)每個神經(jīng)元都與前一層局部區(qū)域中相鄰的多個點(diǎn)相連,區(qū)域的大小取決于卷積核的大小,卷積核的大小被稱為“感受野”。③卷積核在工作時,“感受野”像一個移動窗口一樣有規(guī)律地掃過輸入數(shù)據(jù),在移動的過程中,卷積核與“感受野”內(nèi)的輸入數(shù)據(jù)做卷積運(yùn)算,然后經(jīng)激活函數(shù)對卷積運(yùn)算結(jié)果做非線性變換。被卷積圖像特征圖卷積核5.3.4卷積神經(jīng)網(wǎng)絡(luò)
(3)池化層①卷積層提取特征后,其輸出的特征圖會被傳遞至池化層進(jìn)行池化操作。最大值池化操作②池化操作(Pooling)可采用尺寸2
2的池化窗口,以步長為2從左到右、從上到下依次對特征圖進(jìn)行最大值采樣,即每個采樣操作都是從4個數(shù)字中取最大值作為該區(qū)域的概括。③通過池化操作,降低了卷積層輸出的特征維度(特征圖分辨率降低),縮小了連接到后層的結(jié)點(diǎn)個數(shù),減少了神經(jīng)網(wǎng)絡(luò)中參數(shù)數(shù)量,能夠在保留主要特征的情況下大幅減少計(jì)算量,同時也提高了信息的抽象程度。5.3.4卷積神經(jīng)網(wǎng)絡(luò)
(4)全連接層①在卷積神經(jīng)網(wǎng)絡(luò)的最后部分通常使用1到2個全連接層來完成分類任務(wù)。④特征圖在全連接層中不需要保留空間拓?fù)浣Y(jié)構(gòu),進(jìn)入全連接層的特征圖需要被轉(zhuǎn)為一維向量并通過全連接層送給輸出層。②全連接層等價于多層前饋神經(jīng)網(wǎng)絡(luò)中的隱藏層,它的每一個結(jié)點(diǎn)都與上一層的所有結(jié)點(diǎn)相連,用來把前邊提取到的特征組合起來。③全連接層本身不具有特征提取能力,它的主要作用是對提取的高級特征進(jìn)行非線性組合以達(dá)到分類的目的。全連接層結(jié)構(gòu)5.3.4卷積神經(jīng)網(wǎng)絡(luò)
(5)輸出層輸出層的結(jié)構(gòu)和工作原理與前饋神經(jīng)網(wǎng)絡(luò)中的輸出層相同,它的輸出內(nèi)容依賴于具體的任務(wù)需求。①對于線性回歸問題,可以直接使用線性函數(shù)作為輸出以便能夠獲得一個連續(xù)值;②對于多類別分類問題,通常使用softmax函數(shù)作為輸出層的激活函數(shù)以便確定輸入所屬類別。③softmax函數(shù)可以輸出屬于每個類別的概率,其概率總和為1,一般取輸出值中最大者作為最終的分類結(jié)果。5.3.4卷積神經(jīng)網(wǎng)絡(luò)輸入層卷積層池化層全連接層輸出層卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)5.3.4卷積神經(jīng)網(wǎng)絡(luò)
怎樣識別
?
CNN基本原理
怎樣識別
?
x具有兩個對角線和一個交叉線3個特征。對應(yīng)這3個特征,可以定義3個卷積核,3個卷積核可以匹配X中3種不同的特征。當(dāng)卷積核與圖像X進(jìn)行卷積運(yùn)算時,與卷積核匹配的特征就被一一提取出來卷積核設(shè)計(jì)思路1:定義一個與X一樣的模板(卷積核)思路2:尋找X的特征卷積核定義了某種模式,卷積運(yùn)算是在計(jì)算每個位置與該模式的相似程度,當(dāng)前位置與該模式越像,響應(yīng)越強(qiáng)。當(dāng)卷積核一小塊一小塊地與被卷積圖像進(jìn)行比對時,被卷積圖像中的特征就可以被提取出來。提取特征5.3.4卷積神經(jīng)網(wǎng)絡(luò)---CNN基本原理
提前特征的結(jié)果提前特征后,方格內(nèi)數(shù)值越接近1,表示對應(yīng)位置和特征的匹配越完整,越是接近0,表示對應(yīng)位置沒有任何匹配,而接近-1則表示對應(yīng)位置和特征沒有什么關(guān)聯(lián),因此可以通過ReLU函數(shù)把負(fù)值變成0。這樣,就可以通過數(shù)值的大小判斷出特征所在的位置。特征圖5.3.4卷積神經(jīng)網(wǎng)絡(luò)
提前特征的結(jié)果CNN基本原理只有與卷積核匹配的區(qū)域才是真正有用的信息,而其他區(qū)域得出的數(shù)值對判定該特征是否存在的影響比較小。為了有效地減少計(jì)算量,卷積神經(jīng)網(wǎng)絡(luò)使用池化操作保留了每一小塊內(nèi)的最大值,也就是相當(dāng)于保留了這一塊最佳的匹配結(jié)果,而舍棄了那些與該特征關(guān)系不大的信息。池化功能5.3.4卷積神經(jīng)網(wǎng)絡(luò)--CNN基本原理人臉特征抽取過程圖中第3層的人臉是由第2層的人臉局部器官和表面組合而成,而第2層又是由第1層的紋理、邊緣組合而成;從特征圖上看,第3層特征圖上一個點(diǎn)代表第2層若干種局部器官或表面的組合,第2層特征圖上一個點(diǎn)代表第1層若干種紋理、邊緣的組合。卷積層組合方式是非常靈活的,不同的邊緣→不同紋理→不同幾何圖形和表面→不同的器官→不同的人臉,復(fù)雜特征往往是由簡單特征組合而成的,比如前面3個卷積核定義的基本形狀可以在第1次卷積中提取出來,把這些提取出來的特征圖組合后再次進(jìn)行卷積運(yùn)算,則可以提取出由基本形狀拼接成的更為復(fù)雜的形狀。
X、
、∧、
每一層模式的組合可以多種多樣,不是“死板”的模板,而是“靈活”的模板,因此整個卷積神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的表達(dá)能力和泛化能力。多層卷積抽取復(fù)雜特征5.3.4卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練后卷積神經(jīng)網(wǎng)絡(luò)的分類過程輸出值標(biāo)簽值0.10.20.10.30.3100000.10000誤差值0.500000.5
0.20.150.10.05謝謝大家!結(jié)束5.3.4卷積神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練流程初始化所有的卷積核元素,使用隨機(jī)值設(shè)置參數(shù)初始化誤差=輸出向量-標(biāo)簽向量計(jì)算輸出誤差前向傳播
輸入一張訓(xùn)練圖像,通過前向傳播,輸出各類別的概率。反向傳播根據(jù)計(jì)算誤差更新所有卷積核的權(quán)重值以及其他參數(shù)值,使輸出誤差逐步減少。5.4人工智能開發(fā)平臺045.4人工智能開發(fā)平臺---機(jī)器學(xué)習(xí)開發(fā)框架
開發(fā)框架是一個可復(fù)用的軟件架構(gòu)解決方案,它規(guī)定了應(yīng)用的體系結(jié)構(gòu),闡明軟件體系結(jié)構(gòu)中各層次間及其層次內(nèi)部各組件間的依賴關(guān)系、責(zé)任分配和控制流程,表現(xiàn)為一組接口、抽象類以及實(shí)例間協(xié)作的方法,為組件復(fù)用提供了上下文關(guān)系。什么是開發(fā)框架?成熟的框架一般都經(jīng)過很多人使用,具有穩(wěn)定性高、性能好、可重用、可擴(kuò)充和可升級等優(yōu)點(diǎn),采用成熟的框架開發(fā)軟件系統(tǒng),相當(dāng)于讓框架完成許多基礎(chǔ)工作,開發(fā)人員只需在此基礎(chǔ)上集中精力完成本系統(tǒng)的業(yè)務(wù)邏輯設(shè)計(jì)即可完成整個系統(tǒng)的開發(fā),這樣就可以縮短大型應(yīng)用軟件系統(tǒng)的開發(fā)周期,提高開發(fā)質(zhì)量。5.4人工智能開發(fā)平臺TensorFlow是一個由谷歌人工智能團(tuán)隊(duì)于2015年開發(fā)完成的開源的機(jī)器學(xué)習(xí)框架,被廣泛應(yīng)用于各類機(jī)器學(xué)習(xí)算法的編程實(shí)現(xiàn),是目前最熱門的機(jī)器學(xué)習(xí)框架。PyTorch是一個由臉書公司開發(fā)的開源Python機(jī)器學(xué)習(xí)框架,自2017年推出,PyTorch越來越受到機(jī)器學(xué)習(xí)從業(yè)者的青睞,已成為繼TensorFlow之后最受歡迎的機(jī)器學(xué)習(xí)框架。機(jī)器學(xué)習(xí)開發(fā)框架PaddlePaddle框架是由百度開發(fā)的開源深度學(xué)習(xí)框架。該框架不僅易學(xué)、易用、高效、可擴(kuò)展,而且基于該框架提供了一整套工具組件和配套服務(wù),可以助力深度學(xué)習(xí)技術(shù)更方便地應(yīng)用到各個領(lǐng)域。scikit-learn是由數(shù)據(jù)科學(xué)家大衛(wèi)?庫爾納佩等人發(fā)起的機(jī)器學(xué)習(xí)開源項(xiàng)目,2010年首次公開發(fā)布,目前已成為一款非常成熟的機(jī)器學(xué)習(xí)框架,是機(jī)器學(xué)習(xí)領(lǐng)域中最知名的python模塊之一。Keras是一個由Python編寫的開源高層神經(jīng)網(wǎng)絡(luò)軟件庫,可以作為Tensorflow高級應(yīng)用程序接口進(jìn)行深度學(xué)習(xí)模型開發(fā),是目前深度學(xué)習(xí)領(lǐng)域非常流行的框架。5.4人工智能開發(fā)平臺--集成開發(fā)環(huán)境
集成開發(fā)環(huán)境(IDE)是一種集代碼編寫、分析、編譯、調(diào)試、源代碼控制等功能于一體的開發(fā)軟件服務(wù)組合套裝軟件。它將代碼編輯器、編譯器(解釋器)、調(diào)試器等常用的開發(fā)工具打包在一起并集成到單個圖形用戶界面(GUI)中,進(jìn)而可以統(tǒng)一發(fā)布、安裝和使用,以便于開發(fā)者構(gòu)建自己的應(yīng)用程序。PyCharm運(yùn)行界面PyCharm是由JetBrains公司打造的一款專門面向Python的全功能集成開發(fā)環(huán)境,它帶有代碼編寫、語法高亮、代碼跳轉(zhuǎn)、智能提示、自動完成、調(diào)試、單元測試、項(xiàng)目管理和版本控制等一整套可以幫助用戶在使用Python進(jìn)行開發(fā)時提高效率的工具,在Windows、macOS和Linux上都可以快速安裝和使用。1.PyCharm5.4人工智能開發(fā)平臺--集成開發(fā)環(huán)境PyCharm界面區(qū)域
例:用Python在PyCharm中編寫程序,打印出“你好”1.打開PyCharm3.輸入代碼:
print("你好")4.運(yùn)行代碼5.輸出結(jié)果:
你好2.新建一個Python文件5.4人工智能開發(fā)平臺--集成開發(fā)環(huán)境JupyterNotebook是一個基于Web的交互式計(jì)算開發(fā)環(huán)境。它能將實(shí)時運(yùn)行的代碼、敘事性的文本、數(shù)學(xué)方程和可視化內(nèi)容全部組合到一個易于共享的文檔中,可以在其中編輯文檔、編寫程序、運(yùn)行代碼和展示結(jié)果。這些特性使JupyterNotebook成為一款執(zhí)行端到端數(shù)據(jù)科學(xué)工作流程的便捷工具,可用于數(shù)據(jù)清理和轉(zhuǎn)換、統(tǒng)計(jì)建模、構(gòu)建和訓(xùn)練機(jī)器學(xué)習(xí)模型、可視化數(shù)據(jù)、大數(shù)據(jù)分析等工作,特別適合交互式計(jì)算、數(shù)據(jù)分析和教學(xué)展示。JupyterNotebook運(yùn)行界面2.JupyterNotebook5.4人工智能開發(fā)平臺機(jī)器學(xué)習(xí)平臺PAIModelArts飛漿開發(fā)平臺智能鈦機(jī)器學(xué)習(xí)平臺智能鈦機(jī)器學(xué)習(xí)平臺是騰訊公司基于騰訊云強(qiáng)大計(jì)算能力為開發(fā)者打造的一站式機(jī)器學(xué)習(xí)平臺。平臺內(nèi)置豐富的算法組件,支持多種算法框架,滿足多種AI應(yīng)用場景的需求,為用戶提供了全鏈路開發(fā)平臺套件。機(jī)器學(xué)習(xí)平臺PAI是阿里云人工智能平臺,它支持豐富的機(jī)器學(xué)習(xí)算法、一站式的機(jī)器學(xué)習(xí)體驗(yàn)、主流的機(jī)器學(xué)習(xí)框架及可視化的建模方式。ModelArts是由華為公司研發(fā)的面向開發(fā)者的一站式AI開發(fā)平臺。ModelArts提供全流程的AI開發(fā)服務(wù),具有按需部署端-邊-云模型能力,能夠幫助用戶快速創(chuàng)建和部署模型,管理全周期AI工作流,實(shí)現(xiàn)系統(tǒng)的平滑、穩(wěn)定、可靠運(yùn)行。飛槳(PaddlePaddle)是百度自主研發(fā)的開源深度學(xué)習(xí)開發(fā)平臺。它集深度學(xué)習(xí)框架、基礎(chǔ)模型庫、端到端開發(fā)套件、工具組件和服務(wù)平臺于一體,廣泛應(yīng)用于工業(yè)、農(nóng)業(yè)、服務(wù)業(yè)等領(lǐng)域。(
/
)謝謝大家!結(jié)束5.4人工智能開發(fā)平臺人工智能開發(fā)語言Python是一種面向?qū)ο?、解釋型、弱類型的腳本語言,也是一種功能強(qiáng)大而完善的通用型語言,其主要特點(diǎn)如下:1.簡單易學(xué)Python語法清晰簡潔,強(qiáng)制縮進(jìn),易于閱讀,語法約束少,容易上手,非常適合初學(xué)者學(xué)習(xí)。2.功能強(qiáng)大Python具有腳本語言中最豐富和強(qiáng)大的類庫,這些類庫覆蓋了文件I/O、GUI、網(wǎng)絡(luò)編程、數(shù)據(jù)庫訪問、文本操作、科學(xué)計(jì)算等絕大部分應(yīng)用場景,可以幫助處理各種工作。3.可移植性Python語言天生具有跨平臺的特征,只要為平臺提供了相應(yīng)的Python解釋器,Python就可以在該平臺上運(yùn)行,從而實(shí)現(xiàn)“一次編程,到處使用”。4.高級動態(tài)編程盡管Python語言是腳本語言,但可以同時被解釋和編譯執(zhí)行。5.5應(yīng)用開發(fā)實(shí)例051.圖像分類2.文本分類3.語音識別5.5.1圖像分類
圖像分類問題是監(jiān)督學(xué)習(xí)中的分類問題在計(jì)算機(jī)視覺領(lǐng)域的實(shí)例化。它的目標(biāo)是對輸入圖片中的核心物體進(jìn)行類別劃分。百度飛槳提供了預(yù)訓(xùn)練模型庫PaddleHub,涵蓋了計(jì)算機(jī)視覺、文本處理、語音識別等眾多方向的官方模型。我們選擇百度飛槳深度學(xué)習(xí)開發(fā)平臺作為代碼示例的開發(fā)平臺。
左側(cè)的VGG16是一個用于圖像分類的卷積神經(jīng)網(wǎng)絡(luò),本小節(jié)將以VGG16為例介紹如何使用在ImageNet上預(yù)訓(xùn)練好的VGG16網(wǎng)絡(luò)對任意給定的圖片進(jìn)行分類。
5.5.1圖像分類為了能夠使用預(yù)訓(xùn)練模型PaddleHub,需要在Python中安裝百度飛槳軟件包。大家可以自行根據(jù)操作系統(tǒng)類型和cuda版本在百度飛槳的主頁選擇合適的飛槳版本和安裝命令進(jìn)行安裝。安裝后在Python中運(yùn)行如下命令驗(yàn)證安裝結(jié)果:importpaddle.fluidpaddle.fluid.install_check.run_check()顯示“YourPaddleFluidisinstalledsuccessfully!”1.安裝飛槳軟件包為了使用預(yù)訓(xùn)練模型,需要使用如下指令安裝模型庫PaddleHub:pipinstallpaddlehub2.安裝模型庫5.5.1圖像分類新建一個名為image_classification.py的python文件,調(diào)用百度飛槳提供的預(yù)訓(xùn)練模型庫PaddleHub進(jìn)行圖像分類。import
matplotlib.pyplot
as
pltimportpaddlehubas
hub
def
image_classification():
#加載vgg模型model=
hub.Module(name="vgg16_imagenet")
#設(shè)置測試圖片路徑test_img_path=
"./data/images/puppy.jpg"input_dict={"image":[test_img_path]}
#顯示測試圖片img=
plt.imread(test_img_path)
plt.imshow(img)
plt.axis('off')
plt.show()
#使用訓(xùn)練好的模型對測試圖片進(jìn)行分類results=model.classification(data=input_dict)
#打印分類結(jié)果
forresultinresults:
print(result)if__name__==
"__main__":
image_classification()3.編寫圖像分類程序(1)導(dǎo)入數(shù)據(jù)可視化matplotlib程序庫模塊;
導(dǎo)入飛槳的paddlehub模型庫模塊;(2)定義用來對圖片進(jìn)行分類的函數(shù);(3)將預(yù)訓(xùn)練模型加載到model;(4)把存儲待分類圖片的路徑及文件名賦值給變量;(5)定義一個字典結(jié)構(gòu),關(guān)鍵字image對應(yīng)test_img_path;(6)使用plt.imread()函數(shù)把待分類的圖片從文件讀入列表img;(7)繪制img中的圖片;關(guān)閉坐標(biāo)軸的顯示;
打開一個窗口顯示圖像
(8)讀入input_dict中的待分類圖片作為輸入數(shù)據(jù)data,并使用訓(xùn)練好的模型model對它進(jìn)行分類,分類結(jié)果保存在results中。(9)利用循環(huán)語句打印results中的每個類別名稱及該類別的概率值。運(yùn)行程序,可從中找到如下的分類結(jié)果:
[{'Pomeranian':0.8621419072151184}]5.5.1圖像分類待分類圖片VGG16輸出結(jié)果'Pomeranian':0.86程序運(yùn)行過程用模型判斷以下句子是贊揚(yáng)還是批評(1)這是一部波瀾壯闊的史詩。(2)這家餐廳不好吃。文本分類舉例5.5.2文本分類
文本分類就是根據(jù)一段不定長的文本內(nèi)容來判斷文本相應(yīng)的類別,也就是說,文本分類任務(wù)要求模型將句子、段落等輸入文本序列映射成一個和任務(wù)相關(guān)的標(biāo)簽。1.什么是文本分類標(biāo)簽--贊揚(yáng)標(biāo)簽--批評相同點(diǎn):與圖像分類一樣,文本分類也屬于監(jiān)督學(xué)習(xí)中的分類問題;不同點(diǎn):文本分類對象不再是一個像素矩陣,而是一個漢字或單詞序列,在這個序列中,每句話的長度是不一樣的,每個詞的前后是有關(guān)系的。2.文本分類與圖像分類的異同點(diǎn)前饋神經(jīng)網(wǎng)絡(luò)的輸入維數(shù)都是固定的,不能任意改變,而前饋神經(jīng)網(wǎng)絡(luò)的輸出只依賴于當(dāng)前的輸入,因此,前饋神經(jīng)網(wǎng)絡(luò)不適合處理這類變長的序列數(shù)據(jù)。3.前饋神經(jīng)網(wǎng)絡(luò)不適合處理文本分類
循環(huán)神經(jīng)網(wǎng)絡(luò)(簡稱RNN)是一類以序列數(shù)據(jù)為輸入,在序列的演進(jìn)方向進(jìn)行遞歸且所有循環(huán)單元按鏈?zhǔn)竭B接的神經(jīng)網(wǎng)絡(luò),它通過使用帶自反饋的神經(jīng)元,能夠處理任意長度的序列數(shù)據(jù),可以實(shí)現(xiàn)某種“記憶功能”,特別適宜處理自然語言、語音識別等方面的問題,也是深度學(xué)習(xí)的代表模型之一。4.循環(huán)神經(jīng)網(wǎng)絡(luò)5.5.2文本分類--RNN
(1)與前饋神經(jīng)網(wǎng)絡(luò)相同點(diǎn):
一個典型的RNN網(wǎng)絡(luò)包含一個輸入層、一個輸出層和一個隱藏層,隱藏層由神經(jīng)元組成;
U是輸入到隱藏層的連接權(quán)重,W是上一次的狀態(tài)到隱藏層的連接權(quán)重,V是隱藏層到輸出層的連接權(quán)重,這些參數(shù)值在各個時間節(jié)點(diǎn)上是不變的。
按時序展開RNN結(jié)構(gòu)(2)與前饋神經(jīng)網(wǎng)絡(luò)不同點(diǎn):RNN網(wǎng)絡(luò)的神經(jīng)元不僅僅與輸入和輸出存在聯(lián)系,而且自身存在一個回路,該回路意味著上一個時刻的網(wǎng)絡(luò)狀態(tài)信息將會作用于下一個時刻的網(wǎng)絡(luò)狀態(tài),即當(dāng)前的狀態(tài)不但與當(dāng)前時刻的輸入有關(guān),而且與前面的隱藏層狀態(tài)有關(guān)。5.5.2文本分類--RNN
隱藏層輸入
隱藏層輸出RNN內(nèi)部隱藏層結(jié)構(gòu)5.5.2文本分類--RNN文本情感分析是一類特殊的文本分類任務(wù),它對帶有主觀描述的文本進(jìn)行二元分類,即根據(jù)一段文本判斷該文本是正面評價還是負(fù)面評價。例如:用RNN判斷“他是一個好學(xué)生”這句話是正面評價還是負(fù)面評價。
不需要判斷每一個詞的情感,而僅需要關(guān)注最后一個狀態(tài)的輸出,因此,循環(huán)神經(jīng)網(wǎng)絡(luò)可以設(shè)計(jì)成如圖所示的結(jié)構(gòu)。用RNN實(shí)現(xiàn)文本情感分析0.920.085.5.2文本分類-----使用預(yù)訓(xùn)練模型進(jìn)行文本情感分析輸出的分類結(jié)果-------------------------------測試語句:這是一部波瀾壯闊的史詩測試結(jié)果:positive正面概率:0.8632負(fù)面概率:0.1368-------------------------------測試語句:這家餐廳不好吃測試結(jié)果:negative正面概率:0.0811負(fù)面概率:0.9189-------------------------------情感分析代碼import
paddlehubas
hub#導(dǎo)入飛槳的paddlehub模型庫模塊def
sentiment_analysis():senta=
hub.Module(name=“senta_lstm”)將#加載預(yù)訓(xùn)練模型
test_text=
[將
#存儲待分析文本到test_text列表中
"這是一部波瀾壯闊的史詩",
"這家餐廳不好吃"]results=senta.sentiment_classify(texts=test_text)
#調(diào)用模型函數(shù)進(jìn)行分類
#打印分類結(jié)果
print("-------------------------------")
forresultinresults:
print("測試語句:%s"%result['text'])
print("測試結(jié)果:%s"%result['sentiment_key'])
print("正面概率:%s"%result['positive_probs'])
print("負(fù)面概率:%s"%result['negative_probs'])
print("-------------------------------")if__name__==
"__main__":
sentiment_analysis()1.LSTM------長短時記憶網(wǎng)絡(luò)2.Senta------中文情感分析模型5.5.3語音識別1.語音識別技術(shù)旨在將語音信號識別并轉(zhuǎn)化為相應(yīng)的文字。4.一個漢字的拼音可以看作是一個音節(jié)。祖國好zuguohao2.語音(聲音)是一種波,在計(jì)算機(jī)中,語音信號被存儲成一個波形文件。3.為了方便和文字之間建立映射,線性波形需要被分割成幀(frame),而同時,文本又是由文字組成的線性序列。因此,語音識別任務(wù)就可以被認(rèn)為是從幀序列到文字序列之間的轉(zhuǎn)換。5.語音識別需要通過聲學(xué)模型把幀序列轉(zhuǎn)換為音節(jié)序列,然后通過語言模型再把音節(jié)序列轉(zhuǎn)換為文字序列。5.5.3語音識別
語音識別主要步驟:
③語音轉(zhuǎn)換:聲學(xué)模型可以把輸入的特征向量轉(zhuǎn)換為音節(jié)符號,即循環(huán)神經(jīng)網(wǎng)絡(luò)按時序把輸入的語音特征向量轉(zhuǎn)換成音節(jié)符號出現(xiàn)的概率。②
提取特征:提取每一幀波形的聲學(xué)特征,把每一幀波形變成一個多維的特征向量,形成聲譜圖。①分幀:通過移動窗口把聲音波形切分為等間隔的若干小段波形。每一小段波形稱為一幀,每幀長度通常為25毫秒。語音波形分幀聲譜圖h1h4h5h3h2h8h6h7聲學(xué)模型輸出音節(jié)出現(xiàn)概率音節(jié)出現(xiàn)概率音節(jié)出現(xiàn)概率音節(jié)出現(xiàn)概率音節(jié)出現(xiàn)概率音節(jié)出現(xiàn)概率音節(jié)出現(xiàn)概率音節(jié)出現(xiàn)概率5.5.3語音識別④路徑搜索根據(jù)音節(jié)符號出現(xiàn)的概率,通過搜索找出最可能與特征向量序列匹配(條件概率最大)的路徑,從而得到路徑上的音節(jié)。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年協(xié)作共建創(chuàng)業(yè)項(xiàng)目孵化框架協(xié)議
- 2025年婚姻終止財(cái)產(chǎn)分割與子女撫養(yǎng)權(quán)策劃協(xié)議
- 2025股權(quán)預(yù)約購買協(xié)議書模板
- 2025年農(nóng)業(yè)設(shè)備銷售合同
- 2025年臨時授課教師合同范本
- 2025年專用設(shè)備租賃合同協(xié)議書
- 2025年教育機(jī)構(gòu)策劃與服務(wù)合作框架協(xié)議
- 2025年債務(wù)清償房產(chǎn)交換協(xié)議
- 2025年廢水排放管理合同范本
- 2025年高速公路工程招標(biāo)全流程代理項(xiàng)目協(xié)議
- 股東會會議系列文件(通知、議程、簽到表、表決票、決議)
- 非法占用農(nóng)田建房舉報(bào)信范文
- 伐樹工程施工合同范本
- 數(shù)據(jù)挖掘(第2版)PPT全套完整教學(xué)課件
- 工程開工報(bào)告(5篇)
- 配電箱試驗(yàn)項(xiàng)目
- 運(yùn)動技能學(xué)習(xí)與控制課件第一章運(yùn)動技能學(xué)習(xí)與控制概述
- 溫室大棚花卉苗圃采暖方案空氣源熱泵
- BEC商務(wù)英語高級考試歷年真題
- 初二地理中考復(fù)習(xí)備考策略與計(jì)劃
- (完整word版)省級溫室氣體清單編制指南
評論
0/150
提交評論