人工智能應(yīng)用概論(第2版) 課件 第5、6章:智能語(yǔ)音、自然語(yǔ)言處理_第1頁(yè)
人工智能應(yīng)用概論(第2版) 課件 第5、6章:智能語(yǔ)音、自然語(yǔ)言處理_第2頁(yè)
人工智能應(yīng)用概論(第2版) 課件 第5、6章:智能語(yǔ)音、自然語(yǔ)言處理_第3頁(yè)
人工智能應(yīng)用概論(第2版) 課件 第5、6章:智能語(yǔ)音、自然語(yǔ)言處理_第4頁(yè)
人工智能應(yīng)用概論(第2版) 課件 第5、6章:智能語(yǔ)音、自然語(yǔ)言處理_第5頁(yè)
已閱讀5頁(yè),還剩44頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第五章

智能語(yǔ)音

《人工智能應(yīng)用概論(第2版)》RengongZhinengYingyongGailun“十四五”廣西壯族自治區(qū)職業(yè)教育規(guī)劃教材

新編21世紀(jì)高等職業(yè)教育精品教材·通識(shí)課系列Part0101智能語(yǔ)音介紹Part0202智能語(yǔ)音技術(shù)應(yīng)用Part0303智能語(yǔ)音體驗(yàn)?zāi)?/p>

錄content[課程導(dǎo)入】“智能問(wèn)答機(jī)器人”基于深度學(xué)習(xí)的自然語(yǔ)言處理(NLP)技術(shù),幫助提升客服體驗(yàn)及服務(wù)效率,實(shí)現(xiàn)24小時(shí)無(wú)須等候智能服務(wù),通過(guò)上下文多輪問(wèn)答,實(shí)現(xiàn)用戶(hù)問(wèn)題解決率超90%;“AI外呼機(jī)器人”通過(guò)自研語(yǔ)音技術(shù)(TTS)的植入,實(shí)現(xiàn)個(gè)性化擬人聲音服務(wù),人機(jī)交流更親切自然;【思考題】機(jī)器是如何實(shí)現(xiàn)識(shí)別人類(lèi)說(shuō)話(huà),將語(yǔ)音轉(zhuǎn)換成文字的?Part01智能語(yǔ)音介紹5.1智能語(yǔ)音技術(shù)概況除了語(yǔ)音導(dǎo)航、智能音箱、語(yǔ)音輸入法等我們?nèi)粘I钪械某R?jiàn)應(yīng)用場(chǎng)景,只要把語(yǔ)音識(shí)別理解成“獲取人類(lèi)語(yǔ)言中的信息”,把語(yǔ)音合成理解成“讓人類(lèi)通過(guò)聲音獲取信息”,再把聲紋識(shí)別、關(guān)鍵詞喚醒等理解成可供選擇的“功能”,將它們與不同載體、場(chǎng)景結(jié)合,就會(huì)形成各種各樣的產(chǎn)品。5.1.1語(yǔ)音識(shí)別語(yǔ)音識(shí)別讓機(jī)器識(shí)別人說(shuō)出的話(huà),即將語(yǔ)音轉(zhuǎn)換成相應(yīng)的文本內(nèi)容(見(jiàn)圖5-1),然后根據(jù)內(nèi)容信息執(zhí)行人的某種意圖。語(yǔ)音識(shí)別又稱(chēng)言語(yǔ)識(shí)別,這項(xiàng)任務(wù)涉及將輸入聲學(xué)信號(hào)與存儲(chǔ)在計(jì)算機(jī)內(nèi)存的詞表(語(yǔ)音、音節(jié)、詞等)相匹配,而匹配個(gè)別語(yǔ)詞的標(biāo)準(zhǔn)技術(shù)則要用輸入信號(hào)與預(yù)存的波形(或波形特征/參數(shù))相比較(模型匹配),相當(dāng)于給機(jī)器裝上了“耳朵”。5.1.1語(yǔ)音識(shí)別語(yǔ)音識(shí)別讓機(jī)器識(shí)別人說(shuō)出的話(huà),即將語(yǔ)音轉(zhuǎn)換成相應(yīng)的文本內(nèi)容(見(jiàn)圖5-1),然后根據(jù)內(nèi)容信息執(zhí)行人的某種意圖。語(yǔ)音識(shí)別又稱(chēng)言語(yǔ)識(shí)別,這項(xiàng)任務(wù)涉及將輸入聲學(xué)信號(hào)與存儲(chǔ)在計(jì)算機(jī)內(nèi)存的詞表(語(yǔ)音、音節(jié)、詞等)相匹配,而匹配個(gè)別語(yǔ)詞的標(biāo)準(zhǔn)技術(shù)則要用輸入信號(hào)與預(yù)存的波形(或波形特征/參數(shù))相比較(模型匹配),相當(dāng)于給機(jī)器裝上了“耳朵”。5.1.1語(yǔ)音識(shí)別語(yǔ)音識(shí)別系統(tǒng)本質(zhì)上是一種模式識(shí)別系統(tǒng),包括特征提取、模式匹配、參考模型庫(kù)等三個(gè)基本單元,它的基本結(jié)構(gòu)如下圖所示:5.1.1語(yǔ)音識(shí)別聲學(xué)模型在進(jìn)行語(yǔ)音識(shí)別之前我們要做不少準(zhǔn)備工作。先用大量聲音數(shù)據(jù)訓(xùn)練一個(gè)聲學(xué)模型(見(jiàn)圖5-3),用來(lái)將聲音轉(zhuǎn)換為聲學(xué)符號(hào)。我們將要識(shí)別的語(yǔ)音按照一定時(shí)間間隔切割成彼此重疊、很小很小的段落,再通過(guò)聲學(xué)模型將這些小片段識(shí)別成對(duì)應(yīng)的語(yǔ)音狀態(tài)。這些語(yǔ)音狀態(tài)是聲母、韻母的組成部分,能很好地對(duì)語(yǔ)音進(jìn)行描述。5.1.1語(yǔ)音識(shí)別語(yǔ)言模型(LanguageModel,簡(jiǎn)稱(chēng)LM)是一個(gè)用于建模自然語(yǔ)言(即人們?nèi)粘J褂玫恼Z(yǔ)言)的概率模型。簡(jiǎn)單來(lái)說(shuō),語(yǔ)言模型的任務(wù)是評(píng)估一個(gè)給定的詞序列(即一個(gè)句子)在真實(shí)世界中出現(xiàn)的概率。5.1.2語(yǔ)音合成語(yǔ)音合成(TexttoSpeech,TTS)技術(shù),又稱(chēng)文語(yǔ)轉(zhuǎn)換技術(shù),能將任意文字信息實(shí)時(shí)轉(zhuǎn)化為標(biāo)準(zhǔn)流暢的語(yǔ)音朗讀出來(lái),相當(dāng)于給機(jī)器裝上了人工嘴巴(見(jiàn)圖5-6)。它涉及聲學(xué)、語(yǔ)言學(xué)、數(shù)字信號(hào)處理、計(jì)算機(jī)科學(xué)等多個(gè)學(xué)科技術(shù),是信息處理領(lǐng)域的一項(xiàng)前沿技術(shù),解決的主要問(wèn)題就是如何將文字信息轉(zhuǎn)化為可聽(tīng)的聲音信息,即讓機(jī)器像人一樣開(kāi)口說(shuō)話(huà)。5.1.3聲紋識(shí)別人們可以靠聲音判斷對(duì)方是誰(shuí),聲音同樣可以被用來(lái)證明“你是你”.和面容、指紋一樣,人類(lèi)的發(fā)聲器官千差萬(wàn)別,發(fā)出的聲音也不盡相同(見(jiàn)圖5-10)。人聲的這種特質(zhì)被稱(chēng)為聲紋(見(jiàn)圖5-11)。5.1.3聲紋識(shí)別事實(shí)上,錄制和播放的過(guò)程會(huì)讓聲音衰減失真,與真人的聲音相差甚遠(yuǎn),很容易鑒別。或者干脆從產(chǎn)品設(shè)計(jì)層面出發(fā),要求用戶(hù)在規(guī)定時(shí)間內(nèi)說(shuō)出一組隨機(jī)數(shù)字,或者與人臉識(shí)別、指紋識(shí)別等其他識(shí)別手段相結(jié)合,從而提升安全性(見(jiàn)圖5-15).Part02智能語(yǔ)音技術(shù)應(yīng)用5.2智能語(yǔ)音技術(shù)應(yīng)用除了語(yǔ)音導(dǎo)航、智能音箱、語(yǔ)音輸入法等我們?nèi)粘I钪械某R?jiàn)應(yīng)用場(chǎng)景,只要把語(yǔ)音識(shí)別理解成“獲取人類(lèi)語(yǔ)言中的信息”,把語(yǔ)音合成理解成“讓人類(lèi)通過(guò)聲音獲取信息”,再把聲紋識(shí)別、關(guān)鍵詞喚醒等理解成可供選擇的“功能”,將它們與不同載體、場(chǎng)景結(jié)合,就會(huì)形成各種各樣的產(chǎn)品。5.2.1酒店虛擬前臺(tái)酒店前臺(tái)工作人員每天都要撥打和接聽(tīng)大量的電話(huà),經(jīng)常出現(xiàn)接打不及時(shí)、處理問(wèn)題沒(méi)耐心、影響現(xiàn)場(chǎng)接待和客房周轉(zhuǎn)等問(wèn)題?;谌斯ぶ悄芗夹g(shù)的酒店虛擬前臺(tái)可以實(shí)現(xiàn)前臺(tái)電話(huà)智能接打,能夠自動(dòng)完成酒店的到店確認(rèn)、退房確認(rèn)、咨詢(xún)和客需服務(wù)等工作,可同時(shí)接打多人電話(huà),瞬間完成業(yè)務(wù)處理,實(shí)現(xiàn)全程無(wú)人化,帶來(lái)高效智能的前臺(tái)服務(wù),從而提升前臺(tái)業(yè)務(wù)效率,提高客房周轉(zhuǎn)能力,解決人手不足和成本攀升等問(wèn)題。5.2.2語(yǔ)音質(zhì)檢考慮到復(fù)雜業(yè)務(wù)處理或客戶(hù)習(xí)慣喜好,目前仍配有人工客服接打客戶(hù)電話(huà),而為了提升客戶(hù)服務(wù)水平,往往需要進(jìn)行語(yǔ)音質(zhì)檢。傳統(tǒng)的質(zhì)檢是采用人工抽檢方式,質(zhì)檢覆蓋率低且無(wú)法準(zhǔn)確定位問(wèn)題工單。人工聽(tīng)錄音的質(zhì)檢方式,需要長(zhǎng)時(shí)間集中精力,聽(tīng)取大量的無(wú)效信息,導(dǎo)致成本高,效率低,工作強(qiáng)度大。同時(shí)大量未質(zhì)檢的工單中的有效內(nèi)容如客戶(hù)訴求信息、服務(wù)信息等未能得到充分挖掘利用。而借助智能語(yǔ)音技術(shù)可大幅提高質(zhì)檢效率,充分發(fā)揮電話(huà)數(shù)據(jù)價(jià)值。5.2.3智能音箱酒店場(chǎng)合下的公共設(shè)施的操作可以采用語(yǔ)音控制來(lái)避免接觸。5.2.4智能音箱智能音箱不僅是音箱,還是新一代的人機(jī)交互入口。它以藍(lán)牙音箱的形式集播放網(wǎng)絡(luò)音樂(lè)、查詢(xún)各類(lèi)信息、語(yǔ)音娛樂(lè)互動(dòng)甚至控制智能家電等功能于一身。Part03智能語(yǔ)音體驗(yàn)5.3.2語(yǔ)音合成國(guó)內(nèi)外不少人工智能頭部企業(yè)建設(shè)了自己的人工智能開(kāi)放平臺(tái),供外部使用。如科大訊飛的訊飛開(kāi)放平臺(tái)(見(jiàn)圖5-26)、百度的百度AI開(kāi)放圖5-26訊飛開(kāi)放平臺(tái)“語(yǔ)音合成”測(cè)試界面平臺(tái)(見(jiàn)圖5-27)、阿里云的阿里靈杰平臺(tái)(見(jiàn)圖5-28)等。請(qǐng)大家訪(fǎng)問(wèn)這三家企業(yè)的人工智能開(kāi)放平臺(tái),比較三家平臺(tái)的“語(yǔ)音合成”AI能力實(shí)現(xiàn)效果。5.2.3探索與思考(1)在訊飛輸入法中說(shuō)古詩(shī)、說(shuō)文言文、說(shuō)當(dāng)下流行語(yǔ),觀(guān)察其識(shí)別率如何。從聲學(xué)模型和語(yǔ)言模型角度思考,語(yǔ)音識(shí)別準(zhǔn)確率與哪些因素相關(guān)?(2)在使用訊飛輸入法進(jìn)行語(yǔ)音輸入時(shí),距離手機(jī)麥克風(fēng)遠(yuǎn)近、周?chē)h(huán)境安靜程度對(duì)語(yǔ)音識(shí)別率有多大影響?除此,還有哪些外在環(huán)境因素會(huì)影響識(shí)別率?(3)訊飛輸入法支持的方言里,有沒(méi)有你家鄉(xiāng)的方言?若增加一種方言,你認(rèn)為可能要做哪些工作?(4)我們?cè)谶\(yùn)用語(yǔ)音合成技術(shù)時(shí),除了法律法規(guī)之外,還應(yīng)該遵守哪些道德規(guī)范?(5)除了本章介紹的智能語(yǔ)音技術(shù),性別年齡識(shí)別、歌曲識(shí)別、對(duì)話(huà)情緒識(shí)別、語(yǔ)音審核等也是智能語(yǔ)音領(lǐng)域的技術(shù)。你能否結(jié)合你的專(zhuān)業(yè)對(duì)應(yīng)的工作崗位,思考這些語(yǔ)音技術(shù)有哪些應(yīng)用場(chǎng)景?(6)你認(rèn)為智能語(yǔ)音交互會(huì)成為人機(jī)交互的主流方式嗎?為什么?閱讀延展謝謝THANKS第六章自然語(yǔ)言處理

《人工智能應(yīng)用概論(第2版)》RengongZhinengYingyongGailun“十四五”廣西壯族自治區(qū)職業(yè)教育規(guī)劃教材

新編21世紀(jì)高等職業(yè)教育精品教材·通識(shí)課系列Part0101自然語(yǔ)言處理概論P(yáng)art0202自然語(yǔ)言處理技術(shù)原理

Part0303自然語(yǔ)言處理的應(yīng)用場(chǎng)景

錄contentPart0404自然語(yǔ)言處理的典型實(shí)踐案例【案例導(dǎo)入】打開(kāi)翻譯軟件,將中文“三人行,必有我?guī)熝伞狈g成英文,看看哪家的翻譯效果更好。Part01自然語(yǔ)言處理概論6.1.1自然語(yǔ)言處理定義自然語(yǔ)言處理(NaturalLanguageProcessing,NLP)研究的是能實(shí)現(xiàn)人與計(jì)算機(jī)之間用自然語(yǔ)言進(jìn)行有效通信的各種理論和方法。而用自然語(yǔ)言與計(jì)算機(jī)進(jìn)行通信,有著十分重要的實(shí)際應(yīng)用意義,也有著革命性的理論意義。實(shí)現(xiàn)人機(jī)間自然語(yǔ)言通信意味著要使計(jì)算機(jī)既能理解自然語(yǔ)言文本的意義,又能以自然語(yǔ)言文本來(lái)表達(dá)給定的意圖、思想等;前者稱(chēng)為自然語(yǔ)言理解,后者稱(chēng)為自然語(yǔ)言生成。自然語(yǔ)言處理主要應(yīng)用于機(jī)器翻譯、輿情監(jiān)測(cè)、自動(dòng)摘要、觀(guān)點(diǎn)提取、文本分類(lèi)、問(wèn)題回答、文本語(yǔ)義對(duì)比、語(yǔ)音識(shí)別、中文OCR等方面。6.1.2自然語(yǔ)言處理發(fā)展歷程1950年,圖靈提出了著名的“圖靈測(cè)試”,這一般被認(rèn)為是自然語(yǔ)言處理思想的開(kāi)端。20世紀(jì)50年代到70年代,自然語(yǔ)言處理主要采用基于規(guī)則的方法。研究院認(rèn)為自然語(yǔ)言處理的過(guò)程和人類(lèi)學(xué)習(xí)認(rèn)知一門(mén)語(yǔ)言的過(guò)程是類(lèi)似的,所以他們基于這個(gè)觀(guān)點(diǎn)來(lái)進(jìn)行研究。這一階段雖然解決了一些簡(jiǎn)單的問(wèn)題,但是無(wú)法從根本上將自然語(yǔ)言處理實(shí)用化。20世紀(jì)80年代以后,賈里尼克和他所在的IBM華生實(shí)驗(yàn)室是推動(dòng)這一轉(zhuǎn)變的關(guān)鍵,他們采用基于統(tǒng)計(jì)的方法,將當(dāng)時(shí)的語(yǔ)音識(shí)別率從70%提升到90%,從實(shí)驗(yàn)室走向?qū)嶋H應(yīng)用。從2008年到現(xiàn)在,引入深度學(xué)習(xí)來(lái)做自然語(yǔ)言處理研究,由最初的詞向量到2013年的word2vec,將深度學(xué)習(xí)與自然語(yǔ)言處理的結(jié)合推向了高潮,并在機(jī)器翻譯、問(wèn)答系統(tǒng)、閱讀理解等領(lǐng)域取得了一定成功。RNN成為自然語(yǔ)言處理最常用的方法之一后,Transformer、BERT、GNN等模型相繼引發(fā)了一輪又一輪的熱潮。6.1.3自然語(yǔ)言處理未來(lái)展望1)更優(yōu)的算法。人工智能發(fā)展的三要素(數(shù)據(jù)、計(jì)算能力和算法)中,與自然語(yǔ)言處理研究者最相關(guān)的就是算法設(shè)計(jì)。2)語(yǔ)言的深度分析。未來(lái)語(yǔ)言中的難題還需要關(guān)注語(yǔ)義理解,從大規(guī)模網(wǎng)絡(luò)數(shù)據(jù)中,通過(guò)深入的語(yǔ)義分析,結(jié)合語(yǔ)言學(xué)理論,發(fā)現(xiàn)語(yǔ)義產(chǎn)生與理解的規(guī)律,研究數(shù)據(jù)背后隱藏的模式,擴(kuò)充和完善已有的知識(shí)模型,使語(yǔ)義表示更加準(zhǔn)確.語(yǔ)言理解需要理性與經(jīng)驗(yàn)的結(jié)合,理性是先驗(yàn)的,而經(jīng)驗(yàn)可以擴(kuò)充知識(shí),因此需要充分利用世界知識(shí)和語(yǔ)言學(xué)理論指導(dǎo)先進(jìn)技術(shù)來(lái)理解語(yǔ)義。3)多學(xué)科的交叉。在理解語(yǔ)義的問(wèn)題上,需要尋找一個(gè)合適的模型。在模型的探索中,需要充分借鑒語(yǔ)言哲學(xué)、認(rèn)知科學(xué)和腦科學(xué)領(lǐng)域的研究成果,從認(rèn)知的角度去發(fā)現(xiàn)語(yǔ)義的產(chǎn)生與理解,有可能會(huì)為語(yǔ)言理解建立更好的模型。在科技創(chuàng)新的今天,多學(xué)科的交叉可以更好地促進(jìn)自然語(yǔ)言處理的發(fā)展。6.1.4自然語(yǔ)言處理整體體系Part02自然語(yǔ)言處理技術(shù)原理6.2.1自然語(yǔ)言處理整體框架自然語(yǔ)言處理整體框架:包括三部分內(nèi)容信息、自然語(yǔ)言技術(shù)、知識(shí)庫(kù)。其過(guò)程是(1)需要構(gòu)建一個(gè)知識(shí)庫(kù),包含實(shí)體、概念及它們之間的關(guān)系。(2)通過(guò)自然語(yǔ)言模型來(lái)理解和處理文本數(shù)據(jù)。(3)根據(jù)知識(shí)庫(kù)推理得出信息,實(shí)現(xiàn)問(wèn)題回答、文本分類(lèi)等功能。這一過(guò)程涉及數(shù)據(jù)預(yù)處理、特征提取和模型應(yīng)用等關(guān)鍵步驟,旨在讓計(jì)算機(jī)更好地理解人類(lèi)語(yǔ)言。6.2.2自然語(yǔ)言處理技術(shù)從研究?jī)?nèi)容來(lái)看,自然語(yǔ)言處理技術(shù)包括語(yǔ)法分析、語(yǔ)義分析、篇章理解,機(jī)器翻譯、語(yǔ)音識(shí)別及文語(yǔ)轉(zhuǎn)換、信息檢索、信息抽取與過(guò)濾、文本分類(lèi)與聚類(lèi)、輿情分析和觀(guān)點(diǎn)挖掘等等.。6.2.3自然語(yǔ)言處理關(guān)鍵技術(shù)1-分詞等分詞、詞性標(biāo)注、句法分析、命名實(shí)體識(shí)別(1)分詞模塊負(fù)責(zé)將輸入的漢字序列切分成單詞序列,在該例子中經(jīng)過(guò)分詞的輸出是“我/愛(ài)/自然語(yǔ)言處理”。(2)詞性標(biāo)注模塊負(fù)責(zé)為分詞結(jié)果中的每個(gè)單詞標(biāo)注一個(gè)詞性,如名詞、動(dòng)詞、形容詞、連詞、副詞、標(biāo)點(diǎn)符號(hào)等。(3)依存句法分析模塊負(fù)責(zé)預(yù)測(cè)句子中單詞與單詞間的依存關(guān)系,確定句子的句法結(jié)構(gòu),包括主、謂、賓、定、補(bǔ)、狀等,并用樹(shù)狀結(jié)構(gòu)來(lái)表示整句的句法結(jié)構(gòu)。(4)命名實(shí)體識(shí)別模塊負(fù)責(zé)從文本中識(shí)別出具有特定意義的實(shí)體,如人名、地名、機(jī)構(gòu)名、專(zhuān)有名詞等。6.2.4自然語(yǔ)言處理關(guān)鍵技術(shù)2-消除語(yǔ)言歧義人類(lèi)的語(yǔ)言多元且復(fù)雜,言語(yǔ)交流中同一個(gè)句子通常不止一種含義,自然語(yǔ)言處理的難題之一就是消除語(yǔ)言歧義(見(jiàn)圖6-5),即消除如詞法分析、句法分析、語(yǔ)義分析等過(guò)程中存在的歧義問(wèn)題,簡(jiǎn)稱(chēng)消歧。6.2.4自然語(yǔ)言處理關(guān)鍵技術(shù)2-消除語(yǔ)言歧義第一,語(yǔ)言中充滿(mǎn)了歧義,這主要體現(xiàn)在詞法、句法及語(yǔ)義三個(gè)層次上。歧義的產(chǎn)生是由于自然語(yǔ)言所描述的對(duì)象——人類(lèi)活動(dòng)非常復(fù)雜,而語(yǔ)言的詞匯和句法規(guī)則又是有限的,這就造成同一種語(yǔ)言形式可能具有多種含義。第二,消除歧義所需要的知識(shí)在獲取、表達(dá)以及運(yùn)用上存在困難。由于語(yǔ)言處理的復(fù)雜性,因此合適的語(yǔ)言處理方法和模型難以設(shè)計(jì)。從上述兩個(gè)主要困難可以看出,自然語(yǔ)言處理這個(gè)難題的根源是人類(lèi)語(yǔ)言的復(fù)雜性和語(yǔ)言描述的外部世界的復(fù)雜性。為解決語(yǔ)義歧義問(wèn)題,目前常見(jiàn)的算法策略有基于貝葉斯分類(lèi)、基于信息論、基于詞典等消歧算法。消除語(yǔ)言歧義的基本過(guò)程如圖6-6所示。圖6-6消除語(yǔ)言歧義的基本過(guò)程6.2自然語(yǔ)言處理的應(yīng)用場(chǎng)景自然語(yǔ)言理解和自然語(yǔ)言生成是自然語(yǔ)言處理的兩大任務(wù),如圖6-7所示。接下來(lái)我們從這兩大任務(wù)去了解自然語(yǔ)言處理的應(yīng)用場(chǎng)景。Part03自然語(yǔ)言處理應(yīng)用場(chǎng)景6.3.1應(yīng)用場(chǎng)景自然語(yǔ)言理解(NaturalLanguageUnderstanding,NLU)和自然語(yǔ)言生成(NaturalLanguageGeneration,NLG)是自然語(yǔ)言處理的兩大任務(wù),如圖6-7所示。接下來(lái)我們從這兩大任務(wù)去了解自然語(yǔ)言處理的應(yīng)用場(chǎng)景。6.3.2智能問(wèn)答智能問(wèn)答系統(tǒng)通常分為知識(shí)型機(jī)器人、閑聊型機(jī)器人和任務(wù)型機(jī)器人(客服機(jī)器人)。知識(shí)型機(jī)器人主要用于解決用戶(hù)的問(wèn)題,例如商品購(gòu)買(mǎi)咨詢(xún)、商品退貨咨詢(xún)等;閑聊型機(jī)器人主要用于深入地與用戶(hù)進(jìn)行無(wú)目的交流;任務(wù)型機(jī)器人(客服機(jī)器人)主要用于完成用戶(hù)的某些特定任務(wù),例如買(mǎi)機(jī)票、話(huà)費(fèi)充值或者天氣咨詢(xún)。6.3.3智能寫(xiě)作近年自然語(yǔ)言處理模型性能的不斷突破,促使其從規(guī)則、模板寫(xiě)作發(fā)展到了以神經(jīng)網(wǎng)絡(luò)模型為核心的智能寫(xiě)作,從輔助記者創(chuàng)作逐步走向自動(dòng)化寫(xiě)作,應(yīng)用場(chǎng)景也從模板化的資訊類(lèi)數(shù)據(jù)報(bào)告,深入分析報(bào)告、詩(shī)歌創(chuàng)作、長(zhǎng)故事文本創(chuàng)作、廣告營(yíng)銷(xiāo)文本寫(xiě)作等更豐富、復(fù)雜的內(nèi)容形式,貫穿信息監(jiān)管、素材采集、文本編輯、文本創(chuàng)作、修改優(yōu)化、敏感信息審核等多項(xiàng)業(yè)務(wù)環(huán)節(jié)。6.3.4文本情感分析情感分析作為一種常見(jiàn)的自然語(yǔ)言處理方法的應(yīng)用,可以從大量數(shù)據(jù)中識(shí)別和吸收相關(guān)信息,而且可以理解更深層次的含義。例如:企業(yè)分析消費(fèi)者對(duì)產(chǎn)品的反饋信息,或者檢測(cè)在線(xiàn)評(píng)論中的差評(píng)信息等。通過(guò)情感分析,可以挖掘產(chǎn)品在各個(gè)維度的優(yōu)劣勢(shì),明確如何改進(jìn)產(chǎn)品。如對(duì)外賣(mài)評(píng)價(jià)進(jìn)行情感分析,分析菜品口味、送達(dá)時(shí)間、送餐態(tài)度、菜品豐富度等多個(gè)維度的用戶(hù)情感指數(shù),從而從各個(gè)維度上改進(jìn)外賣(mài)服務(wù)。6.3.4文本情感分析1、基于情感詞典的情感分類(lèi)方法先對(duì)文本進(jìn)行分詞和停用詞處理等預(yù)處理,再利用事先構(gòu)建好的情感詞典,對(duì)文本進(jìn)行字符串匹配,從而挖掘正面和負(fù)面信息。情感詞典包含積極詞語(yǔ)、消極詞語(yǔ)、否定詞、程度副詞表四部分。6.3.4文本情感分析2、基于詞典的文本匹配算法相對(duì)簡(jiǎn)單。遍歷語(yǔ)句中分詞后的詞語(yǔ),如果詞語(yǔ)命中詞典,則進(jìn)行相應(yīng)權(quán)重的處理。積極詞語(yǔ)權(quán)重為加法,消極詞語(yǔ)權(quán)重為減法,否定詞權(quán)重取相反數(shù),程度副詞權(quán)重則和它修飾的詞語(yǔ)權(quán)重相乘,如圖6-9所示。利用最終輸出的權(quán)重值,可以區(qū)分是積極、消極還是中性情感。6.3.5市場(chǎng)上較前沿的自然語(yǔ)言模型【OpenAI】ChatGPT(ChatGenerativePre-trainedTransformer)是OpenAI研發(fā)的一款聊天機(jī)器人程序,于2022年11月30日發(fā)布。ChatGPT是人工智能技術(shù)驅(qū)動(dòng)的自然語(yǔ)言處理工具,它能夠基于在預(yù)訓(xùn)練階段所見(jiàn)的模式和統(tǒng)計(jì)規(guī)律來(lái)生成回答,還能根據(jù)聊天的上下文進(jìn)行互動(dòng),真正像人類(lèi)一樣來(lái)聊天交流,甚至能完成寫(xiě)郵件、視頻腳本、文案、代碼、論文等任務(wù)。【科大訊飛】訊飛星火認(rèn)知大模型是。該模型具有七大核心能力,即文本生成、語(yǔ)言理解、知識(shí)問(wèn)答、邏輯推理、數(shù)學(xué)能力、代碼能力、多模交互。該模型開(kāi)放半年內(nèi)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論