項(xiàng)目11-智能語音_第1頁
項(xiàng)目11-智能語音_第2頁
項(xiàng)目11-智能語音_第3頁
項(xiàng)目11-智能語音_第4頁
項(xiàng)目11-智能語音_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

信息技術(shù)與人工智能基礎(chǔ)項(xiàng)目11

智能語音01項(xiàng)目背景02思維導(dǎo)圖03思政聚焦04項(xiàng)目相關(guān)知識05項(xiàng)目任務(wù)目錄CONTENTS06項(xiàng)目小結(jié)與展望01項(xiàng)目背景智能語音技術(shù)介紹“當(dāng)我們?nèi)ゲ宛^吃飯,一個(gè)語音機(jī)器人幫助你完成菜單推薦、價(jià)格咨詢、特色介紹、買單結(jié)賬等行為。這些需求都可以由機(jī)器人理解并形成服務(wù)需求發(fā)給離你最近的服務(wù)人員,從而避免了你不斷招手,而服務(wù)員來回奔跑的過程。此外,你在開車的時(shí)候,可以詢問“附近的加油站”、“肚子餓了去哪里”;回家的時(shí)候?qū)χ悄芤粝湔f幫你開空調(diào)、開窗簾等都是智能語音技術(shù)的典型應(yīng)用。

這段感性認(rèn)識很重要,請仔細(xì)修改,寫完整、寫通順,建議先寫感性內(nèi)容,再講上面的理論。理論部分也可以不寫,項(xiàng)目概述的意義是引導(dǎo)教學(xué),理論可以放到后面再講。

已修改、還不夠好,回頭再完善一下。智能語音技術(shù)應(yīng)用

智能語音技術(shù)相關(guān)產(chǎn)品很早就已經(jīng)走入了我們生活,如蘋果的Siri、微軟的Cortanna、百度的小愛音箱

、阿里巴巴的天貓精靈等,它們可以解決日常生活中很多的人機(jī)交互問題。

這是小米的產(chǎn)品?

小愛是百度的產(chǎn)品。02思維導(dǎo)圖項(xiàng)目五思維導(dǎo)圖03思政聚焦智能語音技術(shù)應(yīng)用2019年學(xué)習(xí)強(qiáng)國2.5.0版本于蘋果商店和安卓商店同步上線,其中圖文內(nèi)容新增語音播報(bào)功能,以實(shí)用性強(qiáng)、高逼真度受到用戶好評。語音播報(bào)的“強(qiáng)伴隨性”恰是學(xué)習(xí)最大的優(yōu)勢,音頻播報(bào)流量使用不大、所占介質(zhì)內(nèi)存空間?。淮蚱茣r(shí)空限制,合理利用碎片化時(shí)間學(xué)習(xí)。開車途中、地鐵里、公交上、跑步時(shí),只要你想學(xué),隨時(shí)隨地,即可投入專屬個(gè)人的沉浸式學(xué)習(xí)。從最開始的語音播報(bào),到聲貌都惟妙惟肖的多語種人工智能虛擬主播,背后其實(shí)是不斷迭代升級的人工智能技術(shù)。其中,語音播報(bào)核心技術(shù)是語音合成。04項(xiàng)目知識準(zhǔn)備智能語音交互智能語音是人工智能技術(shù)的重要組成部分,實(shí)現(xiàn)了人機(jī)語言的通信,其主要技術(shù)包括了語音識別(AutomaticSpeechRecognition,ASR)和語音合成(Text-To-Speech,TTS)。語音識別是讓機(jī)器能夠“聽見”周圍的聲音實(shí)現(xiàn)機(jī)器感知智能;語音合成則是讓機(jī)器模仿人類“說出”給定的文字內(nèi)容。因此,智能語音技術(shù)既模擬了人類的耳朵又模擬了人類的嘴巴語音識別的概述語音識別的目的就是讓機(jī)器明白你說什么,而語音識別的過程就是機(jī)器模擬人類的聽覺系統(tǒng)的過程。因此,語音識別技術(shù)就是讓機(jī)器通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)槲谋竞椭噶畹募夹g(shù)。語音識別技術(shù)主要包括特征提取技術(shù)、模式匹配準(zhǔn)則及模型訓(xùn)練技術(shù)三個(gè)方面。RadioRex2052565980初80末語音識別的歷史貝爾實(shí)驗(yàn)室模擬電子器件RCA實(shí)驗(yàn)室統(tǒng)計(jì)學(xué)的原理數(shù)據(jù)庫語音查詢系統(tǒng)、辦公語音助手系統(tǒng)和筆記記錄聽寫機(jī)隱馬爾科夫模型神經(jīng)網(wǎng)絡(luò)00云模式語音識別相關(guān)技術(shù)與面臨的挑戰(zhàn)相關(guān)技術(shù)面臨挑戰(zhàn)上文內(nèi)容對語音信號的語義產(chǎn)生的影響;發(fā)音人的口音、發(fā)音的方式與習(xí)慣會導(dǎo)致語音特征在參數(shù)空間分布的不同;發(fā)音人心理和生理變化直接影響了語音信號的變化;環(huán)境及各種突發(fā)的干擾等因素造成的語音信號失真問題。語音合成的概述語音合成技術(shù)是通過機(jī)械的、電子的方法來模仿人類的語音的技術(shù)。它能將你輸入的句子實(shí)時(shí)轉(zhuǎn)化為標(biāo)準(zhǔn)語音流暢的朗讀出來,整個(gè)過程如同人類邊看文本內(nèi)容變朗讀出來的過程。它主要如何讓機(jī)器像人一樣開口說話,涉及的技術(shù)包括聲學(xué)、語言學(xué)、數(shù)字信號處理、計(jì)算機(jī)科學(xué)等多個(gè)學(xué)科技術(shù)。起源階段18-19世紀(jì)19301980199020xx今天語音合成的歷史電子合成器階段共振峰合成器階段單元挑選拼接合成階段基于機(jī)器學(xué)習(xí)技術(shù)合成階段DNN/CNN/RNN語音合成相關(guān)技術(shù)與面臨的挑戰(zhàn)相關(guān)技術(shù)面臨挑戰(zhàn)如何處理遠(yuǎn)場復(fù)雜環(huán)境的挑戰(zhàn)如何讓語義理解更智能如何滿足在不同場景下人們的個(gè)性化需求。04項(xiàng)目任務(wù)任務(wù)1:制作一個(gè)語音識別器1、任務(wù)描述本任務(wù)實(shí)踐的主要目的是掌握語音識別的過程。首先通過了解認(rèn)識語音信號,學(xué)習(xí)如何去可視化不同類別音頻信號,并通過不同技術(shù)來處理語音信號來制作一個(gè)語音識別系統(tǒng)。任務(wù)1:制作一個(gè)語音識別器2、技術(shù)分析音頻信號結(jié)構(gòu)時(shí)域信號與頻域信號音頻特征提取語音中文字的識別任務(wù)1:制作一個(gè)語音識別器3、任務(wù)實(shí)現(xiàn)---請大家掃二維碼根據(jù)步驟測試實(shí)現(xiàn)任務(wù)2:制作一個(gè)語音合成器1、任務(wù)描述本任務(wù)實(shí)踐的主要目的是掌握語音合成的過程。首先通過制作一段合成電子音樂了解基于波形拼接的語音合成過程。然后,輸入一段文本來展示基于深度學(xué)習(xí)的智能語音合成效果。任務(wù)2:制作一個(gè)語音合成器2、技術(shù)分析語調(diào)語速語音庫任務(wù)1:制作一個(gè)語音合成器3、任務(wù)實(shí)現(xiàn)---請大家掃二維碼根據(jù)步驟測試實(shí)現(xiàn)04項(xiàng)目小結(jié)與展望項(xiàng)目小結(jié)

本章介紹了智能語音技術(shù)的概念、發(fā)展歷程、相關(guān)的技術(shù)與挑戰(zhàn)等內(nèi)容。以制作一個(gè)語音識別器和語音合成器這兩個(gè)項(xiàng)目實(shí)踐,對智能語音的兩大關(guān)鍵技術(shù)的應(yīng)用做了案例具體實(shí)現(xiàn)。其中語音識別實(shí)現(xiàn)過程主要包括音頻基本信息的查看、音頻信號可視化、頻域信號的可視化、信號的MFCC特征可視化、信號的FilterBank特征可視化、根據(jù)語言模型識別出文字等重要步驟。制作一個(gè)語音合成器則試聽電子合成音樂、制作電子合成音樂、語音合成文本分詞、文本詞語拼音生成、選擇合成的參數(shù)來合成給定文本的語音。讀者可以在學(xué)習(xí)智能語音技術(shù)理論的基礎(chǔ)上動(dòng)手實(shí)踐,體會到智能語音應(yīng)用的趣味。。項(xiàng)目展望目前的智能語音已經(jīng)應(yīng)用于各種場景,產(chǎn)生了很多可落地的成熟產(chǎn)品。當(dāng)前基于深度學(xué)習(xí)的語音識別和語音合成技術(shù)已經(jīng)可以做很好了,滿足了市場上絕大部分需求。當(dāng)前的主要

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論