多媒體技術(shù)及應(yīng)用(第3版) 課件 第1、2章 多媒體技術(shù)基礎(chǔ)-音頻處理技術(shù)與應(yīng)用_第1頁
多媒體技術(shù)及應(yīng)用(第3版) 課件 第1、2章 多媒體技術(shù)基礎(chǔ)-音頻處理技術(shù)與應(yīng)用_第2頁
多媒體技術(shù)及應(yīng)用(第3版) 課件 第1、2章 多媒體技術(shù)基礎(chǔ)-音頻處理技術(shù)與應(yīng)用_第3頁
多媒體技術(shù)及應(yīng)用(第3版) 課件 第1、2章 多媒體技術(shù)基礎(chǔ)-音頻處理技術(shù)與應(yīng)用_第4頁
多媒體技術(shù)及應(yīng)用(第3版) 課件 第1、2章 多媒體技術(shù)基礎(chǔ)-音頻處理技術(shù)與應(yīng)用_第5頁
已閱讀5頁,還剩90頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第1章多媒體技術(shù)基礎(chǔ)1.1多媒體概述1.2多媒體系統(tǒng)1.3多媒體作品1.1.1多媒體的基本概念1.媒體的含義

存儲信息的實(shí)體:如磁盤、磁帶、光盤、紙張等。

表示信息的載體:如文字、聲音、圖形圖像、動畫、視頻和語言等。

傳播信息的載體:如電視、電影、報紙、雜志、網(wǎng)絡(luò)等。2.媒體的類型

感覺媒體:作用于人的感官,使人能直接產(chǎn)生感覺的一類媒體。

如語言、音樂,聲效、圖形、圖像、文字和數(shù)據(jù)等。表示媒體:感覺媒體的表示媒介。如圖像編碼和聲音編碼等。

表現(xiàn)媒體:用于通信中使電信號和感覺媒體之間產(chǎn)生轉(zhuǎn)換用的媒體。

如輸出設(shè)備,包括顯示器和打印機(jī)等。

存儲媒體:存放媒體的物理載體,如磁盤、磁帶、光盤等。

傳輸媒體:傳輸媒體的物理載體。如電話線、電纜和光纜等。1.1.1多媒體的基本概念多媒體:主要包括文字、圖形、圖像、聲音、動畫和視頻等多種信息載體。多媒體技術(shù):利用計算機(jī)及相應(yīng)的多媒體設(shè)備,采用數(shù)字化處理技術(shù),將多種媒體有機(jī)結(jié)合起來進(jìn)行處理的技術(shù)。新媒體:是相對于傳統(tǒng)媒體而言,利用數(shù)字技術(shù)、網(wǎng)絡(luò)技術(shù)和移動技術(shù)等,通過網(wǎng)絡(luò)及各種終端設(shè)備,向用戶提供信息和娛樂服務(wù)的傳播形態(tài)。如數(shù)字雜志與報紙、數(shù)字廣播與電視、微信與微博等等。具有交互性、即時性、海量性與共享性等特點(diǎn)。1.1.2多媒體技術(shù)的發(fā)展多媒體技術(shù)最早起源于20世紀(jì)80年代中期。1984年:美國Apple公司推出了世界上第一臺具有多媒體特性的Macintosh計算機(jī),具有了圖形用戶界面和用鼠標(biāo)進(jìn)行交互。1985年:美國Commodore公司推出了世界上第一臺真正的多媒體系統(tǒng)Amiga,具有了完備的視聽處理功能,CD-ROM則實(shí)現(xiàn)了大容量多媒體信息的存儲和處理,促進(jìn)了多媒體技術(shù)的發(fā)展。1986年:Philips公司和Sony公司聯(lián)合研制并推出了CD-I標(biāo)準(zhǔn),使多媒體信息的存儲規(guī)范化和標(biāo)準(zhǔn)化,用戶可以通過交互的方式播放光盤中的內(nèi)容。1.1.2多媒體技術(shù)的發(fā)展今后發(fā)展的方向:多樣化、集成化、網(wǎng)絡(luò)化、快速化和智能化1990年:Microsoft和Philips等10多家廠商制定了多媒體個人計算機(jī)標(biāo)準(zhǔn)

MPC1。1996年:推出杜比數(shù)字環(huán)繞音響AC97標(biāo)準(zhǔn),使聽覺達(dá)到了環(huán)繞立體音的效果。1997年:Intel公司推出了具有多媒體擴(kuò)展指令集MMX)的CPU,成為多媒體計算機(jī)新的標(biāo)準(zhǔn)。1999年:英偉達(dá)公司推出的GPU使得計算機(jī)處理圖形圖像更加高效,尤其在3D圖形處理時通過硬件實(shí)現(xiàn)光影轉(zhuǎn)換,解決了高質(zhì)量圖像顯示需要的透明性、運(yùn)動模糊、景深控制、光線跟蹤和實(shí)時渲染等問題。多媒體技術(shù)的應(yīng)用多媒體技術(shù)的應(yīng)用已經(jīng)滲透到了各個方面,主要包括:文化娛樂、在線教育、遠(yuǎn)程醫(yī)療、軍事演練和視頻監(jiān)控等。在線教育遠(yuǎn)程醫(yī)療互動游戲與娛樂軍事演練電視電話會議模擬駕駛物聯(lián)網(wǎng)視頻監(jiān)控1.1.3多媒體的關(guān)鍵技術(shù)

數(shù)據(jù)壓縮/解壓縮技術(shù)網(wǎng)絡(luò)多媒體技術(shù)

流媒體技術(shù)多媒體數(shù)據(jù)庫技術(shù)

VR/AR/MR技術(shù)第1章多媒體技術(shù)基礎(chǔ)1.1多媒體概述1.2多媒體系統(tǒng)1.3多媒體作品1.2多媒體系統(tǒng)多媒體軟件系統(tǒng)多媒體應(yīng)用軟件多媒體處理系統(tǒng)多媒體操作系統(tǒng)多媒體硬件系統(tǒng)多媒體設(shè)備計算機(jī)硬件1.2.1多媒體硬件系統(tǒng)1.2.1多媒體硬件系統(tǒng)聲卡視頻卡1394接口并行口也可以用無線或藍(lán)牙傳輸數(shù)據(jù)打印機(jī)投影儀數(shù)碼相機(jī)數(shù)碼攝像機(jī)掃描儀外置刻錄機(jī)電視機(jī)Midi設(shè)備USB口耳機(jī)揚(yáng)聲器麥克風(fēng)1.多媒體輸入輸出設(shè)備輸入設(shè)備輸出設(shè)備鼠標(biāo)麥克風(fēng)掃描儀數(shù)碼相機(jī)攝像機(jī)光筆數(shù)位板耳機(jī)揚(yáng)聲器打印機(jī)刻錄機(jī)投影儀繪圖儀用于將聲音信號轉(zhuǎn)換為電信號的錄音設(shè)備1.多媒體輸入輸出設(shè)備—麥克風(fēng)●

動圈麥:利用電磁感應(yīng)原理將聲波轉(zhuǎn)變成了電訊號。●電容麥:電容式麥克風(fēng)有兩塊金屬極板,聲音的振動能使兩塊極板之間的距離發(fā)生改變,導(dǎo)致電容C改變,而電量Q不變,這樣就會引起電壓的變化,從而將聲波轉(zhuǎn)變成了電訊號。由于采用超薄的振動膜,體積小、重量輕、靈敏度高且頻率響應(yīng)寬,適合超小型麥克風(fēng),缺點(diǎn)是結(jié)構(gòu)復(fù)雜、造價昂貴,音膜脆弱且怕潮。

利用電子傳感器把光學(xué)影像轉(zhuǎn)換成電子數(shù)據(jù)的照相機(jī)。1.多媒體輸入輸出設(shè)備—數(shù)碼相機(jī)數(shù)碼相機(jī)的工作原理

將數(shù)碼照相機(jī)的鏡頭對著被拍攝的物體,按動快門,圖像便被分成紅、綠、藍(lán)三種光線,然后投影在CCD(電荷耦合器件)上,CCD把光線轉(zhuǎn)換成電荷,電荷強(qiáng)度隨影像反射光線的強(qiáng)度而改變,然后CCD把這些電荷送到模/數(shù)轉(zhuǎn)換器,對光線數(shù)據(jù)編碼,存儲在相機(jī)的存儲卡中。數(shù)碼相機(jī)的性能指標(biāo)1)分辨率:分辨率越高,打印的照片尺寸越大;2)顏色深度:24位或36位,可以生成真彩色的圖像;3)存儲能力及存儲介質(zhì):決定了相機(jī)可拍攝照片的數(shù)量;4)數(shù)據(jù)輸出方式:支持高清格式和wifi傳輸;5)連續(xù)拍攝:間隔越短越好;鏡頭類型快門速度光圈大小傳統(tǒng)相機(jī)單反數(shù)碼相機(jī)1.多媒體輸入輸出設(shè)備—數(shù)碼相機(jī)

又叫速拍儀或備課王,可以進(jìn)行高速掃描,具有光學(xué)字符識別(OCR)功能,能夠?qū)呙璧膱D片識別轉(zhuǎn)換成可編輯的Word文檔,還能進(jìn)行拍照、錄像、復(fù)印、制作電子書等。

高拍儀擁有活動的結(jié)構(gòu),能對空間的任何物品進(jìn)行拍攝并投影。1.多媒體輸入輸出設(shè)備—高拍儀用于將靜態(tài)圖像掃描到計算機(jī)里1.多媒體輸入輸出設(shè)備—掃描儀平板掃描儀的工作過程:1)掃描儀的光源發(fā)出均勻光線照到圖像表面;2)經(jīng)過A/D轉(zhuǎn)換,把當(dāng)前掃描線的圖像轉(zhuǎn)換成電信號;3)掃描頭往前移動,讀取下一行圖像數(shù)據(jù);4)經(jīng)過掃描儀的CPU處理后,圖像數(shù)據(jù)暫存在緩沖區(qū)中;5)按照先后順序把圖像數(shù)據(jù)傳輸至計算機(jī)并存儲。1)分辨率水平分辨率×垂直分辨率(dpi)

水平分辨率:由傳感器單元數(shù)量決定,分辨率越高,掃描的圖像越清晰。

垂直分辨率:是步進(jìn)電機(jī)在平板上移動時所走的步數(shù)。2)灰度:灰度越高圖像的層次越豐富。3)色彩位數(shù):決定掃描儀對顏色的區(qū)分能力。一般的掃描儀至少有30位色彩位數(shù),能表示230種顏色。4)掃描速度:在指定的分辨率和圖像尺寸下的掃描時間。5)掃描幅面:掃描儀支持的幅面大小,如A4、A3、A1和A0。掃描儀的主要性能指標(biāo)1.多媒體輸入輸出設(shè)備—掃描儀2.多媒體接口設(shè)備—聲卡(1)聲卡的組成與功能音頻信號處理芯片:處理輸入的音頻信號,它控制采樣頻率和采樣精度。

音效合成芯片:控制輸出音頻信號的高低音和各種音效。

數(shù)模轉(zhuǎn)換電路:進(jìn)行模/數(shù)和數(shù)/模轉(zhuǎn)換。2.多媒體接口設(shè)備—聲卡錄制與播放聲音文件:能夠錄入外部的聲音信號,并轉(zhuǎn)換成音頻文件保存。播放就是把處理好的音頻信號通過揚(yáng)聲器或耳機(jī)輸出。編輯與合成音樂文件:對聲音文件進(jìn)行多種特殊處理,例如,加入回聲、倒放、淡入淡出、單聲道放音和雙聲道交叉放音等,使得數(shù)字化的聲音獲得所需的音響效果。MIDI音樂的合成:用于外部電子樂器與計算機(jī)之間的通信,實(shí)現(xiàn)對帶有MIDI接口的電子樂器的控制和操作。(1)聲卡的組成與功能(2)聲卡的接口2.多媒體接口設(shè)備—聲卡又稱視頻捕捉卡,用于獲取數(shù)字化視頻信息,并將其存儲和顯示。2.多媒體接口設(shè)備—視頻采集卡和采集設(shè)備2.多媒體接口設(shè)備—視頻采集卡和采集設(shè)備2.多媒體接口設(shè)備—視頻采集卡和采集設(shè)備2.多媒體接口設(shè)備—顯卡

又稱顯示器適配卡,連接主機(jī)與顯示器的接口卡,作用是將主機(jī)的輸出信息轉(zhuǎn)換成字符、圖形和顏色等信息,傳送到顯示器上顯示。主要型號:AMD(超微半導(dǎo)體)的RX系列NVIDIA(英偉達(dá))的RTX系列和GTX系列和P系列2.多媒體接口設(shè)備—通用接口①

USB端口:是一個外部總線標(biāo)準(zhǔn),用于規(guī)范電腦與外部設(shè)備的連接和通訊,USB傳輸速度更快,支持熱插拔以及連接多個設(shè)備的特點(diǎn)。②

交互控制接口:用來連接觸摸屏、鼠標(biāo)、光筆等人機(jī)交互設(shè)備。3.多媒體存儲設(shè)備—CD系列CD類型特點(diǎn)CD-DA存放數(shù)字化的音樂節(jié)目CD-G存放靜止圖像和音樂節(jié)目CD-V存放模擬的電視圖像和數(shù)字化的聲音CD-ROM存放數(shù)字化的文字、圖形、圖像和聲音等CD-I存放數(shù)字化的文字、圖形、聲音、靜止圖像和動畫等VideoCD存放數(shù)字化的電影、電視等節(jié)目CD原指激光唱盤,即CD-DA,用于存放數(shù)字化的音樂節(jié)目。①CD-ROM(只讀光盤):利用凹坑的邊緣來記錄1,平坦部分記錄0,利用激光束來讀出數(shù)據(jù),其物理特性決定了只能讀取光盤上的數(shù)據(jù)。3.多媒體存儲設(shè)備—CD系列②CD-R(一次寫光盤):就是在反射層下多了一個記錄層,CD-R可以分多次寫入數(shù)據(jù),只能寫入到以前沒有寫入過的區(qū)域。③CD-RW(可擦寫光盤):相變型可擦寫光盤利用激光使記錄介質(zhì)在結(jié)晶態(tài)和非結(jié)晶態(tài)之間的可逆相變結(jié)構(gòu)來記錄數(shù)據(jù)和擦除數(shù)據(jù)。數(shù)字視頻光盤(DigitalVideoDisc,DVD):主要用來存放視頻節(jié)目,也可以存儲其他類型的數(shù)據(jù),單層單面容量為4.7GB,雙層雙面容量可達(dá)17GB。3.多媒體存儲設(shè)備—DVD和BD藍(lán)光光盤(Blu-RayDisc,BD):由一片厚度為1.1Mm的記錄層和厚度為0.1Mm的透明保護(hù)層復(fù)合而成采用波長為405Nm藍(lán)紫色激光,容

量25GB左右,最高可達(dá)200GB。三種光盤結(jié)構(gòu)的比較3.多媒體存儲設(shè)備—優(yōu)盤、固態(tài)硬盤U盤:又叫優(yōu)盤或閃盤:通過USB接口與電子設(shè)備連接,可即插即用,目前容量可達(dá)2TB。固態(tài)硬盤(SSD):是用固態(tài)電子存儲芯片陣列制成的硬盤?;陂W存的固態(tài)硬盤:采用FLASH芯片作為存儲介質(zhì),即SSD,優(yōu)點(diǎn)是可移動,數(shù)據(jù)保護(hù)不受電源控制,能適應(yīng)于各種環(huán)境,適合于個人用戶使用,使用壽命較長?;趧討B(tài)隨機(jī)存取存儲器(DRAM):是一種高性能的存儲器,理論上可無限次寫入,但是需要獨(dú)立電源來保護(hù)數(shù)據(jù)安全?;?DXPoint類:原理上接近DRAM,但是屬于非易失存儲,有接近無限的存儲壽命。缺點(diǎn)是成本極高,多用于發(fā)燒級臺式機(jī)和數(shù)據(jù)中心。3.多媒體存儲設(shè)備—存儲卡存儲卡:利用閃存技術(shù)來存儲信息的一種存儲器,一般作為數(shù)碼相機(jī)、掌上電腦和MP3等數(shù)碼產(chǎn)品的存儲介質(zhì)。1.2.2多媒體軟件系統(tǒng)多媒體軟件系統(tǒng)多媒體素材制作軟件多媒體創(chuàng)作軟件多媒體操作系統(tǒng)多媒體驅(qū)動程序多媒體播放軟件多媒體轉(zhuǎn)換軟件1.2.3多媒體應(yīng)用系統(tǒng)設(shè)計

需求分析腳本設(shè)計多媒體素材制作多媒體集成與調(diào)試多媒體作品包裝與發(fā)布第1章多媒體技術(shù)基礎(chǔ)1.1多媒體概述1.2多媒體系統(tǒng)1.3多媒體作品1.3.1多媒體作品制作要求—作品選題

作品主題必須健康向上,最好結(jié)合自己的專業(yè)知識、社會熱點(diǎn)和焦點(diǎn)問題、自己的興趣愛好;鼓勵大家弘揚(yáng)中華的優(yōu)秀傳統(tǒng)文化,通過多媒體技術(shù)生動形象地展示身邊的“真善美”,樹立正確的人生觀和世界觀,同時發(fā)揮各專業(yè)學(xué)生的學(xué)科特色,提升其專業(yè)審美能力。選題建議

①可行性:是否具備必要的硬件和軟件,只有條件允許才能完成作品的制作

②實(shí)用性:作品展示的內(nèi)容具有一定的實(shí)際意義或應(yīng)用價值。

③新穎性:反映的是最新的社會問題,如目前社會關(guān)注的熱點(diǎn)或焦點(diǎn)問題

或反映最新的科學(xué)技術(shù)成果等1.3.1多媒體作品制作要求—作品規(guī)劃內(nèi)容規(guī)劃內(nèi)容前后要保持一致和連續(xù)內(nèi)容表現(xiàn)形式要生動和豐富多彩,避免呆板和重復(fù)原創(chuàng)性要求:盡可能采用自己原創(chuàng)設(shè)計與制作的素材結(jié)構(gòu)規(guī)劃采用模塊化設(shè)計方式,首先確定由哪幾個模塊組成,各個模塊之間的關(guān)系或過渡方式;如果是交互式作品設(shè)計還必須考慮導(dǎo)航結(jié)構(gòu),按照導(dǎo)航策略畫出模塊之間的關(guān)系圖。進(jìn)度規(guī)劃將任務(wù)進(jìn)行詳細(xì)的分解寫出每一階段必須完成的任務(wù)和所要達(dá)到的目標(biāo)1.3.1多媒體作品制作要求—作品要求技術(shù)要求不限定作品制作所選用軟件作品內(nèi)容和表現(xiàn)形式也不限定要求作品必須是原創(chuàng)完成形式可以獨(dú)自完成,也可以2到3人組成一個團(tuán)隊一起完成人數(shù)越多,對作品的要求也越高,注意合理分工格式要求一個視頻或動畫文件,可以進(jìn)行順序播放或進(jìn)行交互控制視頻文件一般不要太大,可以是mp4,mov,wmv等格式文檔要求作品主題和特色介紹;作品的構(gòu)思和組成;作品格式和運(yùn)行要求;作品的詳細(xì)分工介紹;作品的詳細(xì)制作步驟;心得體會或意見與建議。1.3.1多媒體作品制作要求—作品設(shè)計原則界面設(shè)計原則簡潔明了:內(nèi)容要簡潔,色彩搭配要協(xié)調(diào),讓用戶能夠一目了然;布局合理:作品前后要保持風(fēng)格一致;要突出重點(diǎn);適應(yīng)性:就是對不同用戶提供不同的接受方式和操作方法;動靜結(jié)合:讓原本靜止的畫面“動”起來,畫面切換必須有用、有序或有趣;創(chuàng)意設(shè)計原則創(chuàng)新性:敢想敢做,動畫沒有計算機(jī)做不到,只有你想不到;科學(xué)性:創(chuàng)意必須符合科學(xué)規(guī)律,不能憑空捏造,違背常理;藝術(shù)性:必須符合藝術(shù)設(shè)計的原則,以增加作品的藝術(shù)感染力;技術(shù)性:創(chuàng)意設(shè)計必須考慮在現(xiàn)有技術(shù)上是否可行;1.3.1多媒體作品制作要求—評分參考創(chuàng)意選題與內(nèi)容是否有創(chuàng)新意識主題論述主題表達(dá)是否充分和全面,內(nèi)容是否偏題了主題。視覺效果畫面是否協(xié)調(diào),顏色搭配是否合理,動作是否流暢、內(nèi)容是否連續(xù)和一致,畫面切換是否自然流暢等聽覺效果背景音樂、音效和旁白是否動聽,與畫面內(nèi)容是否一致,能否起到烘托主題的效果。技術(shù)難度是否有一定的技術(shù)含量1.3.2多媒體作品制作流程第1周布置任務(wù),醞釀準(zhǔn)備第2~7周演示部分優(yōu)秀習(xí)作,為選題提供參考,盡早開始收集和準(zhǔn)備素材第8~9周遞交選題規(guī)劃:作品選題,構(gòu)思和合作情況第12周遞交中期進(jìn)展報告:匯報素材收集情況和目前已經(jīng)完成的內(nèi)容第13~16周詳細(xì)制作:按照分工的任務(wù)完成自己具體的工作,16周集成調(diào)試,寫報告第16周周末提交作品和報告,答辯講解1.3.3多媒體作品制作指南選題建議傳統(tǒng)文化熱點(diǎn)問題大型活動創(chuàng)新項目偶像介紹興趣愛好內(nèi)容與構(gòu)思原創(chuàng)性技術(shù)性故事性制作方式展示方式視覺效果色調(diào)一致搭配協(xié)調(diào)布局合理過渡自然聲音效果背景音樂過渡自然節(jié)奏匹配旁白講解清晰,與畫面同步字幕處理簡潔清晰大段文字不能靜止不動字幕運(yùn)動速度合適技術(shù)與創(chuàng)新提倡原創(chuàng)技術(shù)可行多媒體技術(shù)與應(yīng)用

第2章音頻處理技術(shù)與應(yīng)用電信學(xué)院計算機(jī)系2.1.1聲音的基本特征2.1.2音頻的數(shù)字化2.1.3智能語音處理技術(shù)2.1音頻處理基礎(chǔ)1.聲波(1)聲波:由各種機(jī)械振動或氣流擾動引起周圍的彈性媒質(zhì)發(fā)生波動。(2)聲源:產(chǎn)生聲波的物體,如人的聲帶和樂器等。(3)聲音:人的聽覺系統(tǒng)所能感知到的聲波。

頻率(Hz)20300300020000語音音頻次聲波超聲波(1)聲波信號的物理特征2.聲音的基本特征周期(T):相鄰兩個波峰或波谷之間的時間。頻率(f):周期的倒數(shù)(f=1/T),即每秒波峰或波谷出現(xiàn)的次數(shù)。幅度:從基線到波峰或波谷的距離,幅度越大聲音越響。音調(diào):由發(fā)聲物體的振動頻率決定。頻率越大(即振動越快),音調(diào)越高,反之音調(diào)越低。(2)聲音信號的心理學(xué)特征音色:主觀評價聲音的量,聲音的音色取決于聲音的頻譜結(jié)構(gòu),高次諧波越豐富,音色越明亮并具有穿透力。響度:人耳對聲音強(qiáng)弱的感覺程度,主要取決于振幅和聲壓。人耳距離聲源越遠(yuǎn),聲音越小。人們感知到的聲音特征:音調(diào)、音色和響度 聲音的頻率范圍越寬,聲音的質(zhì)量越高。(3)聲音質(zhì)量的評價質(zhì)量頻率范圍采樣頻率(kHz)采樣精度(bits)聲道數(shù)數(shù)據(jù)率(kB/s)電話200~3400Hz88單聲道8AM100~5500Hz11.0258單聲道11.0FM20~11000Hz22.05016立體聲88.2CD-DA5~20000Hz44.116立體聲176.4DVD0~96000Hz192246聲道12002)信噪比:有用信號與噪音信號的強(qiáng)度之比(分貝)。3)聲音質(zhì)量的主觀度量:大多數(shù)人對聲音質(zhì)量的感覺。1)聲音質(zhì)量分級:按聲音頻率范圍將聲音質(zhì)量分為5級

音頻信號:通過麥克風(fēng)等設(shè)備轉(zhuǎn)換成的電信號。規(guī)則音頻信號:帶有語音、音樂和音效的有規(guī)律的音頻信號。

語音:語言的載體,有豐富的語言內(nèi)涵。

音樂:是一種規(guī)范的符號化的聲音。

音效:自然界中各種聲音效果,如掌聲和雷聲等。不規(guī)則音頻信號:不包含任何信息的聲音,如噪聲。3.音頻信號的表示2)音頻信號的波形表示3)音頻信號的頻譜表示

聲音信號的頻率分布曲線。男聲的基頻較低,低頻分量更加豐富,聽起來會更加低沉、渾厚。ω0:聲音的基音,決定了音調(diào)的高低nω0:聲音的泛音,決定了聲音的音色An:聲波的振幅,表示聲音的強(qiáng)弱1)音頻信號的數(shù)學(xué)表示“同濟(jì)大學(xué)”女聲“同濟(jì)大學(xué)”男聲3.音頻信號的表示2.1.1聲音的基本特征2.1.2音頻的數(shù)字化2.1.3智能語音處理技術(shù)2.1音頻處理基礎(chǔ)(1)采樣:聲音信號在時間上的離散化。即每隔一定時間抽取一個信號樣本采樣頻率:每秒采樣的次數(shù)。奈奎斯特理論:采樣頻率不低于聲音信號最高頻率的兩倍,這樣就能把數(shù)字聲音還原成原來的聲音,稱為無損數(shù)字化。語音的最高頻率約為3.4kHz,電話采樣頻率為8kHz;音頻的最高頻率為20kHz,CD音質(zhì)的采樣頻率為44.1kHz;1.音頻信號的數(shù)字化聲波在時間和幅度上都是連續(xù)的,是一種模擬信號。數(shù)字化過程:就是采樣、量化和編碼的過程。采樣過程中對每一個采樣點(diǎn)的幅度值用數(shù)字量來表示。(2)量化:聲音信號在幅度上的離散化采樣精度:即量化的位數(shù),8位可以將幅度分成256等份,位數(shù)越多量化等級數(shù)也越多,所能表示的聲波幅度的動態(tài)范圍也越大,當(dāng)然需要的存儲空間也越大。如果幅度的劃分是等間隔的,則稱為線性量化,否則為非線性量化。(3)編碼如何計算數(shù)字化音頻的數(shù)據(jù)量?數(shù)據(jù)量=采樣頻率*采樣精度*采樣時間*聲道數(shù)/8(字節(jié)數(shù))例2.1計算1分鐘未壓縮的高保真立體聲數(shù)字聲音數(shù)據(jù)的大小。60*(44100*16*2)/8=10.09MB一個容量為4GB的MP3播放器可存放100首這樣的歌曲。脈沖編碼調(diào)制法(PCM):用二進(jìn)制來表示每一個有固定電平的量化值。2.數(shù)字音頻壓縮標(biāo)準(zhǔn)(1)電話質(zhì)量的語音壓縮標(biāo)準(zhǔn)G.711,G.721,

G.723,G.729等采樣頻率:8kHz,量化位數(shù):8位(2)調(diào)幅廣播語音壓縮標(biāo)準(zhǔn)G.722:第一個寬帶語音編碼算法,采樣頻率:16kHz(3)寬帶音頻壓縮標(biāo)準(zhǔn)

MPEG-1的音頻:第一個高保真立體聲音頻壓縮國際標(biāo)準(zhǔn),提供三個獨(dú)立的壓縮層次,mp3則采用了其中第三層的標(biāo)準(zhǔn)。WAV文件:波形文件,文件大,適合存儲簡短的聲音片段和旁白。MP3文件:是MPEG音頻第3層的簡稱,有損壓縮,壓縮比達(dá)12:1。RA文件:RealMedia音頻部分,采用流式傳輸,適合在線聆聽。WMA文件:微軟推出的流式音頻格式。AC3文件:又叫杜比數(shù)碼環(huán)繞立體聲,提供5個全頻域聲道和1個超低音聲道,稱為5.1聲道,一般作為DVD的伴音。AIFF

文件:Apple公司開發(fā),被Macintosh平臺及其應(yīng)用程序所支持。FLAC文件:無損壓縮,源碼開放,支持所有操作系統(tǒng)平臺。AMR文件:移動通信中廣泛使用的語音標(biāo)準(zhǔn),用于保存手機(jī)錄音。3.常見音頻文件2.1.1聲音的基本特征2.1.2音頻的數(shù)字化2.1.3智能語音處理技術(shù)2.1音頻處理基礎(chǔ)語音識別:讓計算機(jī)能夠聽懂人說話1.語音識別技術(shù)Windows的語音識別語音合成的三個層次

從文字到語音從概念到語音從意向到語音語音合成的特點(diǎn)標(biāo)準(zhǔn)清晰,但缺少感情色彩語音合成的應(yīng)用文語轉(zhuǎn)換、語音查詢2.語音合成技術(shù)語音合成:使計算機(jī)具有類似人的說話能力2.2.1基本操作2.2.2音頻的編輯2.2.3效果控制2.2.4多軌合成與混縮輸出2.2AdobeAuditionCCAudition的操作界面(單軌)

Audition的操作界面(多軌)

1.新建和保存項目(1)新建多軌合成項目(2)保存項目項目文件中保存的是:1)導(dǎo)入了哪些素材(存放快捷方式)2)放置在什么軌道3)設(shè)置了什么參數(shù)4)添加了什么效果(1)新建音頻文件2.新建和保存波形(2)保存音頻文件文件/打開文件/導(dǎo)入Ctrl+i打開視頻,支持avi,mov,mp4,wmv等視頻格式。CC版可以直接在單軌下播放;拖放到多軌下,音頻與視頻自動分離,放在不同的軌道上,畫面顯示在視頻面板。3.打開文件提取CD中的音頻類似于WindowsMediaPlayer中的翻錄VCD光盤中伴奏的提取伴奏原唱梁祝.mov鎖定原唱所在聲道執(zhí)行菜單“編輯/復(fù)制到新文件”即可提取伴奏伴奏沉默是金.mp4原唱4.錄音麥克風(fēng)的選擇(信噪比越大越好)1)動圈麥和電容麥(專業(yè))2)全指向和單一指向3)有線和無線在麥克風(fēng)的“高級”屬性中,選擇聲卡合適的輸入格式,然后重啟Audition。無法錄音的問題(1)外錄:選擇麥克風(fēng),單擊錄制。(2)內(nèi)錄:選擇立體聲混音,播放視頻或音頻,單擊錄制即可。單軌下錄音注意:1)錄制的波形振幅要盡量大;2)沒有聲音的地方應(yīng)該是一條直線,否則有噪音;3)可以將錄錯的波形調(diào)到靜音以后重新錄制;多軌下錄音背景音樂錄制的波形(1)新建多軌合成項目(2)導(dǎo)入伴奏(3)按下R,使該軌道進(jìn)入錄音狀態(tài)(4)定位好時間線(5)單擊錄制按鈕穿插錄音對已經(jīng)錄制好的聲音片段進(jìn)行重新錄制注意:只有選區(qū)內(nèi)會錄音,不影響其他波形。選取重錄部分按下定位好時間線點(diǎn)按(自動清除選區(qū))2.2.1基本操作2.2.2音頻的編輯2.2.3效果控制2.2.4多軌合成與混縮輸出2.2AdobeAuditionCC1.單軌下的編輯(1)波形的選取拖曳鼠標(biāo)左鍵即可選擇單個聲道的波形(把另一聲道鎖定)(2)波形移動與復(fù)制(剪切、復(fù)制與粘貼、混合粘貼)(3)波形的裁剪與刪除裁剪:只留下選擇的波形,其余刪除刪除:刪除選擇的波形,后面的波形會自動前移,若刪除的是單個聲道的波形,則不影響后面的波形,實(shí)質(zhì)設(shè)為靜音。(5)波形的反相與反向反相:波形相位的反轉(zhuǎn)反向:前后反向,達(dá)到逆向播放的效果反相前的波形反相后的波形反向后的波形反向前的波形2.多軌下的編輯音量旋鈕:背景音量降低,旁白音量提升聲相旋鈕:可控制聲音在左耳與右耳之間的均衡輸入:默認(rèn)為立體聲,若選擇“無”,則不能錄音輸出:默認(rèn)為主控,若選擇“無”,則不會發(fā)聲(1)多軌面板效果發(fā)送輸入/輸出軌道名EQ靜音獨(dú)奏錄音音量旋鈕聲相旋鈕輸入輸出音軌自動化監(jiān)視輸入切換節(jié)拍器切換全局剪輯伸縮切換對齊移動工具:左鍵移動選中的波形片段,右鍵拖移可移動或復(fù)制波形片段。剃刀工具:在單擊處剪開波形滑動工具:用于滑動選擇想要的波形片段時間選擇工具:左鍵選波形,右鍵移動波形(2)工具欄框選、套索和筆刷工具:在單軌狀態(tài)下單擊頻譜頻率顯示,用于選取所要操作的頻譜區(qū)域。污點(diǎn)修復(fù)工具:修復(fù)頻譜信號,一般是不到4秒的劣音,如咔噠聲,破音等移動工具剃刀滑動工具時間選擇框選套索筆刷污點(diǎn)修復(fù)頻譜頻率頻譜音調(diào)(3)多軌下編輯拆分:在當(dāng)前時間線位置剪開時間鎖定:只能上下移動,不能左右移動刪除“編輯|刪除”:刪除選中的波形片段,不影響該軌道上的其他波形“編輯|波紋刪除”:將選定的波形刪除,其后面的波形會自動前移“波紋刪除|gap”,把兩個波形之間的空隙刪除循環(huán):拖曳波形的邊界,可以使波形往前或往后重復(fù)出現(xiàn)靜音:使選定的波形片段靜音淡入淡出:設(shè)置開始時淡入,結(jié)束時淡出(4)包絡(luò)編輯包絡(luò)編輯:一般用于控制聲音屬性的變化音量包絡(luò):控制音量的變化,如淡入淡出或忽高忽低聲相包絡(luò):控制聲相的變化,實(shí)現(xiàn)左耳和右耳的均衡展開擴(kuò)展控制區(qū)音量包絡(luò)線靜音包絡(luò)線聲相包絡(luò)線2.2.1基本操作2.2.2音頻的編輯2.2.3效果控制2.2.4多軌合成與混縮輸出2.2AdobeAuditionCC作用于選定的波形(默認(rèn)為全選),屬于破壞性編輯。單軌下加效果作用于整個軌道上的所有波形片段,不會立即改變波形,在混縮輸出時才會改變波形。多軌下加效果

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論