語音產(chǎn)品測試.ppt_第1頁
語音產(chǎn)品測試.ppt_第2頁
語音產(chǎn)品測試.ppt_第3頁
語音產(chǎn)品測試.ppt_第4頁
語音產(chǎn)品測試.ppt_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、語音產(chǎn)品測試 音質(zhì)測試和性能測試,網(wǎng)易杭州研究院 賓 崢 ,移動通信 電話會議 網(wǎng)絡(luò)電話 游戲語音 。,語音產(chǎn)品的范圍,低劣音質(zhì)的悲劇,音質(zhì)測試 語音過程的實現(xiàn) 什么在影響音質(zhì)? 如何改善音質(zhì)? 怎么測試音質(zhì)? 服務(wù)器性能測試 測試需求 測試方法 測試數(shù)據(jù) 測試瓶頸,概要,語音過程的實現(xiàn),衡量語音質(zhì)量的因素,延時 流暢 清晰 舒適 .,什么在影響音質(zhì)?,環(huán)境背景 客戶端硬件 輸入輸出設(shè)備 cpu 語音引擎 有損壓縮 采樣率 語音處理技術(shù) 網(wǎng)絡(luò) 服務(wù)器 服務(wù)器丟包,網(wǎng)絡(luò)對音質(zhì)的影響,抖動 tcp抖動 udp抖動、亂序 udp丟包 網(wǎng)絡(luò)延時,延時的來源,網(wǎng)絡(luò)延時 客戶端 接收端jitter延時 發(fā)

2、送端延時 采集、回放延時 編、解碼延時 服務(wù)器延時,如何改善音質(zhì)?,語音引擎的優(yōu)化 回聲消除 噪聲抑制 自動增益 靜音檢測和舒適噪音 . 適應(yīng)網(wǎng)絡(luò)環(huán)境 強大的服務(wù)器,適應(yīng)網(wǎng)絡(luò)環(huán)境,對于延時 網(wǎng)絡(luò)傳輸延時無法規(guī)避 對于抖動 jitter buffer 對于丟包 發(fā)送端增加冗余數(shù)據(jù) 接收端增加丟包補償策略 服務(wù)器端增加丟包補償策略 極端情況下 發(fā)送端轉(zhuǎn)成tcp 接收端轉(zhuǎn)成tcp,強大的服務(wù)器,分布式、可擴展 轉(zhuǎn)發(fā)語音數(shù)據(jù)不做任何邏輯處理 確保硬件處理能力達到要求,改善音質(zhì)的悖論,語音引擎無法兼顧高音質(zhì)、低延時、低帶寬 使用jitter緩解抖動時,會增加延時 發(fā)送冗余數(shù)據(jù)緩解丟包,會增加延時和帶寬占

3、用 發(fā)送冗余數(shù)據(jù)會增加服務(wù)器壓力 極差網(wǎng)絡(luò)環(huán)境下,TCP連接雖能明顯改善音質(zhì),但也會增加延時、帶寬占用和服務(wù)器壓力 .,如何評價音質(zhì)?,主觀評價 平均意見分MOS(Mean Opinion Score) 下降的平均MOS(Degradation Mean Opinion Score) 診斷押韻測試DRT(Diagnostic Rhyme Test) 滿意度判斷測試DAM(Diagnostic Acceptability Measure)等 客觀評價 建立一個人腦與耳朵的模型,模擬聽眾環(huán)境 通過這個模型模擬聽覺失真 計算出一個質(zhì)量指標(biāo),衡量原始語音與經(jīng)過處理的語音之間音質(zhì)下降的程度 這些指標(biāo)通常

4、都與主觀測試有相似的值域,但沒有嚴(yán)格的映射。,PSQM(Perceptual Speech Quality Measure,感知通話質(zhì)量測量)- ITU-T P.861 PSQM+ - 荷蘭KPN公司 PESQ(Perceptual Evaluation of Speech Quality,感知評估通話質(zhì)量測量)- ITU-T P.862,客觀評價算法,音質(zhì)評價方法比較,主觀評價方法 是最終用戶的感受,反映語音的真實質(zhì)量 耗時、成本高,不可重復(fù) 客觀評價方法 可以批量、自動進行 評估結(jié)果較為準(zhǔn)確 操作復(fù)雜、成本高昂,適用于電信級別,我們怎么測試?,語音引擎設(shè)置的影響 語音引擎對網(wǎng)絡(luò)的適應(yīng)性 產(chǎn)

5、品對網(wǎng)絡(luò)的適應(yīng)性 與其它產(chǎn)品音質(zhì)對比,語音引擎設(shè)置的影響,語音樣本輸入到語音引擎 語音引擎輸出到播放設(shè)備 排除網(wǎng)絡(luò)因素 調(diào)整語音引擎參數(shù)和設(shè)置 多人次、多樣本主觀評價,語音引擎對網(wǎng)絡(luò)的適應(yīng)性,udp丟包時的音質(zhì),抖動&亂序時的音質(zhì),產(chǎn)品對網(wǎng)絡(luò)的適應(yīng)性,測試場景設(shè)計 上行 or 下行 tcp or udp 抖動 udp丟包,與其它產(chǎn)品音質(zhì)對比,測試場景設(shè)計 網(wǎng)絡(luò)環(huán)境 軟硬件環(huán)境 所在測試房間的人數(shù)、設(shè)置等,如何可重復(fù) 如何更客觀 如何更精確 。,怎樣做得更好?,除了音質(zhì).,還需要強大的服務(wù)器,語音服務(wù)器架構(gòu),不同房間段的服務(wù)器隔離 同一房間段內(nèi)服務(wù)器可擴展,性能測試需求,基于udp 單臺服務(wù)器轉(zhuǎn)

6、發(fā)量 是否丟包 對延時的影響 服務(wù)器集群的擴展性 . 基于tcp 嚴(yán)格限制用戶使用tcp,測試系統(tǒng)架構(gòu),測試場景,測試場景 1個房間里,X人說話、Y人聽眾 N個房間里,分別Xn人說話、Yn人聽眾 理論上等價于 單位時間內(nèi)的udp包輸入、輸出 即 服務(wù)器輸入PI = 單人發(fā)包頻率 * Xn 服務(wù)器輸出PO = (單人發(fā)包頻率 * Xn * Yn) 入口流量 = PI * 包大小 出口流量 = PO * 包大小,性能測試數(shù)據(jù),服務(wù)器集群 測試系統(tǒng)(發(fā)送端)網(wǎng)卡出包統(tǒng)計(P1) 被測服務(wù)器網(wǎng)卡入包統(tǒng)計(P2) 被測服務(wù)器網(wǎng)卡出包統(tǒng)計(P3) 測試系統(tǒng)(接收端)網(wǎng)卡入包統(tǒng)計(P4) 標(biāo)準(zhǔn)客戶端 丟包 延時 音質(zhì)主觀感受,測試數(shù)據(jù)分析,預(yù)期 P1= 發(fā)包頻率*發(fā)包人數(shù) = P2 P2 * 收包人數(shù) = P3 = P4 客戶端延時、音質(zhì)表現(xiàn)等 實際 P2 P1 : 測試系統(tǒng)發(fā)送端到被測系統(tǒng)有丟包 P3 P3* 收包人數(shù) : 服務(wù)器寫出有丟包 P4 P3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論