Praat客服語音標注_第1頁
Praat客服語音標注_第2頁
Praat客服語音標注_第3頁
Praat客服語音標注_第4頁
Praat客服語音標注_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、語音轉(zhuǎn)寫操作手冊(三層)一、用腳本打開語音文件 1 點擊praat>open>read from file>找到你打開的文件>打 開>選中同一個文件名的兩個文件>View & Edit; 2 Ctrl+2可以同時兩層打點,Alt+Backspace可以刪除時間點; 做完以后Ctrl+S 保存到根文件下面;請參看培訓視頻。二、開始標注語音文件 時間邊界定位: 按Tab鍵可以播放語音,再次按Tab鍵/Esc鍵可以停止播放語音 按Ctrl+i可以放大波形;Ctrl+o可以縮小波形。建議放大12標注。 聽音,在整段電話語音的基礎(chǔ)上,根據(jù)語義和停頓時間等因素,

2、在音頻信號中每一句話的句首和句尾分別添加時間邊界。添加時間邊界的方法為:將鼠標移動到語音波形的相應(yīng)位置,這時會出現(xiàn)一條虛線以及圓圈,分別點擊SPEAKER層和CONTENT層對應(yīng)的圓圈即可?;蛘咧苯覥trl+2可以自動同時在SPEAKER層和CONTENT層打上時間點。在整個語音文件中,SPEAKER層和CONTENT層的時間邊界的數(shù)目是完全一致的,每一對時間邊界也是完全相等的。請注意,SPEAKER層和CONTENT層的時間邊界必須保持一致。也就是說不管點擊哪一層的時間邊界,另外一層一定是空心藍色,而不是實心藍色 文件標注: GLOBAL層主要標注語音文件的一些全局信息,包括說話人性別信息和

3、語種信息(方言區(qū))。標注格式如下:speaker:空格1空格性別,空格2空格性別;空格language:空格1空格方言區(qū),空格2空格方言區(qū)例如:speaker: 1 male, 2 female; language: 1 普通話, 2 普通話speaker: 1 male, 2 male; language: 1 普通話, 2 普通話speaker: 1 female, 2 female; language: 1 普通話, 2 普通話speaker: 1 female, 2 male; language: 1 普通話, 2 普通話 SPEAKER層需要標注的是說話人信息,“說話人”取值為以下兩

4、種:1、2,分別表示說話人1、說話人2。(說話人1、2僅標注在文字段上,符號段不標注) 如果是客服類對話,則SPEAKER層的“說話人”取值為1的語音,必須是話務(wù)員;用戶的語音取值為2 客服定義為奇數(shù),用戶為偶數(shù);(客服一定是和用戶有直接對話,否則不算客服)如果第三個人是用戶的情況:speaker: 1 female, 2 female, 4 female; language: 1 普通話, 2 普通話, 4 普通話 CONTENT層需要標注的是該句對應(yīng)的文字,如果是漢語交談,則只能用簡體漢字。對于語音中的數(shù)字部分需根據(jù)發(fā)音情況轉(zhuǎn)換為對應(yīng)的漢字,例如“27”“二十七”;“我的電話是238183

5、2”“我的電話是二三八幺八三二(與發(fā)音相同)”。 CONTENT層正常語音的標注 如果此語段為某一個人的漢語對話語音,請在SPEAKER和CONTENT標注時間邊界,SPEAKER層標注1或者2,CONTENT層輸入相應(yīng)的文本。 如果此語段為兩個人交叉語音,關(guān)于重疊(交叉)的語音,即對于某個人的一句話未完,另一個人的一句話已經(jīng)開始的情況:請在SPEAKER層和CONTENT層標注時間邊界,SPEAKER層不標注內(nèi)容,CONTENT層標注“+”對于疊加,必須是真實的。不能將大段的聽不清語音和疊加混在一起。疊加段內(nèi)的非疊加部分,前后最多不得超過1個字。至于由于添加疊加的時間邊界導致的半個語音(即切

6、掉頭或者尾)可用*或UNK來表示。*和UNK取決于是單段的聽不清,還是在語音中聽不清。 在整個語音中,需根據(jù)說話人的變換來增加時間邊界。 如果同一說話人說話時間較長,則應(yīng)根據(jù)其語義來增加時間邊界,每個時間段的長度最多不能超過8s,但斷句也不要太散太短。每個自然語言段平均在5-6秒左右即可。 每個時間邊界的最佳位置在音頻能量的最低點(即波譜圖上黑色部分最淡的地方),如果僅有幾個字包含不進來,那么建議舍棄這幾個字 英文:(英文小寫) 【單詞】對于語音中簡單的英文單詞,在能聽懂的情況下,直接標出即可。特殊符號用發(fā)音標注,不寫特殊符號。例如:“網(wǎng)址是三w點sina點com”; “二三八幺八三二艾特qq

7、點com”;(不要寫) “請以井號鍵結(jié)束”;(不要寫#)【字母】每個字母中間用空格隔開。例如:good表示單詞讀音,g o o d則表示字母讀音。例如:我的編號是f m s幺三二 如果發(fā)音是表示應(yīng)答的“嗯”,統(tǒng)一都用“嗯”,不要用“恩”或者“厄”。其他的這種口頭發(fā)音,也需要用帶口字旁的漢字標注。比如哦,啊,唉等. CONTENT層短暫噪音的標注短暫噪音是指非常短暫的突發(fā)的聲音,所有此類標注都是中括號與語音內(nèi)容的組合,不要標注時間邊界。1 聽不清的一個字/英文單詞直接在句子中標注UNK。 例如:二三八幺八UNK二 2 兩個或者兩個以上聽不懂的字,標注* 聽不清的長句 方言 大段的英文句子 拿著話

8、筒和其他人說話 3 短暫的笑聲:直接在句子中標注LAUGH。 4 短暫的由說話人發(fā)出的干擾濁音:直接在句子中標注SONANT 咳嗽聲 打噴嚏 清嗓子 5 系統(tǒng)提示音,即系統(tǒng)播出的語音提示:PROMPT系統(tǒng)自動播放的語音內(nèi)容,而非說話人的語音內(nèi)容(第二層不用標說話人)例如:PROMPT歡迎致電我公司現(xiàn)在由一號客服代表為您服務(wù) CONTENT層持續(xù)噪音的標注持續(xù)噪音是指比較長的一段聲音,所有此類標注都是單獨的噪音類型,需要標注中括號和時間邊界,SPEAKER層不標注內(nèi)容 1 明顯的靜音段(大于500ms):SIL(如果空白段沒有任何聲音,可以空著,后期技術(shù)處理) 2 各種垃圾聲音:ENS 1) 連

9、續(xù)的拍桌子 2) 連續(xù)的敲擊聲 3) 持續(xù)的各種環(huán)境噪音(大于500ms) 3 連續(xù)的笑聲:LAUGH 4 持續(xù)的音樂聲:MUSIC 唱歌聲(有歌詞和旋律) 哼唱(沒有歌詞,但有旋律) 口哨聲 可能是別人唱歌、演奏,也可能是背景的電視、收音機發(fā)出的音樂和歌聲 口哨聲 包括持續(xù)時間較長的彩鈴聲 5 錄音及電信系統(tǒng)引起的噪聲:SYSTEM包括電話按鍵音dtmf、電話忙音 beap、錄音系統(tǒng)的其他噪音等,都是通信系統(tǒng)主動發(fā)出的聲音,而不是摘機、掛機或干擾帶來的咔啦或呲呲雜音。一般會用的噪音符號:+,*,ENS,UNK,SONANT,LAUGH,PROMPT,SYSTEM 修改標注 去除端點:點中端點,alt_backspace 移動端點:直接用鼠標拖動 修改文字:點中語音段,在編輯框中修改 保存 Ctrl+S保存到你文件的根目錄下面;三 工具自查checktool 1 先進入 程序安裝 文件夾,安裝perl和python程序。注意perl安裝使用默認路徑 C:Perlbinperl,python安裝使用默認路徑C:Python27python。 2 點擊1_Textgrid_modify > tmp>已完成語音放tmp里面>退出來一步點擊run 3 把1_Textgrid_modify中tmp的語音全部復

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論