



下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
PAGE華南理工大學(xué)電信學(xué)院人機(jī)通信智能接口實(shí)驗(yàn)室簡(jiǎn)要SCUT-COUCH數(shù)據(jù)格式說(shuō)明手冊(cè)HCIILaboratorySCUT華南理工大學(xué)人機(jī)通信智能接口實(shí)驗(yàn)室/PAGE3華南理工大學(xué)電信學(xué)院人機(jī)通信智能接口實(shí)驗(yàn)室1.SCUT-COUCH數(shù)據(jù)庫(kù)詳細(xì)說(shuō)明1.1.SCUT-COUCH數(shù)據(jù)文件命名規(guī)則每套COUCH數(shù)據(jù)由兩個(gè)文件名相同,擴(kuò)展名不同的文件組成。擴(kuò)展名分別idx和dat。其中,dat文件為實(shí)際的數(shù)據(jù)文件,idx文件是dat文件的索引文件。每個(gè)文件名(除去擴(kuò)展名)的命名遵循如下格式“數(shù)據(jù)集名+下劃線+編號(hào)”。其中數(shù)據(jù)集名為“Big5”,“Digit”,“GB1”,“GB2”,“Letter”,“Pinyin”,“Symbol”,“TradGB1”,“WORD17366”,“WORD44208”和“WORD8888”中的一個(gè);編號(hào)代表該文件在相應(yīng)數(shù)據(jù)集的套數(shù)編號(hào),由三位阿拉伯?dāng)?shù)字組成。例如“WORD44208_001”代表SCUT-COUCH2009數(shù)據(jù)庫(kù)中WORD44208數(shù)據(jù)集中的第1套數(shù)據(jù),同時(shí)它包括兩個(gè)文件:“WORD442081.2.COUCH數(shù)據(jù)文件格式每套樣本數(shù)據(jù)均由一個(gè)索引文件(擴(kuò)展名為idx,我們稱為IDX文件)和一個(gè)數(shù)據(jù)文件(擴(kuò)展名為dat,我們稱為DAT文件)組成。1.2.1.IDX文件的格式IDX文件格式由表1所示,IDX文件由文件頭和索引單元兩種結(jié)構(gòu)組成。每種結(jié)構(gòu)均為固定大小。表1IDX文件存儲(chǔ)結(jié)構(gòu)文件頭樣本0索引單元樣本1索引單元樣本N索引單元IDX文件頭格式如表2所示。文件頭單元位于文件起始位置,只有一個(gè)long型字段,它的值等于本套數(shù)據(jù)文件存儲(chǔ)的樣本總數(shù)。表2IDX文件頭格式數(shù)據(jù)名數(shù)據(jù)類型數(shù)據(jù)長(zhǎng)度(Byte)描述SampleSumlong4本套數(shù)據(jù)文件的樣本總數(shù)IDX文件索引單元格式如表3所示。每個(gè)樣本的索引單元固定大小為13個(gè)字節(jié),共4個(gè)數(shù)據(jù)字段。其中IDX文件中索引單元的個(gè)數(shù)與相應(yīng)DAT文件中的樣本數(shù)量是相同的。表3IDX文件樣本索引單元格式數(shù)據(jù)名數(shù)據(jù)類型數(shù)據(jù)長(zhǎng)度(Byte)描述SampleStateunsignedchar1Hcii-lab保留使用OswIndexint4Hcii-lab保留使用IdxIndexint4樣本在本套數(shù)據(jù)中的編號(hào),從0開(kāi)始計(jì)數(shù)DatOffsetlong4樣本數(shù)據(jù)單元在對(duì)應(yīng)DAT文件中的偏移位置1.2.2.DA文件格式DAT文件存儲(chǔ)結(jié)構(gòu)由表4所示,由各個(gè)樣本數(shù)據(jù)單元構(gòu)成,每個(gè)數(shù)據(jù)單元大小不定長(zhǎng),具體結(jié)構(gòu)如表5所示。表4DAT文件存儲(chǔ)結(jié)構(gòu)樣本0數(shù)據(jù)單元樣本1數(shù)據(jù)單元樣本2數(shù)據(jù)單元樣本N數(shù)據(jù)單元表5DAT文件數(shù)據(jù)單元格式數(shù)據(jù)名數(shù)據(jù)類型數(shù)據(jù)長(zhǎng)度(Byte)描述WordLengthunsignedchar1樣本內(nèi)碼長(zhǎng)度,字節(jié)為單位WordCodeunsignedchar[]WordLength樣本的內(nèi)碼PointNumunsignedshortint2樣本的點(diǎn)的個(gè)數(shù)LineNumunsignedshortint2樣本的筆畫個(gè)數(shù)GetTimePointNumunsignedshortint2捕獲到時(shí)間的點(diǎn)的個(gè)數(shù)GetTimePointIndexunsignedshortint[]GetTimePointNum捕獲到時(shí)間的點(diǎn)的序號(hào)ElapsedTimeDWORD[]GetTimePointNum每點(diǎn)距離上一捕獲時(shí)間的采樣點(diǎn)的時(shí)間距離StrokeData樣本筆畫數(shù)據(jù),結(jié)構(gòu)如下所示StrokePointNumunsignedshortint2每筆的點(diǎn)數(shù)Point(x,y)unsignedshortint2+2一筆中每個(gè)點(diǎn)的x和y的坐標(biāo)值1.2.3.IDX文件和DAT文件關(guān)系idx文件SampleSumSampleStateOswIndexIdxIndexDatOffsetSampleStateOswIndexIdxIndexDatOffsetdat文件樣本0數(shù)據(jù)單元idx文件SampleSumSampleStateOswIndexIdxIndexDatOffsetSampleStateOswIndexIdxIndexDatOffsetdat文件樣本0數(shù)據(jù)單元樣本1數(shù)據(jù)單元樣本2數(shù)據(jù)單元樣本SampleSum-1數(shù)據(jù)單元樣本0索引樣本1索引圖2idx文件與dat文件關(guān)系圖1.2.4.正確讀取COUCH數(shù)據(jù)讀取IDX文件IDX文件為COUCH數(shù)據(jù)的索引文件,通過(guò)讀取IDX文件中的索引單元,可以快速獲取應(yīng)樣本的信息和該樣本的數(shù)據(jù)單元在dat文件中的位置。讀取IDX文件時(shí),必須先讀取IDX文件頭(格式詳見(jiàn)表2),以獲取本套數(shù)據(jù)的樣本總個(gè)數(shù)。IDX文件中每個(gè)樣本索引單元結(jié)構(gòu)大小固定為13個(gè)字節(jié)(格式詳見(jiàn)表3),因此可以方便快速讀取到目標(biāo)索引結(jié)構(gòu)。讀取DAT文件DAT文件存儲(chǔ)有序的樣本數(shù)據(jù)單元(詳見(jiàn)表5)。讀取目標(biāo)數(shù)據(jù)單元時(shí),由于某些字段的大小并不固定(WordCode,GetTimePointIndex,ElapsedTime,StrokeData),因此必須根據(jù)表5所示字段的順序,逐個(gè)讀取或者跳過(guò)相應(yīng)的字段。DAT文件中,每個(gè)數(shù)據(jù)單元的大小不定,因此獲取目標(biāo)數(shù)據(jù)單元時(shí),必須先得知該單元在文件中的位置??梢皂樞蜃x取DAT文件的每個(gè)數(shù)據(jù)單元直至目標(biāo)數(shù)據(jù)單元,但更為恰當(dāng)?shù)姆椒ㄊ峭ㄟ^(guò)讀取IDX文件,獲取目標(biāo)樣本索引單元。索引單元的DatOffset字段的值即為該樣本數(shù)據(jù)單元在DAT文件的中偏移量(該偏移從文件開(kāi)始位置,以字節(jié)為單位計(jì)數(shù)),成功獲取偏移量后即可定位至DAT文件正確的位置讀取目
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 內(nèi)蒙古科技大學(xué)《土木工程力學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 四川省德陽(yáng)市中學(xué)江縣市級(jí)名校2025年初三下第三次周考綜合試題含解析
- 西藏拉薩片八校2025年高三寒假測(cè)試二歷史試題含解析
- 江門職業(yè)技術(shù)學(xué)院《智能計(jì)算系統(tǒng)》2023-2024學(xué)年第二學(xué)期期末試卷
- 咸寧市嘉魚縣2025年數(shù)學(xué)三下期末教學(xué)質(zhì)量檢測(cè)試題含解析
- 濰坊食品科技職業(yè)學(xué)院《朝鮮語(yǔ)會(huì)話(Ⅲ)》2023-2024學(xué)年第二學(xué)期期末試卷
- 煙臺(tái)城市科技職業(yè)學(xué)院《健康評(píng)估技能》2023-2024學(xué)年第一學(xué)期期末試卷
- 山東水利職業(yè)學(xué)院《大學(xué)生就業(yè)指導(dǎo)》2023-2024學(xué)年第一學(xué)期期末試卷
- 遼寧省錦州市2025屆下學(xué)期第三次考試英語(yǔ)試題(輔導(dǎo)班)試題含解析
- 二零二五股權(quán)轉(zhuǎn)讓協(xié)議之補(bǔ)充協(xié)議
- 2025年全民國(guó)家安全教育日(4.15)知識(shí)測(cè)試競(jìng)賽題庫(kù)(含答案)
- 2025春季學(xué)期國(guó)開(kāi)電大本科《人文英語(yǔ)3》一平臺(tái)在線形考綜合測(cè)試(形考任務(wù))試題及答案
- 提高四級(jí)手術(shù)術(shù)前多學(xué)科討論完成率實(shí)施方案
- 2024年共青團(tuán)團(tuán)??荚嚾雸F(tuán)考試題庫(kù)及答案
- 手榴彈使用教案
- 《新農(nóng)技推廣法解讀》ppt課件
- 車載式輪椅升降裝置的結(jié)構(gòu)設(shè)計(jì)-畢業(yè)設(shè)計(jì)說(shuō)明書
- 社區(qū)家庭病床護(hù)理記錄文本匯總
- 劍橋BEC中級(jí)真題第四輯TEST1
- 畢業(yè)設(shè)計(jì)(論文)-CK6150總體及縱向進(jìn)給和尾座部件的設(shè)計(jì)
- 施工項(xiàng)目人員任命書(范本)
評(píng)論
0/150
提交評(píng)論