組成原理課件23非數(shù)值數(shù)據(jù)的表示_第1頁(yè)
組成原理課件23非數(shù)值數(shù)據(jù)的表示_第2頁(yè)
組成原理課件23非數(shù)值數(shù)據(jù)的表示_第3頁(yè)
組成原理課件23非數(shù)值數(shù)據(jù)的表示_第4頁(yè)
組成原理課件23非數(shù)值數(shù)據(jù)的表示_第5頁(yè)
已閱讀5頁(yè),還剩13頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

北京理工大學(xué)計(jì)算機(jī)學(xué)院第2章2.1數(shù)值數(shù)據(jù)的表示2.2機(jī)器數(shù)的定點(diǎn)表示與浮點(diǎn)表示2.3非數(shù)值數(shù)據(jù)的表示2.4十進(jìn)制數(shù)和數(shù)串的表示2.5不同類型的數(shù)據(jù)表示舉例2.6數(shù)據(jù)校驗(yàn)碼北京理工大學(xué)計(jì)算機(jī)學(xué)院2.3非數(shù)值數(shù)據(jù)的表示2.3.1字符和字符串的表示方法1.ASCII字符編碼常見的ASCII碼用七位二進(jìn)制表示一個(gè)字符,它包括10個(gè)十進(jìn)制數(shù)字(0~9)、52個(gè)英文大寫和小寫字母(A~Z,a~z)、34個(gè)專用符號(hào)和32個(gè)控制符號(hào),共計(jì)128個(gè)字符。在ASCII碼表中,數(shù)字和英文字母都是按順序排列的,只要知道其中一個(gè)的二進(jìn)制代碼,不要查表就可以推導(dǎo)出其他數(shù)字或字母的二進(jìn)制代碼。北京理工大學(xué)計(jì)算機(jī)學(xué)院2.3非數(shù)值數(shù)據(jù)的表示北京理工大學(xué)計(jì)算機(jī)學(xué)院2.3非數(shù)值數(shù)據(jù)的表示2.字符串的存放字符串是指一串連續(xù)的字符。例如,字符串IFX>0THENREAD(C)。

(1)向量法在存儲(chǔ)器中占用一片連續(xù)的空間,每個(gè)字節(jié)存放一個(gè)字符代碼,字符串的所有元素(字符)在物理上是鄰接的。在字長(zhǎng)為32位的存儲(chǔ)器,每一個(gè)主存單元可存放4個(gè)字符,整個(gè)字符串需5個(gè)主存單元。在每個(gè)字節(jié)中實(shí)際存放的是相應(yīng)字符的ASCII碼。北京理工大學(xué)計(jì)算機(jī)學(xué)院IFX>0THENREA(C)D2.3非數(shù)值數(shù)據(jù)的表示5449462020202030454541444852433E2928584E北京理工大學(xué)計(jì)算機(jī)學(xué)院2.3非數(shù)值數(shù)據(jù)的表示(2)串表法一個(gè)存儲(chǔ)單元有32位,僅存放一個(gè)字符代碼。字符串的每個(gè)字符代碼后有一個(gè)鏈接字,用以指出下一個(gè)字符的存儲(chǔ)單元地址。串表法不要求串中的各個(gè)字符在物理上相鄰,在對(duì)字符串進(jìn)行刪除和插入操作時(shí),只需修改相應(yīng)字符代碼后面的鏈接字即可。由于鏈接字占據(jù)了存儲(chǔ)單元的大部分空間,使得主存的有效利用率下降(只有原來的25%)。上例中整個(gè)字符串需19個(gè)主存單元。北京理工大學(xué)計(jì)算機(jī)學(xué)院2.3非數(shù)值數(shù)據(jù)的表示2.3.2漢字的表示1.漢字國(guó)標(biāo)碼

GB2312-80,簡(jiǎn)稱國(guó)標(biāo)碼。該標(biāo)準(zhǔn)共收集常用漢字6763個(gè),其中一級(jí)漢字3755個(gè),按拼音排序;二級(jí)漢字3008個(gè),按部首排序;另外還有各種圖形符號(hào)682個(gè),共計(jì)7445個(gè)。每個(gè)漢字、圖形符號(hào)都用兩個(gè)字節(jié)表示,每個(gè)字節(jié)只使用低七位編碼。北京理工大學(xué)計(jì)算機(jī)學(xué)院2.3非數(shù)值數(shù)據(jù)的表示2.漢字區(qū)位碼

區(qū)位碼將漢字編碼GB2312-80中的6763個(gè)漢字分為94個(gè)區(qū),每個(gè)區(qū)中包含94個(gè)漢字(位),區(qū)和位組成一個(gè)二維數(shù)組,每個(gè)漢字在數(shù)組中對(duì)應(yīng)一個(gè)唯一的區(qū)位碼。漢字的區(qū)位碼定長(zhǎng)4位,前2位表示區(qū)號(hào),后2位表示位號(hào),區(qū)號(hào)和位號(hào)用十進(jìn)制數(shù)表示,區(qū)號(hào)從01到94,位號(hào)也從01到94。例如,“中”字在54區(qū)的48位上,其區(qū)位碼為“54-48”,“國(guó)”字在25區(qū)的90位上,其區(qū)位碼為“25-90”。北京理工大學(xué)計(jì)算機(jī)學(xué)院2.3非數(shù)值數(shù)據(jù)的表示

漢字區(qū)位碼并不等于漢字國(guó)標(biāo)碼,它們兩者之間的關(guān)系可用以下公式表示:

國(guó)標(biāo)碼=區(qū)位碼(十六進(jìn)制)+2020H

例如:已知漢字“春”的區(qū)位碼為“20-26”,計(jì)算它的國(guó)標(biāo)碼。區(qū)位碼:

2026十進(jìn)制

14H1AH十六進(jìn)制

+20H+20H

國(guó)標(biāo)碼:

34H3AH北京理工大學(xué)計(jì)算機(jī)學(xué)院2.3非數(shù)值數(shù)據(jù)的表示3.漢字機(jī)內(nèi)碼

漢字可以通過不同的輸入碼輸入,但在計(jì)算機(jī)內(nèi)部其內(nèi)碼是唯一的。

因?yàn)闈h字處理系統(tǒng)要保證中西文的兼容,當(dāng)系統(tǒng)中同時(shí)存在ASCII碼和漢字國(guó)標(biāo)碼時(shí),將會(huì)產(chǎn)生二義性。北京理工大學(xué)計(jì)算機(jī)學(xué)院2.3非數(shù)值數(shù)據(jù)的表示

例如:從主存中讀出兩個(gè)字節(jié)的內(nèi)容,它們分別為30H和21H,這時(shí)既可能是表示漢字“啊”的國(guó)標(biāo)碼,又可能是表示西文“0”和“!”的ASCII碼。啊30210!北京理工大學(xué)計(jì)算機(jī)學(xué)院2.3非數(shù)值數(shù)據(jù)的表示

常用的漢字機(jī)內(nèi)碼為兩字節(jié)長(zhǎng)的代碼,它是在相應(yīng)漢字國(guó)標(biāo)碼的每個(gè)字節(jié)最高位上加“1”。即:

漢字機(jī)內(nèi)碼=漢字國(guó)標(biāo)碼+8080H

例如,上述“啊”字的國(guó)標(biāo)碼是3021H,其漢字機(jī)內(nèi)碼則是B0A1H。3021+8080B0A1北京理工大學(xué)計(jì)算機(jī)學(xué)院2.3非數(shù)值數(shù)據(jù)的表示4.漢字字形碼

漢字字形碼是指確定一個(gè)漢字字形點(diǎn)陣的代碼,又叫漢字字模碼或漢字輸出碼。在一個(gè)漢字點(diǎn)陣中,凡筆畫所到之處,記為“1”,否則記為“0”。根據(jù)對(duì)漢字質(zhì)量的不同要求,可有16×16、24×24、32×32或48×48的點(diǎn)陣結(jié)構(gòu)。顯然點(diǎn)陣越大,輸出漢字的質(zhì)量越高,每個(gè)漢字所占用的字節(jié)數(shù)也越多。北京理工大學(xué)計(jì)算機(jī)學(xué)院2.3非數(shù)值數(shù)據(jù)的表示5.漢字編碼的發(fā)展

1990年頒布了繁體字的編碼標(biāo)準(zhǔn)GB12345-90,目的在于規(guī)范必須使用繁體字的各種場(chǎng)合,該標(biāo)準(zhǔn)共收錄6866個(gè)漢字(比GB2312多103個(gè)字),純繁體的字大概有2200余個(gè)。

1995年底推出的GBK編碼是中文編碼擴(kuò)展國(guó)家標(biāo)準(zhǔn),該編碼標(biāo)準(zhǔn)兼容GB2312,共收錄漢字21003個(gè)、符號(hào)883個(gè),并提供1894個(gè)造字碼位,簡(jiǎn)、繁體字融于一庫(kù)。

2000年底又頒布了GB18030大字符集標(biāo)準(zhǔn),這個(gè)標(biāo)準(zhǔn)可以涵蓋27484個(gè)漢字,繁、簡(jiǎn)字均處于同一平臺(tái)。北京理工大學(xué)計(jì)算機(jī)學(xué)院2.3非數(shù)值數(shù)據(jù)的表示2.3.3

統(tǒng)一代碼(Unicode)隨著國(guó)際間的交流與合作的擴(kuò)大,信息處理應(yīng)用對(duì)字符集提出了多文種、大字量、多用途的要求,解決問題的最佳方案是設(shè)計(jì)一種全新的編碼方法,這種方法必須有足夠的能力來表示任意一種語(yǔ)言里使用的所有符號(hào),這就是統(tǒng)一代碼(Unicode)。北京理工大學(xué)計(jì)算機(jī)學(xué)院2.3非數(shù)值數(shù)據(jù)的表示1.編碼方式

Unicode的基本方法是用一個(gè)16位的數(shù)來表示每個(gè)符號(hào),這種符號(hào)集可表示65536個(gè)不同的字符或符號(hào)。被稱為基本多語(yǔ)言平面(BMP)。這個(gè)空間已經(jīng)非常大了,但設(shè)計(jì)者考慮到將來某一天它可能也會(huì)不夠用,所以采用了一種可使這種表示法使用得更遠(yuǎn)的方法。北京理工大學(xué)計(jì)算機(jī)學(xué)院2.3非數(shù)值數(shù)據(jù)的表示

當(dāng)只用2字節(jié)數(shù)來表示Unicode字符時(shí),使用的是UCS-2編碼,但盡管如此,也允許在UCS-2文本中插入一些UCS-4字符。為此,在BMP中,保留了兩個(gè)有1024個(gè)大小的塊,這兩個(gè)塊中任何位置都不能用來表示任何符號(hào)。UCS-4的兩個(gè)16位字每個(gè)表示一個(gè)數(shù),這個(gè)數(shù)是UCS-2BMP中1024個(gè)數(shù)值中的一個(gè)。這兩個(gè)數(shù)的組合可以表示多達(dá)1百萬(wàn)多個(gè)自定義的UCS-4字符。

UCS-2:65536-2×1024

UCS-4:210×210=220北京理工大學(xué)計(jì)算機(jī)學(xué)院2.3非數(shù)值數(shù)據(jù)的表示

2.實(shí)現(xiàn)方式

Unicode的實(shí)現(xiàn)方式不同于編碼方式。一個(gè)字符的Unicode編碼是確

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論