




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
北京理工大學(xué)計(jì)算機(jī)學(xué)院第2章2.1數(shù)值數(shù)據(jù)的表示2.2機(jī)器數(shù)的定點(diǎn)表示與浮點(diǎn)表示2.3非數(shù)值數(shù)據(jù)的表示2.4十進(jìn)制數(shù)和數(shù)串的表示2.5不同類型的數(shù)據(jù)表示舉例2.6數(shù)據(jù)校驗(yàn)碼北京理工大學(xué)計(jì)算機(jī)學(xué)院2.3非數(shù)值數(shù)據(jù)的表示2.3.1字符和字符串的表示方法1.ASCII字符編碼常見(jiàn)的ASCII碼用七位二進(jìn)制表示一個(gè)字符,它包括10個(gè)十進(jìn)制數(shù)字(0~9)、52個(gè)英文大寫和小寫字母(A~Z,a~z)、34個(gè)專用符號(hào)和32個(gè)控制符號(hào),共計(jì)128個(gè)字符。在ASCII碼表中,數(shù)字和英文字母都是按順序排列的,只要知道其中一個(gè)的二進(jìn)制代碼,不要查表就可以推導(dǎo)出其他數(shù)字或字母的二進(jìn)制代碼。北京理工大學(xué)計(jì)算機(jī)學(xué)院2.3非數(shù)值數(shù)據(jù)的表示北京理工大學(xué)計(jì)算機(jī)學(xué)院2.3非數(shù)值數(shù)據(jù)的表示2.字符串的存放字符串是指一串連續(xù)的字符。例如,字符串IFX>0THENREAD(C)。
(1)向量法在存儲(chǔ)器中占用一片連續(xù)的空間,每個(gè)字節(jié)存放一個(gè)字符代碼,字符串的所有元素(字符)在物理上是鄰接的。在字長(zhǎng)為32位的存儲(chǔ)器,每一個(gè)主存單元可存放4個(gè)字符,整個(gè)字符串需5個(gè)主存單元。在每個(gè)字節(jié)中實(shí)際存放的是相應(yīng)字符的ASCII碼。北京理工大學(xué)計(jì)算機(jī)學(xué)院IFX>0THENREA(C)D2.3非數(shù)值數(shù)據(jù)的表示5449462020202030454541444852433E2928584E北京理工大學(xué)計(jì)算機(jī)學(xué)院2.3非數(shù)值數(shù)據(jù)的表示(2)串表法一個(gè)存儲(chǔ)單元有32位,僅存放一個(gè)字符代碼。字符串的每個(gè)字符代碼后有一個(gè)鏈接字,用以指出下一個(gè)字符的存儲(chǔ)單元地址。串表法不要求串中的各個(gè)字符在物理上相鄰,在對(duì)字符串進(jìn)行刪除和插入操作時(shí),只需修改相應(yīng)字符代碼后面的鏈接字即可。由于鏈接字占據(jù)了存儲(chǔ)單元的大部分空間,使得主存的有效利用率下降(只有原來(lái)的25%)。上例中整個(gè)字符串需19個(gè)主存單元。北京理工大學(xué)計(jì)算機(jī)學(xué)院2.3非數(shù)值數(shù)據(jù)的表示2.3.2漢字的表示1.漢字國(guó)標(biāo)碼
GB2312-80,簡(jiǎn)稱國(guó)標(biāo)碼。該標(biāo)準(zhǔn)共收集常用漢字6763個(gè),其中一級(jí)漢字3755個(gè),按拼音排序;二級(jí)漢字3008個(gè),按部首排序;另外還有各種圖形符號(hào)682個(gè),共計(jì)7445個(gè)。每個(gè)漢字、圖形符號(hào)都用兩個(gè)字節(jié)表示,每個(gè)字節(jié)只使用低七位編碼。北京理工大學(xué)計(jì)算機(jī)學(xué)院2.3非數(shù)值數(shù)據(jù)的表示2.漢字區(qū)位碼
區(qū)位碼將漢字編碼GB2312-80中的6763個(gè)漢字分為94個(gè)區(qū),每個(gè)區(qū)中包含94個(gè)漢字(位),區(qū)和位組成一個(gè)二維數(shù)組,每個(gè)漢字在數(shù)組中對(duì)應(yīng)一個(gè)唯一的區(qū)位碼。漢字的區(qū)位碼定長(zhǎng)4位,前2位表示區(qū)號(hào),后2位表示位號(hào),區(qū)號(hào)和位號(hào)用十進(jìn)制數(shù)表示,區(qū)號(hào)從01到94,位號(hào)也從01到94。例如,“中”字在54區(qū)的48位上,其區(qū)位碼為“54-48”,“國(guó)”字在25區(qū)的90位上,其區(qū)位碼為“25-90”。北京理工大學(xué)計(jì)算機(jī)學(xué)院2.3非數(shù)值數(shù)據(jù)的表示
漢字區(qū)位碼并不等于漢字國(guó)標(biāo)碼,它們兩者之間的關(guān)系可用以下公式表示:
國(guó)標(biāo)碼=區(qū)位碼(十六進(jìn)制)+2020H
例如:已知漢字“春”的區(qū)位碼為“20-26”,計(jì)算它的國(guó)標(biāo)碼。區(qū)位碼:
2026十進(jìn)制
↓
↓
14H1AH十六進(jìn)制
+20H+20H
國(guó)標(biāo)碼:
34H3AH北京理工大學(xué)計(jì)算機(jī)學(xué)院2.3非數(shù)值數(shù)據(jù)的表示3.漢字機(jī)內(nèi)碼
漢字可以通過(guò)不同的輸入碼輸入,但在計(jì)算機(jī)內(nèi)部其內(nèi)碼是唯一的。
因?yàn)闈h字處理系統(tǒng)要保證中西文的兼容,當(dāng)系統(tǒng)中同時(shí)存在ASCII碼和漢字國(guó)標(biāo)碼時(shí),將會(huì)產(chǎn)生二義性。北京理工大學(xué)計(jì)算機(jī)學(xué)院2.3非數(shù)值數(shù)據(jù)的表示
例如:從主存中讀出兩個(gè)字節(jié)的內(nèi)容,它們分別為30H和21H,這時(shí)既可能是表示漢字“啊”的國(guó)標(biāo)碼,又可能是表示西文“0”和“!”的ASCII碼。啊30210!北京理工大學(xué)計(jì)算機(jī)學(xué)院2.3非數(shù)值數(shù)據(jù)的表示
常用的漢字機(jī)內(nèi)碼為兩字節(jié)長(zhǎng)的代碼,它是在相應(yīng)漢字國(guó)標(biāo)碼的每個(gè)字節(jié)最高位上加“1”。即:
漢字機(jī)內(nèi)碼=漢字國(guó)標(biāo)碼+8080H
例如,上述“啊”字的國(guó)標(biāo)碼是3021H,其漢字機(jī)內(nèi)碼則是B0A1H。3021+8080B0A1北京理工大學(xué)計(jì)算機(jī)學(xué)院2.3非數(shù)值數(shù)據(jù)的表示4.漢字字形碼
漢字字形碼是指確定一個(gè)漢字字形點(diǎn)陣的代碼,又叫漢字字模碼或漢字輸出碼。在一個(gè)漢字點(diǎn)陣中,凡筆畫所到之處,記為“1”,否則記為“0”。根據(jù)對(duì)漢字質(zhì)量的不同要求,可有16×16、24×24、32×32或48×48的點(diǎn)陣結(jié)構(gòu)。顯然點(diǎn)陣越大,輸出漢字的質(zhì)量越高,每個(gè)漢字所占用的字節(jié)數(shù)也越多。北京理工大學(xué)計(jì)算機(jī)學(xué)院2.3非數(shù)值數(shù)據(jù)的表示5.漢字編碼的發(fā)展
1990年頒布了繁體字的編碼標(biāo)準(zhǔn)GB12345-90,目的在于規(guī)范必須使用繁體字的各種場(chǎng)合,該標(biāo)準(zhǔn)共收錄6866個(gè)漢字(比GB2312多103個(gè)字),純繁體的字大概有2200余個(gè)。
1995年底推出的GBK編碼是中文編碼擴(kuò)展國(guó)家標(biāo)準(zhǔn),該編碼標(biāo)準(zhǔn)兼容GB2312,共收錄漢字21003個(gè)、符號(hào)883個(gè),并提供1894個(gè)造字碼位,簡(jiǎn)、繁體字融于一庫(kù)。
2000年底又頒布了GB18030大字符集標(biāo)準(zhǔn),這個(gè)標(biāo)準(zhǔn)可以涵蓋27484個(gè)漢字,繁、簡(jiǎn)字均處于同一平臺(tái)。北京理工大學(xué)計(jì)算機(jī)學(xué)院2.3非數(shù)值數(shù)據(jù)的表示2.3.3
統(tǒng)一代碼(Unicode)隨著國(guó)際間的交流與合作的擴(kuò)大,信息處理應(yīng)用對(duì)字符集提出了多文種、大字量、多用途的要求,解決問(wèn)題的最佳方案是設(shè)計(jì)一種全新的編碼方法,這種方法必須有足夠的能力來(lái)表示任意一種語(yǔ)言里使用的所有符號(hào),這就是統(tǒng)一代碼(Unicode)。北京理工大學(xué)計(jì)算機(jī)學(xué)院2.3非數(shù)值數(shù)據(jù)的表示1.編碼方式
Unicode的基本方法是用一個(gè)16位的數(shù)來(lái)表示每個(gè)符號(hào),這種符號(hào)集可表示65536個(gè)不同的字符或符號(hào)。被稱為基本多語(yǔ)言平面(BMP)。這個(gè)空間已經(jīng)非常大了,但設(shè)計(jì)者考慮到將來(lái)某一天它可能也會(huì)不夠用,所以采用了一種可使這種表示法使用得更遠(yuǎn)的方法。北京理工大學(xué)計(jì)算機(jī)學(xué)院2.3非數(shù)值數(shù)據(jù)的表示
當(dāng)只用2字節(jié)數(shù)來(lái)表示Unicode字符時(shí),使用的是UCS-2編碼,但盡管如此,也允許在UCS-2文本中插入一些UCS-4字符。為此,在BMP中,保留了兩個(gè)有1024個(gè)大小的塊,這兩個(gè)塊中任何位置都不能用來(lái)表示任何符號(hào)。UCS-4的兩個(gè)16位字每個(gè)表示一個(gè)數(shù),這個(gè)數(shù)是UCS-2BMP中1024個(gè)數(shù)值中的一個(gè)。這兩個(gè)數(shù)的組合可以表示多達(dá)1百萬(wàn)多個(gè)自定義的UCS-4字符。
UCS-2:65536-2×1024
UCS-4:210×210=220北京理工大學(xué)計(jì)算機(jī)學(xué)院2.3非數(shù)值數(shù)據(jù)的表示
2.實(shí)現(xiàn)方式
Unicode的實(shí)現(xiàn)方式不同于編碼方式。一個(gè)字符的Unicode編碼是確
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年機(jī)械設(shè)備批發(fā)服務(wù)項(xiàng)目合作計(jì)劃書(shū)
- 表單填寫規(guī)范培訓(xùn)
- 2025年燈柱燈桿項(xiàng)目建議書(shū)
- 機(jī)場(chǎng)行李搬運(yùn)機(jī)器人行業(yè)跨境出海戰(zhàn)略研究報(bào)告
- 客運(yùn)汽車站企業(yè)縣域市場(chǎng)拓展與下沉戰(zhàn)略研究報(bào)告
- P2P網(wǎng)貸企業(yè)縣域市場(chǎng)拓展與下沉戰(zhàn)略研究報(bào)告
- 鮮、冷、凍肉企業(yè)數(shù)字化轉(zhuǎn)型與智慧升級(jí)戰(zhàn)略研究報(bào)告
- 山西省2024-2025學(xué)年高三下學(xué)期2月開(kāi)學(xué)摸底考試英語(yǔ)試題
- 酒水企業(yè)ESG實(shí)踐與創(chuàng)新戰(zhàn)略研究報(bào)告
- 貢緞臺(tái)布企業(yè)縣域市場(chǎng)拓展與下沉戰(zhàn)略研究報(bào)告
- GA/T 1788.4-2021公安視頻圖像信息系統(tǒng)安全技術(shù)要求第4部分:安全管理平臺(tái)
- FEKO教程-教學(xué)講解課件
- 鋼板型材機(jī)械性能試驗(yàn)報(bào)告
- 2023年蘇州市吳中產(chǎn)業(yè)投資集團(tuán)有限公司招聘筆試模擬試題及答案解析
- 船舶制造基地可行性研究報(bào)告
- 腫瘤生物靶向治療護(hù)理課件
- 紅樓夢(mèng)人物關(guān)系圖譜可A4打印版
- 石化公司建設(shè)項(xiàng)目竣工文件整理歸檔規(guī)范
- A4線纜標(biāo)簽數(shù)據(jù)模板
- 加油站電器火災(zāi)應(yīng)急預(yù)案演練記錄
- 沖壓件,汽車表面零件缺陷及原因分析
評(píng)論
0/150
提交評(píng)論