



全文預(yù)覽已結(jié)束
下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
計(jì)算機(jī)數(shù)據(jù)與編碼1.6.1 信息和數(shù)據(jù)信息是人們對(duì)客觀世界的認(rèn)識(shí),即對(duì)客觀世界的一種反映。數(shù)據(jù)是表達(dá)現(xiàn)實(shí)世界中各種信息的一組可以記錄、可以識(shí)別的記號(hào)或符號(hào)。它是信息的載體,是信息的具體表現(xiàn)形式。數(shù)據(jù)形式可以是字符、符號(hào)、表格、聲音、圖像等。數(shù)據(jù)可以在物理介質(zhì)上記錄或傳輸,并通過(guò)輸入設(shè)備傳送給計(jì)算機(jī)處理加工。數(shù)據(jù)的單位分為以下幾種:1) 位(bit)計(jì)算機(jī)中最小的數(shù)據(jù)單位 二進(jìn)制的一個(gè)數(shù)位,稱為比特位,簡(jiǎn)稱位。1位二進(jìn)制只能表示兩種狀態(tài),即0或1。n位二進(jìn)制能表示2n種狀態(tài)2) 字節(jié)(Byte)相鄰8個(gè)比特位組成一個(gè)字節(jié),用B表示。字節(jié)是計(jì)算機(jī)中用來(lái)表示存儲(chǔ)容量大小的基本單位。1B = 8bits1KB = 210B = 1024B1MB = 220B = 1024KB1GB = 230B = 1024MB1TB = 240B = 1024GB3) 字(Word)在計(jì)算機(jī)中作為一個(gè)整體被存取、傳送、處理的二進(jìn)制數(shù)位叫做一個(gè)字,每個(gè)字中二進(jìn)制位數(shù)的長(zhǎng)度,稱為字長(zhǎng)。用8位字長(zhǎng)表示一個(gè)整數(shù)與用16位字長(zhǎng)表示一個(gè)整數(shù),其所表示的數(shù)的上限和下限是不一樣的。字長(zhǎng)所占位數(shù) 其所表示的數(shù)的范圍8 -128 127 即:-27 (27 - 1)16 -32768 32767 即:-215 (215 - 1)32 -2147483648 2147483647 即:-231 (231 - 1)1.6.2 數(shù)字化信息編碼在計(jì)算機(jī)內(nèi)部,可用物理器件的高低電平代表二進(jìn)制的“0”和“1”,另外,脈沖的正負(fù)極性,晶體管的導(dǎo)通和截止都可以用來(lái)表示二進(jìn)制的“0”和“1”。由于二進(jìn)制只有兩個(gè)狀態(tài),數(shù)據(jù)的傳輸和處理不容易出錯(cuò),另外二進(jìn)制數(shù)的記數(shù)、加減法運(yùn)算規(guī)則較為簡(jiǎn)單,可用開(kāi)關(guān)電路實(shí)現(xiàn),且二進(jìn)制的“0”和“1”正好與邏輯命題的兩個(gè)值“真”和“假”相對(duì)應(yīng),為計(jì)算機(jī)種中實(shí)現(xiàn)邏輯運(yùn)算和邏輯判斷提供了便利的條件。所以,在計(jì)算機(jī)中,廣泛采用的是只有“0”和“1”兩個(gè)基本符號(hào)組成的基二碼,或稱為二進(jìn)制碼。計(jì)算機(jī)最重要的功能是處理信息,這些信息包括數(shù)值、文字、圖形、符號(hào)、圖象、聲音等,所有這些信息都必須經(jīng)過(guò)編碼,轉(zhuǎn)換成計(jì)算機(jī)能夠識(shí)別和處理的二進(jìn)制碼的形式才能夠被存儲(chǔ)、傳送和加工。BCD碼是二進(jìn)制編碼的十進(jìn)制數(shù)(Binary Coded Decimal)的簡(jiǎn)寫。有四位 BCD碼、六位BCD碼和擴(kuò)展的BCD碼三種。(1)非數(shù)值數(shù)據(jù)的表示1) 字符數(shù)據(jù)的表示ASCII碼(America Standard Code for Information Interchage)是美國(guó)標(biāo)準(zhǔn)信息交換碼,被國(guó)際化組織指定為國(guó)際標(biāo)準(zhǔn),分為7位和8位兩種版本。國(guó)際通用的是7位ASCII碼,它已對(duì)大、小寫英文字母、阿拉伯?dāng)?shù)字、標(biāo)點(diǎn)符號(hào)及控制符等特殊符號(hào)編碼,共128個(gè)字符。表中特殊符號(hào)的意義如下:NUL 空白SOH 標(biāo)題開(kāi)始STX 正文開(kāi)始EXT 正文結(jié)束EOT 傳輸結(jié)束ENQ 詢問(wèn)ACK 承認(rèn)BEL 告警BS 退格HT 橫向列表LF 換行VT 垂直列表FF 換頁(yè)CR 回車SO 移位輸出SI 移位輸入SP 空格DLE 轉(zhuǎn)義DC1 設(shè)備控制1DC2 設(shè)備控制2DC3 設(shè)備控制3DC4 設(shè)備控制4NAK 否認(rèn)SYN 空轉(zhuǎn)同步ETB 信息組傳送結(jié)束CAN 作廢EM 紙盡SUB 取代ESC 擴(kuò)展FS 文字分隔符GS 組分隔符RS 記錄分隔符US 單元分隔符DEL 刪除(2) 漢字的表示漢字與英文的主要區(qū)別: 1) 英文是拼音文字,漢字是表意文字。英文字母只有26個(gè),漢字多達(dá)5萬(wàn)個(gè)以上,常用漢字也有6000多個(gè)。 2) 漢字的同音字很多,一個(gè)音往往會(huì)有幾個(gè)甚至幾十個(gè)字。3) 英文排序簡(jiǎn)單,漢字排序非常復(fù)雜,而且與文字本身沒(méi)有本質(zhì)聯(lián)系。開(kāi)發(fā)一個(gè)完善的中文信息處理系統(tǒng)必須解決以下三個(gè)主要問(wèn)題: (1) 漢字輸入 (2) 漢字輸出 (3) 漢字與西文的兼容性漢字的編碼和表示 1)漢字交換碼(國(guó)標(biāo)碼) 漢字交換碼(國(guó)標(biāo)碼)主要用于漢字信息交換。國(guó)標(biāo)碼:以國(guó)家標(biāo)準(zhǔn)局1980年頒布的信息交換用漢字編碼字符集基本集(代號(hào)為GB2312 80)規(guī)定的漢字交換碼作為國(guó)家標(biāo)準(zhǔn)漢字編碼。 GB2312 80中共有7445個(gè)字符符號(hào): 漢字符號(hào)6763個(gè) 一級(jí)漢字3755個(gè)(按漢語(yǔ)拼音字母順序排列) 二級(jí)漢字3008個(gè)(按部首筆劃順序排列) 非漢字符號(hào)682個(gè) GB2312 80規(guī)定,所有的國(guó)標(biāo)碼漢字及符號(hào)組成一個(gè)94 94的方陣。在此方陣中,每一行稱為一個(gè)區(qū),每一列稱為一個(gè)位。這個(gè)方陣實(shí)際上組成一個(gè)有94個(gè)區(qū)(編號(hào)由01到94),每個(gè)區(qū)有94個(gè)位(編號(hào)由01到94)的漢字字符集。 一個(gè)漢字所在的區(qū)號(hào)和位號(hào)的組合就構(gòu)成了該漢字的區(qū)位碼。其中,高兩位為區(qū)號(hào),低兩位為位號(hào)。這樣區(qū)位碼可以唯一地確定某一漢字或字符;反之,任何一個(gè)漢字或符號(hào)都對(duì)應(yīng)一個(gè)唯一的區(qū)位碼,沒(méi)有重碼。 區(qū)位碼分布情況如下:區(qū) 號(hào) 內(nèi) 容 1區(qū) 鍵盤上沒(méi)有的各種符號(hào) 2區(qū) 各種序號(hào) 3區(qū) 鍵盤上的各種符號(hào)(按中文方式給出) 4 -5區(qū) 日文字母 6區(qū) 希臘字母 7區(qū) 俄文字母 8區(qū) 標(biāo)識(shí)拼音聲調(diào)的母音及拼音字母名稱 9區(qū) 制表符號(hào) 10- 15區(qū) 未用 16-55區(qū) 一級(jí)漢字(按拼音字母順序排列) 56- 87區(qū) 二級(jí)漢字(按部首筆劃順序排列) 88- 94區(qū) 自定義漢字 由上可以看出,所有漢字與符號(hào)的94個(gè)區(qū),可以分為四個(gè)組:1 -15區(qū):為圖形符號(hào)區(qū)。其中1 9區(qū)為標(biāo)準(zhǔn)符號(hào)區(qū);10 15區(qū)為自定義符號(hào)區(qū)。16 -55區(qū):為一級(jí)漢字區(qū),包含3755個(gè)漢字。這些區(qū)中的漢字按漢語(yǔ)拼音順序排序,同音字按筆畫(huà)順序列出。56 -87區(qū):為二級(jí)漢字區(qū),包含3008個(gè)漢字。這些區(qū)中的漢字是按部首筆劃順序排序的。88 -94區(qū):為自定義漢字區(qū)。國(guó)標(biāo)碼規(guī)定,每個(gè)漢字(包括非漢字的一些符號(hào))由2字節(jié)代碼表示。每個(gè)字節(jié)的最高位為0,只使用低7位,而低7位的編碼中又有34個(gè)適用于控制用的,這樣每個(gè)字節(jié)只有27 - 34 = 94個(gè)編碼用于漢字。2個(gè)字節(jié)就有94 94=8836個(gè)漢字編碼。在表示一個(gè)漢字的2個(gè)字節(jié)中,高字節(jié)對(duì)應(yīng)編碼表中的行號(hào),稱為區(qū)號(hào);低字節(jié)對(duì)應(yīng)編碼表中的列號(hào),稱為位號(hào)。漢字國(guó)標(biāo)碼的范圍用二進(jìn)制表示是: 00100001 00100001 01111110 01111110 (1+32)10 (1+32)10 (94+32)10 (94+32)10 7位ASCII碼是128個(gè)字符組成的字符集。其中編碼值0 31(00000000 00011111)不對(duì)應(yīng)任何印刷字符,通常稱為控制符,用于計(jì)算機(jī)通信中的通信控制或?qū)τ?jì)算機(jī)設(shè)備的功能控制。編碼值32(00100000)是空格字符SP。編碼值127(1111111)是刪除字符DEL。漢字國(guó)標(biāo)碼的起始二進(jìn)制位置選擇00100001即(33)10是為了跳過(guò)ASCII碼的32個(gè)控制字符和空格字符。所以,漢字國(guó)標(biāo)碼的高位和低位分別比對(duì)應(yīng)的區(qū)位碼大(32)10或(00100000)2或(20)H,即: 國(guó)標(biāo)碼高位 = 區(qū)碼 + 20H (H表示十六進(jìn)制) 國(guó)標(biāo)碼低位 = 位碼 + 20H2) 漢字機(jī)內(nèi)碼(內(nèi)碼)(漢字存儲(chǔ)碼) 漢字機(jī)內(nèi)碼(內(nèi)碼)(漢字存儲(chǔ)碼)的作用是統(tǒng)一了各種不同的漢字輸入碼在計(jì)算機(jī)內(nèi)部的表示。 為了將漢字的各種輸入碼在計(jì)算機(jī)內(nèi)部統(tǒng)一起來(lái),就有了專用于計(jì)算機(jī)內(nèi)部存儲(chǔ)漢字使用的漢字機(jī)內(nèi)碼,用以將輸入時(shí)使用的多種漢字輸入碼統(tǒng)一轉(zhuǎn)換成漢字機(jī)內(nèi)碼進(jìn)行存儲(chǔ),以方便機(jī)內(nèi)的漢字處理 漢字機(jī)內(nèi)碼是在計(jì)算機(jī)內(nèi)部存儲(chǔ)、處理的代碼。計(jì)算機(jī)既要處理漢字,又要處理英文。因此計(jì)算機(jī)必須能區(qū)別漢字字符和英文字符。英文字符的的機(jī)內(nèi)碼是最高為為0的8位ASCII碼。為了不與7位ASCII碼發(fā)生沖突,把國(guó)標(biāo)碼每個(gè)字節(jié)的最高位由0改為1,其余位不變的編碼作為漢字字符的機(jī)內(nèi)碼。漢字機(jī)內(nèi)碼的范圍用二進(jìn)制表示是: 10100001 10100001 11111110 11111110 機(jī)內(nèi)碼的高位和低位比對(duì)應(yīng)的國(guó)標(biāo)碼的高位和低位大(128)10或(10000000)2或(80)H 即: 機(jī)內(nèi)碼高位 = 國(guó)標(biāo)碼高位 + 80H 機(jī)內(nèi)碼低位 = 國(guó)標(biāo)碼低位 + 80H 又因?yàn)椋?國(guó)標(biāo)碼高位 = 區(qū)碼 + 20H 國(guó)標(biāo)碼低位 = 位碼 + 20H 所以: 機(jī)內(nèi)碼高位 = 區(qū)碼 + A0H 機(jī)內(nèi)碼低位 = 位碼 + A0H 也就是說(shuō),機(jī)內(nèi)碼高位和機(jī)內(nèi)碼低位分別比對(duì)應(yīng)的區(qū)碼和位碼大(160)10或(10100000)2或(A0)H 例如:漢字啊的區(qū)位碼為1601,其中區(qū)碼為(16)10或(10)H,位碼為(01)10或(01)H。 則: 機(jī)內(nèi)碼高位 = 10H + A0H = B0H 機(jī)內(nèi)碼低位 = 01H + A0H = A1H 所以: 機(jī)內(nèi)碼= B0A1H 3) 漢字輸入碼(外碼)漢字輸入碼(外碼)是為了通過(guò)鍵盤字符把漢字輸入計(jì)算機(jī)而設(shè)計(jì)的一種編碼。 英文輸入時(shí),相輸入什么字符便按什么鍵,輸入碼和機(jī)內(nèi)碼一致。漢字輸入時(shí),可能要按幾個(gè)鍵才能輸入一個(gè)漢字。 漢字輸入方案有成百上千個(gè),但是這千差萬(wàn)別的外碼輸入進(jìn)計(jì)算機(jī)后都會(huì)轉(zhuǎn)換成統(tǒng)一的內(nèi)碼。 漢字輸入方案大致可分為以下4種類型:(1) 音碼:如全拼、雙拼、微軟拼音等 (2) 形碼:如五筆字型、鄭碼、表形碼等 (3) 音形碼:如智能ABC、自然碼等(4) 數(shù)字碼:如區(qū)位碼、電報(bào)碼等4) 漢字字形碼(輸出碼)漢字字形碼(輸出碼)用于漢字的顯示和打印,是漢字字形的數(shù)字化信息。 漢字的內(nèi)碼是用數(shù)字代碼來(lái)表示漢字,但是為了在輸出時(shí)讓人們看到漢字,就必須輸出漢字的字形。在漢字系統(tǒng)中,一般采用點(diǎn)陣來(lái)表示字形。 16 *16漢字點(diǎn)陣示意 16 * 16點(diǎn)陣字形的字要使用32個(gè)字節(jié)(16 * 16/8=32)存儲(chǔ),24 * 24點(diǎn)陣字形的字要使用72個(gè)字節(jié)(24 *
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 如何在Photoshop中實(shí)現(xiàn)分層效果試題及答案
- 某年度臨床研究服務(wù)產(chǎn)業(yè)分析報(bào)告
- 2025年稅法考試的復(fù)習(xí)清單及試題及答案
- 敘事文學(xué)的魅力與特征試題及答案
- 工業(yè)廢氣深度凈化技術(shù)在環(huán)保產(chǎn)業(yè)的技術(shù)創(chuàng)新與產(chǎn)業(yè)布局報(bào)告
- 備考攻略Msoffice試題及答案解析
- 提升數(shù)字教育資源版權(quán)管理水平的措施研究
- 2025年漢語(yǔ)考試反饋試題及答案
- 基于大數(shù)據(jù)的教師能力分析與提升策略研究
- 2025年城市道路拓寬改造項(xiàng)目社會(huì)穩(wěn)定風(fēng)險(xiǎn)預(yù)警與應(yīng)對(duì)策略報(bào)告
- 霍蘭德職業(yè)興趣測(cè)試題(卷)完整版
- 醫(yī)院檢驗(yàn)科實(shí)驗(yàn)室生物安全管理委員會(huì)及工作職責(zé)
- 福建省市政基礎(chǔ)設(shè)施工程竣工驗(yàn)收?qǐng)?bào)告(附件2)
- 市政工程監(jiān)理規(guī)劃范本(完整版)
- 艾里遜自動(dòng)變速箱針腳圖PPT通用課件
- 交管12123駕照學(xué)法減分題庫(kù)及答案共155題(完整版)
- 5Why分析法經(jīng)典培訓(xùn)(43頁(yè))
- 食品物性學(xué)-第二章 食品力學(xué)性質(zhì)和流變學(xué)基礎(chǔ)
- 2018二建繼續(xù)教育(市政公用工程)試題庫(kù)(有答案解析)
- 斜屋面瓦安裝施工及方案
- 鋼樓梯鋼結(jié)構(gòu)施工方案
評(píng)論
0/150
提交評(píng)論