版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、陳炬樺介紹數(shù)值型數(shù)據(jù)和介紹數(shù)值型數(shù)據(jù)和字符型數(shù)據(jù)的基本編字符型數(shù)據(jù)的基本編碼技術(shù),并簡(jiǎn)單介紹碼技術(shù),并簡(jiǎn)單介紹數(shù)據(jù)壓縮技術(shù)。數(shù)據(jù)壓縮技術(shù)。l二進(jìn)制信息表示二進(jìn)制信息表示l數(shù)制及轉(zhuǎn)換數(shù)制及轉(zhuǎn)換l數(shù)值型數(shù)據(jù)的表示及運(yùn)算數(shù)值型數(shù)據(jù)的表示及運(yùn)算l字符編碼技術(shù)字符編碼技術(shù)l數(shù)據(jù)壓縮數(shù)據(jù)壓縮2.1.1信息與數(shù)據(jù)信息與數(shù)據(jù)l數(shù)據(jù)是信息的具體表示形式,而信息是數(shù)據(jù)所表數(shù)據(jù)是信息的具體表示形式,而信息是數(shù)據(jù)所表達(dá)的含義。例如,數(shù)值達(dá)的含義。例如,數(shù)值20是一個(gè)數(shù)據(jù),可能表示某是一個(gè)數(shù)據(jù),可能表示某班有班有20人、某人人、某人20歲或某物歲或某物20噸等信息。噸等信息。l信息與數(shù)據(jù)是一個(gè)密不可分的有機(jī)整體。信息和
2、信息與數(shù)據(jù)是一個(gè)密不可分的有機(jī)整體。信息和數(shù)據(jù)這兩個(gè)名詞常??梢酝ㄓ?。數(shù)據(jù)這兩個(gè)名詞常??梢酝ㄓ谩?.1.2 二進(jìn)制信息二進(jìn)制信息l計(jì)算機(jī)內(nèi)部的信息是以二進(jìn)制形式表示。二進(jìn)計(jì)算機(jī)內(nèi)部的信息是以二進(jìn)制形式表示。二進(jìn)制是逢制是逢2進(jìn)進(jìn)1。l為什么使用二進(jìn)制為什么使用二進(jìn)制?u二進(jìn)制的二進(jìn)制的“0”和和“1”可以分別用電器元件的兩種狀可以分別用電器元件的兩種狀態(tài)來表示,很容易實(shí)現(xiàn)。如開關(guān)的接通為態(tài)來表示,很容易實(shí)現(xiàn)。如開關(guān)的接通為1,斷開為,斷開為0;高電平為高電平為1,低電平為,低電平為0等。假如采用十進(jìn)制,要制造等。假如采用十進(jìn)制,要制造具有十種穩(wěn)定狀態(tài)的物理電路,則是非常困難的。具有十種穩(wěn)定狀
3、態(tài)的物理電路,則是非常困難的。u二進(jìn)制數(shù)的運(yùn)算規(guī)則簡(jiǎn)單,容易用計(jì)算機(jī)硬件實(shí)現(xiàn),二進(jìn)制數(shù)的運(yùn)算規(guī)則簡(jiǎn)單,容易用計(jì)算機(jī)硬件實(shí)現(xiàn),也便于邏輯判斷。也便于邏輯判斷。2.1.3 信息單位信息單位l最小單位:最小單位:bit、比特、位、比特、位l最基本的存儲(chǔ)單元:最基本的存儲(chǔ)單元: Byte、字節(jié),包括、字節(jié),包括8個(gè)個(gè) bitl常用單位:常用單位: 1KB (千字節(jié)千字節(jié)) = 1024 Byte = 210 Byte 1MB (兆字節(jié)兆字節(jié)) = 1024 KB = 220 Byte 1GB (吉字節(jié)吉字節(jié)) = 1024 MB = 230 Byte 1TB (太拉字節(jié)太拉字節(jié)) = 1024 GB
4、= 240 Bytel機(jī)器字(字):計(jì)算機(jī)能夠直接處理的二進(jìn)制位串機(jī)器字(字):計(jì)算機(jī)能夠直接處理的二進(jìn)制位串l機(jī)器字長(字長):一個(gè)機(jī)器字所含二進(jìn)制位的位數(shù)。機(jī)器字長(字長):一個(gè)機(jī)器字所含二進(jìn)制位的位數(shù)。一般為一般為8的倍數(shù),如的倍數(shù),如8、16、32、64、1282.2.1 進(jìn)位計(jì)數(shù)制進(jìn)位計(jì)數(shù)制數(shù)制:數(shù)制:也稱計(jì)數(shù)制,是指用一組固定的符號(hào)和統(tǒng)一的也稱計(jì)數(shù)制,是指用一組固定的符號(hào)和統(tǒng)一的規(guī)則來表示數(shù)值的方法。規(guī)則來表示數(shù)值的方法。進(jìn)位計(jì)數(shù)制:進(jìn)位計(jì)數(shù)制:按進(jìn)位的方法進(jìn)行計(jì)數(shù)。例如,十進(jìn)制、按進(jìn)位的方法進(jìn)行計(jì)數(shù)。例如,十進(jìn)制、二進(jìn)制、八進(jìn)制和十六進(jìn)制等。二進(jìn)制、八進(jìn)制和十六進(jìn)制等。進(jìn)位計(jì)數(shù)制
5、三要素進(jìn)位計(jì)數(shù)制三要素l數(shù)位:數(shù)位:如個(gè)、十、百、千、萬位等。如個(gè)、十、百、千、萬位等。l基數(shù):基數(shù):數(shù)碼個(gè)數(shù),逢基數(shù)進(jìn)一。數(shù)碼個(gè)數(shù),逢基數(shù)進(jìn)一。l位權(quán):位權(quán):與數(shù)位相關(guān)的一個(gè)固定數(shù)值。例如,十進(jìn)制數(shù)與數(shù)位相關(guān)的一個(gè)固定數(shù)值。例如,十進(jìn)制數(shù)的個(gè)位位權(quán)為的個(gè)位位權(quán)為100=1,十位為,十位為101=10,百位為,百位為102=100 而小數(shù)點(diǎn)后的位權(quán)依次為而小數(shù)點(diǎn)后的位權(quán)依次為10-1、10-2 等;對(duì)于二進(jìn)制數(shù)等;對(duì)于二進(jìn)制數(shù)101.01,其位權(quán)依次是,其位權(quán)依次是22、21、20、2-1、2-2。常見進(jìn)位計(jì)數(shù)制常見進(jìn)位計(jì)數(shù)制位權(quán)展開式位權(quán)展開式l用于把任何一個(gè)用于把任何一個(gè)R進(jìn)制數(shù)進(jìn)制數(shù)N轉(zhuǎn)
6、換為等值的十進(jìn)制數(shù):轉(zhuǎn)換為等值的十進(jìn)制數(shù):l其中其中:i=0,1,2,3, Ri為第為第i位的位權(quán),位的位權(quán),ai為第為第i位數(shù)碼所對(duì)應(yīng)的十位數(shù)碼所對(duì)應(yīng)的十進(jìn)制數(shù)(或稱系數(shù))。進(jìn)制數(shù)(或稱系數(shù))。2.2.2 將非十進(jìn)制數(shù)轉(zhuǎn)換為十進(jìn)制數(shù)將非十進(jìn)制數(shù)轉(zhuǎn)換為十進(jìn)制數(shù)方法:方法:采用位權(quán)展開式采用位權(quán)展開式示例:示例:(1011.101)2 = 123+022+121+120+ 12-1+02-2+12-3 = (11.625)10 (143) 8 = 182+481+380 = (99)10 (FA59)16 = 15163+10162+5161+9160 = (64089)10 2.2.3 將十進(jìn)
7、制數(shù)轉(zhuǎn)換為非十進(jìn)制數(shù)將十進(jìn)制數(shù)轉(zhuǎn)換為非十進(jìn)制數(shù)基本方法:基本方法:將整數(shù)部分和小數(shù)部分分別進(jìn)行轉(zhuǎn)換,然將整數(shù)部分和小數(shù)部分分別進(jìn)行轉(zhuǎn)換,然后再將它們合并起來。后再將它們合并起來。一、對(duì)于整數(shù)部分,采用除一、對(duì)于整數(shù)部分,采用除R取余數(shù)倒排法:取余數(shù)倒排法:例例2.2,(89)10 (1011001)2 ,采用,采用“除除2取余倒排法取余倒排法” 例例2.3,(219)10 (DB)16 ,采用,采用“除除16取余倒排法取余倒排法” 二、對(duì)于小數(shù)部分,采用乘二、對(duì)于小數(shù)部分,采用乘R取整順排法取整順排法例例2.4,(0.3125)10 (0.0101)2 , 采用采用“乘乘2取整順排取整順排法法
8、” 2.2.4 非十進(jìn)制數(shù)之間的轉(zhuǎn)換非十進(jìn)制數(shù)之間的轉(zhuǎn)換(一)二進(jìn)制轉(zhuǎn)換為八進(jìn)制(一)二進(jìn)制轉(zhuǎn)換為八進(jìn)制十六進(jìn)制十六進(jìn)制l方法:方法:3位合位合1位(或位(或4位合位合1位),不足補(bǔ)位),不足補(bǔ)0 l例例2.5(二)八進(jìn)制(二)八進(jìn)制十六進(jìn)制轉(zhuǎn)換為二進(jìn)制十六進(jìn)制轉(zhuǎn)換為二進(jìn)制l方法:方法: “一分為三一分為三”(或(或 “一分為四一分為四”),去除),去除頭尾多余的頭尾多余的0。l例例2.62.3.1 二進(jìn)制的基本運(yùn)算二進(jìn)制的基本運(yùn)算一、算術(shù)運(yùn)算一、算術(shù)運(yùn)算l二進(jìn)制加、減運(yùn)算規(guī)則:逢二進(jìn)一,借一當(dāng)二二進(jìn)制加、減運(yùn)算規(guī)則:逢二進(jìn)一,借一當(dāng)二l例例2.7二、邏輯運(yùn)算二、邏輯運(yùn)算l邏輯或:邏輯或:00
9、=0 01=1 10=1 11=1l邏輯與:邏輯與:00=0 01=0 10=0 11=1l非運(yùn)算:非運(yùn)算:0的非是的非是1,1的非是的非是0。l異或運(yùn)算:異或運(yùn)算:l例例2.82.3.2 機(jī)器數(shù)與真值機(jī)器數(shù)與真值l機(jī)器數(shù)機(jī)器數(shù):數(shù)值在計(jì)算機(jī)中的二進(jìn)制表示形式數(shù)值在計(jì)算機(jī)中的二進(jìn)制表示形式,包括,包括數(shù)的正、負(fù)符號(hào)和小數(shù)點(diǎn)。數(shù)的正、負(fù)符號(hào)和小數(shù)點(diǎn)。l真值真值:機(jī)器數(shù)所代表的一般數(shù)學(xué)意義上用正負(fù)號(hào)和機(jī)器數(shù)所代表的一般數(shù)學(xué)意義上用正負(fù)號(hào)和數(shù)字符號(hào)表示的實(shí)際數(shù)值。數(shù)字符號(hào)表示的實(shí)際數(shù)值。一、數(shù)符位一、數(shù)符位l根據(jù)有無數(shù)符位,機(jī)器數(shù)分為根據(jù)有無數(shù)符位,機(jī)器數(shù)分為u有符號(hào)數(shù)有符號(hào)數(shù)u無符號(hào)數(shù)無符號(hào)數(shù)l數(shù)
10、符數(shù)符:機(jī)器數(shù)的最高位通常定義為符號(hào)位,表示數(shù)機(jī)器數(shù)的最高位通常定義為符號(hào)位,表示數(shù)的正負(fù)號(hào)的正負(fù)號(hào),一般一般0表示正號(hào)表示正號(hào)“+”,1表示負(fù)號(hào)表示負(fù)號(hào)“”。其余位則表示數(shù)值的大小。其余位則表示數(shù)值的大小。如:如:(0110101)2表示為:表示為:二、定點(diǎn)數(shù)和浮點(diǎn)數(shù)二、定點(diǎn)數(shù)和浮點(diǎn)數(shù)l在計(jì)算機(jī)內(nèi)部,并不顯式地表示出小數(shù)點(diǎn),而是在計(jì)算機(jī)內(nèi)部,并不顯式地表示出小數(shù)點(diǎn),而是通過對(duì)小數(shù)點(diǎn)的位置加以規(guī)定來表示。根據(jù)數(shù)中小通過對(duì)小數(shù)點(diǎn)的位置加以規(guī)定來表示。根據(jù)數(shù)中小數(shù)點(diǎn)的位置是否固定,可把機(jī)器數(shù)分為定點(diǎn)數(shù)和浮數(shù)點(diǎn)的位置是否固定,可把機(jī)器數(shù)分為定點(diǎn)數(shù)和浮點(diǎn)數(shù)兩種表示方法。點(diǎn)數(shù)兩種表示方法。l定點(diǎn)數(shù):定點(diǎn)
11、數(shù):小數(shù)點(diǎn)的位置固定不變的機(jī)器數(shù),用于小數(shù)點(diǎn)的位置固定不變的機(jī)器數(shù),用于表示整數(shù)和純小數(shù)。表示整數(shù)和純小數(shù)。l浮點(diǎn)數(shù)浮點(diǎn)數(shù):小數(shù)點(diǎn)位置不固定的機(jī)器數(shù),用于表示小數(shù)點(diǎn)位置不固定的機(jī)器數(shù),用于表示實(shí)數(shù)。實(shí)數(shù)。2.3.3 整數(shù)和實(shí)數(shù)的表示方法整數(shù)和實(shí)數(shù)的表示方法一、整數(shù)一、整數(shù)l整數(shù)沒有小數(shù)部分,因此可以認(rèn)為小數(shù)點(diǎn)固整數(shù)沒有小數(shù)部分,因此可以認(rèn)為小數(shù)點(diǎn)固定在數(shù)的最右邊。定在數(shù)的最右邊。l例:例:有符號(hào)整數(shù)有符號(hào)整數(shù) 65 表示表示為:為:二二、純小數(shù)純小數(shù)l純小數(shù)沒有整數(shù)部分,因此可以把小數(shù)點(diǎn)固純小數(shù)沒有整數(shù)部分,因此可以把小數(shù)點(diǎn)固定在機(jī)器數(shù)的最高數(shù)值位之前定在機(jī)器數(shù)的最高數(shù)值位之前l(fā)例:例:純小數(shù)
12、純小數(shù) 0.5 表示為:表示為:三三、實(shí)數(shù)、實(shí)數(shù)l基本基本表示方法:表示方法:用階碼和尾數(shù)來表示。如用階碼和尾數(shù)來表示。如: 0.3429106 尾數(shù)尾數(shù) 階碼階碼浮點(diǎn)數(shù)機(jī)內(nèi)表示形式浮點(diǎn)數(shù)機(jī)內(nèi)表示形式l尾數(shù):尾數(shù):表示數(shù)值的有效數(shù)字,當(dāng)尾數(shù)不為表示數(shù)值的有效數(shù)字,當(dāng)尾數(shù)不為0時(shí),時(shí),其絕對(duì)值大于等于其絕對(duì)值大于等于0.5(注:因?yàn)槭嵌M(jìn)制數(shù),要(注:因?yàn)槭嵌M(jìn)制數(shù),要求尾數(shù)的第求尾數(shù)的第1位必須是位必須是1 )且小于)且小于1。l階碼:階碼:用來指示尾數(shù)中的小數(shù)點(diǎn)應(yīng)當(dāng)向左或向右用來指示尾數(shù)中的小數(shù)點(diǎn)應(yīng)當(dāng)向左或向右移動(dòng)的位數(shù)。移動(dòng)的位數(shù)。l例如,例如,設(shè)機(jī)器字長為設(shè)機(jī)器字長為16位,尾數(shù)為位,尾
13、數(shù)為8位,階碼為位,階碼為6位,則二進(jìn)制實(shí)數(shù)位,則二進(jìn)制實(shí)數(shù)1101.010 = 0.1101012100,其機(jī)內(nèi)表示形式如下:其機(jī)內(nèi)表示形式如下: 2.3.4 原碼、反碼和補(bǔ)碼原碼、反碼和補(bǔ)碼機(jī)器數(shù)的編碼方法有多種,最常用的是原碼、反碼和補(bǔ)碼。機(jī)器數(shù)的編碼方法有多種,最常用的是原碼、反碼和補(bǔ)碼。一、原碼一、原碼l編碼規(guī)則:符號(hào)位編碼規(guī)則:符號(hào)位0表示正,表示正,1表示負(fù),數(shù)值部分表示負(fù),數(shù)值部分用該數(shù)絕對(duì)值的二進(jìn)制數(shù)表示。例如:用該數(shù)絕對(duì)值的二進(jìn)制數(shù)表示。例如:l原碼易于乘除運(yùn)算,但不易于加減運(yùn)算,且零有原碼易于乘除運(yùn)算,但不易于加減運(yùn)算,且零有兩種表示形式兩種表示形式 二、反碼二、反碼l編
14、碼規(guī)則:符號(hào)位編碼規(guī)則:符號(hào)位0表示正,表示正,1表示負(fù),正數(shù)的反表示負(fù),正數(shù)的反碼等于原碼,負(fù)數(shù)的反碼等于原碼除符號(hào)位外按位碼等于原碼,負(fù)數(shù)的反碼等于原碼除符號(hào)位外按位取反,即取反,即0變變1、1變變0。例如:。例如:l反碼不方便運(yùn)算,且零也有兩種表示形式,一般反碼不方便運(yùn)算,且零也有兩種表示形式,一般在求補(bǔ)碼的過程中用到反碼。在求補(bǔ)碼的過程中用到反碼。三、補(bǔ)碼三、補(bǔ)碼l編碼規(guī)則編碼規(guī)則:符號(hào)位:符號(hào)位0表示正,表示正,1表示負(fù),正數(shù)的補(bǔ)表示負(fù),正數(shù)的補(bǔ)碼等于原碼,負(fù)數(shù)的補(bǔ)碼等于其反碼末位加碼等于原碼,負(fù)數(shù)的補(bǔ)碼等于其反碼末位加1。例。例如:如:l例例2.9,求,求X=+1011,Y=110
15、1的原碼、反碼和補(bǔ)的原碼、反碼和補(bǔ)碼:碼:l補(bǔ)碼易于加減運(yùn)算,且零有唯一的表示形式補(bǔ)碼易于加減運(yùn)算,且零有唯一的表示形式四、四、BCD碼碼lBCD碼:用一組碼:用一組4位二進(jìn)制碼來表示位二進(jìn)制碼來表示1位十進(jìn)制數(shù)位十進(jìn)制數(shù)的編碼方法,也稱作二的編碼方法,也稱作二十進(jìn)制碼。通常是指十進(jìn)制碼。通常是指8421 BCD碼。碼。l例例2.102.3.5 數(shù)值運(yùn)算數(shù)值運(yùn)算一、補(bǔ)碼運(yùn)算一、補(bǔ)碼運(yùn)算采用補(bǔ)碼進(jìn)行加減運(yùn)算十分方便。通過對(duì)負(fù)數(shù)的編采用補(bǔ)碼進(jìn)行加減運(yùn)算十分方便。通過對(duì)負(fù)數(shù)的編碼處理,允許符號(hào)位和數(shù)值一起參與運(yùn)算,可以把碼處理,允許符號(hào)位和數(shù)值一起參與運(yùn)算,可以把減法運(yùn)算轉(zhuǎn)化為加法運(yùn)算。不論求和、求
16、差,也不減法運(yùn)算轉(zhuǎn)化為加法運(yùn)算。不論求和、求差,也不論操作數(shù)為正、為負(fù),運(yùn)算時(shí)一律只做加法,從而論操作數(shù)為正、為負(fù),運(yùn)算時(shí)一律只做加法,從而大大簡(jiǎn)化運(yùn)算器的設(shè)計(jì)。大大簡(jiǎn)化運(yùn)算器的設(shè)計(jì)。例例2.11 通過補(bǔ)碼計(jì)算通過補(bǔ)碼計(jì)算9+5、95、9+5和和95 二、移位運(yùn)算二、移位運(yùn)算移位的意義移位的意義l移位運(yùn)算運(yùn)算相當(dāng)于乘移位運(yùn)算運(yùn)算相當(dāng)于乘 2n 運(yùn)算運(yùn)算l可以采用移位和加法相結(jié)合,實(shí)現(xiàn)乘可以采用移位和加法相結(jié)合,實(shí)現(xiàn)乘/除運(yùn)算除運(yùn)算l移位運(yùn)算分為:移位運(yùn)算分為:算術(shù)移位:對(duì)有符號(hào)數(shù)的移位算術(shù)移位:對(duì)有符號(hào)數(shù)的移位邏輯移位:對(duì)無符號(hào)數(shù)的移位邏輯移位:對(duì)無符號(hào)數(shù)的移位算術(shù)移位規(guī)則算術(shù)移位規(guī)則不論是正
17、數(shù)還是負(fù)數(shù),移位后其符號(hào)位均不變,只不論是正數(shù)還是負(fù)數(shù),移位后其符號(hào)位均不變,只對(duì)數(shù)值位進(jìn)行移位(見下表)。對(duì)數(shù)值位進(jìn)行移位(見下表)。示例:示例:正數(shù)正數(shù)+26在不同碼制下的移位在不同碼制下的移位示例:負(fù)數(shù)示例:負(fù)數(shù)-26在不同碼制下的移位在不同碼制下的移位邏輯移位規(guī)則邏輯移位規(guī)則l邏輯左移時(shí),高位移出,低位添邏輯左移時(shí),高位移出,低位添0;邏輯右移時(shí),;邏輯右移時(shí),低位移出,高位添低位移出,高位添0。l例如,對(duì)于例如,對(duì)于01010011,邏輯左移,邏輯左移1位為位為1010010;對(duì)于對(duì)于10110010,邏輯右移,邏輯右移1位為位為01011001。三、精度和溢出三、精度和溢出l精度:
18、精度:可以給出的有效數(shù)字的位數(shù)。機(jī)器字長越可以給出的有效數(shù)字的位數(shù)。機(jī)器字長越長,可以表示的數(shù)的范圍越大,精度越高。長,可以表示的數(shù)的范圍越大,精度越高。l溢出:溢出:一個(gè)數(shù)的大小超出了計(jì)算機(jī)所能表示的數(shù)一個(gè)數(shù)的大小超出了計(jì)算機(jī)所能表示的數(shù)的范圍。的范圍。上溢上溢:兩個(gè)正數(shù)相加,結(jié)果大于機(jī)器所能表:兩個(gè)正數(shù)相加,結(jié)果大于機(jī)器所能表示的最大正數(shù)。示的最大正數(shù)。下溢下溢:兩個(gè)負(fù)數(shù)相加,結(jié)果小于機(jī)器所能表:兩個(gè)負(fù)數(shù)相加,結(jié)果小于機(jī)器所能表示的最小負(fù)數(shù)。示的最小負(fù)數(shù)。l程序狀態(tài)字寄存器(程序狀態(tài)字寄存器(PSW):標(biāo)記溢出(即將其:標(biāo)記溢出(即將其溢出標(biāo)志位自動(dòng)置為溢出標(biāo)志位自動(dòng)置為1,否則為,否則為
19、0)。)。2.4.1 字符編碼的基本知識(shí)字符編碼的基本知識(shí)l字符字符是各種文字和符號(hào)的總稱,包括各國文字、標(biāo)是各種文字和符號(hào)的總稱,包括各國文字、標(biāo)點(diǎn)符號(hào)、圖形符號(hào)、數(shù)字以及一般不可見的控制符點(diǎn)符號(hào)、圖形符號(hào)、數(shù)字以及一般不可見的控制符等等l字符編碼字符編碼是指將字符表示為一個(gè)二進(jìn)制數(shù)。是指將字符表示為一個(gè)二進(jìn)制數(shù)。l字符集字符集是字符的集合,也稱為是字符的集合,也稱為編碼字符集編碼字符集,強(qiáng)調(diào)字,強(qiáng)調(diào)字符集為每個(gè)字符分配一個(gè)唯一整數(shù)。符集為每個(gè)字符分配一個(gè)唯一整數(shù)。l代碼點(diǎn)代碼點(diǎn)是指可用于編碼字符集的整數(shù)。由編碼字符是指可用于編碼字符集的整數(shù)。由編碼字符集定義的代碼點(diǎn)整數(shù)取值范圍稱為集定義的
20、代碼點(diǎn)整數(shù)取值范圍稱為編碼空間編碼空間。每個(gè)。每個(gè)代碼點(diǎn)表示一個(gè)字符或被聲明為未使用。代碼點(diǎn)表示一個(gè)字符或被聲明為未使用。l字符編碼方案字符編碼方案:是從編碼空間的每個(gè)代碼點(diǎn)到是從編碼空間的每個(gè)代碼點(diǎn)到1個(gè)或個(gè)或多個(gè)固定寬度編碼單元序列的映射。多個(gè)固定寬度編碼單元序列的映射。l編碼單元:編碼單元:表示代碼點(diǎn)整數(shù)的基本二進(jìn)制位序列,一表示代碼點(diǎn)整數(shù)的基本二進(jìn)制位序列,一般為般為8位、位、16位或位或32位。最終將轉(zhuǎn)換為字節(jié)序列。位。最終將轉(zhuǎn)換為字節(jié)序列。l字節(jié)序(字節(jié)序(Endian ):是指多字節(jié)整數(shù)在內(nèi)存中的存放:是指多字節(jié)整數(shù)在內(nèi)存中的存放順序,分為:順序,分為:大序(大序(Big-End
21、ian):高位在前,低位在后。例:高位在前,低位在后。例如,將整數(shù)如,將整數(shù)6C49H編排為字節(jié)序列編排為字節(jié)序列 6C 49小序(小序(Little-Endian):低位在前,高位在后。:低位在前,高位在后。例如,將整數(shù)例如,將整數(shù)6C49H編排為字節(jié)序列編排為字節(jié)序列 49 6Cl字符的編碼過程字符的編碼過程: 分配代碼點(diǎn)分配代碼點(diǎn)用用1個(gè)或多個(gè)編碼單元表示個(gè)或多個(gè)編碼單元表示字節(jié)序列字節(jié)序列2.4.2 十六進(jìn)制編輯器簡(jiǎn)介十六進(jìn)制編輯器簡(jiǎn)介lHex編輯器能夠以字節(jié)和二進(jìn)制位為單位來修改編輯器能夠以字節(jié)和二進(jìn)制位為單位來修改文件。文件。由于任何文件可看成字節(jié)流,因此由于任何文件可看成字節(jié)流,
22、因此Hex編輯編輯器可查看、編輯任何文件的二進(jìn)制表示器可查看、編輯任何文件的二進(jìn)制表示lWinHex簡(jiǎn)介簡(jiǎn)介2.4.3 ASCII碼及其碼及其ANSI擴(kuò)展擴(kuò)展lASCII碼碼是美國信息交換標(biāo)準(zhǔn)碼(是美國信息交換標(biāo)準(zhǔn)碼(American Standard Code for Information Interchange)的簡(jiǎn)稱,)的簡(jiǎn)稱,用于編碼國際上最通用的西文字符。用于編碼國際上最通用的西文字符。lASCII碼一般使用碼一般使用8位(位(1個(gè)字節(jié))編碼單元表示字個(gè)字節(jié))編碼單元表示字符,最高位恒為符,最高位恒為0,只用低,只用低7位對(duì)字符進(jìn)行編碼,能表位對(duì)字符進(jìn)行編碼,能表示示27=128種
23、字符。種字符。lASCII字符集包括字符集包括26個(gè)大寫字母?jìng)€(gè)大寫字母AZ、26個(gè)小寫字個(gè)小寫字母母az、10個(gè)數(shù)字個(gè)數(shù)字09、32個(gè)標(biāo)點(diǎn)符號(hào)和運(yùn)算符、個(gè)標(biāo)點(diǎn)符號(hào)和運(yùn)算符、1個(gè)個(gè)空格(碼值空格(碼值32)以及)以及33個(gè)控制字符。個(gè)控制字符。l每個(gè)每個(gè)ASCII碼由一個(gè)高碼由一個(gè)高3位組位組 b6b5b4 和一個(gè)低和一個(gè)低4位位組組b3b2b1b0 構(gòu)成。構(gòu)成。例例: 回車符(回車符(CR)是)是 000 1101例例2.12 驗(yàn)證編輯文本文檔時(shí)通過按回車鍵產(chǎn)生的換驗(yàn)證編輯文本文檔時(shí)通過按回車鍵產(chǎn)生的換行符通常稱為回車換行符(行符通常稱為回車換行符(CR/LF)。)。啟動(dòng)啟動(dòng)“記事本記事本”,
24、輸入,輸入“abc”、回車鍵、回車鍵、 “ABC”,存盤,存盤啟動(dòng)啟動(dòng) WinHex 編輯器,打開第編輯器,打開第1步保存的步保存的 文件。文件。中間中間2個(gè)字節(jié)個(gè)字節(jié)0D、0A分別是回車符(分別是回車符(CR)和換行符)和換行符(LF)的十六進(jìn)制數(shù)表示)的十六進(jìn)制數(shù)表示ASCII擴(kuò)展字符集擴(kuò)展字符集l由于由于ASCII碼只使用單字節(jié)編碼單元中的低碼只使用單字節(jié)編碼單元中的低7位,位,因此因此ASCII碼可被擴(kuò)展。碼可被擴(kuò)展。lANSI 擴(kuò)展標(biāo)準(zhǔn):擴(kuò)展標(biāo)準(zhǔn):ASCII擴(kuò)展字符集仍然使用單擴(kuò)展字符集仍然使用單字節(jié)編碼單元,要求字節(jié)編碼單元,要求ASCII碼必須用碼必須用1個(gè)等值的高個(gè)等值的高位為
25、位為0的編碼單元表示,但對(duì)于其他高位為的編碼單元表示,但對(duì)于其他高位為1的編的編碼單元?jiǎng)t依賴于特定字符集的具體定義碼單元?jiǎng)t依賴于特定字符集的具體定義ANSI 字符集字符集 :是指按是指按ANSI標(biāo)準(zhǔn)派生的標(biāo)準(zhǔn)派生的ASCII擴(kuò)擴(kuò)展字符集,如:展字符集,如:Latin-1、GB2312、Big-5等。有時(shí)等。有時(shí)也稱為多字節(jié)字符集(簡(jiǎn)稱也稱為多字節(jié)字符集(簡(jiǎn)稱MBCS)。)。2.4.4 漢字編碼漢字編碼 常用編碼:常用編碼:GB2312、BIG-5、GBK和和GB180302.4.4.1 GB2312一、國標(biāo)字符集與區(qū)位碼一、國標(biāo)字符集與區(qū)位碼lGB2312字符集包括字符集包括6763個(gè)常用簡(jiǎn)體
26、漢字和個(gè)常用簡(jiǎn)體漢字和682個(gè)圖個(gè)圖形符號(hào),并為每個(gè)字符給出形符號(hào),并為每個(gè)字符給出國標(biāo)碼國標(biāo)碼和和區(qū)位碼區(qū)位碼。l所有字符排成一個(gè)所有字符排成一個(gè)9494的矩陣,矩陣中每一行稱的矩陣,矩陣中每一行稱為一個(gè)區(qū),每一列稱為一個(gè)位。矩陣中的每個(gè)字符可為一個(gè)區(qū),每一列稱為一個(gè)位。矩陣中的每個(gè)字符可用區(qū)碼和位碼表示,稱為用區(qū)碼和位碼表示,稱為區(qū)位碼區(qū)位碼。區(qū)位碼區(qū)位碼也是一種漢字輸入碼。例如,在也是一種漢字輸入碼。例如,在“區(qū)位輸區(qū)位輸入法入法”狀態(tài)下狀態(tài)下l輸入輸入0102、0103、0104可輸入全角符號(hào)可輸入全角符號(hào)“、。、?!眑輸入輸入1601、1602、1603可輸入一級(jí)漢字可輸入一級(jí)漢字“
27、啊阿埃啊阿埃”l輸入輸入5601、5602、5603可輸入二級(jí)漢字可輸入二級(jí)漢字“亍丌兀亍丌?!倍鴺?biāo)碼、區(qū)位碼和機(jī)內(nèi)碼之間的換算關(guān)系二、國標(biāo)碼、區(qū)位碼和機(jī)內(nèi)碼之間的換算關(guān)系l國標(biāo)碼采用兩個(gè)字節(jié)表示:國標(biāo)碼采用兩個(gè)字節(jié)表示: 國標(biāo)碼高字節(jié)國標(biāo)碼高字節(jié) = (區(qū)碼區(qū)碼)16 20H 國標(biāo)碼低字節(jié)國標(biāo)碼低字節(jié) = (位碼位碼)16 20Hl漢字機(jī)內(nèi)碼(漢字機(jī)內(nèi)碼(符合符合ANSI字符集標(biāo)準(zhǔn)字符集標(biāo)準(zhǔn)):):機(jī)內(nèi)碼高字節(jié)機(jī)內(nèi)碼高字節(jié) = 國標(biāo)碼高字節(jié)國標(biāo)碼高字節(jié) 80H = (區(qū)碼區(qū)碼)16 A0H機(jī)內(nèi)碼低字節(jié)機(jī)內(nèi)碼低字節(jié) = 國標(biāo)碼低字節(jié)國標(biāo)碼低字節(jié) 80H = (位碼位碼)16 A0H例例2.
28、13 查看漢字查看漢字“國啊國啊”的機(jī)內(nèi)碼。的機(jī)內(nèi)碼。啟動(dòng)啟動(dòng)“記事本記事本”,輸入,輸入“abc國啊國啊”,存盤(注意:,存盤(注意: “編碼編碼”下拉列表中的下拉列表中的“ANSI”表示按表示按ANSI字符編碼字符編碼格式保存)。格式保存)。啟動(dòng)啟動(dòng) WinHex 編輯器,打開剛保存的文件。編輯器,打開剛保存的文件。2.4.4.2 其他常用漢字編碼其他常用漢字編碼一、一、BIG-5 (大五碼)(大五碼)l通行于我國臺(tái)灣、香港等地區(qū)的繁體字編碼方案。通行于我國臺(tái)灣、香港等地區(qū)的繁體字編碼方案。l采用雙字節(jié)編碼方案,第采用雙字節(jié)編碼方案,第1字節(jié)的最高位總是字節(jié)的最高位總是1,第,第2字節(jié)的最
29、高位可能是字節(jié)的最高位可能是1或或0。二、二、GBKlGBK是對(duì)是對(duì)GB2312的擴(kuò)充,仍然采用雙字節(jié)編碼方案,的擴(kuò)充,仍然采用雙字節(jié)編碼方案,收錄收錄21886個(gè)漢字和圖形符號(hào)。個(gè)漢字和圖形符號(hào)。lGB18030是對(duì)是對(duì)GBK的擴(kuò)充,在雙字節(jié)編碼的基礎(chǔ)上的擴(kuò)充,在雙字節(jié)編碼的基礎(chǔ)上對(duì)罕見漢字使用對(duì)罕見漢字使用4字節(jié)編碼。收錄字節(jié)編碼。收錄27484個(gè)漢字,同時(shí)個(gè)漢字,同時(shí)還收錄日文、朝鮮語和藏、蒙等文字。還收錄日文、朝鮮語和藏、蒙等文字。 ASCII GB2312 GBK GB18030 向下兼容向下兼容2.4.5 Unicode編碼編碼lUnicode(通用碼)是當(dāng)前國際上最為通用的字符(
30、通用碼)是當(dāng)前國際上最為通用的字符編碼規(guī)范,它為全世界所有語言(超過編碼規(guī)范,它為全世界所有語言(超過650種)的種)的每個(gè)字符分配一個(gè)唯一數(shù)字,以滿足跨語言、跨平每個(gè)字符分配一個(gè)唯一數(shù)字,以滿足跨語言、跨平臺(tái)進(jìn)行文本轉(zhuǎn)換、處理的要求。臺(tái)進(jìn)行文本轉(zhuǎn)換、處理的要求。lUnicode標(biāo)準(zhǔn)已經(jīng)被計(jì)算機(jī)業(yè)界主流所采用,許多標(biāo)準(zhǔn)已經(jīng)被計(jì)算機(jī)業(yè)界主流所采用,許多操作系統(tǒng)、所有最新的瀏覽器和許多其他軟件產(chǎn)品操作系統(tǒng)、所有最新的瀏覽器和許多其他軟件產(chǎn)品都支持它。都支持它。2.4.5.1 Unicode字符集字符集lUnicode字符集采用四維編碼空間字符集采用四維編碼空間l每個(gè)字位對(duì)應(yīng)一個(gè)每個(gè)字位對(duì)應(yīng)一個(gè)Un
31、icode代碼點(diǎn)。代碼點(diǎn)。lUnicode代碼點(diǎn)書寫格式:如代碼點(diǎn)書寫格式:如 U+41 表示表示 “A”UCS-4碼和碼和UCS-2碼碼lUCS-4碼碼定義定義Unicode字符集的所有代碼點(diǎn),對(duì)每字符集的所有代碼點(diǎn),對(duì)每個(gè)代碼點(diǎn)使用個(gè)代碼點(diǎn)使用4個(gè)個(gè)8位(即位(即32位,且最高位總是位,且最高位總是0)依次表示這個(gè)代碼點(diǎn)所在的組、平面、行和字位:依次表示這個(gè)代碼點(diǎn)所在的組、平面、行和字位:共有共有231=2,147,483,648個(gè)代碼點(diǎn)。例如,字符個(gè)代碼點(diǎn)。例如,字符“ ”編排在編排在00組組01面面04行行00位,故其位,故其UCS-4碼是碼是U+00010400。l基本多文種平面(基
32、本多文種平面(BMP):是指:是指Unicode字符集字符集的第的第1個(gè)平面,即個(gè)平面,即0組組0面。面。lUCS-2碼碼只對(duì)只對(duì)BMP中的代碼點(diǎn)進(jìn)行雙中的代碼點(diǎn)進(jìn)行雙8位編碼,共位編碼,共有有216=65,536個(gè)代碼點(diǎn)。例如個(gè)代碼點(diǎn)。例如 “A” U+0041 “” U+20AC “漢漢” U+6C49。lUCS-2碼基本上可以容納所有的歐美字符和絕大碼基本上可以容納所有的歐美字符和絕大部分的亞洲字符,因此,部分的亞洲字符,因此,UCS-2字符集被普通支持。字符集被普通支持。l小提示:小提示:在在Word中,將輸入點(diǎn)移至某個(gè)字符的右中,將輸入點(diǎn)移至某個(gè)字符的右側(cè),按下側(cè),按下Alt+X,該
33、字符就轉(zhuǎn)換為,該字符就轉(zhuǎn)換為Unicode代碼點(diǎn),代碼點(diǎn),再按則轉(zhuǎn)換回原字符再按則轉(zhuǎn)換回原字符2.4.5.2 UTF編碼編碼lUTF是對(duì)是對(duì)Unicode字符集編碼的實(shí)現(xiàn)方案,為每個(gè)字符集編碼的實(shí)現(xiàn)方案,為每個(gè)Unicode字符給出機(jī)內(nèi)表示格式,字符給出機(jī)內(nèi)表示格式, Unicode 字符的機(jī)內(nèi)字符的機(jī)內(nèi)碼碼lUTF規(guī)范定義了三種編碼格式,即規(guī)范定義了三種編碼格式,即UTF-8、UTF-16和和UTF-32,它們都能夠正確地編碼任何,它們都能夠正確地編碼任何Unicode代碼代碼點(diǎn)。其中,點(diǎn)。其中,UTF-8和和UTF-16被廣泛使用,而被廣泛使用,而UTF-32很很少使用。少使用。一、一、U
34、TF-32lUTF-32碼是定長碼,使用碼是定長碼,使用1個(gè)個(gè)32位(即位(即4字節(jié))編字節(jié))編碼單元表示每個(gè)等值的碼單元表示每個(gè)等值的Unicode代碼點(diǎn)。例如,字代碼點(diǎn)。例如,字符符“A”的代碼點(diǎn)的代碼點(diǎn)U+41用用4個(gè)字節(jié)表示等值的無符號(hào)個(gè)字節(jié)表示等值的無符號(hào)整數(shù)整數(shù)41H。lUTF-32的優(yōu)點(diǎn)在于編碼簡(jiǎn)單,缺點(diǎn)是每個(gè)字符都的優(yōu)點(diǎn)在于編碼簡(jiǎn)單,缺點(diǎn)是每個(gè)字符都需需4字節(jié)表示,太浪費(fèi)存儲(chǔ)空間。字節(jié)表示,太浪費(fèi)存儲(chǔ)空間。二、二、UTF-16lUTF-16碼是變長碼,使用碼是變長碼,使用1個(gè)或個(gè)或2個(gè)個(gè)16位(即位(即2字字節(jié))編碼單元對(duì)節(jié))編碼單元對(duì)Unicode代碼點(diǎn)進(jìn)行編碼。代碼點(diǎn)進(jìn)行編
35、碼。對(duì)對(duì)BMP字符的表示方式等同于字符的表示方式等同于UCS-2,使用,使用2個(gè)字節(jié)個(gè)字節(jié)。例如用兩個(gè)字節(jié)例如用兩個(gè)字節(jié)6CH和和49H表示字符表示字符“漢漢”的代碼點(diǎn)的代碼點(diǎn)U+6C49對(duì)于非對(duì)于非BMP字符則使用字符則使用4個(gè)字節(jié)表示。個(gè)字節(jié)表示。lUTF-16的優(yōu)點(diǎn)在于幾乎所有常見字符都使用雙字的優(yōu)點(diǎn)在于幾乎所有常見字符都使用雙字節(jié)表示,便于統(tǒng)一處理;缺點(diǎn)是每個(gè)節(jié)表示,便于統(tǒng)一處理;缺點(diǎn)是每個(gè)ASCII字符也字符也要用要用2個(gè)字節(jié)表示。個(gè)字節(jié)表示。UTF-16分類分類l由于由于UTF-16使用雙字節(jié)編碼單元,因此使用雙字節(jié)編碼單元,因此UTF-16碼碼有兩種形式:有兩種形式:大序大序UT
36、F-16(UTF-16 big-endian):如):如“國國”的代碼點(diǎn)的代碼點(diǎn)U+56FD表示為表示為2字節(jié)序列字節(jié)序列56 FD小序小序UTF-16(UTF-16 little-endian):如):如“國國”表示為表示為2字節(jié)序列字節(jié)序列FD 56。l標(biāo)記字節(jié)序:使用標(biāo)記字節(jié)序:使用BOM字符字符U+FEFF,即如果文,即如果文檔起始檔起始2個(gè)字節(jié)是個(gè)字節(jié)是FE FF,則表示文檔是大序,則表示文檔是大序UTF-16;若這;若這2個(gè)字節(jié)為個(gè)字節(jié)為FF FE,則文檔為小序,則文檔為小序UTF-16。例例2.14 查看英文字符查看英文字符“a”和漢字和漢字“國國”的小的小序序UTF-16編碼編
37、碼啟動(dòng)啟動(dòng)“記事本記事本”,輸入文字,輸入文字“a國國”,然后以,然后以“Unicode”編碼格式保存。編碼格式保存。啟動(dòng)啟動(dòng) WinHex 編輯器查看。編輯器查看。三、三、UTF-8lUTF-8碼也是變長碼,使用碼也是變長碼,使用1個(gè)或多個(gè)個(gè)或多個(gè)8位(即位(即1字字節(jié))編碼單元對(duì)節(jié))編碼單元對(duì)Unicode代碼點(diǎn)進(jìn)行編碼。代碼點(diǎn)進(jìn)行編碼。對(duì)對(duì)BMP字符使用字符使用13個(gè)字節(jié)序列編碼,如表個(gè)字節(jié)序列編碼,如表2-11所示所示對(duì)于非對(duì)于非BMP字符則使用字符則使用4個(gè)或更多字節(jié)表示個(gè)或更多字節(jié)表示UTF-8編碼示例編碼示例字符字符“漢漢”的代碼點(diǎn)是的代碼點(diǎn)是U+6C49,根據(jù)表,根據(jù)表2-11
38、所示格所示格式,先將式,先將6C49寫成二進(jìn)制數(shù)寫成二進(jìn)制數(shù)01101100 01001001,然,然后用這個(gè)比特流依次替換模板后用這個(gè)比特流依次替換模板 1110 xxxx 10 xxxxxx 10 xxxxxx 中的中的x,得到,得到11100110 10110001 10001001,即即UTF-8把字符把字符“漢漢”編碼為編碼為3字節(jié)序列字節(jié)序列 E6 B1 89。lUTF-8的優(yōu)點(diǎn)在于與的優(yōu)點(diǎn)在于與ASCII兼容、容錯(cuò)能力強(qiáng)、與兼容、容錯(cuò)能力強(qiáng)、與字節(jié)序無關(guān),便于在不同平臺(tái)之間交流;其缺點(diǎn)是字節(jié)序無關(guān),便于在不同平臺(tái)之間交流;其缺點(diǎn)是所有漢、日、韓等字符必須用所有漢、日、韓等字符必須
39、用3個(gè)字節(jié)表示。個(gè)字節(jié)表示。lUTF-8文檔常起始于文檔常起始于3字節(jié)序列字節(jié)序列EF BB BF(即字符(即字符U+FEFF的的UTF-8編碼)編碼)例例2.15 查看字符查看字符“A”和和“漢漢”的的UTF-8編碼編碼啟動(dòng)啟動(dòng)“記事本記事本”,輸入文字,輸入文字“A漢漢”,然后以,然后以“UTF-8”編碼格式保存編碼格式保存啟動(dòng)啟動(dòng) WinHex 編輯器編輯器查看查看2.4.5.3 統(tǒng)漢字統(tǒng)漢字Unicode 把經(jīng)過中日韓整合(把經(jīng)過中日韓整合(CJK Unification)的)的漢字稱為統(tǒng)漢字(漢字稱為統(tǒng)漢字(Unihan),共有共有2萬多個(gè)。萬多個(gè)。2.4.5.4 Unicode與代
40、碼頁與代碼頁l“代碼頁代碼頁”(Code Page)是某種字符集的編號(hào))是某種字符集的編號(hào),如如GB2312的代碼頁是的代碼頁是20936、BIG5是是950。由代碼由代碼頁可確定相應(yīng)的字符編碼轉(zhuǎn)換表。頁可確定相應(yīng)的字符編碼轉(zhuǎn)換表。lWindows系統(tǒng)內(nèi)核已統(tǒng)一使用系統(tǒng)內(nèi)核已統(tǒng)一使用 Unicode,但由于大,但由于大量應(yīng)用軟件及文檔還未使用量應(yīng)用軟件及文檔還未使用 Unicode,因此,因此 Windows 仍然保留代碼頁字符轉(zhuǎn)換機(jī)制,即通過指仍然保留代碼頁字符轉(zhuǎn)換機(jī)制,即通過指定的字符編碼轉(zhuǎn)換表將非定的字符編碼轉(zhuǎn)換表將非 Unicode 的字符編碼(如的字符編碼(如GBK、Big-5碼)轉(zhuǎn)
41、換為碼)轉(zhuǎn)換為 Unicode 編碼編碼2.4.6 字形碼字形碼l字形是指字符的外觀,相當(dāng)于一個(gè)小圖形字形是指字符的外觀,相當(dāng)于一個(gè)小圖形l字形碼(也稱字模)是描述字符字形的編碼。字形碼(也稱字模)是描述字符字形的編碼。l字庫:存放字模的數(shù)據(jù)文件字庫:存放字模的數(shù)據(jù)文件l漢字庫:主要用于存放漢字字模的字庫漢字庫:主要用于存放漢字字模的字庫l字符輸出:計(jì)算機(jī)在輸出(顯示或打印)字符時(shí),字符輸出:計(jì)算機(jī)在輸出(顯示或打印)字符時(shí),要根據(jù)字符的機(jī)內(nèi)碼找出該字符的字模在字庫中的位要根據(jù)字符的機(jī)內(nèi)碼找出該字符的字模在字庫中的位置,從而取出字模,用于輸出。置,從而取出字模,用于輸出。點(diǎn)陣點(diǎn)陣l點(diǎn)陣是對(duì)字符
42、外觀的直接描述,其他描述(如矢量、點(diǎn)陣是對(duì)字符外觀的直接描述,其他描述(如矢量、輪廓方法)的最終結(jié)果仍是點(diǎn)陣。輪廓方法)的最終結(jié)果仍是點(diǎn)陣。l點(diǎn)陣描述方法:將字符放入一個(gè)橫豎都經(jīng)過等分的點(diǎn)陣描述方法:將字符放入一個(gè)橫豎都經(jīng)過等分的方塊中,如圖方塊中,如圖2.9所示,形成一個(gè)位圖。所示,形成一個(gè)位圖。l每個(gè)點(diǎn)用每個(gè)點(diǎn)用1位二進(jìn)制數(shù)表示,有筆劃的為位二進(jìn)制數(shù)表示,有筆劃的為1,無筆劃,無筆劃的為的為0。每。每8個(gè)點(diǎn)依次組成個(gè)點(diǎn)依次組成1個(gè)字節(jié)。例如,在個(gè)字節(jié)。例如,在1616點(diǎn)陣中,每個(gè)字模需要點(diǎn)陣中,每個(gè)字模需要1616/8=32個(gè)字節(jié)表示。個(gè)字節(jié)表示。矢量字模矢量字模用一種稱為形(用一種稱為形
43、(shape)的圖形實(shí)體來定)的圖形實(shí)體來定義字符,使用直線和圓弧作為字符的基本筆畫。其優(yōu)義字符,使用直線和圓弧作為字符的基本筆畫。其優(yōu)點(diǎn)是字模存儲(chǔ)量少,缺點(diǎn)是字形不優(yōu)美。點(diǎn)是字模存儲(chǔ)量少,缺點(diǎn)是字形不優(yōu)美。輪廓字模輪廓字模l輪廓技術(shù)采用直線或二次曲線的集合來描述一個(gè)字輪廓技術(shù)采用直線或二次曲線的集合來描述一個(gè)字符的輪廓線,對(duì)輪廓線構(gòu)成的一個(gè)或若干個(gè)封閉平面符的輪廓線,對(duì)輪廓線構(gòu)成的一個(gè)或若干個(gè)封閉平面區(qū)域,采用適當(dāng)?shù)膮^(qū)域填充算法,生成字符的位圖點(diǎn)區(qū)域,采用適當(dāng)?shù)膮^(qū)域填充算法,生成字符的位圖點(diǎn)陣。陣。l兼有字模存儲(chǔ)量少、字形又美觀的雙重優(yōu)點(diǎn)。輪廓兼有字模存儲(chǔ)量少、字形又美觀的雙重優(yōu)點(diǎn)。輪廓字符
44、可以任意放大、縮小及變化形體。字符可以任意放大、縮小及變化形體。lTrueType 字形技術(shù)采用這種輪廓技術(shù),字形技術(shù)采用這種輪廓技術(shù), Windows 的絕大多數(shù)字庫都屬于的絕大多數(shù)字庫都屬于 TrueType 字庫字庫2.4.7 漢字輸入碼漢字輸入碼漢字輸入碼是指從鍵盤上輸入的代表漢字的編碼,又漢字輸入碼是指從鍵盤上輸入的代表漢字的編碼,又稱漢字外碼。漢字輸入碼分為以下稱漢字外碼。漢字輸入碼分為以下4類:類:l流水碼:將漢字按一定的順序排列,依次編排一個(gè)流水碼:將漢字按一定的順序排列,依次編排一個(gè)號(hào)碼,如區(qū)位碼。流水碼輸入法簡(jiǎn)單、唯一,但較難號(hào)碼,如區(qū)位碼。流水碼輸入法簡(jiǎn)單、唯一,但較難記
45、憶和掌握。記憶和掌握。l音碼:根據(jù)漢字的讀音進(jìn)行編碼,如全拼、雙拼、音碼:根據(jù)漢字的讀音進(jìn)行編碼,如全拼、雙拼、智能智能ABC等。音碼輸入法易于掌握,懂得漢語拼音即等。音碼輸入法易于掌握,懂得漢語拼音即可,但重碼率高,不便盲打???,但重碼率高,不便盲打。2.4.7 漢字輸入碼(漢字輸入碼(2)l形碼:根據(jù)漢字的字形進(jìn)行編碼。如五筆字型、形碼:根據(jù)漢字的字形進(jìn)行編碼。如五筆字型、鄭碼。形碼輸入法較難掌握,但重碼率低,便于盲鄭碼。形碼輸入法較難掌握,但重碼率低,便于盲打。打。l音形碼:根據(jù)漢字的字音和字形進(jìn)行編碼,如首音形碼:根據(jù)漢字的字音和字形進(jìn)行編碼,如首尾碼。尾碼。此外,多數(shù)漢字輸入法都提供
46、了重碼字輔助選擇、此外,多數(shù)漢字輸入法都提供了重碼字輔助選擇、詞組輸入、聯(lián)想輸入等功能。詞組輸入、聯(lián)想輸入等功能。2.5.1 基本概念基本概念l數(shù)據(jù)壓縮數(shù)據(jù)壓縮是指對(duì)數(shù)據(jù)重新進(jìn)行編碼,以減少是指對(duì)數(shù)據(jù)重新進(jìn)行編碼,以減少所需存儲(chǔ)空間所需存儲(chǔ)空間l解壓縮解壓縮是指將壓縮的數(shù)據(jù)恢復(fù)成原狀是指將壓縮的數(shù)據(jù)恢復(fù)成原狀l壓縮比壓縮比:壓縮前和壓縮后的數(shù)據(jù)量之比,如:壓縮前和壓縮后的數(shù)據(jù)量之比,如壓縮比為壓縮比為20 1表示壓縮后的數(shù)據(jù)量是原始數(shù)表示壓縮后的數(shù)據(jù)量是原始數(shù)據(jù)的據(jù)的1/20l數(shù)據(jù)壓縮技術(shù)用于壓縮文本、圖像、音頻和數(shù)據(jù)壓縮技術(shù)用于壓縮文本、圖像、音頻和視頻等數(shù)據(jù)。有些壓縮技術(shù)需要特殊的硬件,視
47、頻等數(shù)據(jù)。有些壓縮技術(shù)需要特殊的硬件,而有些壓縮技術(shù)則完全由軟件實(shí)現(xiàn)。而有些壓縮技術(shù)則完全由軟件實(shí)現(xiàn)。數(shù)據(jù)為什么能被壓縮呢?數(shù)據(jù)為什么能被壓縮呢?l數(shù)據(jù)中常存在一些冗余,如重復(fù)符號(hào)數(shù)據(jù)中常存在一些冗余,如重復(fù)符號(hào)l數(shù)據(jù)中間尤其是相鄰的數(shù)據(jù)之間,常存在著相關(guān)數(shù)據(jù)中間尤其是相鄰的數(shù)據(jù)之間,常存在著相關(guān)性,如圖像中常常有色彩均勻的背影、視頻的相鄰性,如圖像中常常有色彩均勻的背影、視頻的相鄰兩幀之間可能只有少量的變化影物是不同的、音頻兩幀之間可能只有少量的變化影物是不同的、音頻信號(hào)有時(shí)具有一定的規(guī)律性和周期性等等信號(hào)有時(shí)具有一定的規(guī)律性和周期性等等l耳、目對(duì)信號(hào)的時(shí)間變化和幅度變化的感受能力耳、目對(duì)信
48、號(hào)的時(shí)間變化和幅度變化的感受能力都有一定的局限性,因此可以將信號(hào)中感覺不出的都有一定的局限性,因此可以將信號(hào)中感覺不出的分量隱蔽掉。分量隱蔽掉。數(shù)據(jù)壓縮技術(shù)的指標(biāo):數(shù)據(jù)壓縮技術(shù)的指標(biāo):l壓縮比:顯然壓縮比越大就越好壓縮比:顯然壓縮比越大就越好l恢復(fù)效果:盡量能夠解壓縮回原始數(shù)據(jù)恢復(fù)效果:盡量能夠解壓縮回原始數(shù)據(jù)l速度:實(shí)現(xiàn)壓縮的算法要簡(jiǎn)單,壓縮、解壓速度速度:實(shí)現(xiàn)壓縮的算法要簡(jiǎn)單,壓縮、解壓速度快,盡可能支持實(shí)時(shí)壓縮、解壓??欤M可能支持實(shí)時(shí)壓縮、解壓。l對(duì)稱性:壓縮和解壓縮占用相同的處理能力和時(shí)對(duì)稱性:壓縮和解壓縮占用相同的處理能力和時(shí)間,適用于實(shí)時(shí)壓縮的視頻傳送(如視頻會(huì)議間,適用于實(shí)時(shí)壓縮的視頻傳送(如視頻會(huì)議);而;而不對(duì)稱編碼意味著壓縮和解壓縮占用不同的處理能不對(duì)稱編碼意味著壓縮和解壓縮占用不同的處理能力和時(shí)間,適用于電子出版和其他多媒體應(yīng)用。力和時(shí)間,適用于電子出版和其他多媒體應(yīng)用。2.5.2 數(shù)據(jù)壓縮方法簡(jiǎn)介數(shù)據(jù)壓縮方法簡(jiǎn)介一、數(shù)據(jù)壓縮方法的分類一
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度夾板產(chǎn)品線上線下銷售合作協(xié)議4篇
- 二零二五年度民爆工程項(xiàng)目安全教育培訓(xùn)合同4篇
- 2025年度抖音平臺(tái)內(nèi)容創(chuàng)作者收益分成合同3篇
- 2025年度草原生態(tài)環(huán)境損害賠償與修復(fù)合同3篇
- 2025版高速公路橋梁錨桿錨鎖維護(hù)保養(yǎng)工程合同4篇
- 個(gè)人獨(dú)資企業(yè)清算協(xié)議書(2024版)
- 二零二五苗木種植基地建設(shè)與管理承包合同4篇
- 二零二五年度杭州房屋租賃市場(chǎng)租賃合同修改與補(bǔ)充服務(wù)協(xié)議3篇
- 生物安全實(shí)驗(yàn)室建設(shè)與改造策略
- 教育科技對(duì)學(xué)生德業(yè)教育與心理健康的雙重影響
- 2025年安慶港華燃?xì)庀薰菊衅腹ぷ魅藛T14人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 人教版(2025新版)七年級(jí)下冊(cè)數(shù)學(xué)第七章 相交線與平行線 單元測(cè)試卷(含答案)
- GB/T 44351-2024退化林修復(fù)技術(shù)規(guī)程
- 從跨文化交際的角度解析中西方酒文化(合集5篇)xiexiebang.com
- 中藥飲片培訓(xùn)課件
- 醫(yī)院護(hù)理培訓(xùn)課件:《早產(chǎn)兒姿勢(shì)管理與擺位》
- 空氣自動(dòng)站儀器運(yùn)營維護(hù)項(xiàng)目操作說明以及簡(jiǎn)單故障處理
- 2022年12月Python-一級(jí)等級(jí)考試真題(附答案-解析)
- T-CHSA 020-2023 上頜骨缺損手術(shù)功能修復(fù)重建的專家共識(shí)
- Hypermesh lsdyna轉(zhuǎn)動(dòng)副連接課件完整版
- 小學(xué)六年級(jí)數(shù)學(xué)計(jì)算題100道(含答案)
評(píng)論
0/150
提交評(píng)論