




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
計算機中數(shù)據(jù)的表示第3章主要內(nèi)容1、二進制與其他進制2、數(shù)值信息的表示與運算3、非數(shù)值信息的表示二進制和魔術3.1.1八卦與二進制易經(jīng)是中國最古老的哲學思想,最能體現(xiàn)中國文化與智慧的思想。易經(jīng)八卦中只有陰和陽兩種符號,卻能組成8種不同的卦象,進一步又能演變成64卦。易經(jīng)其實是通過陰、陽使用0和1兩種符號進行計算、組合,然后再將其“語義化”為八卦信息的。在“先天八卦次序“中,白矩形表示陽,黑矩形表示陰,陽可以用陽爻(─,連通的線條)來表示,陰可以用陰爻(——,斷開的線條)來表示。如果按照垂直的角度去看這個八卦中矩形的顏色,用陽爻表示白矩形,用陰爻表示黑矩形表3-1八卦卦符編碼卦名顏色卦符二進制坤黑黑黑陰陰陰000艮黑黑白陰陰陽001坎黑白黑陰陽陰010巽黑白白陰陽陽011震白黑黑陽陰陰100離白黑白陽陰陽101兌白白黑陽陽陰110乾白白白陽陽陽111在“先天八卦次序”中,“兩儀”、“四象”、“八卦”中矩形面積比是:4:2:1如果把“八卦”中的面積設計為1,那么四象的面積就是2,而兩儀的面積就是4。我們可以沿八卦中各卦的垂直方向,如圖3-1所示,依次將“兩儀”、“四象”、“八卦”的面積相加就可以得出八卦各卦對應的十進制數(shù):坤:000[2]=4×0+2×0+1×0=0艮:001[2]=4×0+2×0+1×1=1坎:010[2]=4×0+2×1+1×0=2巽:011[2]=4×0+2×1+1×1=3震:100[2]=4×1+2×0+1×0=4離:101[2]=4×1+1×0+1×1=5兌:110[2]=4×1+2×1+1×0=6乾:111[2]=4×1+2×1+1×1=73.1.2進位計數(shù)制1.進制的概念用進位的原則進行計數(shù)稱為進位計數(shù)制,簡稱數(shù)制或進制。進制是一種計數(shù)方式,其中使用的數(shù)字符號的數(shù)目稱為其基數(shù)。若基數(shù)為n,就稱為n進制,一般有以下兩個特點。(1)逢n進1n進制數(shù)由n個數(shù)碼組成:0、1、2、…、n-1,逢n進1。如十進制有10個數(shù)字,二進制有2個數(shù)字。(2)采用位權表示法處在不同位置上的數(shù)碼所代表的值不同,一個數(shù)碼在某個固定位置上所代表的值是確定的,這個固定位上的值稱為位權。任何一種進制表示的數(shù)都可以寫成按權展開的多項式之和。一個十進制數(shù)各位的權是以10為底的冪。如:1234=1×103+2×102+3×101+4×1002.常用進位計數(shù)制十進制數(shù)是人們最熟悉的一種進位計數(shù)制,它由0、1、2、…、8、9這10個數(shù)碼組成,即基數(shù)為10。十進制的特點為:逢十進一,借一當十。二進制就是用0和1表達信息。二進制由0、1兩個數(shù)碼組成,即基數(shù)為2。二進制的特點為:逢二進一,借一當二。一個二進制數(shù)各位的權是以2為底的冪。如:10110011=1×27+0×26+1×25+1×24+0×23+0×22+1×21+1×20同理,八進制由0、1、2、3、4、5、6、7這8個數(shù)碼組成,即基數(shù)為8。八進制的特點為:逢八進一,借一當八。十六進制由0、1、2、…、9、A、B、C、D、E、F這16個數(shù)碼組成,即基數(shù)為16。十六進制的特點為:逢十六進一,借一當十六。一個十六進制數(shù)各位的權是以16為底的冪。在書寫不同進制的數(shù)時,一般用以下兩種數(shù)制表示方法:(1)把一串數(shù)用括號括起來,再加這種數(shù)制的下標。如(100100)2,(120)8
,(1AC)16。對于十進制數(shù)下標一般可以省略。(2)用進位制的字母符號B(二進制)、O(八進制)、D(十進制)、H(十六進制)來表示。如:二進制數(shù)(11011100)2可以寫為11011100B,八進制數(shù)(537)8可以寫為537O,十六進制數(shù)(A2A0C)16可表示為A2A0CH。在不至于產(chǎn)生歧義時,我們往往可以不注明十進制數(shù)的進制。3.1.3不同數(shù)制之間的轉換1.二、八、十六進制轉換為十進制二進制數(shù)轉換為十進制數(shù)可通過按權展開來進行。如:(1100100.001)2=1×26+1×25+0×24+0×23+1×22+0×21+0×20+0×2-1+0×2-2+1×2-3=64+32+4=(100.125)10其他進制數(shù)互相轉換可參照十、二進制數(shù)的轉換規(guī)則進行。如:(267)8=2×82+6×81+7×80=(183)10(1AC)16=1×162+10×161+12×160=(428)102.十進制轉換為二、八、十六進制十進制數(shù)的整數(shù)部分和小數(shù)部分在轉換時需作不同的計算,分別求值后再組合。整數(shù)部分采用“除基取余法”,小數(shù)部分采用“乘基取整法”。以十進制數(shù)轉換為二進制數(shù)為例:對于整數(shù)部分采用除2取余法,即逐次除以2,直至商為0,得出的余數(shù)倒著排列,就是轉換為二進制后各位的數(shù)碼。小數(shù)部分采用乘2取整法,即逐次乘以2,從每次乘積的整數(shù)部分得到二進制數(shù)各位的數(shù)碼。例:將十進制數(shù)100.125轉化為二進制數(shù)。13(100)10=(?)2(100)10=(1100100)2225………0212………126………023………021………120………1100250………0余數(shù)十進制整數(shù)化成二進制整數(shù)14十進制小數(shù)化成二進制小數(shù)(0.125)10=(?)2(0.125)10=(0.001)20.25020.500…020.5001.000…10.12520.250…0整數(shù)(100.125)10=(1100100.001)23.二、八、十六進制之間的互相轉換(1)二進制和八進制之間的轉換二進制數(shù)轉換成八進制數(shù)的方法是:將二進制數(shù)從小數(shù)點開始,對整數(shù)部分向左每3位分成一組,對小數(shù)部分向右每3位分成一組,不足3位的分別向高位或低位補0湊成3位。然后將每一組的3位二進制數(shù),分別轉換成八進制數(shù)碼中的一個數(shù)字,全部連接起來即可。例:把二進制數(shù)11111101.101轉化為八進制數(shù)。(11111101.101)2=(011111101.101)2=(375.5)8反過來,將八進制數(shù)轉換成二進制數(shù)時,只要將每一位八進制數(shù)轉換成相應的3位二進制數(shù),然后依次連接起來即可。(2)二進制數(shù)與十六進制數(shù)的相互轉換二進制數(shù)與十六進制數(shù)的相互轉換方法和二進制數(shù)與八進制數(shù)的轉換方法相類似。二進制數(shù)轉換成十六進制數(shù),只要把每4位分成一組,再分別轉換成十六進制數(shù)碼中的一個數(shù)字,不足4位的分別向高位或低位補0湊成4位,全部連接起來即可。反之,十六進制數(shù)轉換成二進制數(shù),只要將每一位十六進制數(shù)轉換成4位二進制數(shù),依次連接起來即可。例:將10110001.101B轉換為十六進制數(shù)。(10110001.1010)2=(10110001.1010)2=(B1.A)163.1.4二進制的運算規(guī)則1.算術運算加法規(guī)則:0+0=0;0+1=1;1+0=1;1+1=10(向高位有進位)。減法規(guī)則:0-0=0;10-1=1(向高位借位);1-0=1;1-1=0。乘法規(guī)則:0×0=0;0×1=0;1×0=0;1×1=1。除法規(guī)則:0/1=0;1/1=1。由上述規(guī)則可以看出,算術運算同我們熟悉的十進制算術運算是一樣的,只是由逢十進一,變成了逢二進一。2.邏輯運算邏輯與運算(AND):0∧0=0;0∧1=0;1∧0=0;1∧1=1。邏輯或運算(OR):0∨0=0;0∨1=1;1∨0=1;1∨1=1。邏輯非運算(NOT):1 ̄=0; ̄0=1。邏輯異或運算(XOR):0⊕0=0;0⊕1=1;1⊕0=1;1⊕1=0。邏輯異或運算可以實現(xiàn)按位加的功能,只有當兩個邏輯值不相同時,結果才為1。3.二進制運算的實現(xiàn)二進制的運算,首先要解決的是如何物理的表示和存儲二進制的0和1,然后通過0和1,可以將各種運算轉換成邏輯運算來實現(xiàn),邏輯運算又可以由元器件來實現(xiàn),進而組成邏輯門電路再構造更復雜的電路,最終由硬件來實現(xiàn)復雜的功能。這里僅以二進制加法為例說明。異或與AB本位進位加數(shù)an加數(shù)bn本位和Sn進位Cn低位的進位Cn-1半加器半加器或1.二進制的優(yōu)點(1)電路中容易實現(xiàn)。(2)物理上最易實現(xiàn)存儲。(3)便于進行加、減運算和計數(shù)編碼。(4)便于邏輯判斷(是或非)。(5)用二進制表示數(shù)據(jù)具有抗干擾能力強,可靠性高等優(yōu)點。3.2數(shù)值信息的表示與運算計算機要處理的信息是多種多樣的,如日常的十進制數(shù)、文字、符號、圖形、圖像和語言等。我們知道計算機無法直接“理解”這些信息,計算機需要采用數(shù)字化編碼的形式對信息進行存儲、加工、和傳送。信息的數(shù)字化表示就是采用一定的基本符號,使用一定的組合規(guī)則來表示信息。計算機中采用的二進制編碼,其基本符號是“0”和“1”。3.2.1定點數(shù)和浮點數(shù)的概念在計算機中,數(shù)值型的數(shù)據(jù)有兩種表示方法,一種叫做定點數(shù),另一種叫做浮點數(shù)。所謂定點數(shù),就是在計算機中所有數(shù)的小數(shù)點位置固定不變。定點數(shù)有兩種:定點小數(shù)和定點整數(shù)。定點小數(shù)將小數(shù)點固定在最高數(shù)據(jù)位的左邊,因此,它只能表示小于1的純小數(shù)。定點整數(shù)將小數(shù)點固定在最低數(shù)據(jù)位的右邊,因此定點整數(shù)表示的也只是純整數(shù)。由此可見,定點數(shù)表示數(shù)的范圍較小。數(shù)的定點表示數(shù)的定點表示是指數(shù)據(jù)字中小數(shù)點的位置固定不變。一般用來表示整數(shù)或一個純小數(shù)(不含整數(shù)位的數(shù))。定點整數(shù)。當表示一個整數(shù)時,小數(shù)點固定在數(shù)據(jù)字最后一位之后定點小數(shù)。當表示一個純小數(shù)時,小數(shù)點固定在符號位之后,數(shù)值最高位以前為了擴大計算機中數(shù)值數(shù)據(jù)的表示范圍,我們將12.34表示為0.1234×102,其中0.1234叫做尾數(shù),10叫做基數(shù),可以在計算機內(nèi)固定下來。2叫做階碼,若階碼的大小發(fā)生變化,則意味著實際數(shù)據(jù)小數(shù)點的移動,我們把這種數(shù)據(jù)叫做浮點數(shù)。由于基數(shù)在計算機中固定不變,因此,我們可以用兩個定點數(shù)分別表示尾數(shù)和階碼,從而表示這個浮點數(shù)。其中,尾數(shù)用定點小數(shù)表示,階碼用定點整數(shù)表示。在計算機中,無論是定點數(shù)還是浮點數(shù),都有正負之分。在表示數(shù)據(jù)時,專門有1位或2位表示符號,對單符號位來講,通常用“1”表示負號;用“0”表示正號。對雙符號位而言,則用“11”表示負號;“00”表示正號。通常情況下,符號位都處于數(shù)據(jù)的最高位。3.2.2定點數(shù)的表示
1.原碼原碼的表示方法為:如果真值是正數(shù),則最高位為0,其它位保持不變;如果真值是負數(shù),則最高位為1,其它位保持不變?!纠?.1】寫出13和–13的原碼(取8位碼長)解:因為13=(1101)2,所以13的原碼是00001101,-13的原碼是10001101。采用原碼,優(yōu)點是轉換非常簡單,只要根據(jù)正負號將最高位置0或1即可。但原碼表示在進行加減運算時很不方便,符號位不能參與運算,并且0的原碼有兩種表示方法:+0的原碼是00000000,-0的原碼是10000000。數(shù)的原碼、補碼做加法2.反碼
反碼的表示方法為:如果真值是正數(shù),則最高位為0,其它位保持不變;如果真值是負數(shù),則最高位為1,其它位按位求反?!纠?.2】寫出13和–13的反碼(取8位碼長)解:因為13=(1101)2,所以13的反碼是00001101,-13的反碼是11110010。反碼跟原碼相比較,符號位雖然可以作為數(shù)值參與運算,但計算完后,仍需要根據(jù)符號位進行調(diào)整。另外0的反碼同樣也有兩種表示方法:+0的反碼是00000000,-0的反碼是11111111。為了克服原碼和反碼的上述缺點,人們又引進了補碼表示法。補碼的作用在于能把減法運算化成加法運算,現(xiàn)代計算機中一般采用補碼來表示定點數(shù)。3.補碼
補碼的表示方法為:若真值是正數(shù),則最高位為0,其它位保持不變;若真值是負數(shù),則最高位為1,其它位按位求反后再加1?!纠?.3】寫出13和–13的補碼(取8位碼長)解:因為13=(1101)2,所以13的補碼是00001101,-13的補碼是11110011。補碼的符號可以作為數(shù)值參與運算,且計算完后,不需要根據(jù)符號位進行調(diào)整。另外,0的補碼表示方法也是唯一的,即00000000。3.2.3浮點數(shù)的表示方法浮點數(shù)表示法類似于科學計數(shù)法,任一數(shù)均可通過改變其指數(shù)部分,使小數(shù)點發(fā)生移動,如數(shù)23.45可以表示為:101×2.345、102×0.2345、103×0.02345等各種不同形式。浮點數(shù)的一般表示形式為:N=2E×D,其中,D稱為尾數(shù),E稱為階碼。存儲數(shù)值時,存儲空間被分成了兩部分,分別存放尾數(shù)和階碼。尾數(shù)的長度影響該數(shù)的精度,而階碼則決定該數(shù)的取值范圍。數(shù)的浮點表示小數(shù)在計算機中通常采用浮點表示法。數(shù)的浮點表示法是指表示一個數(shù)時,其小數(shù)點的位置是浮動的??茖W記數(shù)法10進制2進制例如:“0.00000111011”的M值為“0.111011”;階碼N為-5,即“-101”2.BCD碼BCD碼(Binary-CodedDecimal?)亦稱二進碼十進數(shù)或二-十進制代碼。用4位二進制數(shù)來表示1位十進制數(shù)中的0~9這10個數(shù)碼。是一種二進制的數(shù)字編碼形式,用二進制編碼的十進制代碼。BCD碼這種編碼形式利用了四個位元來儲存一個十進制的數(shù)碼,使二進制和十進制之間的轉換得以快捷的進行。這種編碼技巧最常用于會計系統(tǒng)的設計里,因為會計制度經(jīng)常需要對很長的數(shù)字串作準確的計算。相對于一般的浮點式記數(shù)法,采用BCD碼,既可保存數(shù)值的精確度,又可免卻使電腦作浮點運算時所耗費的時間。此外,對于其他需要高精確度的計算,BCD編碼亦很常用。同一信息不同表示方法的對比245的十進制記為245245的二進制記為
11110101245的八進制記為365245的十六進制記為F5245的BCD碼記為0010
0100
0101245的ASCII碼記為00110010
00110100
001101013.2.4二進制運算1.加減運算(1)原碼運算在原碼運算時,與我們熟悉的十進制并無本質(zhì)區(qū)別。除了逢二進一,還有在計算機中符號也采用數(shù)字表示,需要注意運算時首先要把符號與數(shù)值分開。例如兩數(shù)相加,先要判斷兩數(shù)的符號,如果同號,可以做加法,如果異號,實際要做減法,減后的差作為兩數(shù)之和,和數(shù)的符號與絕對值較大的數(shù)的符號相同。兩數(shù)相減也是一樣,首先要判斷兩數(shù)符號,然后決定是相加還是相減,還要根據(jù)兩數(shù)的大小與符號決定兩數(shù)之差的符號。(2)補碼運算如果是補碼運算則不存在符號與數(shù)值分開的問題。在補碼運算時,把符號位也看成數(shù)值,一起參加運算,而且加法運算就一定是相加,減法運算就一定是相減,因此在計算機中對帶符號的數(shù)進行加減時,最好使用補碼。補碼的運算規(guī)則是:X補+Y補=(X+Y)補X補-Y補=X補+(-Y)補這樣我們就可以把減法轉換成加法來運算,這對我們平時的運算也許不重要,但對于計算機是很有意義的。因為計算機所有的運算都是硬件實現(xiàn)的,能把減法轉換成加法,在進行硬件設計的時候就可以省掉減法器,節(jié)省了設計。數(shù)的原碼、補碼做加法3.3非數(shù)值信息的表示非數(shù)值信息包括文字、圖形、圖像、聲音等,在計算機中采用編碼的方式來表示。所謂編碼就是用若干位數(shù)碼或符號的不同組合來表示非數(shù)值信息的方法,是人為地將若干位數(shù)碼或符號的每一種組合指定唯一的含義。不同的國家或地區(qū),都會規(guī)定計算機信息交換的編碼集。編碼后,非數(shù)值信息在計算機中就變成可計算處理的信息了,如圖3-2所示。計算化計算化符號化非數(shù)值性信息十進制(0,1,2,…,9)基于十進制的計算再語義化非數(shù)值性信息二進制(0和1)基于二進制的計算再符號化還原3.3.1字符編碼1.ASCII碼字符編碼是指用一系列的二進制數(shù)來表示非數(shù)值型數(shù)據(jù)(如字符、標點符號等)的方法,簡稱為編碼。表示26個英文字母,用5個二進制位編碼已足夠表示26個字符了。但是,每個英文字母有大小寫之分,還有大量的標點符號和其他一些特殊符號(如$、#、@、&、+等),所以用5位編碼就不夠用了。目前計算機中采用的字符編碼主要是ASCII碼,它是AmericanStandardCodeforInformationInterchange(美國標準信息交換代碼)的縮寫,已被國際標準化組織(ISO)采納,作為國際通用的信息交換標準代碼。ASCII碼是一種西文機內(nèi)碼,有7位ASCII碼和8位ASCII碼兩種。(1)7位ASCII碼7位ASCII碼稱為標準ASCII碼,用一個字節(jié)(8位)表示一個字符,并規(guī)定其最高位為0,可表示128個不同字符。其中有94個可顯示字符(10個數(shù)字字符、26個英文小寫字母、26個英文大寫字母、32個各種標點符號和專用符號),34個控制字符,如表3-2所示。標準ASCII碼字符表低四位高三位0000010100111001011101110000NULDELSP0@P`p0001SOHDC1!1AQaq0010STXDC2“2BRbr0011ETXDC3#3CScs0100EOTDC4$4DTdt0101ENQNAK%5EUeu0110ACKSYN&6FVfv0111BELETB‘7GWgw1000BSCAN(8HXhx1001HTEM)9IYiy1010LTSUB*:JZjz1011VTESC+;K[k{1100FFFS,<L\l|1101CRGS-=M]m}1110SQRS.>N^n~1111SIUS/?O_oDEL2.編碼中的計算非數(shù)值信息中如字母大小寫的轉換、圖片的尺寸大小或顏色的變換等都是計算機計算的結果。計算處理完畢后,再把信息解碼還原到人們能看的懂的輸出設備上。(1)字母大小寫轉換任何一個大寫字母,其ASCII碼加上32,就可以變成小寫字母。同理,小寫字母的ASCII碼,減去32,就可以轉換成對應的大寫字母。我們還可以再擴展一下,任何一個符號,把其ASCII碼加上一個合理的數(shù)N,就變成了另一個符號,利用這個規(guī)律,我們也可以把一段文字都加上同樣一個數(shù)N,實現(xiàn)數(shù)據(jù)的加密。而這個N,就是我們的密鑰。解密時,只要把相應的符號的ASCII減去N,就能還原成最初的符號了。(2)異或加密異或的特點是原始值與某一個數(shù)值經(jīng)過兩次異或運算會變成原來的值,利用這個特性可以對字符進行加解密。加密端把數(shù)據(jù)與一個密鑰進行異或操作生成密文,接收方收到密文后利用加密方提供的密鑰再次進行異或操作就能得到明文。例如,假設你要加密的內(nèi)容為A,密鑰為B:01000010,則A與B異或運算后得密文C:C=A⊕B=01000001⊕01000010=00000011對方收到的密文C,再次與密鑰B進行異或運算,即可取得原加密的內(nèi)容A:A=B⊕C=01000010⊕00000011=01000001對一個字符是這樣運算,對一串字符、一篇文章也是如此。所以只要知道密鑰,就可以利用異或運算完成加密和解密。3.3.2漢字編碼所謂漢字編碼,就是采用一種科學可行的辦法,為每個漢字編一個唯一的代碼,以便計算機辨認、接收和處理。計算機處理漢字的過程,實際上就是漢字編碼間的轉換過程。在計算機中輸入漢字時,操作者在鍵盤上輸入“輸入碼”,通過輸入碼找到漢字的國標區(qū)位碼(也稱為交換碼),再計算出漢字的機內(nèi)碼后存儲。而當顯示或打印漢字時,則首先從指定地址取出漢字內(nèi)碼,根據(jù)內(nèi)碼從字模庫中取出漢字的字形碼,并以漢字字形碼輸出到屏幕或打印機上,如圖3-3所示。地址碼字庫字形碼輸入碼機內(nèi)碼鍵盤輸入自動輸入交換碼存儲器通信內(nèi)部處理打印顯示字形碼內(nèi)碼交換碼圖3-3漢字處理過程1.輸入碼輸入碼是用鍵盤上的字母符號編碼組合表示每一個漢字的編碼,它使人們通過鍵入字母符號代替鍵入漢字。漢字輸入碼,也稱為漢字外部碼(簡稱外碼)。目前我國的漢字輸入碼編碼方案有上千種,在計算機上常用的也有多種。根據(jù)編碼規(guī)則是按照讀音還是字形,漢字輸入碼可分為流水碼、音碼、形碼和音形結合碼四種。智能ABC、微軟拼音、搜狗拼音和谷歌拼音等漢字輸入法為音碼,五筆字型為形碼。音碼借助漢語拼音編碼,重碼多、單字輸入速度慢,但容易掌握;形碼重碼較少,單字輸入速度較快,但學習和掌握較困難。目前,漢字輸入方法除了用鍵盤外,還可以使用手寫、語音和掃描識別等多種方式,但鍵盤輸入仍是目前最主要的漢字輸入方法。漢字輸入碼的編碼原則是應該易于接受、學習、記憶和掌握,重碼少,碼長盡可能短。2.漢字交換碼漢字交換碼是指不同的具有漢字處理功能的計算機系統(tǒng)之間在交換漢字信息時所使用的代碼標準。漢字交換碼也稱國標碼。(1)GB2312-80GB2312-80是我國于1980年頒布的第一個漢字編碼字符集標準,即《信息交換用漢字編碼字符集基本集》。用連續(xù)的兩個字節(jié)(16位)來表示一個漢字,每個字節(jié)的最高位都為0。GB2312-80收錄了6763個漢字以及682個符號,共7445個字符,奠定了中文信息處理的基礎。(2)Big5Big5碼是目前中國臺灣、香港地區(qū)普遍使用的一種繁體漢字的編碼標準。在當前流行的一些操作系統(tǒng)繁體版本中使用的都是Big5編碼。(3)GBK1995年12月,漢字擴展內(nèi)碼規(guī)范——GBK1.0編碼方案發(fā)布,收錄了21886個符號,包括21003個漢字和883個其它符號。2000年,GBK18030取代GBK1.0成為正式的國家標準。GBK18030編碼完全兼容GB2312-80標準,是在GB2312-80標準基礎上的內(nèi)碼擴展規(guī)范,共收錄了27484個漢字,同時收錄了藏文、蒙文、維吾爾文等主要的少數(shù)民族文字,同時在這個標準中,繁、簡漢字均處同一平臺,可解決兩岸三地間GB碼與Big5碼間的字碼轉換不便的問題。(4)UnicodeUnicode是為了解決傳統(tǒng)的字符編碼方案的局限而產(chǎn)生的,它為每種語言中的每個字符設定了統(tǒng)一并且唯一的二進制編碼,又稱萬國碼、統(tǒng)一碼,以滿足跨語言、跨平臺進行文本轉換、處理的要求。1990年開始研發(fā),1994年正式公布。Unicode是國際組織制定的可以容納世界上所有文字和符號的字符編碼方案。Unicode編碼是一組16位編碼,可以表示超過65000個不同的信息單元。從原理上講,Unicode可以表示現(xiàn)在正在使用的或者已經(jīng)不再使用的任何語言中的字符。對于國際商業(yè)和通信來說,這種編碼方式是非常有用的,因為在一個文件中可能需要包含有漢語、日語、英語等不同的語種。并且Unicode編碼還適用于軟件的本地化,即可以針對特定的國家修改軟件。另外,使用Unicode編碼,軟件開發(fā)人員可以修改屏幕的提示、菜單和錯誤信息提示等,來適用于不同國家的語言文字。3.機內(nèi)碼機內(nèi)碼是計算機內(nèi)處理漢字信息時所用的漢字代碼。在漢字信息系統(tǒng)內(nèi)部,對漢字信息的采集、傳輸、存儲、加工運算的各個過程都要用到機內(nèi)碼。機內(nèi)碼是真正的計算機內(nèi)部用來存儲和處理漢字信息的代碼。國標碼GB2312不能直接在計算機中使用,因為它沒有考慮與信息交換代碼ASCII碼的沖突。比如:“大”的國標碼是3473H,與字符組合“4S”的ASCII碼相同,“嘉”的漢字編碼為3C4EH,與碼值為3CH和4EH的兩個ASCII字符“<”和“N”混淆。為了能區(qū)分漢字與ASCII碼,在計算機內(nèi)部表示漢字時把交換碼(國標碼)兩個字節(jié)最高位改為1,稱為機內(nèi)碼。這樣,當某字節(jié)的最高位是1時,必須和下一個最高位同樣為1的字節(jié)合起來,代表一個漢字,而某字節(jié)的最高位是0時,就代表一個ASCII碼字符,以和ASCII碼相區(qū)別。如漢字“大”的音碼輸入碼為“da”,國標碼為3473H,二進制為0011010001110011,則機內(nèi)碼為1011010011110011。4.字形碼
字形碼記錄漢字的外形,用來將漢字顯示到屏幕上或打印到紙上,是漢字的輸出形式。記錄漢字字形通常有點陣法和矢量法兩種方法,分別對應兩種字形編碼:點陣碼和矢量碼。所有的不同字體、字號的漢字字形構成漢字庫?!按蟆睗h字字形碼是一種字模點陣碼。也有不同的處理漢字點陣信息的編碼,如向量編碼等oooooo11oooooooooooooo11oooooooooooooo11oooooooooooooo11ooooo1oo1111111111111111oooooo11oooooooooooooo11oooooooooooooo11oooooooooooooo11oooooooooooooo111oooooooooooo11oo1oooooooooo11oooo1oooooooo11ooooo11ooooooo1ooooooo11ooooo1ooooooooo111o
11ooooooooooo1oo計算機內(nèi)部由外到內(nèi)由內(nèi)到外大4、字形碼是用0和1編碼有、無亮點像素,形成一種點陣形式的漢字字形編碼,通過顯示器或打印機輸出漢字。簡易16X16,普及24X24,提高32X32,精密48X48,點陣規(guī)模越大,字形越清晰美觀,在字模庫中所戰(zhàn)勝的空間也越大?!按蟆睗h字內(nèi)碼:漢字在計算機內(nèi)部采用漢字內(nèi)碼存儲,漢字內(nèi)碼是一兩字節(jié)且最高位均為1的0,1型編碼計算機內(nèi)部由外到內(nèi)由內(nèi)到外b7
b6b5b4b3b2b1b0
b7
b6b5b4b3b2b1b0
用0和1編碼漢字,每個漢字在計算機內(nèi)部由2個字節(jié)表示0011010001110111國標碼1011010011110111(機)內(nèi)碼漢字的編碼“型”輸入碼有若干:拼音碼、字型碼、區(qū)位碼……拼音碼:xing雙拼碼:x;其中,‘x’表聲母x,而‘;’表韻母ing五筆字型碼:gajf其中,g表字根“-”,a表開下的草字頭,j表右側立刀,f表下面土字計算機內(nèi)部由外到內(nèi)由內(nèi)到外漢字輸入碼是用鍵盤上的字母符號編碼每一漢字的編碼,它使人們通過鍵入字母符號代替鍵入漢字。漢字的編碼“大”用0和1編碼無亮點和有亮點形成字形信息,便于顯示……漢字字形碼是一種字模點陣碼。也有不同的處理漢字點陣信息的編碼,如向量編碼等oooooo11oooooooooooooo11oooooooooooooo11oooooooooooooo11ooooo1oo1111111111111111oooooo11oooooooooooooo11oooooooooooooo11oooooooooooooo11oooooooooooooo111oooooooooooo11oo1oooooooooo11oooo1oooooooo11ooooo11ooooooo1ooooooo11ooooo1ooooooooo111o
11ooooooooooo1oo計算機內(nèi)部由外到內(nèi)由內(nèi)到外大漢字字形碼是用0和1編碼無亮點和有亮點像素,形成漢字字形的一種編碼。依據(jù)字形碼通過顯示器或打印機輸出漢字。漢字的編碼“大”da1011010011110111oooooo11oooooooooooooo11oooooooooooooo11oooooooooooooo11ooooo1oo1111111111111111oooooo11oooooooooooooo11oooooooooooooo11oooooooooooooo11oooooooooooooo111oooooooooooo11oo1oooooooooo11oooo1oooooooo11ooooo11ooooooo1ooooooo11ooooo1ooooooooo111o11ooooooooooo1oo計算機內(nèi)部由外到內(nèi)由內(nèi)到外漢字處理過程:通過漢字外碼輸入,以漢字內(nèi)碼存儲,以漢字字形碼輸出漢字的編碼3.3.4多媒體信息的表示和處理計算機不僅能處理文字和數(shù)字,而且還能處理文本、圖像、音頻、視頻等多種媒介,這些媒介就是多媒體信息,它以簡潔、直觀、鮮活和擬人的方式表達豐富的信息內(nèi)容,呈現(xiàn)了出傳統(tǒng)信息表達方式無法比擬的優(yōu)越性。多媒體技術是當前信息技術領域發(fā)展得最快、最活躍的技術,也是成為未來信息處理的主流技術。1.文本文本是文字信息在計算機中的表示形式,組成文本的基本元素是字符。根據(jù)用途,文本信息一般分為純文本、格式文本和超文本三類。(1)純文本純文本,也稱ASCII文本,是由許多用于表達正文內(nèi)容的包括字母、漢字、標點符號以及其他有限的“回車”、“換行”、“制表”等可打印字符組成,幾乎不包含任何其他格式信息或結構信息。在計算機中的文件類型一般是.txt,文件中不能插入圖片、表格等,也不能插入超鏈接。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年社保失業(yè)考試試題及答案
- 電工中級工理論復習測試題
- 工業(yè)機器人高級工練習卷附答案(一)
- CFD軟件:CFX二次開發(fā)-CFX前后處理工具的二次開發(fā)
- 2025年網(wǎng)絡經(jīng)濟學試題及答案
- 2025年高中語文人教版必修3練習:動物游戲之謎
- 2025年特務考試試題及答案
- 2025年消化科三基試題及答案
- 2025年行銷管理面試題及答案
- 2025年山東單招歷史試題及答案
- 師德師風培訓筆記
- 養(yǎng)老護理練習題庫(含答案)
- 2025年南京城市職業(yè)學院單招職業(yè)技能測試題庫完整
- 2025年滁州城市職業(yè)學院單招職業(yè)適應性測試題庫匯編
- 特種設備生產(chǎn)和充裝單位許可規(guī)則
- 第七章 力 達標測試卷(含答案)2024-2025學年度人教版物理八年級下冊
- 2024年全國教育大會精神全文課件
- 2024年安徽機電職業(yè)技術學院高職單招(英語/數(shù)學/語文)筆試題庫含答案解析
- 個人所得稅專項附加扣除及個人所得稅計算培訓
- 平面機構簡圖及自由分解PPT課件
- 工業(yè)園區(qū)提升改造項目可行性研究報告模板
評論
0/150
提交評論