打字輸入法:走進98王碼_第1頁
打字輸入法:走進98王碼_第2頁
打字輸入法:走進98王碼_第3頁
打字輸入法:走進98王碼_第4頁
打字輸入法:走進98王碼_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、王碼五筆型輸入法98版第 頁 共 29 頁目 錄 一、基礎(chǔ)知識11. 漢字的5種筆畫12. 筆畫間的三種關(guān)系13. 漢字結(jié)構(gòu)的三個層次24. 漢字的三種字型35. 漢字編碼與王碼36. 漢字編碼的單位-碼元47. 碼元順序與筆順規(guī)范5 二、認識王碼鍵盤7 1. 王碼鍵盤的5個區(qū)72. 各區(qū)的5個鍵位73. 王碼鍵盤鍵位圖84. 王碼鍵盤鍵面符號介紹105. 快速記住碼元的區(qū)位號11 三、碼元漢字輸入法121. 鍵名漢字輸入122. 成字碼元輸入123. 補碼碼元及其輸入134. 碼元總表14 四、合體字的輸入161. 合體字的取碼規(guī)則162. 多元字的取碼規(guī)則183. 四元字的取碼規(guī)則194.

2、 二元字和三元字的取碼規(guī)則及識別碼195. “識別碼”的直觀快速教學法216. “98王碼”漢字編碼流程圖22 五、簡碼重碼和容錯碼241. 簡碼輸入242. 重碼253. 容錯碼264. 萬能學習鍵z26 六、詞語輸入281. 詞語輸入規(guī)則28 一、基礎(chǔ)知識1.【漢字的5種筆畫】1983年王永民教授給“筆畫”定義為:書寫漢字時,一次寫成的一個連續(xù)不斷的線段。由此可推知:l多個筆畫寫成的是筆畫結(jié)構(gòu),如“十、口”等,不能叫筆畫。l一個連貫的筆畫,不能斷開成幾段來處理。例如,不能把“申”分解為“丨田丨”,也不能把“里”拆成“田土”等。經(jīng)科學歸納,漢字的基本筆畫只有下表所示的5種。為了編碼,這5種單

3、筆畫,分別以數(shù)字1、2、3、4、5作為代號:代 號基本筆畫名稱筆畫走向筆畫變形1橫 一左-右2豎 丨上-下3撇 丿右上-左下4捺 左上-右下5折 乙?guī)мD(zhuǎn)折 變形筆畫與基本筆畫是同一類筆畫,這是因為:(1)由“現(xiàn)”是“王”字旁可知,提筆“”實際是橫的變形。(2)由“村”是“木”字旁可知,點筆“丶”應(yīng)屬于“”。(3)由舊體的“木”字其豎筆帶鉤可知,豎筆向左帶鉤“”應(yīng)屬于豎。(4)其余一切帶轉(zhuǎn)折、拐彎的筆畫,都歸“折”類。2.【筆畫間的三種關(guān)系】漢字筆畫之間的結(jié)構(gòu)形態(tài),即構(gòu)形關(guān)系,共有三種:1. 相分離:如“八、小、三”,以及“旦、札、只”的最后一筆;2. 相連接:如“刀、人、幾”,以及“廣、里、夫

4、”的最后一筆;3. 相交叉:如“十、九、又”,以及“于、中、事”的最后一筆。筆畫之間的三種構(gòu)形關(guān)系,是漢字圖形中直觀易辨、非常有用的特征信息。在漢字形碼中,當僅僅提取筆畫結(jié)構(gòu)信息還不足以區(qū)分漢字的字形時,就有必要在編碼中使用這種“構(gòu)形信息”。在98王碼中,我們用數(shù)字來表示筆畫的三種關(guān)系,即:筆畫間的關(guān)系 構(gòu)形代碼相分離散 1相連接連 2相交叉交 398王碼在處理中、日、韓三國字集的21003個漢字的編碼時,就用到了上述筆畫的構(gòu)形信息。3.【漢字結(jié)構(gòu)的三個層次】漢字的最小結(jié)構(gòu)單位是筆畫,單筆畫有橫、豎、撇、捺、折,共5種。由2個以上單筆畫以散、連、交的方式,可以構(gòu)成筆畫結(jié)構(gòu)。筆畫結(jié)構(gòu)中成為漢字的

5、,或構(gòu)字能力較強的結(jié)構(gòu),在文字學中叫做“字根”或“部件”。漢字的字根或部件,大約有6001000種。由字根或部件,用積木組字的方法,可以構(gòu)成漢字。漢字的字數(shù)成千上萬:國標gb231280中有6763個漢字;臺灣big5字集中有13053個漢字;國際標準gbk字集中有21003個漢字。這么多漢字,在文字學中,都可以認為是由“字根”或“部件”組合而成的。由此可見,漢字結(jié)構(gòu)有三個層次。即:筆畫構(gòu)成字根(部件);字根(部件)構(gòu)成漢字。特別提示:筆畫、字根(部件)和整字,都只是“文字學”的概念。這些概念和編碼學及信息處理中作為編碼單元的“碼元”,雖有關(guān)系,但絕然不是一回事,尤其沒有一一對應(yīng)的關(guān)系。4.【

6、漢字的三種字型】漢字是一種平面圖形文字。同樣幾個碼元(字根),擺放位置不同,就可能成為不同的字。如:“叭”與 “只” “吧”與“邑” 可見,碼元(字根)的位置關(guān)系,也是漢字的一種重要特征信息。這個“字型”信息,在98王碼的編碼中很有用處。根據(jù)漢字碼元(字根)之間的位置關(guān)系,我們可以把成千上萬的方塊漢字分為三種字型:左右型、上下型、雜合型,并順序命以代號1、2、3,如下表表示。字型代號字型圖 示字 例特 征1左右型 漢湖結(jié)封碼元之間可有間距,總體左右排列2上下型 字莫花華碼元之間可有間距,總體上下排列3雜合型 困同兇區(qū)這司乘果碼元之間雖有間距,但不分上下左右,或者渾然一體,不分塊5.【漢字編碼與

7、王碼】漢字沒有字母,我們不能像輸入英文那樣,用鍵盤上的26個字母直接向電腦輸入漢字。為此,要將漢字或漢字的構(gòu)成部分,編成“代號”,也就是“代碼”,以便用電腦鍵盤輸入這些代碼,間接地輸入漢字。為漢字編制代碼的方法,叫“漢字編碼”。不考慮讀音,完全依據(jù)筆畫和字形特征,為漢字編制代碼的方法叫“形碼”。98王碼,即98版五筆字型,是一種形碼。98王碼既可以輸入國家標準的6763個漢字,也可以輸入港臺地區(qū)的13053個繁體字,以及國際標準gbk大字符集的中、日、韓三國21003個漢字。98王碼完全依字形編碼,不受漢字讀音和方言的限制,重碼很少。在國標gb2312_80字集的6763個漢字中,重碼率低于2

8、%,加上簡碼,平均每打1萬個字,才需要挑選一次。即使在gbk字集21003個漢字范圍內(nèi),重碼率也低于5%。重碼率低,是用小鍵盤實現(xiàn)盲打,提高輸入效率的決定因素。6.【漢字編碼的單位-碼元】編碼是給漢字以及筆畫結(jié)構(gòu)編制“代碼”,或命名“代號”,就好象給人起名字一樣。漢字編碼既不涉及書法藝術(shù),更不是“造字法”。漢字是圖形文字,筆畫繁多、形態(tài)多變。如把幾萬個漢字分解成較小的塊塊,即使不細分,分解出來的“字根”或“部件”,也會多達上千種。無論如何,在標準鍵盤的26個字母鍵上,是無法擺得下將近1000個符號的。把漢字理解為“字根”或“部件”,客觀上是為漢字設(shè)計了“字母”。然而漢字根本沒有,也不可能有字母

9、!因此,我們不可能,也沒有必要以文字學意義上的字根或部件為單位,在鍵盤上一筆不差地拼出漢字。98王碼中,是以“碼元”為單位,向電腦輸入漢字的。我們把筆畫結(jié)構(gòu)特征相似,筆畫形態(tài)及筆畫多少大致相同的“筆畫結(jié)構(gòu)”,作為編碼的“單元”,即編碼的“元素”,簡稱“碼元”。“碼元”是一個編碼學上的概念,它是指筆畫結(jié)構(gòu)的特征,完全不同于文字學意義上的字根或部件。如“打倒山”、“彐”和“”,形態(tài)雖略有不同,但有視覺上的相同特征,這三個筆畫結(jié)構(gòu),雖然是三個不同的字根(部件),但我們認為屬于同一個“碼元”。其中“彐”有代表性,使用次數(shù)多,叫“主碼元”,簡稱“主元”;而使用次數(shù)少的“、”,則叫“次元”,或“副元”。再

10、如:“水”的同源字形,以及與“水”的筆畫特征大致相同的筆畫結(jié)構(gòu),有“”等等,合在一起,在編碼學中,就可以歸為同一碼元。其中,“水”叫“主元”,其余的叫“次元”??傊?,“碼元”只是編碼學意義上的“單元”,是經(jīng)過抽象的“字根”或“部件”。碼元只代表“筆畫特征”,而不代表筆畫的具體結(jié)構(gòu)和細節(jié)。因此,只要“特征”相同,筆畫的細節(jié)盡管不一樣,也并不影響它們是同屬一個“碼元”。例如:“”就是同一碼元。很明顯,它們的共同“特征”是“筆畫向下構(gòu)成一個罩”,這里,“”是“主元”,“”是“次元”。98王碼的“碼元”除5個單筆畫外,“主元”有150個,“次元”有90個。最后,為了學好用好98王碼,我們必須反復強調(diào),

11、“碼元”完全不同于文字學意義上的“字根”或“部件”?!按a元”只是我們?yōu)榱私o無比復雜的漢字編制代碼,命名代號。我們把曲直長短略有不同,但總體形似的筆畫結(jié)構(gòu)歸為同一碼元。字根或部件,是作為漢字的構(gòu)成部分,不可以隨意改動變形的,否則就“不是那個字”了。理清文字學中“字根”與編碼學中“碼元”的概念混淆,對于消除長期以來不同學科之間的相互非難和誤解,對于融多學科之長用于編碼研究,具有深刻的理論意義和重要的現(xiàn)實意義。7.【碼元順序與筆順規(guī)范】碼元是指漢字筆畫結(jié)構(gòu)的“特征”。一個較復雜的漢字,常有一系列的結(jié)構(gòu)“特征”。當把幾個“碼元”用于編碼時,為便于教學和應(yīng)用,其碼元的序列最好與漢字的書寫順序保持一致。如

12、:新:立 木 斤 (正確)立 斤 木 (錯誤)刀:刀 丿 (正確)刀 丿 (錯誤)另外,筆畫既不能任意切斷,也不能重復使用,在兩個碼元中出現(xiàn)如:里:日 土 (正確)田 土 (錯誤)一般來說,一個漢字的碼元順序和筆畫順序是一致的,大多數(shù)情況下,碼元順序也與書寫漢字時字根(部件)的順序相一致。但也有例外的情況。1、碼元順序與筆順不一致。例如:“國”字的最后一筆,也即“”的最后一筆。但“國”的第一個碼元“”,卻把最后一筆“帶”走了。再如“或”,第一個碼元是“”,卻把最后的兩個筆畫帶到第一個碼元中了??梢?,“編碼”不是書法。為了照顧碼元的完整性和直觀性,有時候就無法遵照“筆順規(guī)范”。2、碼元順序與漢字

13、部件結(jié)構(gòu)的順序不一致。例如: “武”字的碼元順序是: (編碼順序) “武”字的規(guī)范筆順是: (書寫順序)由此,我們可以看到,碼元和字根(部件)確有不同之處。 二、認識王碼鍵盤 1.【王碼鍵盤的5個區(qū)】 英文鍵盤用26個字母輸入英文。王碼鍵盤依照字形輸入漢字。將150個碼元按科學規(guī)律和技術(shù)要求,分配在26個英文字母鍵除z鍵以外的25個鍵上,就形成了98王碼的“碼元鍵盤”。98王碼鍵盤分為5個區(qū)。第1區(qū):主要放置橫起筆的碼元,32個王土大木工 等;第2區(qū):主要放置豎起筆的碼元,23個目日口田山 等;第3區(qū):主要放置撇起筆的碼元,34個禾白月人金 等;第4區(qū):主要放置點起筆的碼元,27個言立水火之

14、等;第5區(qū):主要放置折起筆的碼元,29個已子女又幺 等;第3區(qū)(撇類34個)第4區(qū)(點類27個)第1區(qū)(橫類32個)第2區(qū)(豎類23個)第5區(qū)(折類29個)2.【各區(qū)的5個鍵位】王碼鍵盤的每一個區(qū),各有5個鍵位。區(qū)號從1到5,位號也是從1到5,區(qū)位號組合共形成55=25個代碼,作為各個鍵位的代號、代碼,也即編碼。對應(yīng)到標準鍵盤z鍵以外的225個鍵上就是:金35 q人34 w月33 e白32 r禾31 t言41 y立42 u水43 i火44 o之45 p工15 a木14 s大13 d土12 f王11 g目21 h日22 j口23 k田24 l(學習鍵)z幺55 x又54 c女53 v子52 b已

15、51 n山25 m ,各區(qū)的位號,都從鍵盤的中部,向兩端排列,這樣就使得雙手放到鍵盤上時,位號的順序與食指到小指的順序相一致。35 31 q t 3區(qū)(撇起筆)41 45 y p 4區(qū)(點起筆)15 11 a g 1區(qū)(橫起筆)21 24 h l 2區(qū)(豎起筆)55 51x n 5區(qū)(折起筆)25m鍵 盤分區(qū)圖這就是5區(qū)5位的王碼(五筆字型)鍵盤。3.【王碼鍵盤鍵位圖】4.【王碼鍵盤鍵面符號介紹】王碼鍵盤的各個鍵面上,有以下幾類符號。現(xiàn)以第1區(qū)第5位15(a)鍵為例,介紹如下: g鍵名,每個鍵上左上角打頭的那個主碼元,都是構(gòu)字能力很強,或者有代表性的漢字。這個漢字,叫做鍵名字,簡稱“鍵名”。主

16、碼元,是各鍵上代表某種漢字結(jié)構(gòu)“特征”的筆畫結(jié)構(gòu)。如“、七、艸”等。次碼元,是具有主碼元的特征,不太常用的筆畫結(jié)構(gòu)。編碼時,為了直觀地提示編碼(僅僅是提示!),幫助記憶,我們常常用“碼元”直接表示編碼,也可以用“主碼元”代表“次碼元”。因此,當你把“碼元”當成“字根”(部件),與漢字結(jié)構(gòu)一一對照時,難免會發(fā)現(xiàn)差異。這是不奇怪的。因為“編碼”既不是書法藝術(shù),也不是“造字法”!這里的“碼元”不是漢字的實際構(gòu)成部分,只是結(jié)構(gòu)特征代表的“符號”。由上圖1區(qū)5位的a鍵可見,第1區(qū)的第5個鍵位上,有5個主碼元:工 艸 七另有7個次碼元: a鍵的代碼,即a鍵上全部碼元的編碼,都由區(qū)號1,位號5組成,也即用1

17、5,或a代表這個鍵上的全部碼元。以后,我們就以15或a來作為a鍵上所有碼元的代碼,為漢字編碼;只是在個別情況下,為了提示編碼,才用碼元,甚至字根(部件)來直觀地提示一下。5.【快速記住碼元的區(qū)位號】(1)區(qū)號與首筆代號一致:區(qū)號一般與碼元第一個筆畫的代號一致。(2)許多位號與次筆代號一致:鍵盤設(shè)計中,我們盡量讓碼元的位號與第2個筆畫的代號一致。為此,大部分碼元,只要用筆畫代碼“讀”它的前2個筆畫,就構(gòu)成了碼元的“區(qū)位號”(記住這個區(qū)位號,就是編碼?。,F(xiàn)示例如下:碼元第一筆第二筆區(qū)位號(編碼)土(橫)1(豎)212.f貝(豎)2(折)525.m禾(撇)3(橫)131.t之(點)4(折)545.

18、p又(折)5(捺)454.c當然,全部按碼元的前2個筆畫去找碼元的鍵位,有些情況也不靈。特別是找“次元”。如“”前2個筆畫是35,可它就不在3區(qū)5位,因它跟“主元”“ ”具有同一特征,二者都在25m鍵上。“主元”表明特征,“頭頭兒”。而“次元”附屬于“主元”,編碼相同。除了“水”、“火”之外,其它各鍵的主元,一般都不會跑出首筆所在的區(qū)。根據(jù)主元,順藤摸瓜,可立即找到次元。 三、碼元漢字輸入法1.【鍵名漢字輸入】碼元之中,有的是漢字,有的不是漢字。每個鍵上左上角的那個碼元,即助記詞中的第一個漢字,叫“鍵名”碼元,或“鍵名”漢字,簡稱“鍵名”。鍵名的輸入法是:把所在的鍵連打4下,如:1區(qū)1位鍵名:

19、王 11 11 11 11 (gggg)3區(qū)2位鍵名:白 32 32 32 32 (rrrr)4區(qū)5位鍵名:之 45 45 45 45 (pppp)5區(qū)3位鍵名:女 53 53 53 53 (vvvv)2.【成字碼元輸入】除鍵名以外,凡本身是漢字的碼元,叫“成字碼元”。其輸入法是:先打一下它所在的鍵( 這一下俗稱“報戶口” ),再打第一個、第二個及最末一個單筆畫,共4下,不足4下,補一個空格鍵:4區(qū)1位的成字碼元:文:文 丶 一 41 41 11 41 (yygy)1區(qū)5位的成字碼元:七:七 一 15 11 51 (agn)(不足4碼,補空格鍵1下)3區(qū)3位的成字碼元:毛:毛 丿 一 33 3

20、1 11 51 (etgn)3區(qū)4位的成字碼元: 亻:亻 丿 丨 34 31 21(wth)(不足4碼,補空格鍵1下)4區(qū)3位的成字碼元: 丶 丶 4341 41 11 (iyyg)(提筆等于橫筆)注意:“碼元”本來只是代表筆形結(jié)構(gòu)的“特征”,只有當一個“碼元”完全等同于一個漢字時,它才可以作為“成字碼元”輸入電腦。在98王碼中,鍵名碼元有25個。1區(qū):王土大木工2區(qū):目日口田山3區(qū):禾白月人金4區(qū):言立水火之5區(qū):已子女又幺成字碼元(包括平時不作為漢字、但有國標碼的偏旁部首),計有100多個。其中本身是常用漢字的66個如下:1區(qū):五夫干士十二寸未甘雨犬三古石廠丁西甫七(21個)2區(qū):上止早蟲

21、川甲四車由貝(10個)3區(qū):斤丘氣手用力毛八幾夕兒(11個)4區(qū):文方辛六羊門小業(yè)廣米(10個)5區(qū):心尸羽耳了也乃皮刀九巴母弓匕(14個)練習:請逐個寫出以上“成字碼元”的輸入碼:示例:也: 也 丨 52 51 21 51 (bnhn)3.【補碼碼元及其輸入】參與編碼時,要編兩個碼的碼元叫“補碼碼元”,也叫雙碼碼元。98王碼中的補碼碼元共有以下3個:表中帶圓圈的筆畫,是“補碼”的筆畫表示形式,作為一個符號,用以提示編碼。編碼示例:獲:15 35 31 13 (aqtd) 艸 犭 犬 (編碼提示)社:45 41 12 11 (pyfg) 礻 土 (編碼提示)4.【碼元總表】把碼元全部安排在對應(yīng)

22、的鍵位上,配上助記詞,就成為如下所示的碼元總表。熟悉碼元及學習編碼時,這張表很有用處。碼元總表示意圖 四、合體字的輸入1.【合體字的取碼規(guī)則】一、書寫順序“合體字”編碼,一般情況下,要按照正確的書寫順序進行。如:新:立 木 斤 (正確,符合規(guī)范書寫順序) 立 斤 木 (錯誤,未按書寫順序編寫)中:口 丨 (正確,符合規(guī)范書寫順序) 丨 口 (錯誤,未按書寫順序編寫)夷:一 弓 人 (正確,符合規(guī)范書寫順序)大 弓 (錯誤,未按書寫順序編寫) 非:丨 三 丨 三 (正確,符合規(guī)范書寫順序) 三 三 (錯誤,未按書寫順序編寫)二、取大優(yōu)先“取大優(yōu)先”,也叫做“優(yōu)先取大”。按“書寫順序”為漢字編碼時

23、,不能無限制地采用筆畫少的碼元。否則,漢字都將變成單筆畫碼元了!要以“再添一個筆畫,便不能構(gòu)成為筆畫更多的碼元”為限度,每次都以那個“盡可能大”的,即“盡可能筆畫多”的結(jié)構(gòu)特征作為碼元編碼。例:世: 第一種:一 凵 乙 (誤) 第二種:廿 乙 (正)顯然,前者是錯誤的,因為其第二個碼元“凵”,完全可以向前“湊”到“一”上,形成多一個筆畫的碼元“廿”。再如:甩: 第一種: (誤) 第二種:月 (正)同樣,第一種編碼是錯誤的。因為其第二碼的“二”,完全可以向前“湊”成“更大”一點的碼元“月”。 “取大優(yōu)先”,俗稱“盡量往前湊”,是一個在漢字取碼時“最常用到的基本規(guī)則”。至于什么才算“大”,“大”到

24、什么程度才到“邊”,等到讀者熟悉了碼元總表,你便不難發(fā)現(xiàn),這個“限度”,這個“邊”,無非是碼元總表中可以“湊”成的“筆畫最多,又符合碼元特征”的筆畫結(jié)構(gòu)罷了!三、兼顧直觀在確認碼元時,為了使碼元特征明顯易辯,有時就要“犧牲”“書寫順序”和 “取大優(yōu)先”的原則,形成個別例外的情況。例1:國按“書寫順序”,其碼元應(yīng)是:“冂 王丶一”;但這樣編碼,不但有悖于該字的字源,也不能使碼元“囗”直觀易辯。我們只好違背“書寫順序”,按“囗王丶”的順序編碼。例2:自按“取大優(yōu)先”編碼為:“亻三”;但這樣,不僅不直觀,而且也有悖于“自”字的字源(有人說,這個字的字源是“一個手指指著鼻子”,這里的“目”是鼻子的象形

25、)。我們只能按“丿目”編碼,這樣的編碼叫“兼顧直觀”。例3:戔二 丶 (取大優(yōu)先)一 (兼顧直觀)顯然,按后者編碼,更能符合碼元的筆畫特征。四、能連不交請看以下取碼實例:失: 丿 夫 (二者是相連的) (正) 大 (二者是相交的) (誤) 朱: 丿 未 (二者是相連的) (正) 木 (二者是相交的) (誤)當一個字既可以視作“相連”的幾個碼元,也可視作“相交”的幾個碼元時,我們認為“相連”的情況是可取的。因為一般來說,“連”比“交”更為“直觀”,更能顯現(xiàn)碼元的筆畫結(jié)構(gòu)特征。五、能散不連在第一章中我們講過,筆畫和字根之間,字根與字根之間的關(guān)系,可以分為“散”的關(guān)系、“連”的關(guān)系和“交”的關(guān)系三種

26、。相應(yīng)地,碼元之間也有這樣的三種關(guān)系。如:倡:三個碼元之間是“散”的關(guān)系;自:首筆“丿”與“目”,兩個碼元之間是“連”的關(guān)系;夷:“一”、“弓”與“人”,三個碼元是“交”的關(guān)系。幾個碼元之間的關(guān)系,是決定漢字字型的主要依據(jù)。漢字的字型,依其碼元之間的關(guān)系,如第一章基礎(chǔ)知識中所講,可以分為左右型(代號1)、上下型(代號2)、雜合型(代號3)。幾個碼元都“交”“連”在一起的,如“夷”、“丙”等,便肯定是“雜合型”,屬于3型字,不會有爭議。然而值得注意的是,有時候,一個漢字的幾個碼元,都不是單筆畫,這些碼元之間的關(guān)系,常常在“散”和“連”之間模棱兩可。如:占:口,兩個碼元按“連”處理,便是雜合型(3

27、型);如按“散”處理,便是上下型(2型)。矢:大,兩個碼元如果按“連”處理,“矢”便是雜合型(3型);兩個碼元如果按“散”處理,“矢”便是上下型(2型)。當遇到這種既能“散”,又能“連”的情況時,我們規(guī)定:只要不是單筆畫,一律按 “能散不連”判別,即作為散的關(guān)系。因此,以上兩例中的“占”和“矢”,都被認為是“上下型”字(2型)。 作出以上這些規(guī)定,可能與文字結(jié)構(gòu)學或字源學上的說法不相一致,這并不重要,因為這里只是“編碼”,不是造字,更不是書法藝術(shù)。編碼中的這種規(guī)定,僅僅是為了避免取碼的二義性,并保證編碼體系的嚴密和完整。人們大可不必認為,作者是要求你從今以后把“占”和“矢”寫成上下分離的兩個部

28、分。實際上,用得上后3條規(guī)定的字,只是極少數(shù)。2.【多元字的取碼規(guī)則】所謂“多元字”,是有4個以上碼元的字。這種字,不管實際上有幾個碼元,我們僅僅“按書寫順序?qū)⒌谝弧⒍?、三及最末一個碼元編碼”,俗稱“一二三末”,共編四個碼。如:戇: 立 早 夂 工 貝 心 (42 22 31 51) u j t n爨: 冂 一 口 冖 木 木 大 火 (33 25 11 44) e m g o3.【四元字的取碼規(guī)則】“四元字”是指剛好有四個碼元特征的字。其取碼方法是“依照書寫順序?qū)⑺膫€碼元編碼” :照:日 刀 口 灬 (22 53 23 44) jvko低: 亻 丶 (34 35 15 41) wqay驛:

29、一 又 (54 11 54 11) cgcg4.【二元字和三元字的取碼規(guī)則及識別碼】只有2個碼元的字,叫“二元字”;只有3個碼元的字,叫“三元字”。當一個字的碼元少于4個時,即“二元字”或“三元字”,其輸入編碼法是:輸入全部碼元后,再追加一個 “末筆字型識別碼” (簡稱“識別碼”)?!白R別碼”是由“末筆”代號加“字型”代號,構(gòu)成的一個復合附加碼。一識別碼的由來在7000來個漢字中,大約有10%的漢字,只有2個碼元。如:“紅、計、要、他”等。把這些字的2個碼元編碼,其編碼長度為2(即2個碼)??墒?,98王碼即(五筆字型),是用25個鍵來輸入漢字的。這樣,只用25個鍵,打2下作為一個漢字的碼,充其

30、量可以組成2525=625個編碼,即兩碼的編碼空間是625。這就相當于,我們只有625個房間號,要住700個人!這就難免產(chǎn)生擁擠。何況,并不是每一種組合都能對應(yīng)一個漢字。因此,許多“房號”永遠是“空號”,不可能有字,勢必使剩余的“房間”更加擁擠不堪產(chǎn)生大量重碼(字不同,但它們的編碼相同叫“重碼”)!“重碼”字太多,輸入時,需要選字,像漢語拼音輸入一樣,打一組鍵,有許多個字顯示出來,不能盲打,必然降低輸入效率,是我們不希望的。何況,這些二元字,大都是最常用的字呢?因此,必須把它們的編碼離散區(qū)分開來。辦法是在碼元的后邊,再補加一個碼元。為此,我們規(guī)定:二元字及三元字,碼元輸入之后,后邊一律再加上一

31、個碼“識別碼”。這樣,可以大幅度減少常用字的“重碼”,從而提高輸入效率?!澳┕P字型識別碼”為減少重碼起了關(guān)鍵作用,使得絕大多數(shù)原本“重碼”的常用字,都有一個與該字對應(yīng)的唯一編碼,而不再“重碼”了。二、“識別碼”的必要性及構(gòu)成以下例子可以進一步說明增加“識別碼”的必要性。1.丟失字型信息會引起重碼 叭: 口 八 (kw) (1型字)只: 口 八 (kw) (2型字)吧: 口 巴 (kc) (1型字)邑: 口 巴 (kc) (2型字)旮: 九 日 (vj) (2型字)旭: 九 日 (vj) (3型字)以上三組漢字,都成了重碼字。如果有辦法將以上三組漢字的“字型”特征,作為一個編碼補在后邊,這些字就

32、都不再重碼了。2.因同一個鍵位上有幾個不同的碼元而引起重碼沐: 氵 木 (is) (末筆為)?。?氵 丁 (is) (末筆為)灑: 氵 西 (is) (末筆為一)他: 亻 也 (wb) (末筆為,1型字)倉: 人 (wb) (末筆為,2型字)仔: 亻 子 (wb) (末筆為一,1型字)以上2組漢字,都是重碼字。如果將這些字的“末筆”特征作為一個編碼補加在后邊,這些字則無一重碼。 “五筆字型”中設(shè)計的“末筆字型識別碼”,是一個既含有“末筆”信息,又含有“字型”信息的一個“綜合功能碼”。在以上例子中,只要在碼元之后加上“識別碼”,就不會有重碼了?!白R別碼”是“五筆字型”僅僅使用25個鍵位,又有極少

33、重碼的關(guān)鍵性技術(shù)。5.【“識別碼”的直觀快速教學法】一、對于1型(左右型)字,碼元輸入之后,補打1個末筆畫,就等同于加了“識別碼”。 例(為了將識別碼與實際的筆畫有所區(qū)別,我們用帶圓圈的筆畫表示識別碼):沐: 氵 木 (“”為末筆,補打“”即為“識別碼”)0?。?氵 丁 (“”為末筆,補打“”即為“識別碼”)1灑: 氵 西 (“一”為末筆,補打“”即為“識別碼”)2杉: 木 彡 (“丿”為末筆,補打“”即為“識別碼”)3憶: 忄 乙 (“乙”為末筆,補打“”即為“識別碼”)二、對于2型(上下型)字,碼元輸入之后,補打由2個末筆畫“復合構(gòu)成”的“碼元”,就等同于加了“識別碼”。例:華: 亻 匕

34、十 (末筆為“丨”,2型,補打“”即為“識別碼”)0字: 宀 子 (末筆為“一”,2型,補打“”即為“識別碼”)1參: 厶 大 彡 (末筆為“丿”,2型,補打“”即為“識別碼”)2會: 人 二 厶 (末筆為“丶”,2型,補打“”即為“識別碼”)3倉: 人 (末筆為“乙”,2型,補打“”即為“識別碼”)三、對于3型(雜合型)字,碼元輸完之后,補打由3個末筆畫“復合構(gòu)成”的“碼元”,就等同于加了“識別碼”。例:同: 冂 一 口 (末筆為“一”,3型,補打“”作為“識別碼”)串: 口 口 丨 (末筆為“丨”,3型,補打“”作為“識別碼”)丙: 一 冂 人 (末筆為“丶”,3型,補打“”作為“識別碼”

35、)疹: 疒 人 彡 (末筆為“丿”,3型,補打“”作為“識別碼”)屜: 尸 (末筆為“”,3型,補打“”作為“識別碼”)為什么這些“帶圈”的“筆畫”可以起到“識別碼”的作用,為什么其中的“幾個筆畫”剛好能起到“識別碼”的作用?這是因為“區(qū)位號”、“筆畫數(shù)”、“字型號”,有“數(shù)”的一致性;(1)單筆畫在各區(qū)的第1位,第1位剛好也代表1型字;(2)雙筆畫在各區(qū)的第2位,第2位剛好也代表2型字;(3)3個單筆畫在各區(qū)的第3位,第3位剛好也代表3型字。符號說明:以后,我們用筆畫加圓圈,代表識別碼的筆畫形式。即:1區(qū)(橫區(qū)):(11g)、(12f)、(13d);2區(qū)(豎區(qū)):(21h)、(22j)、(2

36、3k);3區(qū)(撇區(qū)):(31t)、(32r)、(33e);4區(qū)(捺區(qū)):(41y)、(42u)、(43i);5區(qū)(折區(qū)):(51n)、(52b)、(53v)。以上共15個符號。實際輸入打鍵時,只打圈里邊的筆畫鍵就行了,外帶圓圈,只是為了便于與真正的筆畫相區(qū)別。6.【“98王碼”漢字編碼流程圖】將本章所講的全部內(nèi)容歸納起來,就形成了98王碼漢字編碼流程圖。這張一目了然的圖表,是“98王碼”編碼的“總路線”,編碼的方法和規(guī)則盡在其中。 五、簡碼重碼和容錯碼1.【簡碼輸入】為了減少擊鍵次數(shù),提高輸入速度,一些常用的字,除按它的全碼可以輸入外,多數(shù)都還可以只取其最前邊的一至三個碼元,再加空格鍵輸入之,

37、即只取其全碼的最前邊的一個、二個或三個碼,再加打空格鍵表示輸入結(jié)束,形成所謂一、二、三級簡碼。一級簡碼(又稱高頻字碼):將各鍵打一下,再打一下空格鍵,即可打出25個最常用的漢字(每鍵一個):一地在要工,上是中國同,和的有人我,主產(chǎn)不為這,民了發(fā)以經(jīng)如: 一: 11(g) 要:14(s) 的: 32(r) 和:31(t)二級簡碼(只輸入全碼的前2個碼):化: 亻 匕 (34 55 wx)玉: 王 丶 (11 44 gy)李: 木 子 (14 52 sb)鄉(xiāng): 丿 (55 31 xt)能: 厶 月 (54 33 ce)三級簡碼(只輸入全碼的前3個碼): 華: 亻 匕 十 (34 55 12 wxf

38、)想:木 目 心 (14 21 51 shn)陳: 阝 小 (52 15 43 bai)得:彳 日 一 (31 22 11 tjg)巍:山 禾 女 (25 31 53 mtv)有時,同一個漢字可有幾種簡碼。例如“經(jīng)”,就同時有一、三級簡碼及全碼等三個輸入碼:經(jīng): 55 (x)經(jīng): 55 54 15 (xca)經(jīng): 55 54 15 11 (xcag)2.【重碼】幾個“五筆字型”編碼完全相同的字,叫做“重碼”。如:衣: (41 33 42 yeu) 亠 哀: (41 33 42 yeu) 枯: (14 13 11 sdg) 木 古 柘: (14 13 11 sdg) 木 石 當輸入一組重碼字的編

39、碼時,幾個重碼的字,會同時出現(xiàn)在屏幕的“提示行”中。如所要的那個字剛好處在第1個位置上,就只管輸入下文,該字便會自動跳到屏幕上光標所在的位置上,這叫“默認第1個”;如果所要的字處在第2個位置上,則可按字母鍵上方的數(shù)字鍵2(有的軟件可按空格鍵“選”第2個字),即可將所要的字挑選到屏幕上?!拔骞P字型”的重碼本來就很少,加上重碼在提示行中的位置是按字的實用頻度排列的,常用的字總是出現(xiàn)在前邊,所以,實際需要挑選的機會極少,平均打1萬個字,才需要挑選12次。另外,提示行中,不在第一個位置顯示的重碼字,除了原碼之外,大都還設(shè)計有一個“半定義”的、不會產(chǎn)生重碼的碼,可以把它唯一地打出來。設(shè)計方法是將原碼的最

40、后一個編碼“人為地”修改為“24l”,這里,我們把24鍵上的碼元“”用作定義碼元,便不需要挑選了。例如: “喜”和“嘉”的編碼都是(12 23 42 23)fkuk?,F(xiàn)將最后一個k改為“l(fā)”,fkul就作為“嘉”的唯一編碼了。這樣“喜”,顯示在第一位,不需要挑選,“嘉”雖重碼,但也有一個唯一碼,只不過要對這些常見重碼字的“人工修正碼”多用多記才行。 3.【容錯碼】什么叫“容錯碼”?“容錯碼”有兩個涵義:其一是容易搞錯的碼;其二是容許搞錯的碼;“容易”弄錯的碼,“容許”你按錯的打,謂之“容錯碼”?!拔骞P字型”輸入技術(shù)中的“容錯碼”設(shè)計了將近1000個,使用者還可以自己再建立?!叭蒎e碼”主要有以下兩種類型:(1)筆順錯個別漢字的書寫順序因人而異,致使碼元的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論