漢字編碼(10.29)市公開課一等獎省賽課微課金獎課件_第1頁
漢字編碼(10.29)市公開課一等獎省賽課微課金獎課件_第2頁
漢字編碼(10.29)市公開課一等獎省賽課微課金獎課件_第3頁
漢字編碼(10.29)市公開課一等獎省賽課微課金獎課件_第4頁
漢字編碼(10.29)市公開課一等獎省賽課微課金獎課件_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

漢字編碼小組:李冠禧李奕伯第1頁何為漢字編碼?漢字編碼(Chinesecharacterencoding)為漢字設計一個便于輸入計算機代碼。第2頁當前漢字輸入路徑?機器自動識別漢字(難度大)經(jīng)過語音識別輸入(難度大)經(jīng)過漢字編碼輸入(比較現(xiàn)實)第3頁為何難漢字編碼實現(xiàn)困難?①數(shù)量龐大;②字形復雜;③存在大量一音多字和一字多音現(xiàn)象。第4頁漢字編碼分類(計算機中漢字表示也是用二進制編碼)外碼(輸入碼)交換碼(國家標準碼)內碼漢字字形碼依據(jù)應用目標不同分類第5頁外碼(輸入碼):將漢字輸入到計算機中一組鍵盤符號;交換碼(國家標準碼):計算機內部處理信息,都是用二進制代碼表示,漢字也不例外。而二進制代碼使用起來是不方便,于是需要采取信息交換碼。內碼:依據(jù)國家標準碼要求,每一個漢字都有了確定二進制代碼,在微機內部漢字代碼都用機內碼,在磁盤上統(tǒng)計漢字代碼也使用機內碼。漢字字形碼:字形碼是漢字輸出碼,輸出漢字時都采取圖形方式,不論漢字筆畫多少,每個漢字都能夠寫在一樣大小方塊中。通慣用16×16點陣來顯示漢字。第6頁內碼?內碼就是漢字在計算機上存放時編碼,比如我們寫一個文本文件,內容為"節(jié)日高興",用16進制編輯器打開它,其內容為BDDAC8D5BFECC0D6這里bdda就是第一個漢字"節(jié)"內碼第7頁點陣代碼內碼舉例標0位置涂黑(背景色),標1位置涂白(前景色)第8頁漢字編碼標準1981年,國家標準局公布了《漢字標準交換碼》,共分兩級,一級3755個字,二級3008個字,共6763個字。這種漢字標準交換碼是計算機內部碼,能夠為各種輸入輸出設備設計提供統(tǒng)一標準,使各種系統(tǒng)之間信息交換有共同一致性,從而使信息資源共享得以確保。第9頁編碼輸入方式一)整字輸入法二)字形分解法三)字形為主、字音為輔編碼法四)全拼音輸入法五)拼音為主、字形為輔編碼法第10頁漢字編碼雙軌跡?

漢字信息處理領域中,音碼和形碼并存并用,一樣是一個雙軌制,即漢字和漢語拼音文字并存并用。優(yōu)點:

會普通話人可按音輸入,方音重人可按形輸入。(互補)第11頁漢字編碼字符集注:字符集(Characterset)是多個字符集合,字符集種類較多,每個字符集包含字符個數(shù)不一樣,常見字符集名稱:ASCII字符集、GB2312字符集、BIG5字符集例:①GB2312-80字符集,漢字名國家標準字符集(GB=GuóBiāo國家標準)。收入漢字6763個,符號715個,總計7478個字符,這是大陸普遍使用簡體字字符集。②Big-5字符集,漢字名大五碼,是臺灣繁體字字符集,收入13060個繁體漢字,808個符號,總計13868個字符,普遍使

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論