第4章交互技術f

上傳人：o*** IP屬地：湖北上傳時間：2021-10-13 格式：PPT 頁數(shù)：38 大?。?017KB 積分：30 舉報 版權申訴

已閱讀5頁，還剩33頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

1、計算機科學與技術系Lecture 42內容提要n掌握人機交互輸入模式n掌握基本交互技術n掌握圖形交互技術n掌握筆交互技術Lecture 434.1人機交互輸入模式 n由于輸入設備是多種多樣的，而且對一個應用程序而言，可以有多個輸入設備，同一個設備又可能為多個任務服務，這就要求對輸入過程的處理要有合理的模式。q請求模式(Request Mode)q采樣模式（Sample Mode）q事件模式（Event Mode）Lecture 444.1人機交互輸入模式 n請求模式q在請求模式下，輸入設備的啟動是在應用程序中設置的。應用程序執(zhí)行過程中需要輸入數(shù)據(jù)時，暫停程序的執(zhí)行，直到從輸入設備接受到請求的輸

2、入數(shù)據(jù)后，才繼續(xù)執(zhí)行程序。程序工作，輸入設備等待程序請求遇到請求指令輸入設備工作，程序等待接收數(shù)據(jù)請求滿足圖4-1 請求模式的工作過程4.1人機交互輸入模式 n采樣模式q輸入設備和應用程序獨立地工作。輸入設備連續(xù)不斷地把信息輸入進來，信息的輸入和應用程序中的輸入命令無關。應用程序在處理其它數(shù)據(jù)的同時，輸入設備也在工作，新的輸入數(shù)據(jù)替換以前的輸入數(shù)據(jù)。當應用程序遇到取樣命令時，讀取當前保存的輸入設備數(shù)據(jù)。q優(yōu)點：這種模式對連續(xù)的信息流輸入比較方便，也可同時處理多個輸入設備的輸入信息。q缺點：當應用程序的處理時間較長時，可能會失掉某些輸入信息。程序工作數(shù)據(jù)采樣數(shù)據(jù)生成數(shù)據(jù)緩存區(qū)輸入設備工作圖4-2

3、采樣模式的工作過程4.1人機交互輸入模式 n事件模式q輸入設備和程序并行工作。輸入設備把數(shù)據(jù)保存到一個輸入隊列，也稱為事件隊列，所有的輸入數(shù)據(jù)都保存起來，不會遺失。應用程序隨時可以檢查這個事件隊列，處理隊列中的事件，或刪除隊列中的事件。應用程序事件檢查事件調用過程模塊處理類型1事件的過程處理類型n事件的過程輸入設備圖4-3 事件模式4.2 基本交互技術n定位q確定平面或空間的一個點的坐標，是交互中最基本的輸入技術之一。q直接定位：用定位設備直接指定某個對象的位置，是一種精確定位方式。q間接定位：通過定位設備的運動控制屏幕上的映射光標進行定位，是一種非精確定位方式。其允許指定的點位于一個坐標范

4、圍內，一般用鼠標等指點設備配合光標來實現(xiàn)。圖4-4 3DS Max中的精確定位4.2 基本交互技術n筆劃q筆劃輸入用于輸入一組順序的坐標點。它相當于多次調用定位輸入，輸入的一組點常用于顯示折線或作為曲線的控制點。4.2 基本交互技術n定值q定值（或數(shù)值）輸入用于設置物體旋轉角度、縮放比例因子等4.2 基本交互技術n選擇q選擇是在某個選擇集中選出一個元素，通過注視、指點或接觸一個對象，使對象成為后續(xù)行為的焦點，是操作對象時不可缺少的一部分。n鍵盤 Ctrl+An鼠標圖4-6 選擇4.2 基本交互技術n字符串4.3圖形交互技術nWIMP界面由窗口(Windows)、圖標(Icons)、菜單(Men

5、us)、指點設備(Pointing Device)四位一體，形成桌面(Desktop)4.3圖形交互技術n幾何約束q幾何約束可以用于對圖形的方向、對齊方式等進行規(guī)定和校準。q對定位的約束（網(wǎng)格吸附）圖4-9 Adobe Photoshop 網(wǎng)格線例如，定義不可見網(wǎng)格線為： x=10i, y=10j,其中i,j=0,n。設輸入點的坐標為（x, y），則離它最近的網(wǎng)格點的坐標為：(10*( )5)/10,10*( )5)/10)round xround y(10*( )5)/10,10*( )5)/10)round xround y(10*( )5)/10,10*( )5)/10)round

6、xround y (10*( )5)/10,10*( )5)/10)round xround y4.3圖形交互技術n幾何約束q方向約束n例如要繪的垂直或水平方向的線，當給定的起點和終點連線和水平線的交角小于45時，便可繪出一條水平線，否則就繪垂直線。繪制印刷線路板、管網(wǎng)圖或地籍圖時非常有用。n在Word繪圖中，通過鎖定縱橫比，在拖動線段一個端點時，線段只是沿原來方向放縮4.3圖形交互技術n引力場q引力場也可以看作是一種定位約束，通過在特定圖素（如直線段）周圍假想有一個區(qū)域，當光標中心落在這個區(qū)域內時，就自動地被直線上最近的一個點所代替，就好像一個質點進入了直線周圍的引力場，被吸引到這條直線上去

7、一樣。q引力場的大小要適中，太小了不易進入引力區(qū)，太大了線和線的引力區(qū)相交，光標在進入引力區(qū)相交部分時可能會被吸引到不希望選的線段上去，增大誤接的概率。 4.3圖形交互技術n拖動q要把一個對象移動到一個新的位置時，如果我們不是簡單地用光標指定新位置的一個點，而是當光標移動時拖動著被移動的對象，這樣會使用戶感到更直觀，并可使對象放置的位置更恰當。q圖形模式和圖像模式n在圖形模式下，當將圖形由一個位置拖到新的位置時，實際上是在移動的位置上按特定的象素操作模式（如異或方式）進行了圖形的重新繪制，這樣被拖動的圖形不會破壞掃過的軌跡上的圖形。n在圖像模式下，當將一個圖形由一個位置拖到一個新的位置時，實際

8、上是進行了圖像的整體移動，即首先將新位置上按拖動圖像大小范圍將屏幕圖像保存，然后將拖動的圖像移動到新位置，當拖動圖像離開該位置而移動到下一個新位置時，再恢復該位置上保存的屏幕圖像。4.3圖形交互技術n橡皮筋技術q被拖動對象的形狀和位置隨著光標位置的不同而變化。q不斷地進行畫圖擦除畫圖的過程n（1）從起點到光標中心點（x，y）處畫圖；n（2）擦除起點到光標中心點（x，y）處的圖形；n（3）光標移動到新的位置：x=x+x，y=y+y；n（4）轉第（1）步，重復這個過程，直到按下確認鍵為止。4.3圖形交互技術n操作柄技術q可以用來對圖形對象進行縮放、旋轉、錯切等幾何變換。先選擇要處理的圖形對象，該圖

9、形對象的周圍會出現(xiàn)操作柄，移動或旋轉操作柄就可以實現(xiàn)相應的變換。4.3圖形交互技術n三維交互技術q面臨問題n三維交互技術采用六自由度輸入設備。所謂六自由度，指沿三維空間X、Y、Z軸平移和繞X、Y、Z軸旋轉，而現(xiàn)在流行的用于桌面型圖形界面的交互設備，如鼠標、軌跡球、觸摸屏等只有兩個自由度(沿平面X、Y軸平移)。n窗口、菜單、圖符和傳統(tǒng)的二維光標在三維交互環(huán)境中會破壞空間感，用戶難以區(qū)分屏幕上光標選擇到對象的深度值和其他顯示對象的深度值，使交互過程非常不自然。三維交互技術n直接操作q三維光標必須有深度感，即必須考慮光標與觀察者距離，離觀察者近的時候較大，離觀察者遠的時候較小。q為保持三維用戶界面的

10、空間感，光標在遇到物體時不能進入到或穿過物體內部。q為了增加額外的深度線索，輔助三維對象的選擇，可以采用半透明三維光標。q三維光標可以是人手的三維模型圖4-17 虛擬手三維交互技術n三維Widgetsq三維交互界面中的一些小工具n三維空間中漂浮的菜單、用于拾取物體的手的三維圖標、平移和旋轉指示器等。q1992年美國Brown大學計算機系提出三維Widget設計原則n三維Widget的幾何形狀應能表示其用途（eg:一個用來扭曲物體的Widget，最好本身就是一個扭曲的物體）n適當選擇Widget控制的自由度由于三維空間有六個自由度，有時會使三維交互操作變得過于復雜，因此在用戶使用某種Widget

11、時，可以固定或者自動計算某些自由度的值n根據(jù)三維用戶界面的用途確定Widget的功能。例如，用于藝術和娛樂的三維用戶界面的Widget，只要能夠完成使畫面看起來像的操作就可以了，而用于工業(yè)設計和制造的用戶界面，則必須保證交互操作參數(shù)的精確性。三維交互技術n三視圖輸入q用二維輸入設備在一定程度上實現(xiàn)三維的輸入。n如果輸入一個三維點，只要在兩個視圖上把點的對應位置指定后便唯一確定了三維空間中的一個點；n把直線段上兩端點在三視圖上輸入后便可決定三維空間的一條直線；n把一個面上的各頂點在三視圖上輸入后，也唯一確定了三維空間中的一個面；n如果把一個多面體上的各面均用上述方法輸入，也就在三維空間中輸入了

12、一個多面體。4.4 語音交互技術n語音合成n語音識別q計算機通過識別和理解過程把語音信號轉變?yōu)橄鄳奈谋疚募蛎畹募夹g，其所涉及的領域包括：信號處理、模式識別、概率論和信息論、發(fā)聲機理和聽覺機理、人工智能等。q目前主流的語音識別技術是基于統(tǒng)計的模式識別的基本理論。n語音識別系統(tǒng)大致可分為語音特征提取，聲學模型與模式匹配，以及語言模型與語義理解語音識別系統(tǒng)n1. 語音特征提取q輸入的模擬語音信號首先要進行預處理，包括預濾波、采樣和量化、加窗、端點檢測、預加重等。q基于語音幀的特征提取方法：將語音信號分為有重疊的若干幀，對每一幀提取語音特征。語音識別系統(tǒng)n2. 聲學模型與模式匹配q聲學模型對應于

13、語音到音節(jié)概率的計算。在識別時將輸入的語音特征同聲學模型進行匹配與比較，得到最佳的識別結果q目前采用的最廣泛的建模技術是隱馬爾科夫模型HMM建模和上下文相關建模n隱馬爾科夫模型HMM建模qHMM刻畫語音信號需作出兩個假設n一是內部狀態(tài)的轉移只與上一狀態(tài)有關n另一是輸出值只與當前狀態(tài)（或當前的狀態(tài)轉移）有關q語音識別中使用HMM通常是用從左向右單向、帶自環(huán)、帶跨越的拓撲結構來對識別基元建模，一個音素就是一個三至五狀態(tài)的HMM，一個詞就是構成詞的多個音素的HMM串行起來構成的HMM，而連續(xù)語音識別的整個模型就是詞和靜音組合起來的HMM。n上下文相關建模方法q建模時考慮了協(xié)同發(fā)音的影響q協(xié)同發(fā)音是指

14、一個音受前后相鄰音的影響而發(fā)生變化，從發(fā)聲機理上看就是人的發(fā)聲器官在一個音轉向另一個音時只能逐漸變化，從而使得后一個音的頻譜與其他條件下的頻譜產生差異。q英語的上下文相關建模通常以音素為基元語音識別系統(tǒng)n3. 語言模型與語義理解q語言模型計算音節(jié)到字的概率。n規(guī)則模型n統(tǒng)計模型q用概率統(tǒng)計的方法來揭示語言單位內在的統(tǒng)計規(guī)律，其中N-Gram模型簡單有效，被廣泛使用。qN-Gram模型基于這樣一種假設，第n個詞的出現(xiàn)只與前面n-1個詞相關，而與其它任何詞都不相關，整句的概率就是各個詞出現(xiàn)概率的乘積。這些概率可以通過直接從語料中統(tǒng)計n個詞同時出現(xiàn)的次數(shù)得到。常用的是二元的Bi-Gram和三元的Tr

15、i-Gram。微軟語音軟件開發(fā)包nMicrosoft Speech SDKqSpeech API（SAPI）nAPI for Text-to-Speech把文本轉化為語音輸出q金山詞霸的單詞朗讀功能ISpVoice * pVoice = NULL;HRESULT hr = CoCreateInstance(CLSID_SpVoice, NULL, CLSCTX_ALL, IID_ISpVoice, (void *)&pVoice);pVoice-Speak(LHello world, 0, NULL);nAPI for Speech Recognition語音識別應用程序接口,聲波轉換成文字4

16、.5筆交互技術n筆式用戶界面，中國科學院軟件研究所戴國忠研究員等提出了PIBG 范式qPIBG范式:P(Physical object)、IB(Icons,Buttons)、G(Gesture)qWIMP范式:W(windows)、I M (icons，menus)、P(pointing systems) 相對應。4.5.1 手寫識別技術n脫機識別：機器對于已經(jīng)寫好或印刷好的靜態(tài)的語言文本圖像的識別；n聯(lián)機識別：用筆在輸入板上寫：用戶一邊寫，機器一邊進行識別，可實時人機交互。n手寫體識別的方法和識別率取決于對手寫約束的層次，這些約束主要是手寫的類型、用戶的數(shù)量、詞匯量的大小以及空間的布局。聯(lián)機

17、手寫識別n系統(tǒng)通過記錄文字圖像抬筆、落筆、筆跡上各像素的空間位置，以及各筆段之間的時間關系等信息，對這些信息進行處理。n在處理過程中，系統(tǒng)以一定的規(guī)則提取信息特征，再由識別模塊將信息特征與識別庫的特征進行比較，加以識別。（筆輸入的識別特征庫是基于許多人習慣的書寫筆順的統(tǒng)計特征建立的。）n最后轉化為計算機所使用的文字代碼。漢字手寫輸入板預處理模式表達（特征提取）判別（分類或句法分析）字典（特征模板集合或句法規(guī)則集合）漢字代碼脫機手寫識別n困難：q脫機手寫識別得到的描述則是點陣圖像，要得到筆段的點陣通常需要細化運算。細化會損失一些信息，并且不可能得到時間順序信息。q脫機識別中，筆畫與筆畫之間經(jīng)常粘

18、連，很難拆分，而且筆段經(jīng)過與另一筆段交叉分成兩段后，也難以分清是否應該連起來。n結構識別、統(tǒng)計識別以及神經(jīng)網(wǎng)絡方法脫機手寫識別n結構識別方法q漢字的組成結構:由筆劃(點、橫、豎、撇、捺等)、偏旁、部首構成q通過把復雜的漢字模式分解為簡單的子模式直至基本模式元素，對子模式的判定以及基于符號運算的匹配算法，實現(xiàn)對復雜模式的識別。q優(yōu)點是區(qū)分相似字的能力強，缺點是抗干擾能力差。脫機手寫識別n統(tǒng)計識別方法q將漢字看為一個整體，其所有的特征是從整體上經(jīng)過大量的統(tǒng)計而得到的，然后按照一定準則所確定的決策函數(shù)進行分類判決。q統(tǒng)計識別的特點是抗干擾性強，缺點是細分能力較弱。n神經(jīng)網(wǎng)絡q具有學習能力和快速并行實現(xiàn)的特點，因此可以通過神經(jīng)網(wǎng)絡分類器的推廣能力準則和特征提取器的有效特征提取準則，對手寫字符進行識別。數(shù)字墨水技術n通過三階貝塞爾曲線來描述筆輸入的筆跡，存儲方式使得數(shù)字墨水文件很小，從而可以更有效地進行存儲。n數(shù)字墨水的處理包括數(shù)字墨水的表示、壓縮和顯示，智能的墨水分析技術，墨水標記和注解技術，墨水的智能操作以及墨水存儲和搜索等一系列有關技術。q墨水解析技術可以將筆輸入的文字串解析成單字，從而將復雜的語句級手寫識別化繁為簡，分解成語句解析和單字識別兩個部分。n微軟已實現(xiàn)了數(shù)字墨水技術對英文、德文、法文、韓文、日文、

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

第4章交互技術f

文檔簡介

溫馨提示

最新文檔

評論

第4章交互技術f

文檔簡介

溫馨提示

最新文檔

評論

相關文檔