




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第7章多通道人機交互9/8/20231第7章多通道人機交互8/3/20231本章內(nèi)容多通道交互技術(shù)概述眼動跟蹤三維輸入實例介紹9/8/20232本章內(nèi)容多通道交互技術(shù)概述8/3/20232多通道交互技術(shù)概述為適應(yīng)目前和未來的計算機系統(tǒng)要求,人機界面應(yīng)能支持時變媒體(time-varingmedia),實現(xiàn)三維、非精確及隱含的人機交互,而多通道人機界面是達到這一目的的重要途徑80年代后期以來,多通道用戶界面(MultimodalUserInterface)成為人機交互技術(shù)研究的嶄新領(lǐng)域,在國內(nèi)外受到高度重視9/8/20233多通道交互技術(shù)概述為適應(yīng)目前和未來的計算機系統(tǒng)要求,人機界面多通道用戶界面消除當前WIMP/GUI用戶界面通信帶寬不平衡的瓶頸綜合采用視線、語音、手勢眼神、表情等新的交互通道、設(shè)備和交互技術(shù)使用戶利用多個通道以自然、串行/并行、協(xié)作的方式進行人機對話通過整合來自多個通道的、精確的和不精確的輸入來捕捉用戶的交互意圖,提高人機交互的自然性和高效性9/8/20234多通道用戶界面消除當前WIMP/GUI用戶界面通信帶寬不平衡圖5-1多通道人機界面概念模型
9/8/20235圖5-1多通道人機界面概念模型8/3/20235多通道用戶界面研究的目標多通道用戶界面主要關(guān)注人機界面中用戶向計算機輸入信息以及計算機對用戶意圖的理解交互的自然性使用戶盡可能多地利用已有的日常技能與計算機交互,降低認識負荷;交互的高效性使人機通訊信息交換吞吐量更大、形式更豐富,發(fā)揮人機彼此不同的認知潛力;與傳統(tǒng)的用戶界面特別是廣泛流行的WIMP/GUI兼容9/8/20236多通道用戶界面研究的目標多通道用戶界面主要關(guān)注人機界面中用戶多通道用戶界面的基本特點
使用多個感覺和效應(yīng)通道
允許非精確的交互
三維和直接操縱
交互的雙向性
交互的隱含性
9/8/20237多通道用戶界面的基本特點使用多個感覺和效應(yīng)通道8/3/2使用多個感覺和效應(yīng)通道感覺通道側(cè)重于多媒體信息的接受,效應(yīng)通道側(cè)重于交互過程中控制與信息的輸入,兩者密不可分、相互配合一種通道(如語音)不能充分表達用戶的意圖時,需輔以其它通道(如手勢指點)的信息;有時使用輔助通道以增強表達力交替而獨立地使用不同的通道不是真正意義上的多通道技術(shù),必須允許充分地并行、協(xié)作的通道配合關(guān)系9/8/20238使用多個感覺和效應(yīng)通道感覺通道側(cè)重于多媒體信息的接受,效應(yīng)通允許非精確的交互人類語言本身就具有高度模糊性,人類在日常生活中習(xí)慣于并大量使用非精確的信息交流允許使用模糊的表達手段可以避免不必要的認識負荷,有利于提高交互活動的自然性和高效性多通道人機交互技術(shù)主張以充分性代替精確性9/8/20239允許非精確的交互人類語言本身就具有高度模糊性,人類在日常生活三維和直接操縱人類的大多數(shù)活動領(lǐng)域具有三維和直接操縱特點人生活在三維空間,習(xí)慣于看、聽和操縱三維的客觀對象,并希望及時看到這種控制的結(jié)果多通道人機交互的自然性反應(yīng)了這種本質(zhì)特點9/8/202310三維和直接操縱人類的大多數(shù)活動領(lǐng)域具有三維和直接操縱特點8/交互的雙向性人的感覺和效應(yīng)通道通常具有雙向性的特點,如視覺可看可注視,手可控制、可觸及等多通道用戶界面使用戶避免生硬的、不自然的、頻繁的、耗時的通道切換,從而提高自然性和效率視線跟蹤系統(tǒng)可促成視覺交互雙向性,聽覺通道利用三維聽覺定位器實現(xiàn)交互雙向性9/8/202311交互的雙向性人的感覺和效應(yīng)通道通常具有雙向性的特點,如視覺可交互的隱含性追求交互自然性的多通道用戶界面并不需要用戶顯式地說明每個交互成分,反之是在自然的交互過程中隱含地說明用戶的視線自然地落在所感興趣的對象之上用戶的手自然地握住被操縱的目標9/8/202312交互的隱含性追求交互自然性的多通道用戶界面并不需要用戶顯式地多通道用戶界面評價基于多通道用戶界面所追求的目標,人們提出相應(yīng)的評價多通道用戶界面的若干指標(Nigay等人提出的CARE指標):互補性(complementary);指派性(Assignment);等效性(Equivalence);冗余性(Redundancy);9/8/202313多通道用戶界面評價基于多通道用戶界面所追求的目標,人們提出相互補性互補性是指若干通道必須以互補方式完成特定的交互任務(wù),也就是說,當單個通道不能提供充分的任務(wù)信息時,需要其他通道補充,如手勢指點補充語音命令互補性可能存在一個“優(yōu)勢通道(DominantModality)”,并需要其他通道予以輔助,例如,用語音直指(“Thiscity”),則需鼠標在屏幕對象上指點9/8/202314互補性互補性是指若干通道必須以互補方式完成特定的交互任務(wù),也指派性指派性是指某通道是完成特定交互任務(wù)唯一途徑的情形,即某通道必須被用于實現(xiàn)特定交互任務(wù)而沒有其他通道可以替代指派性可分為兩種情形一種是不存在其他選擇,稱為嚴格的指派性(StrictAssignment)另一種是雖然存在選擇,但用戶或系統(tǒng)總是傾向于使用同一種通道,稱為代理指派性(AgentAssignment)9/8/202315指派性指派性是指某通道是完成特定交互任務(wù)唯一途徑的情形,即某等效性等效性是指在完成特定交互任務(wù)時至少有兩種以上通道可以互相替代,由于設(shè)備特性、用戶習(xí)慣或臨時因素(如手頭正忙)而使某種通道不能使用時,可選擇其他通道代替。9/8/202316等效性等效性是指在完成特定交互任務(wù)時至少有兩種以上通道可以互冗余性冗余性是指在特定交互中多個通道同時使用并具有相同的表達作用不同通道為相同參數(shù)提供所需信息,并且所表達信息可能是一致的,也可能是矛盾的9/8/202317冗余性冗余性是指在特定交互中多個通道同時使用并具有相同的表達眼動跟蹤(Eye-GazeTracking)
與視覺有關(guān)的人機交互自始至終都離不開視線的控制如果能通過用戶的視線盯著感興趣的目標,計算機便“自動”將光標置于其上,人機交互將更為直接,也省去了上述交互過程中的大部分步驟有關(guān)視覺輸入的人機界面研究主要涉及兩個方面一是視線跟蹤原理和技術(shù)的研究二是在使用這種交互方式后,人機界面的設(shè)計技術(shù)和原理的研究9/8/202318眼動跟蹤(Eye-GazeTracking)與視覺有關(guān)的眼動跟蹤早期的視線跟蹤技術(shù)首先應(yīng)用于心理學(xué)研究、助殘等領(lǐng)域,后來被應(yīng)用于圖像壓縮及人機交互技術(shù)視線跟蹤技術(shù)有強迫式與非強迫式、穿戴式與非穿戴式、接觸式與非接觸式之分視線追蹤主要用于軍事領(lǐng)域(如飛行員觀察記錄),閱讀及幫助殘疾人通信等
9/8/202319眼動跟蹤早期的視線跟蹤技術(shù)首先應(yīng)用于心理學(xué)研究、助殘等領(lǐng)域,
圖5-2StanfordUniversity和ThePoynterInstitute合作研究人們對于Internet上新聞的注意程度9/8/202320圖5-2StanfordUniversity和The圖5-3人們對于Internet上新聞的注意程度研究結(jié)果9/8/202321圖5-3人們對于Internet上新聞的注意程度研究結(jié)果人們對于Internet上新聞的注意程度研究結(jié)果
內(nèi)容注視率文章文字(Articlestext)92%簡訊(Briefs)82%照片(Photos)64%標題廣告(BannerAds)45%圖形(graphics)22%9/8/202322人們對于Internet上新聞的注意程度研究結(jié)果內(nèi)眼動的主要形式
眼動有三種主要形式跳動(Saccades)在正常的視覺觀察過程中,眼動表現(xiàn)為在一系列被觀察目標上的停留及在這些停留點之間的飛速跳躍在注視點之間的飛速跳躍稱為眼跳動。注視(Fixations)停留時間至少持續(xù)100ms以上的稱為注視。在注視中,眼也不是絕對靜止不動,會有微小運動,但大小一般不會超過1°視角。絕大多數(shù)信息只有在注視時才能獲得并進行加工。平滑尾隨跟蹤(SmoothPursuit)緩慢、聯(lián)合追蹤的眼動通常稱為平滑尾隨跟蹤。9/8/202323眼動的主要形式眼動有三種主要形式8/3/202323眼動跟蹤的基本要求
在人機交互中眼動跟蹤技術(shù)必須滿足以下幾點要求,才能滿足實際需求:
不能妨礙視野不要與用戶接觸,對用戶基本無干擾精度要高動態(tài)范圍要從1弧分(六十分之一弧度)到45o反映速度要快,實時響應(yīng)能與獲取的身體和頭部運動相配合
定位校正簡單可作為計算機的標準外設(shè)
9/8/202324眼動跟蹤的基本要求在人機交互中眼動跟蹤技術(shù)必須滿足以下幾眼動跟蹤的基本原理
利用紅外發(fā)光二極管發(fā)出紅外線,采用圖像處理技術(shù)和能鎖定眼睛的特殊攝像機,通過分析人眼虹膜和瞳孔中紅外線圖象點的連續(xù)變化情況,得到視線變化的數(shù)據(jù),從而達到視線追蹤的目的。
從視線跟蹤裝置得到的原始數(shù)據(jù)需要經(jīng)過進一步的處理才能用于人機交互。數(shù)據(jù)處理的目的是濾除噪聲、識別定位及局部校準與補償?shù)龋钪匾氖翘崛〕鲇糜谌藱C交互所必需的眼睛定位坐標。但是由于眼動存在固有的抖動,以及眼睛眨動、頭部劇烈的移動所造成的數(shù)據(jù)中斷,存在許多干擾信號,提取有意眼動數(shù)據(jù)非常困難。解決此問題的辦法之一是利用眼動的某種先驗?zāi)P图右詮浹a。
9/8/202325眼動跟蹤的基本原理利用紅外發(fā)光二極管發(fā)出紅外線,采用圖像米達斯接觸問題與解決方法“米達斯接觸(MidasTouch)”問題:如果鼠標器光標總是隨著用戶的視線移動,可能會引起用戶的厭煩,因為用戶可能希望能隨便看著什么而不必非“意味著”什么,更不希望每次轉(zhuǎn)移視線都可能啟動一條計算機命令。
避免“米達斯接觸”問題的方法:在理想情況下,應(yīng)當在用戶希望發(fā)出控制時,界面及時地處理其視輸入,而在相反的情況下則忽略其視線的移動。
可采用其他通道(如鍵盤或語音)進行配合。9/8/202326米達斯接觸問題與解決方法“米達斯接觸(MidasTouch三維輸入
許多應(yīng)用(如虛擬現(xiàn)實系統(tǒng))需要三維空間定位技術(shù):三維空間控制器的共同特點是具有六個自由度,分別描述三維對象的寬度、深度、高度、俯仰角、轉(zhuǎn)動角、偏轉(zhuǎn)角。通過控制這六個參數(shù),用戶可以在屏幕上平移三維對象或光標,也可沿三個坐標軸轉(zhuǎn)動三維對象。三維空間控制器、視線跟蹤器、數(shù)據(jù)手套等輸入設(shè)備產(chǎn)生的空間位置是相對的。在三維用戶交互中必須便于用戶在三維空間中觀察、比較、操作、改變?nèi)S空間的狀態(tài)。9/8/202327三維輸入許多應(yīng)用(如虛擬現(xiàn)實系統(tǒng))需要三維空間定位技術(shù):三三維空間的交互操作方式三維光標由六自由度三維輸入裝置控制的三維光標將使三維交互操作更自然和方便;三維光標必須有深度感,即必須考慮光標與觀察者距離:離觀察者近的時候較大,離觀察者遠的時候較小;確定光標在三維空間的方向,這種定向操作必須自然且方便操作;為保持三維用戶界面的空間感,光標在遇到物體時不能進入到物體內(nèi)部。三維光標的實現(xiàn)需要大量的計算,對硬件的要求較高,編程接口也比二維光標復(fù)雜得多。
9/8/202328三維空間的交互操作方式三維光標8/3/202328三維空間的交互操作方式三維widgets三維widgets即三維交互界面中的一些小工具。用戶可以通過直接控制它們使界面或界面中的三維對象發(fā)生改變。
三維widget包括在三維空間中漂浮的菜單、用于拾取物體的手的三維圖標、平移和旋轉(zhuǎn)指示器等。許多三維用戶界面的研究者正在設(shè)計和試驗各種不同的三維widgets,希望將來能夠建立一系列標準的三維widgets就像二維圖形用戶界面中的窗口、按鈕、菜單等。9/8/202329三維空間的交互操作方式三維widgets8/3/202329圖5-5三維widgets圖例9/8/202330圖5-5三維widgets圖例8/3/202330采用三視圖輸入技術(shù),實現(xiàn)三維的輸入
如果輸入一個三維點,只要在兩個視圖上把點的對應(yīng)位置指定后便唯一確定了三維空間中的一個點;把直線段上兩端點在三視圖上輸入后便可決定三維空間的一條直線;把一個面上的各頂點在三視圖上輸入后,也唯一確定了三維空間中的一個面;如果把一個多面體上的各面均用上述方法輸入,也就在三維空間中輸入了一個多面體9/8/202331采用三視圖輸入技術(shù),實現(xiàn)三維的輸入如果輸入一個三維點,只要
圖5-6三視圖輸入實例9/8/202332圖5-6三視圖輸入實例8/3/202332多通道人機交互通道(Modality)用戶可以使用手動、語言、眼神等多種效應(yīng)通道與計算機系統(tǒng)進行交互9/8/202333多通道人機交互通道(Modality)8/3/202333多通道人機交互通道指傳送或獲得信息的通訊通道的類型,它包含了信息表達、感知以及動作執(zhí)行的方式,定義了數(shù)據(jù)類型模式一種狀態(tài)或上下文信息,決定對信息的解釋一獲取意義通道整合(ModalityIntegration)指用戶在與計算機系統(tǒng)交互時,多個交互通道之間相互作用形成交互意圖的過程9/8/202334多通道人機交互通道8/3/202334多通道用戶界面的三維表示模型9/8/202335多通道用戶界面的三維表示模型8/3/202335多通道用戶界面的概念模型9/8/202336多通道用戶界面的概念模型8/3/202336人機交互模型的發(fā)展9/8/202337人機交互模型的發(fā)展8/3/202337輸入原語為了擺脫設(shè)備的特定物理特性和操作方式上的差異,便利多種輸入設(shè)備在詞法級的整合,有必要在物理設(shè)備和對話控制中再抽象出一層,即輸入原語翻譯層與應(yīng)用無關(guān)的輸入原語的抽象具有重要意義原語IP(InputPrimitive)代表了用戶到計算機的詞法輸入,它是來自不同的通道的獨立的、最小的、不可分割的操作,這些原子操作在一定的應(yīng)用上下文中有著特定的交互意義9/8/202338輸入原語為了擺脫設(shè)備的特定物理特性和操作方式上的差異,便利多輸入原語界面需抽象出一個簡單完備的原語集合每個IP可實例化為一個四元組〈用戶動作,數(shù)據(jù)表示,使用通道,時間標簽〉它體現(xiàn)了某一時刻來自某個輸入通道的用戶輸入動作與一種內(nèi)部數(shù)據(jù)表示聯(lián)系在一起IP是通道無關(guān)的,不同的物理通道的輸入可以映射到相同的IP二維鼠標的Click動作和眼動跟蹤的眼睛凝視動作都可歸為"指點類"IP─POINT;9/8/202339輸入原語界面需抽象出一個簡單完備的原語集合8/3/20233輸入原語IP是應(yīng)用無關(guān)的,在軟件環(huán)境的支持下,同一個IP在不同的應(yīng)用上下文中可被解釋為完全不同的操作根據(jù)用戶的交互意圖和交互方式,抽象出六類輸入原語瀏覽(NAVIGATE),指點(POINT),拾取(TOUCH),文本(WORD),變換(TRANSFORM)手勢(GESTURE)9/8/202340輸入原語IP是應(yīng)用無關(guān)的,在軟件環(huán)境的支持下,同一個IP在不輸入原語9/8/202341輸入原語8/3/202341輸入原語9/8/202342輸入原語8/3/202342用戶模型和描述方法在構(gòu)建一個多通道界面的結(jié)構(gòu)模型時,以下是問題關(guān)鍵不應(yīng)該在應(yīng)用程序中進行多通道整合允許用戶完成不同通道與不同功能之間的映射多通道相互作用能在不中斷相互作用過程的條件下隨時相互啟動和終止9/8/202343用戶模型和描述方法在構(gòu)建一個多通道界面的結(jié)構(gòu)模型時,以下是問用戶模型和描述方法
VisualMan多通道用戶界面模型2DGUI應(yīng)用/3DVR應(yīng)用通道整合交互分析交互設(shè)備9/8/202344用戶模型和描述方法 VisualMan多通道用戶界面用戶模型和描述方法交互設(shè)備處理直接來自不同通道的輸入,系統(tǒng)對每一時刻的全部輸入進行加工主要的交互通道包括語音、手和身體的運動以及視覺追綜等交互分析根據(jù)各通道的特性分析來自不同通道的輸入,形成交互的原語完成定位、說明屬性和操作。交互分析使原語的說明變得與設(shè)備無關(guān)通道整合將相同操作維度的原語輸入通過整合來完成某項任務(wù)的操作,從而做到任務(wù)的完成與通道無關(guān)不同的物理裝置能整合成相同的操作,形成與裝置獨立的多通道界面9/8/202345用戶模型和描述方法交互設(shè)備處理直接來自不同通道的輸入,系統(tǒng)對用戶模型和描述方法在這個多道通用戶界面模型中,有二個重要的特征值得注意用戶對一個特定的操作沒有固定的輸入順序各輸入的時相(timing)對說明操作維度是非常重要的9/8/202346用戶模型和描述方法在這個多道通用戶界面模型中,有二個重要的特用戶模型和描述方法9/8/202347用戶模型和描述方法8/3/202347用戶模型和描述方法層次化的多通道界面描述方法HMISLOTOS(LanguageOfTemporalOrderingSpecification)LOTOS算符主要有以下幾種:T1|||T2(交替Interleaving)T1[]T2(選擇Choice)T1|[a1,...,an]|T2(同步Synchronization)T1[>T2 (禁止Deactivation)T1>>T2(允許Enabling)9/8/202348用戶模型和描述方法層次化的多通道界面描述方法HMIS8/3/象棋對弈實例中國象棋9/8/202349象棋對弈實例中國象棋8/3/202349用戶模型和描述方法LOTOS9/8/202350用戶模型和描述方法LOTOS8/3/202350用戶模型和描述方法拾取棋子UAN9/8/202351用戶模型和描述方法拾取棋子UAN8/3/202351用戶模型和描述方法放置棋子9/8/202352用戶模型和描述方法放置棋子8/3/202352用戶模型和描述方法基于事件-目標的多通道用戶結(jié)構(gòu)模型9/8/202353用戶模型和描述方法基于事件-目標的多通道用戶結(jié)構(gòu)模型8/3/用戶模型和描述方法分布式多通道用戶界面的結(jié)構(gòu)模型9/8/202354用戶模型和描述方法分布式多通道用戶界面的結(jié)構(gòu)模型8/3/20多通道整合和算法分布式多通道用戶界面模型共享窗口客戶通過網(wǎng)絡(luò)完成對同一系統(tǒng)的操作,每一個用戶都可以在他的私有窗口中通過多個通道和CSCW系統(tǒng)交互,操作的結(jié)果可以在共享窗口中顯示出來共享窗口服務(wù)器共享窗口服務(wù)器同時為所有的用戶提供系統(tǒng)輸出DMMI協(xié)調(diào)服務(wù)器支持多用戶之間的協(xié)作9/8/202355多通道整合和算法分布式多通道用戶界面模型8/3/202355多通道整合和算法基本概念整合(Integration)在比較低的層次上,主要關(guān)注如何把各種各樣的交互設(shè)備和交互方式容納到系統(tǒng)中在較高的層次上,主要關(guān)注多個通道之間在意義的傳達和提取上的協(xié)作融合(Fusion)在多個層次上(詞素的、詞法的、語義的、會話的)上對來自不同通道、具有不同表示的信息的合一化處理,其目的是正確地獲取用戶輸入,特別是正確地解釋用戶輸入分流(Fission)在多個層次上對需要向用戶傳達的特定信息向不同輸出通道、不同信息表示和表現(xiàn)的轉(zhuǎn)換9/8/202356多通道整合和算法基本概念8/3/202356多通道整合和算法多通道整合實例分析自然語言/語音和指點的整合語音與唇讀的整合眼動和其他通道的整合9/8/202357多通道整合和算法多通道整合實例分析8/3/202357多通道整合原理_通道用法語音和手勢/直接操縱互補其他形式的多通道整合也應(yīng)該考慮,如語音和書寫的整合語音通道并不需要支持大詞匯量,并且當詞匯量小時識別得到改善結(jié)合多個通道的輸入有利于提高識別率在任何時候所有通道都應(yīng)該可用,以保證通道的自由組合如果存在限制,則限制應(yīng)該是來自交互任務(wù)本身,而非系統(tǒng)功能的局限9/8/202358多通道整合原理_通道用法語音和手勢/直接操縱互補8/3/20多通道整合原理_系統(tǒng)結(jié)構(gòu)系統(tǒng)應(yīng)該能夠在硬件和軟件上支持多種、多個通道時間是融合處理的基本準則系統(tǒng)需要能夠精確記錄通道輸入事件的時間以自然語言處理為核心將強烈影響多通道系統(tǒng)的結(jié)構(gòu);采用語音/自然語言為輸入方式的系統(tǒng)也可以采取更簡單的系統(tǒng)結(jié)構(gòu)和整合方法語義層次的整合會給界面帶來更多的應(yīng)用相關(guān)性,整合需要充分利用應(yīng)用領(lǐng)域信息由于各個通道的技術(shù)是不完美的,任務(wù)特定的應(yīng)用領(lǐng)域有利于實現(xiàn)多個通道的協(xié)作,這里存在著強的約束9/8/202359多通道整合原理_系統(tǒng)結(jié)構(gòu)系統(tǒng)應(yīng)該能夠在硬件和軟件上支持多種、多通道整合原理-整合策略語音和手勢信息的融合是目前整合的主要問題融合中的一個重要問題是歧義消除上下文知識或者會話模型有助于消解歧義的輸入并提高識別率設(shè)備之間在時間響應(yīng)上的差異可能非常大多通道反饋是一個在信息融合過程中及時與適當?shù)叵蛴脩舴至髦匾畔⒌倪^程急性子融合只要多通道輸入支持一定程度的整合,就開始處理,可以看作事件驅(qū)動的慢性子的融合則要到具有了全部輸入之后才開始處理。融合處理可以是分散系統(tǒng)中,也可以集中進行9/8/202360多通道整合原理-整合策略語音和手勢信息的融合是目前整合的主要面向任務(wù)的整合模型(ATOM)多通道界面的面向任務(wù)設(shè)計,需要解決如何將同一任務(wù)的相關(guān)信息讓不同的通道來分擔(dān),并使它們能夠相互協(xié)作的問題任務(wù)結(jié)構(gòu)的設(shè)計解決如何定義任務(wù)的總的行為結(jié)構(gòu)的問題,以及相應(yīng)的交互任務(wù)參數(shù)的設(shè)計要解決如何構(gòu)成一個完整的任務(wù)表示的各個參數(shù)的問題參數(shù)的輸入可能是以多通道的方式進行的。與傳統(tǒng)界面相比,任務(wù)參數(shù)的設(shè)計問題在多通道界面設(shè)計中尤其突出,多通道協(xié)作的指稱就是這一設(shè)計所要考慮的問題之一9/8/202361面向任務(wù)的整合模型(ATOM)多通道界面的面向任務(wù)設(shè)計,需要多通道輸入的格模型多通道整合的問題可以看作一個如何對多通道信息流加以合理地組塊化并正確解釋各個組塊的意義的問題將整個多通道輸入流分割成對應(yīng)于任務(wù)的“段”和對應(yīng)于任務(wù)參數(shù)的“節(jié)”;分塊的依據(jù)主要是語法約束和時間接近性模型以格(lattice)這種代數(shù)結(jié)構(gòu)為基礎(chǔ)來自多個通道的輸入在時間上的關(guān)系是一種偏序關(guān)系為了支持多通道整合,需要由各個通道輸入處理程序給每個輸入事件加上時間戳,這種時間戳應(yīng)該盡可能接近用戶相應(yīng)動作發(fā)生的時間9/8/202362多通道輸入的格模型多通道整合的問題可以看作一個如何對多通道信積木世界實例9/8/202363積木世界實例8/3/202363格模型整合算法9/8/202364格模型整合算法8/3/202364格模型整合算法多通道輸入的格模型9/8/202365格模型整合算法多通道輸入的格模型8/3/202365面向任務(wù)整合的主要因素任務(wù)時間任務(wù)結(jié)構(gòu)和任務(wù)參數(shù)的多通道結(jié)構(gòu)上下文應(yīng)用領(lǐng)域信息9/8/202366面向任務(wù)整合的主要因素任務(wù)8/3/202366面向任務(wù)整合整合算法(1)1)通過自下而上的過程識別出任務(wù),比如單純地根據(jù)語音識別的結(jié)果2)根據(jù)任務(wù)知識更新任務(wù)上下文3)對任務(wù)結(jié)構(gòu)中的每一任務(wù)參數(shù)重復(fù)執(zhí)行下面的(1)(2)(1)根據(jù)任務(wù)結(jié)構(gòu)信息并利用時間節(jié)進行進行輸入分解;(2)在分解后,進行任務(wù)參數(shù)的多通道整合,根據(jù)不同情況處理自然語言中的指稱 自然語言中的指稱: A)通過應(yīng)用相關(guān)的處理,結(jié)合交互上下文,根據(jù)指點輸入求出候選對象集P. B)通過應(yīng)用相關(guān)的處理,結(jié)合交互上下文,根據(jù)名詞短語輸入求出候選對象集N C)根據(jù)不同的指稱方式: a)直指指稱:以P作為所指集R; b)代詞指代指稱:結(jié)合上下文,求出P中滿足會話上下文約束的候選對象,以P作為所指集R;9/8/202367面向任務(wù)整合整合算法(1)1)通過自下而上的過程識別出任務(wù),面向任務(wù)整合整合算法(2) c)名詞短語(可以是指代的)指稱:求出P與N的交集,結(jié)合會話上下文,求出該交集中滿足會話上下文約束的候選對象,作為所指集。 D)根據(jù)任務(wù)相關(guān)約束(如當前任務(wù)不能以某些對象為參數(shù))進一步縮小R。 E)如果R為空,或者R中有超過允許個數(shù)的候選對象,則整合失敗。 F)給出適當反饋,如突出顯示所指對象。 其他情況1:相應(yīng)處理 其他情況2:相應(yīng)處理 。。。。。。4)將具有完整而確認任務(wù)參數(shù)信息的任務(wù)表示提交給應(yīng)用執(zhí)行。9/8/202368面向任務(wù)整合整合算法(2) c)名詞短語(可以是指代的)多通道整合和算法9/8/202369多通道整合和算法8/3/202369多通道分層整合模型和算法通道信息的分層表示9/8/202370多通道分層整合模型和算法通道信息的分層表示8/3/20237多通道分層整合模型和算法多通道的整合模型9/8/202371多通道分層整合模型和算法多通道的整合模型8/3/202371多通道分層整合模型和算法詞法級整合設(shè)IP1=<ACTION1,PARA1,TEMP1>,IP2=<ACTION2,PARA2,TEMP2> IP1IP2=<ACTION3,PARA1PARA2,(TEMP1+TEMP2)/2 IFACTION=ACTION2and|TEMP1-TEMP2|<T, whereT是兩個通道相關(guān)的最小時間間隔 且ACTION1=ACTION2=ACTION3 IP1IP=IP1orIP2 IFACTION1<>ACTION2or|TEMP1-TEMP2|>T語法級整合將原語分層三類:表示動作,對象和對象屬性9/8/202372多通道分層整合模型和算法詞法級整合8/3/202372多通道分層整合模型和算法語義級整合TASK:=<NAME,PARA1,PARA2,…,PARAi,…,PARAn>PARA:=<TYPE,DATA,TEMP>Mi=<TYPEi,DATAi,Tempi>(提交的任意參數(shù))MiTASK=<BANE,PARA1,PARA2,…,PARAj*,…PARAn> ifTYPEi=TYPEjand|TEMPi-TEMPj|/2<T, wherePARAj*表示整合的結(jié)果,其中 PARAj*=<TYPEi,DATAi,TEMPi>Mi
TASK=<BANE,PARA1,PARA2,…,PARAj,…PARAn> IFTYEPi<>TYPE1,2,…,j,…,nor|TEMPi–TEMPj|>T9/8/202373多通道分層整合模型和算法語義級整合8/3/202373基于概率模型的指稱整合模型三級整合的整體結(jié)構(gòu)模型9/8/202374基于概率模型的指稱整合模型三級整合的整體結(jié)構(gòu)模型8/3/20基于概率模型的指稱整合模型多通道整合的體系結(jié)構(gòu)9/8/202375基于概率模型的指稱整合模型多通道整合的體系結(jié)構(gòu)8/3/202基于概率模型的指稱整合模型多通道整合的體系結(jié)構(gòu)9/8/202376基于概率模型的指稱整合模型多通道整合的體系結(jié)構(gòu)8/3/202基于概率模型的指稱整合模型概率整合的基本機制9/8/202377基于概率模型的指稱整合模型概率整合的基本機制8/3/2023基于概率模型的指稱整合模型概率變換發(fā)生在整合過程的不同階段交互元素提取器在某一時刻t輸出整合概率Pi(t)(1
i
m,m為通道數(shù))命令整合器在某一段時間段[t0,tn]內(nèi)接受來自各交互元素提取器產(chǎn)生的整合概率Pi(tj)(1
i
m,1
j
n)對于每個交互元素i,在[t0,tn]經(jīng)過整合,得到與時間無關(guān)的整合概率:9/8/202378基于概率模型的指稱整合模型概率變換發(fā)生在整合過程的不同階段8基于概率模型的指稱整合模型不同階段的概率變換9/8/202379基于概率模型的指稱整合模型不同階段的概率變換8/3/2023基于概率模型的指稱整合模型-幾個重要問題交互周期從用戶發(fā)動一個交互任務(wù)到提交系統(tǒng)完成該交互任務(wù)時間間隔,是交互任務(wù)的基本單位“超時“閥值為了支持回溯事件,工作事件隊列WEQ保存給定時間內(nèi)的所有事件可能會溢出不同參數(shù)對WEQ的遍歷深度可能不同9/8/202380基于概率模型的指稱整合模型-幾個重要問題交互周期8/3/20基于概率模型的指稱整合模型-幾個重要問題時序問題時序適應(yīng)向用戶界面自然性的重要特性多通道用戶界面應(yīng)當支持非時序性,允許用戶以任何合理的順序指定交互任務(wù)的各種交互元素如何根據(jù)非嚴格時序交互捕捉用戶的交互意圖首先確定動作在獲得了任務(wù)的結(jié)構(gòu)后,就獲得了任務(wù)結(jié)構(gòu)中各參數(shù)之間的時序關(guān)系可以按有序和無序的要求填寫參數(shù)槽9/8/202381基于概率模型的指稱整合模型-幾個重要問題時序問題8/3/20基于概率模型的指稱整合模型-幾個重要問題交互上下文事件的指向(是否有目標)、系統(tǒng)的狀態(tài)、應(yīng)用語義響應(yīng)特性通道相關(guān)概率根據(jù)交互任務(wù)的匹配特性,不同通道和設(shè)備適合于不同的交互任務(wù),通道和設(shè)備對于完成任務(wù)的自然形成都會有所不同同一事件可解釋為不同參數(shù),但具有不同的概率,不同事件可解釋為同一參數(shù),概率各不相同9/8/202382基于概率模型的指稱整合模型-幾個重要問題交互上下文8/3/2基于模糊識別模型的視線交互整合模型視線交互將視線交互抽象成不精確的指稱,采用模糊識別模型進行視線的交互整合手勢的指點范圍 9/8/202383基于模糊識別模型的視線交互整合模型視線交互8/3/20238基于模糊識別模型的視線交互整合模型人機交互中的指稱技術(shù)自然語言處理技術(shù)指稱處理描述式直指式指代式目標選擇與指稱按名引用(描述式)屬性描述(描述式)空間引用(直指式)時間引用(指代式)指代(指代式)間接引用(描述式和直指式結(jié)合)9/8/202384基于模糊識別模型的視線交互整合模型人機交互中的指稱技術(shù)8/3基于模糊識別模型的視線交互整合模型人機交互中的指稱技術(shù)參數(shù)指定與指稱可以用語言描述35直指式間接方式人機交互中的模糊信息多通道用戶界面需處理模糊信息,在多通道整合中集中處理9/8/202385基于模糊識別模型的視線交互整合模型人機交互中的指稱技術(shù)8/3基于模糊識別模型的視線交互整合模型模糊目標選擇與參數(shù)指定算法屬性模糊集的確定將目標的可描述屬性視為一個模糊集域,每個目標屬性可以用適當?shù)恼Z言變量的原詞來概括空間位置:上、下、左、右、中、前、后、左上、東形狀大小:大、中、寬、圓的顏色特征:日常顏色名稱特征:在上下文中并不能唯一確定的個體和忽略大小寫、拼寫錯的名稱等位序模糊特征:下一個、前面的、附近的、剛剛經(jīng)過的9/8/202386基于模糊識別模型的視線交互整合模型模糊目標選擇與參數(shù)指定算法基于模糊識別模型的視線交互整合模型模糊目標選擇與參數(shù)指定算法屬性模糊集的確定直指模糊集9/8/202387基于模糊識別模型的視線交互整合模型模糊目標選擇與參數(shù)指定算法基于模糊識別模型的視線交互整合模型模糊目標選擇與參數(shù)指定算法指稱范圍的確定特定單選非特定單選復(fù)選指定詞匯集的確定模糊目標選擇算法需要識別和處理四類描述詞匯屬性形容詞:大的、紅的修飾副詞:很、稍微、一些、一點、最范圍限定詞:這個、一個、所有、每個連接詞:而且、或是、不是、非9/8/202388基于模糊識別模型的視線交互整合模型模糊目標選擇與參數(shù)指定算法基于模糊識別模型的視線交互整合模型模糊目標選擇與參數(shù)指定算法隸屬函數(shù)的確定位置:采用以目標中心點為自變量的分段函數(shù)形狀大?。合日页鰠⒖紭藴?,在確定目標的實際指標與標準值之間的函數(shù)關(guān)系顏色:GRB模型計算距離位序:離散形式直指:興趣區(qū)域9/8/202389基于模糊識別模型的視線交互整合模型模糊目標選擇與參數(shù)指定算法基于模糊識別模型的視線交互整合模型模糊目標選擇與參數(shù)指定算法模糊目標識別特征抽?。簭膶ο髕i(i=0,2,…n)中提取與識別有關(guān)的特征,并監(jiān)測xi在各個特征上的具體數(shù)據(jù),將對象xi轉(zhuǎn)換為模式p(xi)=(xi1,xi2,…,xin)建立隸屬函數(shù)
A:識別判決:找出最接近的模糊集A最大原則閥值原則混合原則9/8/202390基于模糊識別模型的視線交互整合模型模糊目標選擇與參數(shù)指定算法基于模糊識別模型的視線交互整合模型目標識別算法根據(jù)用戶描述的屬性信息分析并選取有關(guān)特征,形成目標模式根據(jù)目標模式的隸屬度函數(shù),計算交互場景中每個目標在“描述屬性”中所涉及的屬性模糊子集上的隸屬度根據(jù)描述屬性中包含的邏輯關(guān)系和程度修飾詞,計算目標的復(fù)合隸屬度若復(fù)選操作,則使用“閥值原則”判決,選擇出隸屬度高于閥值的所有目標若為單選操作,則綜合使用“閥值原則”和“最大原則”9/8/202391基于模糊識別模型的視線交互整合模型目標識別算法8/3/202基于模糊識別模型的視線交互整合模型模糊參數(shù)指定參數(shù)通常是連續(xù)的和無限的從用戶描述信息中提取參數(shù)的本質(zhì)是去除模糊性對于用戶未提到的屬性緯度,可以使用平均參數(shù)隨機參數(shù)缺省參數(shù)對于用戶提到的屬性維度,可在模糊集中使用極大;極小;中間;隨機策略9/8/202392基于模糊識別模型的視線交互整合模型模糊參數(shù)指定8/3/2025.4實例介紹多通道人機交互與許多領(lǐng)域緊密相關(guān),包括:多媒體、虛擬現(xiàn)實、模式識別(語音識別、手寫識別、表情識別及相應(yīng)的合成技術(shù))、自然語言處理等。以基于多通道交互技術(shù)的虛擬座艙和象棋游戲為例說明多通道人機交互的特性9/8/2023935.4實例介紹多通道人機交互與許多領(lǐng)域緊密相關(guān),包括:多媒基于多通道交互技術(shù)的虛擬座艙利用虛擬座艙系統(tǒng)來發(fā)展座艙設(shè)計新概念是一種有效的方法易于重構(gòu)和低費用是利用虛擬座艙系統(tǒng)的有利因素在虛擬座艙系統(tǒng)中采用多通道用戶界面設(shè)計是座艙發(fā)展的趨勢飛機性能的日益提高使得飛行員與機器之間的信息交換更加頻繁,如何拓寬信息傳輸通道是迫切需要解決的問題通過多通道來交換信息是解決問題的主要方法9/8/202394基于多通道交互技術(shù)的虛擬座艙利用虛擬座艙系統(tǒng)來發(fā)展座艙設(shè)計新虛擬座艙系統(tǒng)的構(gòu)成虛擬座艙系統(tǒng)通過視覺、聽覺、觸覺向飛行員提供信息,飛行員通過言語、手來控制飛行。虛擬座艙系統(tǒng)由硬件和軟件兩部分組成9/8/202395虛擬座艙系統(tǒng)的構(gòu)成虛擬座艙系統(tǒng)通過視覺、聽覺、觸覺向飛行員提硬件組成整個虛擬座艙系統(tǒng)的硬件組成包括座艙框架、油門桿、駕駛桿、座椅、話筒、觸摸屏、三對影像以及兩臺顯示器。這些硬件通過兩臺計算機整合
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 水利水電工程的綜合評價指標與試題及答案
- 2025年廠級安全培訓(xùn)考試試題【培優(yōu)B卷】
- 2025年公司管理人員安全培訓(xùn)考試試題及答案【基礎(chǔ)+提升】
- 2025安全管理員安全培訓(xùn)考試試題匯編
- 水利水電工程的溝通與協(xié)調(diào)能力與試題與答案
- 水利水電工程文化傳播與推廣試題及答案
- 工程項目管理的法律法規(guī)試題及答案
- 2025-2030年遙測顯示器市場市場現(xiàn)狀供需分析及投資評估規(guī)劃分析研究報告
- 2025-2030年運動護具行業(yè)市場現(xiàn)狀供需分析及投資評估規(guī)劃分析研究報告
- 2025-2030年特色農(nóng)業(yè)旅游產(chǎn)業(yè)深度調(diào)研及前景趨勢與投資研究報告
- 2025屆浙江省稽陽聯(lián)誼學(xué)校高三下學(xué)期4月二模政治試題 含解析
- 2025年全國學(xué)生愛眼護眼、預(yù)防近視知識考試題與答案
- 2025年四川省德陽市中考模擬地理試題四套附參考答案
- 特種設(shè)備崗位試題及答案
- 2025年北京市東城區(qū)九年級初三一模英語試卷(含答案)
- 支教培訓(xùn)考試題及答案
- 中級宏觀經(jīng)濟學(xué)知到課后答案智慧樹章節(jié)測試答案2025年春浙江大學(xué)
- 國開2024年秋《機械制圖》形考作業(yè)1-4答案
- 個人工勞務(wù)分包合同
- MOOC 創(chuàng)業(yè)管理-江蘇大學(xué) 中國大學(xué)慕課答案
- 2024年四川省自然資源投資集團有限責(zé)任公司招聘筆試參考題庫附帶答案詳解
評論
0/150
提交評論