




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、一種基于語音識(shí)別的智能人機(jī)交互模式構(gòu)想近年來,隨著人工智能技術(shù)的快速發(fā)展,語音識(shí)別技術(shù)越來越成熟,語音交互模式正逐漸發(fā)展成為一種簡單、可依賴的智能人機(jī)交互模式。在以智能語音為主要交互方式的智能時(shí)代中,人們的雙手和雙眼將得以解放,人們的生活將更加便利和美好。計(jì)算機(jī)行業(yè)變革的原動(dòng)力及前智能時(shí)代面臨的問題科技改變生活、改變世界,計(jì)算機(jī)技術(shù)的興起與發(fā)展歷程真切有力地證實(shí)了這一點(diǎn)。20世紀(jì)末期,微軟、蘋果用鼠標(biāo)點(diǎn)開了 PC時(shí)代的大門,讓個(gè)人電腦走進(jìn)千家萬戶,使得信息的傳播擺脫了時(shí)空的束縛。21世紀(jì)初,蘋果、谷歌在觸屏上劃開了移動(dòng)時(shí)代的帷幕,讓智能手機(jī)風(fēng)靡全球,使得社交和娛樂無處不在。作為計(jì)算機(jī)領(lǐng)域最具典
2、型性的兩種不同形態(tài)的產(chǎn)品,個(gè)人電腦和智能手機(jī)均以獨(dú)有的方式得到了千千萬萬的人們的普遍認(rèn)可和接受,從而引發(fā)了時(shí)代的變革。早期電腦依賴于鍵盤和字符屏幕的交互體驗(yàn)?zāi)J綄⒍鄶?shù)人拒之于計(jì)算機(jī)的門外,而依賴于鼠標(biāo)點(diǎn)擊的圖形用戶界面交互模式的發(fā)明,無疑極大地降低了普通民眾使用和理解個(gè)人電腦的門檻,使得PC時(shí)代的步伐悄然而至,進(jìn)而深刻地影響了人們的生活。傳統(tǒng)手機(jī)依賴于實(shí)體鍵盤或筆觸交互的體驗(yàn)?zāi)J?,讓手機(jī)的使用總顯得不那么便捷,而依賴于多點(diǎn)觸控的交互體驗(yàn)?zāi)J阶屓藗儗?duì)手機(jī)的操作更加得心應(yīng)手、方便快捷,使得移動(dòng)時(shí)代的浪潮洶涌而至,從而改變?nèi)藗內(nèi)粘I畹姆椒矫婷?。事?shí)表明,引發(fā)計(jì)算機(jī)時(shí)代變革的真正動(dòng)力,源于技術(shù),卻并
3、非純粹的技術(shù)。確切的說,那是一種建立在計(jì)算機(jī)技術(shù)上的最友好便捷的人機(jī)交互體驗(yàn)?zāi)J?。這是一個(gè)用戶體驗(yàn)至上的年代,計(jì)算機(jī)的使命是為人們創(chuàng)造出一個(gè)簡單、可依賴,卻又不乏趣味的多彩世界,只有最大限度地降低人們的學(xué)習(xí)和使用成本,才能創(chuàng)造出最具普適性的大眾產(chǎn)品。緊隨移動(dòng)時(shí)代的步伐,我們即將迎來一個(gè)全新的計(jì)算機(jī)時(shí)代,智能時(shí)代。在這個(gè)時(shí)代,一切設(shè)備都將被納入到計(jì)算機(jī)互聯(lián)網(wǎng)組成的體系中接受支配和調(diào)動(dòng)。那將是一個(gè)隨心所欲的時(shí)代,一切設(shè)備的控制和調(diào)動(dòng)都將變得輕而易舉和不費(fèi)吹灰之力。為了迎接美好智能時(shí)代的到來,人們?nèi)栽诓粩嗟嘏蛧L試。然而,何謂智能時(shí)代,智能時(shí)代用戶的真正訴求和痛點(diǎn)何在,究竟什么才是真正的智能,這些
4、問題目前似乎尚未形成普遍的共識(shí)或意識(shí)。在我們目前所處的這個(gè)前智能時(shí)代,探索者們通常的做法是用智能手機(jī)觸屏方式來控制我們的設(shè)備以求達(dá)到便捷控制的目的。那么既然如此,我們?yōu)槭裁床恢苯又圃斐鲆粋€(gè)智能的萬能遙控器來實(shí)現(xiàn)這種控制?手機(jī)的使命不是應(yīng)該定位于娛樂和社交才更加合理嗎?設(shè)備的控制是否該另請(qǐng)高明,智能時(shí)代是否一定需要與智能手機(jī)以及它的那一套觸屏操作模式捆綁在一起?這是真正的智能嗎?值得注意的是,智能時(shí)代應(yīng)該是一個(gè)不同于PC時(shí)代和移動(dòng)時(shí)代的全新計(jì)算機(jī)時(shí)代。設(shè)備與人的距離已經(jīng)超出了人手的勢(shì)力范圍,設(shè)備的反饋模式也脫離了屏幕的限制,依賴于雙手和雙眼的觸屏交互模式對(duì)于用戶而言顯然已經(jīng)有些力不從心和差強(qiáng)人意
5、?;蛟S,智能時(shí)代亟須尋求一種不同于PC和手機(jī)的全新的用戶交互模式來引發(fā)計(jì)算機(jī)領(lǐng)域的再一次革新,使得智能的理念深入人心。一種語音智能控制模式的構(gòu)想及其可行性不妨做如下一個(gè)構(gòu)想,在你的家居系統(tǒng)中,存在很多不同類型的設(shè)備,包括電視、冰箱、空調(diào)、洗衣機(jī)、電燈、空氣凈化器等。這些設(shè)備與傳統(tǒng)的設(shè)備在核心功能上沒有本質(zhì)區(qū)別,甚至更加專一和簡單,但是它們都具有一個(gè)共同的神奇特點(diǎn),那就是聽主人的口令行事。作為主人的你,首先需要為每一個(gè)設(shè)備取一個(gè)個(gè)性化的名字,比如電燈叫做亮亮,空調(diào)叫做大個(gè)頭,電視叫做小明。然后就會(huì)出現(xiàn)這樣一種交互場(chǎng)景:你說:亮亮,開燈!電燈回應(yīng):亮亮得令,亮亮已開燈。你說:大個(gè)頭,啟動(dòng)空調(diào)!空調(diào)
6、回應(yīng):大個(gè)頭得令,大個(gè)頭已啟動(dòng)空調(diào)!你說:大個(gè)頭,播報(bào)溫度!空調(diào)回應(yīng):大個(gè)頭得令,當(dāng)前20攝氏度!你說:亮亮,關(guān)燈!電燈回應(yīng):亮亮得令,亮亮已關(guān)燈!你說:小明,湖南衛(wèi)視!電視回應(yīng):小明得令,小明已跳到湖南衛(wèi)視!你說:小明,關(guān)機(jī)!電視回應(yīng):小明得令,小明已關(guān)機(jī)!這將是一個(gè)美妙的場(chǎng)景,在這個(gè)場(chǎng)景中一切設(shè)備都被擬人化了,成為了聽你口令調(diào)遣的仆人,語音成為你們之間最便捷的溝通方式,而你的雙手和雙眼也因此得到了解放,再也不用望著狹小的觸屏點(diǎn)來點(diǎn)去了。不知道這樣一種構(gòu)想是否會(huì)讓人有些小小的激動(dòng)和期待。在我們所構(gòu)想的那個(gè)美妙場(chǎng)景中,有以下幾點(diǎn)要素需要明確和強(qiáng)調(diào):1、每個(gè)設(shè)備都具有至少一個(gè)由“主人錄入或系統(tǒng)默
7、認(rèn)指定的個(gè)性化的語音名稱,這個(gè)語音名稱將被系統(tǒng)用來確定“主人命令下達(dá)的對(duì)象,因此不同設(shè)備其名稱不能相同;2、每個(gè)設(shè)備具有有限的語音指令集,每條指令均可個(gè)性化定制或者由系統(tǒng)默認(rèn)指定,這個(gè)語音指令也是系統(tǒng)決定使用何種指令的根本依據(jù);3、設(shè)備指令執(zhí)行的結(jié)果全部由預(yù)設(shè)的系統(tǒng)語音播報(bào),播報(bào)效果友好音色甜美柔、富有感染力且語義明晰??傊?,一切的要旨都是追求語音交互的極致體驗(yàn),讓人與設(shè)備的交流暢通無阻、親切自然,讓語音的這種交互模式成為另一種全新的簡單可依賴的人機(jī)交互模式。從已有的技術(shù)現(xiàn)狀來看,實(shí)現(xiàn)這樣一個(gè)擬人化的家居系統(tǒng)似乎并非遙不可及,甚至可以說技術(shù)條件已然具備。其中,最關(guān)鍵的問題在于語音指令的識(shí)別?,F(xiàn)
8、如今,語音識(shí)別技術(shù)在軟件互聯(lián)網(wǎng)科技行槳已經(jīng)并不新鮮,甚至趨于成熟?;蛟S識(shí)別準(zhǔn)確率的問題仍然是這項(xiàng)技術(shù)的一個(gè)現(xiàn)有瓶頸,但需要明確的是,在構(gòu)想中的那個(gè)擬人化的智能家居系統(tǒng)中,我們并不需要完全的語音識(shí)別。確切地說,我們需要的是一種語音指令匹配技術(shù)。當(dāng)“主人發(fā)出一個(gè)語音指令時(shí),系統(tǒng)需要在有限的指令集中挑選出匹配度最高的一項(xiàng)指令來執(zhí)行,并反饋執(zhí)行結(jié)果。我們有理由相信,在現(xiàn)有的語音識(shí)別技術(shù)水平上,語音指令匹配準(zhǔn)確率可以達(dá)到一個(gè)實(shí)用性的高度。在這樣一個(gè)智能體系中,控制中心負(fù)責(zé)語音指令的接收、匹配與分發(fā),語音接收器是一個(gè)必備的終端,其他的設(shè)備作為接受控制的目標(biāo)設(shè)備。每當(dāng)一個(gè)目標(biāo)設(shè)備接入系統(tǒng)時(shí),需要注冊(cè)設(shè)備語音
9、名稱、設(shè)備指令集以及設(shè)備反饋集,而設(shè)備指令執(zhí)行的反結(jié)果播報(bào)既可以直接由語音接收器來完成,也可以由執(zhí)行指令的目標(biāo)設(shè)備來完成,可視場(chǎng)景而定。對(duì)于語音接收器來說,手機(jī)可以是一個(gè)常規(guī)的選擇,但可以有無限的想象空間,比如一個(gè)智能手表、智能手環(huán)、智能鈕扣或者對(duì)講機(jī)等,甚至還可以是隱匿于建筑物之中的語音接收器??傊菍⑹且粋€(gè)充滿無限可能的個(gè)性化設(shè)備。語音智能控制模式實(shí)施需要解決的問題當(dāng)然,對(duì)于這樣一個(gè)想想都覺得美妙的系統(tǒng)來說,也難免會(huì)存在一些問題或者漏洞。最顯著的是識(shí)別準(zhǔn)確率的問題,即由距離和環(huán)境噪聲等因素導(dǎo)致的識(shí)別問題,這些問題有賴于研究者們探索出更可靠的辦法來逐步優(yōu)化和解決。此外,一些場(chǎng)景下可能還會(huì)涉
10、及安全問題。比如,如何解決語音開門時(shí)的安全性問題?對(duì)于任何一個(gè)人模擬下達(dá)“開門的用戶指令時(shí),系統(tǒng)是否都要執(zhí)行?不過,倘假設(shè)指令的接收器是如同鑰匙一樣用戶隨身攜帶的物品如智能手表,那么這個(gè)問題就不是問題了。即便語音接收器被直接固定到墻上,我們?nèi)钥梢允褂靡纛l指紋、人臉識(shí)別、指紋識(shí)別或者其他任何有效的途徑來共同協(xié)助完成身份的識(shí)別。除安全問題外,同時(shí)可能還會(huì)涉及到用戶隱私問題。比如在私人場(chǎng)合,語音接收器是否需要全程開啟,這難免會(huì)讓人擔(dān)心正常的人與人之間的語音交流信息泄漏到互聯(lián)網(wǎng)中。這種擔(dān)憂卻也并非關(guān)鍵問題,一種語音接收器啟停的合理觸發(fā)機(jī)制可以有效解決這種擔(dān)憂。盡管語音交互體驗(yàn)?zāi)J交蛟S潛存諸多問題,但倘
11、假設(shè)人們一旦發(fā)現(xiàn)并認(rèn)可了它的無限潛力,那么我們相信這種模式定會(huì)在世人的集思廣益和共同努力中不斷被優(yōu)化、改進(jìn)和完善,以至達(dá)到極致體驗(yàn)。智能時(shí)代的展望如今,我們所處的時(shí)代是一個(gè)充斥著各色大大小小電子屏幕的時(shí)代,電子屏幕在創(chuàng)造多彩世界的同時(shí)也將人們的感官引向了視覺疲勞的邊緣。上班時(shí),我們需要面對(duì)13英寸大小的電腦屏幕辦公。下班后,出于放松和休息的目的,我們的眼睛也一刻離不開那塊5英寸大小的手機(jī)屏幕。屏幕無疑豐富了我們的世界,卻也成為我們生活的羈絆,在屏幕的世界里,人們的感官能力陷入了一種使用失衡的畸形狀態(tài),我們太過依賴于那雙業(yè)已疲憊的雙眼,當(dāng)我們走在車水馬龍的街道上時(shí),我們的眼睛顯然已經(jīng)不夠用了。既然感官已失衡,視覺已疲勞,何不有所改變,換用聽覺呢?形與色的世界固然炫麗多姿、令人依戀,但聲音的世界同樣五彩斑
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 壓力表送檢合同范例
- 賣厝地合同范本
- 2025年凈水設(shè)備租賃合同標(biāo)準(zhǔn)文本
- 智能營銷系統(tǒng)投資-深度研究
- 2025年一級(jí)造價(jià)師兼職合同示例
- 二建注冊(cè)合同范本
- 商品卸抵押合同范本
- 智能設(shè)備故障診斷-深度研究
- 個(gè)人電子產(chǎn)品銷售合同范本
- 血小板聚集動(dòng)力學(xué)研究-深度研究
- 走近人工智能
- 制造業(yè)信息化管理系統(tǒng)架構(gòu)規(guī)劃
- 藍(lán)色卡通風(fēng)好書推薦教育PPT模板
- 《納米復(fù)合材料》第2章 納米復(fù)合材料概論
- 宮頸癌HPV疫苗知識(shí)培訓(xùn)(課堂PPT)
- 2019版外研社高中英語必選擇性必修一單詞表
- 常用電工儀器儀表使用方法
- 海南大學(xué)本科教育學(xué)分制條例
- 建設(shè)工程綠色施工圍蔽指導(dǎo)圖集
- 2022新教科版六年級(jí)科學(xué)下冊(cè)全一冊(cè)全部教案(共28節(jié))
- 中級(jí)Java軟件開發(fā)工程師筆試題(附答案)
評(píng)論
0/150
提交評(píng)論