



下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 語音控制無人機初探 朱立鑫 崔韞鑫摘要:隨著無人機技術的迅猛發(fā)展,控制無人機的方式也在不斷革新。研究在開源地面站上實現(xiàn)無人機語音指令控制技術,可使操作更加便捷。通過簡潔、友好的語音界面就可與控制系統(tǒng)進行深入信息交互,完成語音指令所代表復雜控制內容。由于本文僅為語音控制無人機初探,主要介紹通過特定的一種方式實現(xiàn)語音控制。本文以開源地面站mission planner作為基礎進行軟件開發(fā),利用windows自帶的語音識別模塊進行識別及其在無人機控制中的應用為研究內容,借此來簡化無人機控制流程、提供一種簡潔的語音指令控制界面,重點研究了語音識別技
2、術在無人機控制上的應用。關鍵詞:語音識別;無人機;地面站語音識別技術是一種人機交互技術。語言作為信息溝通的最主要方式,可為人機交互使用時提供其它方式不可替代的直接和便利。因此,將語音識別這種人機交互手段應用于無人機控制方面,可以為操作人員提供一種簡便的語音指令控制界面,使操作更加便捷。一、語音控制無人機研究現(xiàn)狀2001年,美國斯坦福大學研制出witas多模態(tài)對話系統(tǒng)用于控制無人機設備。隨后,語音控制技術高速發(fā)展。目前,我國民用無人機領域內,語音控制無人機已成為下一發(fā)展階段。二、語音控制無人機總體設計本人主要從三個方面介紹語音控制無人機,即語音識別技術、指令控制及地面站軟件開發(fā)。三、無人機語音識
3、別技術本文主要介紹通過使用c#和speech sdk來進行語音識別。本文介紹的語音識別功能,其實就是利用windows的語音引擎,它包含在speech sdk開發(fā)包中。我們就是使用此開發(fā)包根據(jù)自己的需要開發(fā)程序。speech sdk包含語音識別sr引擎和語音合成ss引擎兩種語音引擎。語音識別引擎用于識別語音命令,調用接口完成某個功能,實現(xiàn)語音控制。語音合成引擎用于將文字轉換成語音輸出。語音識別引擎分兩種模式識別:文本識別模式和命令識別模式。此兩種模式的主要區(qū)別在于識別過程中使用的匹配字典不同。前者使用的是通用字典,特點是覆蓋的詞匯量大,因為詞匯量大直接導致識別的精度降低,識別速度較慢。后者的字
4、典需要開發(fā)者自己編寫,這種方式由開發(fā)者定義詞匯的數(shù)量,大大降低匹配過程中需要檢索的詞匯量,提高了識別速度,同時因為候選項極少,所以一般不會識別錯誤。由于控制無人機飛行僅需要幾個特定的指令,而且對識別率要求較高,所以選用命令識別模式進行語音識別開發(fā)。四、無人機飛行協(xié)議及控制指令(一)mavlink簡介mavlink協(xié)議是在串口通訊基礎上的一種更高層的開源通訊協(xié)議,主要應用在微型飛行器(micro aerial vehicle)的通訊上。mavlink是為小型飛行器和地面站通訊時常常用到的那些數(shù)據(jù)制定一種發(fā)送和接收的規(guī)則并加入了校驗(checksum)功能。如圖所示,每個消息幀都是上述的結構,除了
5、灰色外,其他的格子都代表了一個字節(jié)的數(shù)據(jù)?;疑褡永锩娴臄?shù)據(jù)長度是不固定的。紅色的是起始標志位(stx)。這個標志位用于mavlink消息幀接收端進行消息解碼。第二個格子代表的是payload的字節(jié)長度(len),范圍從0255。第三個格子代表的是本次消息幀的序號(seq),每次發(fā)完一個消息,這個字節(jié)的內容會加1,加到255后會從0重新開始。這個序號用于mavlink消息幀接收端計算消息丟失比例。第四個格子代表發(fā)送本條消息幀的設備的系統(tǒng)編號(sys)。第五個格子代表了發(fā)送本條消息幀的設備的單元編號(comp)。第六個格子代表了有效載荷中消息包的編號(msg),mavlink消息幀接收端根據(jù)這個
6、編號來確定有效載荷里的消息包并根據(jù)編號選擇對應的方式來處理有效載荷里的信息包。最后兩個字節(jié)是16位校驗位,ckb是高八位,cka是低八位。校驗碼由crc16算法得到。(二)地面站和飛控的通訊流程無人機連接好mp地面站后,都會主動向地面站發(fā)送心跳包、飛行器姿態(tài)、系統(tǒng)狀態(tài)等組成的數(shù)據(jù)流。地面站會在剛連接上飛控時發(fā)送命令,請求飛控傳回所有參數(shù),飛控根據(jù)自己的情況判斷是否接受地面站的請求,并根據(jù)不同的命令執(zhí)行相應的操作。mp地面站比較成熟,在軟件內已經預設了無人機飛行所需的各種指令。這些指令通過mavlink協(xié)議傳遞給飛控,從而實現(xiàn)對無人機的控制。我們只需在地面站中找到這些指令,將語音識別結果與這些指
7、令相對應就可以實現(xiàn)對無人機的語音控制。五、地面站軟件開發(fā)mission planner是一個功能齊全的開源地面站應用程序。本人在此軟件的基礎上進行二次開發(fā),加入語音識別模塊,將識別結果與無人機飛行命令相對應,從而實現(xiàn)對無人機的語音控制。實現(xiàn)語音控制用到的mp地面站內的飛行指令,主要是導航命令。導航命令是用于控制無人機的運動,包括起飛、航路點和移動至周圍和著陸。本人用到的導航命令:mav_cmd_nav_takeoff:從地面起飛(發(fā)射)。實現(xiàn)“起飛”指令。mav_cmd_nav_return_to_launch:返回home位置或就近的集結點。home的位置是飛行器解鎖位置。實現(xiàn)“返航”指令。mav_cmd_nav_land:在當前或指定位置降落。實現(xiàn)“降落”指令。mav_cmd_nav_guided_enable:啟用引導控制模式切換到外部控制器。在guided模式下,在預先建立的三維坐標系中,引導無人機在空間中實現(xiàn)“前進”、“后退”、“向左”、“向右”、“上升”、“下降”等指令。六、總結本文以開源地面站mission planner作為基礎進行軟件開發(fā),利用windows自帶的語音識別模塊進行識別及其在無人機控制中的應用為研究內容,借此簡化無人機控制流程、提供一種簡潔的語音指令控制界面,實現(xiàn)了語音控制無人機功能。本文僅為語音控制無人機初探,主要介紹通過特
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 確保軟件質量的測試策略及試題及答案
- 二級C語言設計模式分析試題及答案
- 邏輯思維與財務概念結合試題及答案
- 皇茶加盟合同協(xié)議書
- 美妝課程培訓合同協(xié)議書
- 計算機二級MySQL題庫新鮮出爐試題及答案
- 養(yǎng)雞場建設合同協(xié)議書
- 融合創(chuàng)新的嵌入式系統(tǒng)試題及答案
- 計算機基礎知識應試試題及答案
- 解除合同協(xié)議書表格模板
- 2025屆湖南省邵陽市高三下學期第三次聯(lián)考數(shù)學試卷(含答案)
- 2025年北京市朝陽區(qū)高三二??荚囌Z文試卷(含答案)
- 2025年中考第一次模擬考試卷:生物(廣西卷)(解析版)
- 2025年公路水運工程重大事故隱患判定標準深度解析
- 湖北省武漢市2025年高三3月份模擬考試英語試題含答案
- 鋼結構吊裝監(jiān)理實施細則
- “住改商”登記利害關系業(yè)主同意證明(參考樣本)
- 廣東省廣州市2025年中考地理模擬卷
- 2025年鄉(xiāng)村醫(yī)學考試思想準備試題及答案
- 地理巴西(第1課時)課件-2024-2025學年七年級地理下冊人教版
- 員工涉黃賭毒協(xié)議書
評論
0/150
提交評論