設(shè)計(jì)原理、研究方法與步驟_第1頁
設(shè)計(jì)原理、研究方法與步驟_第2頁
設(shè)計(jì)原理、研究方法與步驟_第3頁
設(shè)計(jì)原理、研究方法與步驟_第4頁
設(shè)計(jì)原理、研究方法與步驟_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、六、 設(shè)計(jì)原理、研究方法與步驟以標(biāo)籤作為主要工具,設(shè)計(jì)一套AI認(rèn)知精緻化系統(tǒng),對照AI學(xué)習(xí)對象(受試者)的認(rèn)知,根據(jù)標(biāo)籤分類法衍生出文件的關(guān)聯(lián)度,用類神經(jīng)網(wǎng)路中的監(jiān)督式學(xué)習(xí)網(wǎng)路模擬學(xué)習(xí)過程,產(chǎn)生網(wǎng)路模型呈現(xiàn)AI用認(rèn)知精緻化方法學(xué)習(xí)的成果,文件和標(biāo)籤及其關(guān)聯(lián)網(wǎng)路建構(gòu)完成後,針對其中一個(gè)標(biāo)籤相關(guān)的所有文件進(jìn)行分群,被下了該標(biāo)籤的文件之間,按照除去該標(biāo)籤之後的關(guān)聯(lián)度高低有著粗細(xì)不等的聯(lián)結(jié)(連線),把下同樣標(biāo)籤的所有文件拿給受試者分群,推論分群對應(yīng)到關(guān)聯(lián)網(wǎng)路的結(jié)果,同一群文件各自間的關(guān)聯(lián)線應(yīng)該較粗,不同群的文件聯(lián)結(jié)則較弱(線細(xì))甚至沒有關(guān)聯(lián)。系統(tǒng)架構(gòu)系統(tǒng)架構(gòu)圖: DATADATABASEOperati

2、on SystemDichotomyVisualizationUserUser InterfaceInput tags使用者介面設(shè)計(jì): 對在電腦裡的檔案按右鍵會出現(xiàn)TagSerch的選項(xiàng),按下即可新增標(biāo)籤。開啟程式執(zhí)行檔:-選擇view來檢視全部檔案的關(guān)聯(lián)網(wǎng)路圖-選擇file針對檔案做管理-選擇tool為用標(biāo)籤搜尋檔案的功能,搜尋結(jié)果會以簡化的關(guān)聯(lián)網(wǎng)路圖來 呈現(xiàn)檢視所有和該標(biāo)籤相關(guān)的檔案。點(diǎn)選網(wǎng)路圖其中一個(gè)檔案後,會在右方attribute欄位裡顯示檔案資訊。在 Tags這個(gè)欄位中有的按鈕,在檢視檔案網(wǎng)絡(luò)時(shí)會enable,以方便使用者一邊檢視網(wǎng)絡(luò)圖,一邊修改檔案的標(biāo)籤設(shè)定。資料庫設(shè)計(jì): 此專題

3、使用Microsoft SQL Server資料庫,包含檔案資料表(file)、 標(biāo)籤資料表(tag)及關(guān)係資料表(file-tag relation) 三個(gè)資料表,如下:a.檔案資料表(file)有兩個(gè)欄位: 檔案編號(fid)與檔案路徑(fpath)。 b.標(biāo)籤資料表(tag)有兩個(gè)欄位: 標(biāo)籤編號(tid)與標(biāo)籤內(nèi)容(ttext)。 c.關(guān)係資料表(file-tag relation)有三個(gè)欄位: 關(guān)係編號(rid)、檔案編號(fid)及標(biāo)籤編號(tid)。 關(guān)係資料表中的檔案編號(file-tag relation.fid)和標(biāo)籤編號(file-tag relation.tid)分別關(guān)

4、聯(lián)到檔案資料表之檔案編號(file.fid)和標(biāo)籤資料表 之標(biāo)籤編號(tag.tid)。 新增一個(gè)檔案時(shí),會把該檔案編號,並紀(jì)錄其存放路徑;而為檔案加上 一個(gè)標(biāo)籤時(shí),會先在標(biāo)籤資料表搜尋該標(biāo)籤內(nèi)容是否已存在;若存在,用該 標(biāo)籤的編號和檔案編號,在關(guān)係資料表插入一筆關(guān)係;若不存在,則先在標(biāo) 籤資料表新增該標(biāo)籤,再插入關(guān)係於關(guān)係資料表中。系統(tǒng)流程圖:DocumentsTagsinput dataloopDocumentsTagsloopRid Fid Tid Fid Path Tid NamedichotomyvisualizationMachine LearningAlgorithmRid Fi

5、d Tid Fid Path Tid Nameconstruct the databasedichotomyMachine LearningAlgorithmnetwork in dichotomy visualizationvisualization系統(tǒng)功能 此為本專題實(shí)驗(yàn)的核心,分為幾個(gè)部分來達(dá)到機(jī)器學(xué)習(xí)的效果:第一部分是選擇特徵(feature selection),然後建構(gòu)資料的模型(model selection),最後把這個(gè)模型當(dāng)成學(xué)習(xí)的成果,拿來做預(yù)測(prediction)。機(jī)器學(xué)習(xí)演算法:選擇特徵 整理資料庫中的資料,計(jì)算每個(gè)tag相關(guān)的檔案以及每個(gè)檔案被下的tag利用鏈結(jié)串

6、列(linklist)暫存。建構(gòu)模型a.繪製二分網(wǎng)路:,把上一步驟整理出來的鏈結(jié)串列整合成二分網(wǎng)路,就是只有兩種多對多節(jié)點(diǎn),且同種節(jié)點(diǎn)間不可有連線的網(wǎng)路。b.二分網(wǎng)路轉(zhuǎn)成關(guān)聯(lián)網(wǎng)路:將二分網(wǎng)路中的標(biāo)籤節(jié)點(diǎn)依序拿掉,共同連接到該節(jié)點(diǎn)的檔案關(guān)聯(lián)度就加一(加一條連線或把現(xiàn)有連線加粗)。預(yù)測依所下的標(biāo)籤簡化關(guān)聯(lián)網(wǎng)路(分群):針對一個(gè)被使用最多次的標(biāo)籤,找出所有和他相關(guān)的檔案,並畫出檔案之間的關(guān)聯(lián)度,原本應(yīng)該要把所有關(guān)聯(lián)度減一,但是連線的粗細(xì)是一個(gè)相對關(guān)係,對整個(gè)實(shí)驗(yàn)並沒有太大的影響,所以把這個(gè)動作省略。實(shí)驗(yàn)步驟1 讓受試者針對文件下一至多個(gè)不等的標(biāo)籤2 系統(tǒng)依使用者所下標(biāo)籤對文件進(jìn)行關(guān)聯(lián)度運(yùn)算且視覺化3

7、 經(jīng)過一段時(shí)間後,給予受試者一部分的文件讓他用直覺進(jìn)行分群4 系統(tǒng)用視覺化結(jié)果也將該部分文件按照關(guān)聯(lián)強(qiáng)度分群5 比對兩個(gè)分群的相似程度給予受試者部分文件使其用直覺進(jìn)行分群比照系統(tǒng)視覺化後的分群與受試者的分群結(jié)果相似程度使用者對文件下標(biāo)籤系統(tǒng)將文件之間的關(guān)聯(lián)度視覺化實(shí)驗(yàn)流程:七、 系統(tǒng)實(shí)現(xiàn)與實(shí)驗(yàn)1.讓受試者針對文件下一至多個(gè)不等的標(biāo)籤Fig.3 選擇TagSearch後會出現(xiàn)一個(gè)視窗顯示檔案名稱和路徑,旁邊有一個(gè)欄位供使用者輸入標(biāo)籤,按下確定後,會把檔案資訊及標(biāo)籤資訊傳送到資料庫。2.系統(tǒng)把文件之間的關(guān)聯(lián)度視覺化Fig.4檔案間相關(guān)度高的連線較粗,在同個(gè)資料夾的檔案標(biāo)示相同的底色。3.給受試者一

8、部分的文件讓他用直覺進(jìn)行分群Fig.5請使用者將認(rèn)定為同樣分群的圖片圈起來,如果該分群只有一個(gè)檔案則不需。4.用視覺化結(jié)果也將該部分文件按照關(guān)聯(lián)強(qiáng)度分群Fig.6視覺化出來的結(jié)果,為了要和使用者分群比對,我們選擇用文件內(nèi)容的縮圖代替檔名呈現(xiàn),中間的文字則是所指定的標(biāo)籤,以縮小文件分群的範(fàn)圍,檔案間關(guān)聯(lián)度高的給予較粗的連線。5.比對兩個(gè)分群的相似程度 我們可以發(fā)現(xiàn)只要是使用者劃分為同一群的文件,之間都會有連線;甚至 是較粗的連線,所以由此可以論斷,這樣的標(biāo)籤網(wǎng)路圖與使用者對文件的記憶 有絕對的關(guān)係。八、 效能評估與成果 實(shí)驗(yàn)結(jié)果和我們預(yù)期的相差不遠(yuǎn),但是在分群邊緣的地方界定比較模糊。還有使用者分

9、群時(shí),如果不是按照直覺,而有做更深入的聯(lián)想,結(jié)果就會稍有出入。這部分可以試著在短時(shí)間內(nèi)作更大量的實(shí)驗(yàn)來減少誤差。九、 結(jié)論 本專題設(shè)計(jì)出的以個(gè)人標(biāo)籤產(chǎn)生關(guān)聯(lián)網(wǎng)路模型,奠基於認(rèn)知精緻化之理論,在機(jī)器學(xué)習(xí)的範(fàn)疇創(chuàng)新方法,是將心理學(xué)結(jié)合人工智慧的初步結(jié)果,學(xué)術(shù)上能提供更進(jìn)一步研究的平臺,產(chǎn)業(yè)上改良現(xiàn)有的個(gè)人電腦檔案管理,把廣泛應(yīng)用於網(wǎng)際網(wǎng)路的標(biāo)籤分類系統(tǒng)擴(kuò)充到PC上,增進(jìn)搜尋檔案時(shí)的效率和便利度。在本專題的實(shí)驗(yàn)過程,我們發(fā)現(xiàn)到此視覺化的網(wǎng)路圖,由實(shí)驗(yàn)證明出合乎人類記憶模型,更可進(jìn)一步應(yīng)用在個(gè)人記憶的重整與加深;舉例來說,當(dāng)記憶節(jié)點(diǎn)間的聯(lián)結(jié)變淡時(shí),可以透過複習(xí)這樣的網(wǎng)路圖來回復(fù),幫助使用者更快找到隨時(shí)

10、間被淡忘的檔案,並再次記憶該檔案的關(guān)聯(lián)性,鞏固記憶節(jié)點(diǎn)的定位。十、 參考文獻(xiàn)i. 林依文. 個(gè)人知識重整-以記憶模型與標(biāo)籤技術(shù)為基礎(chǔ) Reorganizing Personal Knowledge Based on Memory Models.新竹: 交通大學(xué), 2007ii. "分眾分類法" </wiki/%e5%88%86%e4%bc%97%e5%88%86%e7%b1%bb%e6%b3%95>.iii. Troelsen, Andrew. Pro C# with .NET 3.0. Special ed. Apr

11、ess, 2007.iv. Hotho, Andreas, Robert J¨aschke, Christoph Schmitz, and Gerd Stumme. Information Retrieval in Folksonomies: Search and Ranking. Germany.v. Harmer, Craig, Sara Abraham, and Peter Vajgel. System and method for performing file lookup based on tags. VERITAS Operating Corporation, assignee. Patent 7228229. 2007.vi. Lee, Kangpyo, Hyunwoo Kim, Chungsu Jang, and Hyoung-Joo Kim. "Folksoviz: a subsumption-based folksono

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論