版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、HEBEI UNIVERSITY密 級 分類號 學(xué)校代碼 學(xué) 號1007520151332碩士學(xué)位論文線性代數(shù)式檢索結(jié)果相似度排序研究學(xué)位申請人:孫夢穎指導(dǎo)教師:田學(xué)東教授學(xué)位類型:工學(xué)碩士學(xué)科專業(yè):計(jì)算機(jī)科學(xué)與技術(shù)授予單位:河北大學(xué)答辯日期:二o八年五月CODE: 10075Classified Index:U.D.C:NO: 20151332A Dissertation for the Degree of M. EngineeringStudy on Similarity Ranking of TheRetrieval Results of Linear AlgebraicExpressi
2、onsCandidate:Supervisor:Academic Degree Applied for:Specialty:University:Date of Oral Examination:Sun MengyingProf. Tian XuedongMaster of EngineeringComputer Science and TechnologyHebei UniversityMay, 2018河北大學(xué)學(xué)位論文獨(dú)創(chuàng)性聲明本人鄭重聲明:所呈交的學(xué)位論文,是本人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作 及取得的研究成果。盡我所知,除了文中特別加以標(biāo)注和致謝的地方外,論文 中不包含其他人己經(jīng)發(fā)表或撰寫
3、的研究成果,也不包含為獲得河北大學(xué)或其他教 育機(jī)構(gòu)的學(xué)位或證書所使用過的材料。與我一同工作的同志對本研究所做的任何 貢獻(xiàn)均已在論文中作了明確的說明并表示了致謝。作者簽名:一_日期:2盅年Y月X日學(xué)位論文使用授權(quán)聲明本人完全了解河北大學(xué)有關(guān)保留、使用學(xué)位論文的規(guī)定,即:學(xué)校有權(quán)保留 并向國家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱。 學(xué)校可以公布論文的全部或部分內(nèi)容,可以采用影印、縮印或其他復(fù)制手段保存 論文。本學(xué)位論文屬于1、保密口 在年月日解密后適用本授權(quán)聲明。2、不保密y(請?jiān)谝陨舷鄳?yīng)方格內(nèi)打“?!保┳髡吆灻喝掌冢痕谀陏月訊日導(dǎo)師簽名:闊步饑日期:年廠月日保護(hù)知識產(chǎn)權(quán)
4、聲明本人為申請河北大學(xué)學(xué)位所提交的題目為(的學(xué)位論文,是我個人在導(dǎo)師(回折;)指導(dǎo)并與導(dǎo)師合作下取得的研究成果, 研究工作及取得的研究成果是在河北大學(xué)所提供的研究經(jīng)費(fèi)及導(dǎo)師的研究經(jīng)費(fèi) 資助下完成的。本人完全了解并嚴(yán)格遵守中華人民共和國為保護(hù)知識產(chǎn)權(quán)所制定 的各項(xiàng)法律、行政法規(guī)以及河北大學(xué)的相關(guān)規(guī)定。本人聲明如下:本論文的成果歸河北大學(xué)所有,未經(jīng)征得指導(dǎo)教師和河北大 學(xué)的書面同意和授權(quán),本人保證不以任何形式公開和傳播科研成果和科研工作內(nèi) 容。如果違反本聲明,本人愿意承擔(dān)相應(yīng)法律責(zé)任。聲明人: 孫皆奴日期:加* 年了月 以日摘要線性代數(shù)是現(xiàn)代數(shù)學(xué)的重要組成部分,它被廣泛地應(yīng)用于自然科學(xué)和社會科學(xué)中
5、。 隨著線性代數(shù)研究的不斷深入,以線性代數(shù)式為線索的數(shù)學(xué)公式檢索需求量不斷增加, 現(xiàn)有的檢索技術(shù)和搜索引擎理論與方法面臨挑戰(zhàn)。較普通數(shù)學(xué)公式而言,線性代數(shù)式的結(jié)構(gòu)更為復(fù)雜,語法、語義更加豐富,實(shí)現(xiàn)其 檢索并將結(jié)果合理排序更加困難。針對此問題,本文對線性代數(shù)式檢索模型中的檢索結(jié) 果排序問題展開研究。首先,通過對線性代數(shù)式特點(diǎn)的分析,在定義線性代數(shù)式查詢模式的基礎(chǔ)上,歸納 總結(jié)了線性代數(shù)式的結(jié)構(gòu)、符號、語法、語義等方面特征。其次,利用猶豫模糊集相關(guān)知識,從整體和局部兩個角度出發(fā),定義線性代數(shù)式的 猶豫模糊相似度評價(jià)屬性及其相應(yīng)的隸屬度函數(shù),建立線性代數(shù)式的相似度函數(shù)。最后,將線性代數(shù)式之間的相似度
6、計(jì)算轉(zhuǎn)變成對應(yīng)猶豫模糊集間的相似度計(jì)算,實(shí) 現(xiàn)基于相似度的線性代數(shù)式檢索結(jié)果的排序。通過對6352條公式的實(shí)驗(yàn),證明了該方法能夠?qū)崿F(xiàn)線性代數(shù)式檢索系統(tǒng)結(jié)果數(shù)據(jù) 的有序輸出。關(guān)鍵詞線性代數(shù)式檢索匹配模式猶豫模糊集相似度函數(shù)排序AbstractAbstractLinear algebra is an important part of modern mathematics. It is widely used in natural science and social science. With the deepening of linear algebra research, the mathe
7、matical formulas retrieve requirements for linear algebraic formulas is increasing, the existing retrieval technology and search engine theory and methods are facing challenges.Compared with the general mathematical fbnnulas, the linear algebra formulas have more complex structures and richer syntax
8、 and semantics, so it is more difficult to retrieve them and sort the results in a reasonable order. And aiming at this problem, we study the ranking of retrieval results in linear algebra formulas retrieval model.Firstly, on the basis of defining linear algebraic query mode, the characteristics of
9、linear algebraic structure, symbol, grammar and semantics are summarized by analyzing the characteristics of linear algebraic methodsSecondly, the fuzzy similarity evaluation attributes and their corresponding membership functions and the similarity functions of linear algebra formulas were defined
10、from global and local aspects by using the knowledge of hesitant fiizzy set.Finally, the similarity computation between linear algebraic equations is converted into similarity computation between corresponding hesitant fiizzy sets, and the ranking of linear algebraic retrieval results based on simil
11、arity is achieved.Through the experiment of the 6352 formulas, it is proved that the method can realize the ordered output of the retrieval results of linear algebra formula retrieval system.Keywords Linear algebraic formulas Retrieval Matching modes Hesitant fuzzy sets Similarity function Sorting目錄
12、 TOC o 1-5 h z 第1章引言1研究背景及意義1國內(nèi)外研究現(xiàn)狀11.2.1數(shù)學(xué)表達(dá)式檢索結(jié)果排序研究現(xiàn)狀1 HYPERLINK l bookmark43 o Current Document 1.2.2猶豫模糊集及其應(yīng)用研究現(xiàn)狀4 HYPERLINK l bookmark46 o Current Document 研究內(nèi)容及主要工作6 HYPERLINK l bookmark52 o Current Document 本文的組織結(jié)構(gòu)6 HYPERLINK l bookmark64 o Current Document 第2章線性代數(shù)式解析及特征提取9 HYPERLINK l book
13、mark67 o Current Document 線性代數(shù)式檢索模式9 HYPERLINK l bookmark73 o Current Document 2.2線性代數(shù)式解析13 HYPERLINK l bookmark76 o Current Document 2.3線性代數(shù)式相似特征提取14 HYPERLINK l bookmark84 o Current Document 本章小結(jié)17 HYPERLINK l bookmark87 o Current Document 第3章線性代數(shù)式檢索結(jié)果相似度排序19 HYPERLINK l bookmark90 o Current Docum
14、ent 3.1猶豫模糊集相關(guān)技術(shù)19 HYPERLINK l bookmark99 o Current Document 3.2基于猶豫模糊集的線性代數(shù)式相似度評價(jià)原理20 HYPERLINK l bookmark102 o Current Document 3.3基于猶豫模糊集的線性代數(shù)式相似度評價(jià)流程22 HYPERLINK l bookmark105 o Current Document 3.4線性代數(shù)式相似度評價(jià)23 HYPERLINK l bookmark111 o Current Document 3.4.1線性代數(shù)式相似度評價(jià)局部屬性24 HYPERLINK l bookmark
15、132 o Current Document 3.4.2線性代數(shù)式相似度評價(jià)整體屬性313.4.3線性代數(shù)式猶豫模糊隸屬度函數(shù)定義33 HYPERLINK l bookmark142 o Current Document 3.4.4隸屬度函數(shù)參數(shù)設(shè)置說明38 HYPERLINK l bookmark145 o Current Document 3.5基于猶豫模糊集的線性代數(shù)式相似度計(jì)算39 HYPERLINK l bookmark148 o Current Document 3.6線性代數(shù)式檢索結(jié)果相似度排序算法41 HYPERLINK l bookmark160 o Current Docu
16、ment 3.7本章小結(jié)42 HYPERLINK l bookmark163 o Current Document 第4章實(shí)驗(yàn)結(jié)果與分析43 HYPERLINK l bookmark166 o Current Document 4.1線性代數(shù)式數(shù)據(jù)集構(gòu)建43ill TOC o 1-5 h z HYPERLINK l bookmark169 o Current Document 4.2線性代數(shù)式檢索相似度排序結(jié)果與分析44 HYPERLINK l bookmark172 o Current Document 4.2.1線性代數(shù)式檢索結(jié)果相似度計(jì)算實(shí)例44 HYPERLINK l bookmark
17、175 o Current Document 4.2.2線性代數(shù)式檢索結(jié)果排序算法對比46 HYPERLINK l bookmark178 o Current Document 4.3本章小結(jié)49第5章總結(jié)與展望51工作總結(jié)51 HYPERLINK l bookmark188 o Current Document 后續(xù)工作展望51 HYPERLINK l bookmark194 o Current Document 參考文獻(xiàn)53 HYPERLINK l bookmark242 o Current Document 致謝57 HYPERLINK l bookmark245 o Current D
18、ocument 攻讀學(xué)位期間取得的科研成果58第1章引言1.1研究背景及意義隨著科學(xué)技術(shù)的發(fā)展,科技信息的載體與交流方式日益豐富,人們不再僅僅依靠紙 質(zhì)書籍來獲取所需要的信息,而是更多地通過網(wǎng)絡(luò)和搜索引擎來查詢數(shù)字化資料,這極 大地方便了人們的工作、學(xué)習(xí)與生活,當(dāng)然,也不可避免地存在諸多問題,如:查詢結(jié) 果多而雜亂,甚至有許多與查詢內(nèi)容不相關(guān)的結(jié)果。因此,如何將無關(guān)結(jié)果剔除,返回 給用戶真正需要的信息,成為亟待解決的問題。目前的搜索引擎主要針對的是文本,二維分布的數(shù)學(xué)公式與文本在結(jié)構(gòu)上存在本質(zhì) 差別,而與普通數(shù)學(xué)公式相比,線性代數(shù)式的結(jié)構(gòu)更加復(fù)雜,語法、語義更為豐富,所 以很難通過現(xiàn)有的搜索引
19、擎來查找線性代數(shù)式相關(guān)內(nèi)容。針對數(shù)學(xué)理論及其應(yīng)用的研究 日新月異,人們希望借助搜索引擎輸入數(shù)學(xué)公式來快速查找到相關(guān)內(nèi)容的要求日益迫切, 因此,許多國內(nèi)外專家學(xué)者對數(shù)學(xué)公式檢索理論和技術(shù)進(jìn)行了研究,并提出多種數(shù)學(xué)公 式的檢索模型。當(dāng)大量的檢索結(jié)果呈現(xiàn)在人們眼前時(shí),人們希望將與查找內(nèi)容完全一致或者更相近 的結(jié)果排列到前面,這樣可以避免從雜亂無章的結(jié)果中挑選有用內(nèi)容的過程,縮短查詢 時(shí)間,數(shù)學(xué)公式檢索的情況也是如此。目前,雖然部分?jǐn)?shù)學(xué)公式檢索方法針對數(shù)學(xué)檢索 結(jié)果的排序問題,設(shè)計(jì)了相似度排序算法,但還是存在許多有待解決的問題,尤其是對 成分、結(jié)構(gòu)更為復(fù)雜的線性代數(shù)式而言,還需要有針對性的研究與開發(fā)。
20、本文利用猶豫模糊集相關(guān)知識,提出了一種線性代數(shù)式檢索結(jié)果的相似度排序方法。 從整體和局部兩個層面對線性代數(shù)式進(jìn)行考察,提取其特征值,并構(gòu)造隸屬度函數(shù)用于 將抽象特征數(shù)字化,再根據(jù)猶豫模糊集的距離公式,完成線性代數(shù)式之間相似度計(jì)算, 實(shí)現(xiàn)基于相似度的檢索結(jié)果排序。本論文選題來源于國家自然科學(xué)基金項(xiàng)目(項(xiàng)目批準(zhǔn)號:61375075)和河北省高等 學(xué)校科學(xué)技術(shù)研究重點(diǎn)項(xiàng)目(項(xiàng)目批準(zhǔn)號:ZD2017208; ZD2017209)的部分研究內(nèi)容。1.2國內(nèi)外研究現(xiàn)狀1.2.1數(shù)學(xué)表達(dá)式檢索結(jié)果排序研究現(xiàn)狀目前,對線性代數(shù)式檢索的研究還不夠成熟,缺乏一些針對性的檢索系統(tǒng)的設(shè)計(jì), 而普通數(shù)學(xué)公式檢索系統(tǒng)的開
21、發(fā)日益增多,為線性代數(shù)式檢索系統(tǒng)的研究打下了良好的 基礎(chǔ)?,F(xiàn)有的搜索系統(tǒng)按照實(shí)現(xiàn)方法可分為兩大類。其一是改進(jìn)文本檢索以適應(yīng)數(shù)學(xué)公 式搜索的系統(tǒng),包括:EgoMath、DLMF Search?!?、MathDex、LeActiveMath7_9等。 其二是為數(shù)學(xué)公式專門建立的檢索系統(tǒng),包括:Wikimirs1011 MathWebSearch12-14o檢索結(jié)果排序是否合理是評價(jià)檢索系統(tǒng)優(yōu)劣的重要指標(biāo),而隨著網(wǎng)絡(luò)數(shù)學(xué)資源日益 豐富,用戶進(jìn)行檢索時(shí)往往會返回大量的檢索結(jié)果,正確的排名結(jié)果能夠有效地減少錯 誤證明的嘗試和回溯數(shù),縮短查詢時(shí)間提升工作效率。目前,對線性代數(shù)式檢索結(jié)果 的相似度排序研究還處
22、于起步階段,而一些學(xué)者針對普通數(shù)學(xué)公式的檢索結(jié)果排序提出 了相關(guān)算法。Schellenberg16將數(shù)學(xué)表達(dá)式用五元組(s,n,r, p,b)表示,其中s表示表達(dá)式的當(dāng)前 字符、n表示當(dāng)前字符的相鄰字符、r表示當(dāng)前字符和相鄰字符的位置關(guān)系、p表示當(dāng) 前字符所處層次、b表示表達(dá)式中子表達(dá)式的層次變化。利用距離公式計(jì)算表示待查詢 表達(dá)式和結(jié)果表達(dá)式的五元組的距離,得出它們的相似度,完成排序。Kamali和Tompa提出了一種面向Presentation MathML格式的數(shù)學(xué)表達(dá)式的結(jié)構(gòu) 相似度的檢索方法,首先把各種形式的數(shù)學(xué)表達(dá)式歸一化成該格式,之后利用“樹編輯 距離”來計(jì)算待查詢表達(dá)式與結(jié)果表
23、達(dá)式之間的相似度,實(shí)現(xiàn)對檢索結(jié)果表達(dá)式的相似 度排序。Zhang和Youssef】針對MathML格式的數(shù)學(xué)表達(dá)式設(shè)計(jì)了一種檢索結(jié)果相似度排 序方法,該方法利用MathML解析樹表示數(shù)學(xué)表達(dá)式,建立其索引結(jié)構(gòu),并定義五個評 價(jià)特征:“數(shù)據(jù)類型層級”、“查詢覆蓋度”、“公式/表達(dá)式”、“匹配深度”、“函數(shù)分類距 離”,再根據(jù)這些特征值遞歸進(jìn)行待查詢表達(dá)式和結(jié)果表達(dá)式的相似距離計(jì)算,得出它 們之間的相似度,并依據(jù)該相似度進(jìn)行檢索結(jié)果的相關(guān)排序。Nguye等人NO設(shè)計(jì)并實(shí)現(xiàn)了數(shù)學(xué)公式檢索系統(tǒng)MASE和Lattice-based Math Searcho 前者應(yīng)用空間向量進(jìn)行數(shù)學(xué)公式的檢索操作,在進(jìn)行
24、數(shù)學(xué)公式特征提取后采用被動攻擊 的在線學(xué)習(xí)分類模型對檢索結(jié)果進(jìn)行排序。后者把不同形式的數(shù)學(xué)公式統(tǒng)一成MathML 格式,在此基礎(chǔ)上進(jìn)行特征提取形成數(shù)學(xué)概念格,并在概念格中實(shí)現(xiàn)數(shù)學(xué)公式的相似度 排序。Hu等人【I?!扛倪M(jìn)了 TF-ID算法并將其應(yīng)用于數(shù)學(xué)公式檢索結(jié)果排序上,將表達(dá)式歸 一化成樹的形式,并將節(jié)點(diǎn)所在層次作為評價(jià)指標(biāo),計(jì)算每個節(jié)點(diǎn)出現(xiàn)的頻率和倒排公 式的頻率,由此得出表達(dá)式間的相似度,完成檢索結(jié)果表達(dá)式的相似度排序。LinUM等 人改進(jìn)了該方法,引入了檢索結(jié)果式包含待查詢式的相同節(jié)點(diǎn)個數(shù)占待查詢式節(jié)點(diǎn)總數(shù) 的比例這一評價(jià)指標(biāo),使排序結(jié)果更加合理化。徐艷霞21提出了一種基于CAS的面向
25、數(shù)學(xué)搜索的排序算法,將TF-IDF算法進(jìn)行 改進(jìn),考慮了數(shù)學(xué)公式間的相關(guān)度和子公式的權(quán)重因素來計(jì)算待查詢公式與檢索結(jié)果式 的相似度,并以此進(jìn)行檢索結(jié)果的相似度排序,該算法中將數(shù)學(xué)公式之間的關(guān)系分為四 種:等價(jià)、代數(shù)相關(guān)、完全相同和無關(guān),并為前三種關(guān)系設(shè)計(jì)針對性的相似度計(jì)算方法。 這一方法為處理數(shù)學(xué)公式的語義智能識別與搜索問題提供了新的思路,提高了系統(tǒng)搜索 的全面性和準(zhǔn)確性。馬惠娟HI設(shè)計(jì)并實(shí)現(xiàn)了 “基于CAS的數(shù)學(xué)搜索引擎索引方法”,利用抽象倒排樹索 引結(jié)構(gòu)建立索引,在建立索引時(shí),采用加權(quán)算法Ro】構(gòu)造數(shù)學(xué)公式及其所在文檔的權(quán)值矩 陣。最后利用優(yōu)化排序和快速排序兩種方法對數(shù)學(xué)表達(dá)式進(jìn)行相似度計(jì)
26、算,并將結(jié)果表 達(dá)式進(jìn)行排序返回給用戶。景珂囚對數(shù)學(xué)搜索引擎進(jìn)行研究,提出了 content索引和Presentation索引兩種索 引機(jī)制,并針對兩種索引機(jī)制提出了不同的檢索結(jié)果排序算法。在Content索引機(jī)制中, 建立數(shù)學(xué)公式查詢樹,并定義節(jié)點(diǎn)N-grams長度、節(jié)點(diǎn)深度和節(jié)點(diǎn)復(fù)雜度特征為每個節(jié) 點(diǎn)賦予權(quán)重,通過權(quán)重值實(shí)現(xiàn)數(shù)學(xué)表達(dá)式的排序。在Presentation索引機(jī)制中,采用 N-grams倒排索引以實(shí)現(xiàn)結(jié)果表達(dá)式的合理排序。高良才、湯幟等人將分層思維應(yīng)用到數(shù)學(xué)公式相似度排序上,設(shè)計(jì)并實(shí)現(xiàn)了 WikiMirs系統(tǒng)。以數(shù)學(xué)公式樹原型為提取層次特征的模型基礎(chǔ),提取其層次信息用于相 似度
27、計(jì)算,從空間和文本兩個維度上考察公式間的相似性,完成相關(guān)檢索。文獻(xiàn)24提出了一種數(shù)學(xué)表達(dá)式檢索結(jié)果相關(guān)排序算法,定義數(shù)學(xué)表達(dá)式評價(jià)屬性 及其相應(yīng)的隸屬度函數(shù),利用猶豫模糊集構(gòu)造數(shù)學(xué)表達(dá)式相似度計(jì)算公式,將提取數(shù)學(xué) 表達(dá)式特征值帶入其中以得出帶查詢數(shù)學(xué)表達(dá)式與檢索結(jié)果集中表達(dá)式的相似度,實(shí)現(xiàn) 了數(shù)學(xué)公式間的相似度排序?,F(xiàn)有的數(shù)學(xué)檢索原型系統(tǒng)也在數(shù)學(xué)表達(dá)式檢索的相似度排序上進(jìn)行了研究,設(shè)計(jì)或 改進(jìn)了一些排序算法,以求反饋給用戶合理的排序結(jié)果。MathWebSearch12-14在數(shù)學(xué)公式檢索結(jié)果相似度排序上采用標(biāo)準(zhǔn)的TF-IDF算法來 計(jì)算查詢內(nèi)容與結(jié)果文檔的相似度,以便把結(jié)果文檔按其與檢索內(nèi)容的
28、相關(guān)性大小劃分 等級,完成相似度排序。MathDex6依據(jù)待查詢式與文件語法的相似度進(jìn)行相關(guān)排序。將待查詢式與檢索結(jié) 果式的匹配程度和待查詢式在文檔中的位置作為評價(jià)指標(biāo),首先記錄檢索結(jié)果集中的所 有公式及其子公式的出現(xiàn)頻率,并采用N-grams方法進(jìn)行數(shù)學(xué)公式匹配,再為待查詢公 式的位置信息分配權(quán)重。DLMF Search5采用針對數(shù)學(xué)公式特點(diǎn)改進(jìn)的TF-IDF算法進(jìn)行檢索結(jié)果的相似度 排序,按照運(yùn)算符的重要性大于運(yùn)算數(shù)來分配分配權(quán)重,得到較為準(zhǔn)確的排序結(jié)果,但 它的本質(zhì)沒有改變,其檢索原理仍然是針對文本的。以上方法為線性代數(shù)式檢索結(jié)果排序提供了思路。由于線性代數(shù)式的結(jié)構(gòu)、語法和 語義的復(fù)雜性
29、,選擇合理的理論及模型,多視角研究線性代數(shù)式的特征,才能完成線性 代數(shù)式檢索結(jié)果的相似度排序。1.2.2猶豫模糊集及其應(yīng)用研究現(xiàn)狀模糊集因決策問題而產(chǎn)生,由ZadehW在1965年首次提出,之后它的幾種擴(kuò)展形 式直覺模糊集I、模糊多重集等也相繼被提出,但它們并不能對所有決策問題進(jìn)行 有效的表述,例如:不確定性決策問題,于是Torra27于2010年提出了猶豫模糊集的概 念,用多個可能值集合的形式來表示某一對象隸屬于模糊集的程度,有效地刻畫了決策 中的不確定性。由于猶豫模糊集在處理不確定性問題上的優(yōu)勢,國內(nèi)外專家學(xué)者對猶豫模糊集進(jìn)行 了更加深刻地研究并將其應(yīng)用到更多的決策性問題上。朱斌等人即提出
30、對偶猶豫模糊集的概念,用可能隸屬度和可能非隸屬度的形式來表 示對決策問題的猶豫度,使決策結(jié)果更加精準(zhǔn)。陳樹偉等人2刃擴(kuò)展了猶豫模糊集,考慮到區(qū)間值的特性與優(yōu)勢,定義了區(qū)間值猶豫 模糊集的概念以及它的運(yùn)算法則等內(nèi)容,為后續(xù)的區(qū)間值猶豫模糊集的聚合算子、相應(yīng) 的決策方法等研究奠定了基礎(chǔ)。李春梅等人3對區(qū)間值猶豫模糊集進(jìn)行了研究,并將其應(yīng)用于用戶聚類領(lǐng)域中,利 用嫡權(quán)重公式計(jì)算出未知的屬性權(quán)重值,最后結(jié)合相關(guān)算法得到最終的分類結(jié)果以實(shí)現(xiàn) 群推薦。吳婉瑩等人DI將區(qū)間值與對偶猶豫模糊集進(jìn)行結(jié)合,提出了區(qū)間值對偶猶豫模糊集 這一全新的概念,并且定義了其相關(guān)系數(shù)的計(jì)算公式,巧妙地解決了屬性權(quán)重部分未知 的
31、模糊多屬性群決策問題。戰(zhàn)秋艷等人3幻改進(jìn)了區(qū)間值猶豫模糊集,重新定義其距離公式和相彳以度計(jì)算公式, 并提出猶豫度理論,在該理論中同時(shí)考慮了猶豫區(qū)間數(shù)量和端點(diǎn)值兩個方面的不同,通 過實(shí)例分析對其合理性進(jìn)行了證明。趙曉冬等人閔對區(qū)間值猶豫模糊集和Heronian平均算子進(jìn)行研究,提出了一種結(jié) 合兩者特點(diǎn)的多屬性決策方法,定義了四類算子并對其性質(zhì)進(jìn)行詳細(xì)說明,有效的利用 Heronian平均算子處理屬性間關(guān)系的優(yōu)勢,使決策效果得以優(yōu)化。劉衛(wèi)鋒和何霞目4將畢達(dá)哥拉斯模糊集融入到猶豫模糊集理論中,充分利用了這兩種 集合各自的優(yōu)勢,給出了畢達(dá)哥拉斯猶豫模糊集的定義與運(yùn)算規(guī)則,為處理多屬性的模 糊決策問題提
32、供了一種創(chuàng)新性的方法。彭定洪和聶軍的對Tversky相似性模型進(jìn)行了改進(jìn),面向猶豫模糊集,提出了一種 全新的相似度測度函數(shù),解決了傳統(tǒng)原始測度不能全面處理原始數(shù)據(jù)的問題,該函數(shù)借 助差異化系數(shù)賦值,得到多組結(jié)果來進(jìn)行比較,提高了系統(tǒng)的準(zhǔn)確性。Babitha和JohnW將猶豫模糊集和軟集相結(jié)合,提出了猶豫模糊軟集理論,該理論 中給出了交運(yùn)算、補(bǔ)運(yùn)算等基本運(yùn)算的定義,開辟了解決多屬性決策問題的新方法。吳良剛和周賽軍印在此基礎(chǔ)上擴(kuò)展了猶豫模糊軟集理論,對集結(jié)算子及相應(yīng)的運(yùn)算 法則進(jìn)行了研究并給出了具體的定義,并通過實(shí)例證明了這些集結(jié)算子在處理多種的領(lǐng) 域中的多屬性決策問題時(shí)存在顯著優(yōu)勢,豐富了猶豫模
33、糊軟集理論。周小強(qiáng)網(wǎng)也對猶豫模糊集和軟集進(jìn)行了研究,提出了廣義直覺模糊軟集等一系列概 念和相應(yīng)的運(yùn)算規(guī)則,研究了幾種決策算子在群決策中的應(yīng)用,證明了猶豫模糊軟集的 優(yōu)勢。王新鑫等人提出了一種基于專家打分法的猶豫模糊多屬性群決策方法,利用猶豫 模糊決策矩陣的擴(kuò)充和聚合來評價(jià)各種決策方案,以便選出最優(yōu)解決方法。陳秀明等人4對直覺猶豫模糊集進(jìn)行了研究,為了增加其在群推薦中的適用性,提 出了相關(guān)系數(shù)概念并給出聚類算法,并借助于電影推薦的實(shí)例分析并證明了該方法切實(shí) 可行。安景文等人41將猶豫模糊集理論應(yīng)用到安全事故應(yīng)急預(yù)案的評估上,并從內(nèi)容的周 詳程度、編制的合法程度、應(yīng)用的科學(xué)程度、操作的難易程度,費(fèi)
34、用的精簡程度五個方 面進(jìn)行測評,再利用猶豫模糊集的相關(guān)知識進(jìn)行相似度求解,選出準(zhǔn)確度更高的應(yīng)急預(yù) 案。謝海研究了猶豫模糊集和傳統(tǒng)集合之間的關(guān)聯(lián)性和差異性,為了使這兩類集合得 以溝通,針對猶豫模糊集和猶豫模糊關(guān)系分別提出了截集和截關(guān)系兩個概念,為后續(xù)的 猶豫模糊集理論的研究奠定了更加穩(wěn)固的基礎(chǔ)。上述研究豐富了猶豫模糊集理論,并將猶豫模糊集應(yīng)用到了多屬性決策問題的求解 上,這為將猶豫模糊集理論應(yīng)用于線性代數(shù)式檢索結(jié)果的相似度排序這一同屬于多屬性 決策的問題奠定了基礎(chǔ)。1.3研究內(nèi)容及主要工作由于線性代數(shù)式由多個子式構(gòu)成,與普通數(shù)學(xué)公式相比,它的結(jié)構(gòu)、語法和語義更 加復(fù)雜,實(shí)現(xiàn)其檢索結(jié)果的相似度排序
35、的難度更大,因此,本文綜合考察了線性代數(shù)式 的各個方面的特點(diǎn),利用猶豫模糊集知識,設(shè)計(jì)了相關(guān)的排序算法,完成針對線性代數(shù) 式檢索結(jié)果的相似度排序。論文主要研究內(nèi)容包括:設(shè)計(jì)線性代數(shù)式解析算法。針對線性代數(shù)式的特點(diǎn),將文獻(xiàn)43設(shè)計(jì)的FDS (Formula Description Structure)數(shù)學(xué)公式解析算法進(jìn)行改進(jìn),并利用改進(jìn)后的算法對線性代數(shù)式的特征進(jìn)行提取。分析線性代數(shù)式的屬性特征,包括:結(jié)構(gòu)、語法和語義三個方面。設(shè)計(jì)評價(jià) 屬性和與之相對應(yīng)的評價(jià)標(biāo)準(zhǔn),并針對每一個評價(jià)標(biāo)準(zhǔn)設(shè)計(jì)相應(yīng)的隸屬度函數(shù)。設(shè)計(jì)面向線性代數(shù)式的檢索結(jié)果排序算法。梳理線性代數(shù)式檢索結(jié)果相似度 排序流程,將猶豫模糊集
36、理論應(yīng)用到線性代數(shù)式之間的相似度計(jì)算上,實(shí)現(xiàn)面向線性代 數(shù)式的檢索結(jié)果的相似度排序。1.4本文的組織結(jié)構(gòu)本文基于現(xiàn)有的數(shù)學(xué)表達(dá)式檢索系統(tǒng),研究線性代數(shù)式檢索結(jié)果的排序問題。論文 總共分五章:第1章引言。介紹數(shù)學(xué)表達(dá)式檢索的研究背景及意義,國內(nèi)外對數(shù)學(xué)表達(dá)式檢索結(jié) 果排序的研究現(xiàn)狀,以及猶豫模糊集及其應(yīng)用的研究現(xiàn)狀。第2章線性代數(shù)式解析及特征提取。主要介紹了線性代數(shù)式的三種匹配模式,針對 線性代數(shù)式改進(jìn)的解析算法,以及利用該算法進(jìn)行特征提取的相關(guān)過程。第3章線性代數(shù)式檢索結(jié)果相似度排序。主要介紹猶豫模糊集相關(guān)技術(shù),基于猶豫 模糊集的線性代數(shù)式相似度評價(jià)原理及流程,線性代數(shù)式相似度評價(jià)屬性和與之相
37、對應(yīng) 的隸屬度函數(shù)的設(shè)計(jì),利用猶豫模糊集進(jìn)行線性代數(shù)式相似度計(jì)算,并依據(jù)該結(jié)果進(jìn)行 線性代數(shù)式檢索結(jié)果的相似度排序,以及線性代數(shù)式檢索結(jié)果相似度排序算法的設(shè)計(jì)。第4章實(shí)驗(yàn)結(jié)果與分析。介紹線性代數(shù)式數(shù)據(jù)集的構(gòu)建以及線性代數(shù)式檢索結(jié)果相 似度計(jì)算實(shí)例分析與結(jié)果對比。第5章總結(jié)與展望。將本文的主要工作進(jìn)行總結(jié),分析其中的不足之處,確定后續(xù) 研究的目標(biāo),提出建議和展望。第2章 線性代數(shù)式解析及特征提取線性代數(shù)式的解析和特征提取是線性代數(shù)式相似度評價(jià)的基礎(chǔ),其合理性和全面性 影響著線性代數(shù)式相似度評價(jià)的優(yōu)劣程度,所以要應(yīng)用恰當(dāng)?shù)慕馕鏊惴▽⒕€性代數(shù)式進(jìn) 行全面的解析,然后把提取到的線性代數(shù)式的特征值應(yīng)用于
38、線性代數(shù)式相似度評價(jià)之中, 從而實(shí)現(xiàn)線性代數(shù)式檢索結(jié)果的有序輸出。2.1線性代數(shù)式檢索模式線性代數(shù)式的種類較多,包括矩陣、行列式和方程組等,不同種類的線性代數(shù)式的 變形和計(jì)算也十分豐富,因此在設(shè)計(jì)線性代數(shù)式的檢索系統(tǒng)時(shí),要從用戶的實(shí)際需求出 發(fā),把它們區(qū)分開來,設(shè)計(jì)不同的線性代數(shù)式匹配模式,有針對性的將待查詢式歸于某 一類檢索模式,再與數(shù)據(jù)庫中的線性代數(shù)式進(jìn)行合理的匹配,以得到用戶最為需要的檢 索結(jié)果。定義1線性代數(shù)式中按照行列規(guī)則排列的、既相互獨(dú)立又有聯(lián)系的子表達(dá)式稱為 線性代數(shù)式的子式。各類線性代數(shù)式的子式舉例如表1所示。表1各類線性代數(shù)式的子式線性代數(shù)式種類行列式矩陣方程組0、實(shí)例11
39、anb.aux + arx =t。篁+ a22x2 =線性代數(shù)式的子式“224,i + anx2 = bx,+= b、定義2 Eq為一個m行列的線性代數(shù)查詢式,Eq(i,j)(i=l, 2, m; j=l, 2, n) 為其子式,耳q (t=l, 2,人)為檢索結(jié)果集合中的)個/行d列線性代數(shù)式,Erq (k,l)(k=l, 2, c; /=1, 2, d)為其子式。本文改進(jìn)了數(shù)學(xué)表達(dá)式檢索系統(tǒng)中的子式匹配模式,針對不同種類的線性代數(shù)式設(shè) 計(jì)了三種檢索模式,分別為:矩陣匹配模式、行列式匹配模式、方程組匹配模式。其中,矩陣匹配結(jié)果中除包含與待查詢矩陣精確一致或部分子式包含待查詢矩陣的子式的矩 陣
40、外,還包括逆矩陣變換、增廣矩陣變換和轉(zhuǎn)置變換等矩陣形式,在進(jìn)行檢索結(jié)果的相 似度測評時(shí),將待查詢矩陣的這些變型形式作為評價(jià)因子;同理,在行列式匹配中將待 查詢行列式的轉(zhuǎn)置變型和值作為相似度的評價(jià)因子;方程組匹配僅實(shí)現(xiàn)子式匹配的功能。x y不同種類的線性代數(shù)式進(jìn)行不同的模式匹配時(shí),均遵循行優(yōu)先原則,以= ”、x + 1 yEr=”為例,按行優(yōu)先原則進(jìn)行模式匹配的流程圖如圖1所示。x+ j x步驟一-1步驟二1步驟一步驟二x + l yx yx+ y X7y xtt步驟三步驟四11x + yt步驟三步驟四1_=1,步驟一步驟二+1x + 1 yy x1x + y x步驟一步驟二Vx + 1 y步驟
41、三1_步驟四_1Lx+ y xf t步驟三步驟四圖i行優(yōu)先原則匹配流程圖圖1中,由左向右最先將待查詢線性代數(shù)式的第一行的各列子式同數(shù)據(jù)庫中線性代 數(shù)式的由左向右、從上至下的每一個子式進(jìn)行匹配,直至檢索結(jié)果集中的所有線性代數(shù) 式的所有子式全部匹配完成,再按相同原則匹配待查詢線性代數(shù)式的下一行的各列子式, 直至最后一行的最后一列子式同數(shù)據(jù)庫中所有線性代數(shù)式的子式匹配完成,則匹配過程 結(jié)束。子式匹配:將用戶輸入的待查詢線性代數(shù)式與的子式Eq(i,j)和檢索結(jié)果集中的線 性代數(shù)式凡的子式E/k,l)看做獨(dú)立的數(shù)學(xué)公式,按行優(yōu)先原則遞歸地將Eq(i,j)同E叫(k,l)進(jìn)行包含匹配,即要求Eq(i,j)
42、 = q (k,l)或者Eq(i,j)是 (k,l)的一部分,若包 含匹配成功,就把耳q伙,/)所對應(yīng)的Eg歸入到最終的檢索結(jié)果,子式匹配原理如圖2 所示。(3)遞歸匹配每一個子公式包含匹配相似度計(jì)算整合結(jié)果Eq的子公式 數(shù)據(jù)集 子結(jié)果集 檢索結(jié)果遞歸匹配每_個子公式1圖2子式匹配原理圖矩陣匹配:在子式匹配的基礎(chǔ)上,將檢索結(jié)果集中加入待查詢矩陣的轉(zhuǎn)置矩陣、逆 矩陣、增廣矩陣和伴隨矩陣,因?yàn)槟婢仃嚭桶殡S矩陣的所有子式可能不包含原矩陣的任 何子式,這樣就會導(dǎo)致子式匹配失敗,即檢索結(jié)果集中不會出現(xiàn)待查詢矩陣的逆矩陣和 伴隨矩陣,顯然這樣的結(jié)果是不合理的。為了能夠達(dá)到用戶滿意的效果,將這些矩陣的 變換
43、形式作為一個評價(jià)屬性,設(shè)置其相應(yīng)的隸屬度函數(shù),完成矩陣匹配。1 2 3 一例如:待查詢線性代數(shù)式與為“”,它的逆矩陣為“ 2 2 2 ”,3 2 32 32 2 ”子式相同也不是其子式的一部2_22 3分,這樣就會導(dǎo)致包含匹配失敗,但二者在邏輯上是互為逆矩陣的,這樣就會造成檢索 結(jié)果存在偏差,因此有必要將矩陣的變換形式作為一個評價(jià)屬性,應(yīng)用于矩陣間的相似 度評價(jià)。行列式匹配:與矩陣匹配類似,考慮到行列式之間的邏輯相似性,將行列式變換形 式和行列式的值分別作為評價(jià)屬性,并為它們設(shè)置相應(yīng)的隸屬度函數(shù),使行列式匹配的 檢索結(jié)果更加合理,這里的行列式變換主要考慮的是待查詢行列式的轉(zhuǎn)置形式。例如:待查詢
44、行列式與為4 5 6 ”,檢索結(jié)果集中的兩個行列式分別為7 8 91 2 31 4 7% =”4 5 6”和 =”2 5 87 8 03 6 9!1雖然氏和,有8個子式相同且相同子式位置完 q icii1 2 31 4 7全一致,而與和耳中僅有3個相同子式的位置一致,但“4 5 6和“2 5 87 8 93 6 9在邏輯上互為轉(zhuǎn)置,所以在行列式變換評價(jià)標(biāo)準(zhǔn)上,我們認(rèn)為與和耳q更相似。相反,如 果不考慮該屬性就會造成檢索結(jié)果的查準(zhǔn)率下降,因此將行列式的變換形式作為行列式 間相似度評價(jià)時(shí)的一個評價(jià)屬性是十分合理的。方程組匹配:方程組匹配等同于子式匹配,其原理與子式匹配的原理完全相同,就 是將包含待
45、查詢方程組的一個或多個子式的數(shù)據(jù)庫中的方程組返回給用戶,完成方程組 匹配。例如:待查詢方程組為數(shù)據(jù)庫中某一方程組為 q 3x+),= 7x +),= 3% =匕3x + y = 7,因?yàn)閨中包含與與相同的子式,所以將Erqi納入到檢索結(jié)果集中。 、z = 52.2線性代數(shù)式解析本文主要針對LaTeX形式的線性代數(shù)式進(jìn)行研究,在文獻(xiàn)43提出的數(shù)學(xué)表達(dá)式解 析算法基礎(chǔ)上做了改進(jìn),將其解析成改進(jìn)的FDS (Fonnula Description Structure)結(jié)構(gòu), 存儲組成線性代數(shù)式的每個子式包含的所有符號nodeexp,長度length,層次level,是 否為運(yùn)算符/數(shù)operate,標(biāo)
46、志位flag,起始位starloc,位置信息/M(包含行號s_line和 列號s_colu兩部分信息),并且存儲線性代數(shù)式的整體屬性特征,包括:矩陣變換信息 mx_vart,行列式變換信息行列式等值信息djkey,規(guī)模信息size (包含行數(shù)line 和列數(shù)co/”兩部分信息),相同子式數(shù)量信息same_s,便于對線性代數(shù)式進(jìn)行特征提 取。文獻(xiàn)43中FDS結(jié)構(gòu)將標(biāo)志位分為8種,分別為:右鄰水平、上部、右上標(biāo)、右下 標(biāo)、下部、內(nèi)部、左上標(biāo)、左下標(biāo),分別用“0, 1, 2, 4, 5, 6, 7, 8”這8個數(shù)字進(jìn) 行表示。針對線性代數(shù)式,規(guī)定每行的第一個子式的主基線的標(biāo)志位為6,其中1=1,2,
47、., 表示其所在行號,每行的非第一個子式的主基線的標(biāo)志位為0。以矩陣“ 2”為例,對改進(jìn)后的標(biāo)志位信息的標(biāo)注規(guī)則進(jìn)行說明。ya + aL 2 J“白”位于第一行第一列,則分?jǐn)?shù)線“的必宓值為61,而“ b2 -4a 位于第一行第二列,則它的位于主基線的符號的flag值為0, “插位于第二行第一列,所以根號“”的/Zag值為62,而 + a ”位于第二行第二列,則它的位2于主基線的符號-,+g”的伽g值為0。線性代數(shù)式的子式主基線以外層次的數(shù)學(xué)符號按照文獻(xiàn)43的規(guī)定來標(biāo)記flag值。J +屏-2ya1+ a2”的每個子式的所有符號的標(biāo)志位值如圖3所示。flag1flag=6-flag=Oflag=
48、62 查詢線性代數(shù)式的子式總數(shù),執(zhí)行(4),否則執(zhí)行(3);(3)查詢線性代數(shù)式的子式信息表,并對包含查詢線性代數(shù)式子式的數(shù)據(jù)庫中的 子式進(jìn)行解析,將解析結(jié)果存入LatList表中,否則執(zhí)行(2);(4)查詢線性代數(shù)式信息表,并根據(jù)suid找到對應(yīng)線性代數(shù)式,對該線性代數(shù)式 進(jìn)行解析,并將特征存入表OatList中;(5)算法終止。其中,數(shù)據(jù)表LaExp、SuExp OatList LatList所包含的具體的列屬性的名稱、含 義以及各表之間的關(guān)系如圖4所示。假設(shè)用戶輸入的待查詢線性代數(shù)式與為“a + by/2+bb1 4ac1i+12”,檢索結(jié)果集中某一LaExpSuExp4expid線性代
49、數(shù)式切expid線性代數(shù)式汨fname文件名稱suid子式idexpstrLaTeX字符串sustr子式LaTeX串OatListLatListexpid線性代數(shù)式Zdsuid子式idline行數(shù)nodeid節(jié)點(diǎn)汨colu列數(shù)sjine子式行號mx_yart矩陣變換s_colu子式列號dt_yart行列式變換length長度信息dt_key行列式的值leve層次信息same_su相同子式個數(shù)starloc起始位置信息flag標(biāo)志位信息operate運(yùn)算符/數(shù)weight運(yùn)算符/數(shù)權(quán)重圖4數(shù)據(jù)表列屬性含義關(guān)系圖a + b + c-2-1+ a2”。在對鳥(1,1) = % +尹進(jìn)行包含匹配時(shí),J
50、屏-4。? 線性代數(shù)式Eg為 J/ +屏a +b +c其LaTeX字符串 firaca+b+c2 ”被替換為垢(1,2) = ”竺三”匹配成功,“ frac ( (substitute+c 2 。a +b + c提取到的,的子式知(1,2)= ”一-”的特征信息包含的內(nèi)容有:“a+b”在“生中的層次信息、標(biāo)志位信息、位置信息(行號和列號)、運(yùn)算數(shù)/符信息, 2具體信息如表2所示。表2結(jié)果子式特征信息表nodeexpfracsubstitute+c2level01111operate10100flag01115line11111colu22222當(dāng)烏的四個子式同耳的每個子式均匹配完成后,再對耳進(jìn)
51、行整體特征提取,提 取的內(nèi)容包括:的矩陣變換信息、行列式變換信息、行列式的值信息、規(guī)模信息(行 數(shù)和列數(shù))、相同子式數(shù)量信息,得到的結(jié)果線性代數(shù)式凡也的整體特征信息表如表3 所示。表3結(jié)果線性代數(shù)式整體特征信息表mx_yartdt_yartdtjkeysizesame_susjines_colu0002212.4本章小結(jié)本章對線性代數(shù)式的匹配模式、線性代數(shù)式的解析及其特征提取進(jìn)行了研究。將線 性代數(shù)式的種類加以區(qū)分,有針對性地設(shè)計(jì)了矩陣匹配、行列式匹配和方程組匹配三種 匹配模式,改進(jìn)了數(shù)學(xué)表達(dá)式的解析算法,使其滿足線性代數(shù)式的解析要求,從整體和 局部兩個方面提取線性代數(shù)式的特征,形成特征信息表
52、,為后續(xù)的相似度計(jì)算提供數(shù)據(jù) 基礎(chǔ)。第3章線性代數(shù)式檢索結(jié)果相似度排序線性代數(shù)式種類豐富、特征復(fù)雜,計(jì)算數(shù)據(jù)集中線性代數(shù)式與待查詢線性代數(shù)式之 間的相似度,并依此對檢索結(jié)果進(jìn)行排序十分困難,考慮到猶豫模糊集在處理多隸屬度 決策問題上的優(yōu)勢,在全面提取線性代數(shù)式結(jié)構(gòu)、語法、語義等特征的基礎(chǔ)上,建立線 性代數(shù)式特征集合,利用猶豫模糊集相關(guān)理論求解線性代數(shù)式之間的相似度,使排序結(jié) 果更加合理、準(zhǔn)確。3.1猶豫模糊集相關(guān)技術(shù)猶豫模糊集27定義為:設(shè)X是一個非空集合,則稱E = x&X(1)為猶豫模糊集,其中如3)稱為猶豫模糊元素,它是元素X對于集合已的幾個可能 的隸屬度的集合,其元素值在0,1上分布2
53、7】。在進(jìn)行決策問題分析時(shí),通常采用計(jì)算距離相似性測度的方法,該方法存在諸多優(yōu) 勢,如可以方便的獲取兩個方案的差距或者相似性,常見的標(biāo)準(zhǔn)距離測度有:標(biāo)準(zhǔn)漢明 距離、標(biāo)準(zhǔn)歐幾里得距離、Hausdorff距離等。文獻(xiàn)44中猶豫模糊集的距離測度被定義為:設(shè)肱和N為關(guān)于集合X =氣,易,.,琳的兩個猶豫模糊集,則肱和N之間的距離 測度為表示為d(M,N),且滿足下面的條件:0d(M,N)l;d(肱,N)=0,當(dāng)且僅當(dāng)M =N時(shí)成立;d(M,N) = d(N,M)。相似性測度網(wǎng)被定義為:設(shè)肱和N為關(guān)于集合X =*,&,,吒的兩個猶豫模糊集,則肱和N之間的相似 性測度為s(M,N),且滿足下面的條件:0s
54、(M,N)0,羅仃)0)為M對應(yīng)中第/大的猶豫模糊元素值,同理 噂 g 為N對應(yīng)中第,大的猶豫模糊元素值,/, =max(ZM(x),/A,(x)表示垢0)和 勾(改)中元素個數(shù)最大值44】。M和N的相似度網(wǎng)表示為s(M,N) = l-dM,N)(3)式中,s(M,N)為猶豫模糊集肱和N的相似度。3.2基于猶豫模糊集的線性代數(shù)式相似度評價(jià)原理與多屬性決策問題類似,在利用猶豫模糊集原理解決線性代數(shù)式相似度評價(jià)問題時(shí), 首先,要全面考察線性代數(shù)式的多方面特征,設(shè)計(jì)相應(yīng)的評價(jià)屬性,并為每個屬性給出 一組評價(jià)標(biāo)準(zhǔn);其次,要為每個評價(jià)標(biāo)準(zhǔn)構(gòu)造與之相對應(yīng)的隸屬度函數(shù),將特征值帶入 得出其隸屬度值,形成猶豫
55、模糊集合;最后,應(yīng)用相似度距離公式,計(jì)算猶豫模糊集合 間的距離,從而得出線性代數(shù)式間的最終的相似度。在進(jìn)行線性代數(shù)式相似度評價(jià)時(shí),烏和凡均為LaTeX字符串形式,利用2.2節(jié)提 出的改進(jìn)的線性代數(shù)式解析算法將它們進(jìn)行解析,并將結(jié)果保存于數(shù)據(jù)庫中。線性代數(shù) 式的評價(jià)屬性采用雙層屬性形式,如圖5所示。雙層屬性模式能夠從多個角度對線性代 數(shù)式的特征進(jìn)行考察,提升了線性代數(shù)相似度評價(jià)的全面性。線性代數(shù)式的雙層評價(jià)屬 性的詳細(xì)介紹如下所示。一級屬性為局部屬性,用集合形式表示為耳,念,包括:線性代數(shù)式的結(jié) 構(gòu)屬性,運(yùn)算數(shù)屬性和運(yùn)算符屬性等。其中,涵蓋了 Eq(i,j)和耳% Q,/)所處的位置(即 該子式
56、位于第幾行第幾列),Eq(i,j)處于EI(h(k,l)的起始位置,Eq(i,j)在耳% (/J)中所處 層次,在Erq (k,l)中的Eq(i,j)與上一層次符號的相對位置關(guān)系(標(biāo)志位信息),Eq(i,j)和 E/k,l)的長度,各個字符是否為運(yùn)算數(shù)或運(yùn)算符等信息。二級屬性為整體屬性,用集 合形式表示為An+1,Am+2,.,A,包括:線性代數(shù)式的規(guī)模屬性(即線性代數(shù)式是幾行 幾列),線性代數(shù)式包含相同子式數(shù)量屬性,線性代數(shù)式的變換屬性(矩陣變換和行列 式變換)等。每個評價(jià)屬性均包含一組評價(jià)標(biāo)準(zhǔn),每個評價(jià)標(biāo)準(zhǔn)對應(yīng)一個隸屬度函數(shù),即每個局 部評價(jià)屬性包含的評價(jià)標(biāo)準(zhǔn),用集合形式表示為indpi,
57、indp2,.ndps,其中 p = (m為局部屬性總數(shù)),相應(yīng)的隸屬度函數(shù)用集合形式表示為 右1,2,,右3。每個整體評價(jià)屬性包含的評價(jià)標(biāo)準(zhǔn),用集合形式表示為 ind,indind,其中0 = m + l,m + 2,.,(秫為局部屬性總數(shù),為評價(jià)屬性總 數(shù)),相應(yīng)的隸屬度函數(shù)用集合形式表示為/例,兒2,,扁3。將提取到的局部屬性特征值帶入相應(yīng)的隸屬度函數(shù)得到局部屬性隸屬度值。同理將 提取到的整體屬性特征值帶入其隸屬度函數(shù)得到整體屬性隸屬度值?;讵q豫模糊集的線性代數(shù)式評價(jià)原理圖如圖5所示。提取特征值代入隸屬度函數(shù)評價(jià)屬性!=評價(jià)標(biāo)準(zhǔn)集I=猶豫模糊集hf圖5線性代數(shù)式評價(jià)原理圖3.3基于猶豫
58、模糊集的線性代數(shù)式相似度評價(jià)流程猶豫模糊集可以用多個可能值集合的形式來表示某一對象隸屬于該模糊集的程度, 這樣就能更好解決多屬性決策問題。所以要全面且合理地選擇決策問題的屬性,再針對 不同屬性設(shè)置相應(yīng)的評價(jià)標(biāo)準(zhǔn)才能得出較為準(zhǔn)確的結(jié)果,線性代數(shù)式相似度評價(jià)過程也 是如此。對線性代數(shù)式進(jìn)行相似度評價(jià)的流程分為特征提取、隸屬度計(jì)算、相似度計(jì)算等三 個步驟。具體的評價(jià)流程如下:步驟1:按每個屬性所對應(yīng)的屬性評價(jià)標(biāo)準(zhǔn)進(jìn)行特征提取,按先后順序分別提取出 取出線性代數(shù)式的局部屬性特征值和整體屬性特征值。步驟2:將提取的局部屬性特征值和整體屬性特征值帶入相應(yīng)的隸屬度函數(shù)進(jìn)行計(jì) 算,形成如圖5所示的局部屬性猶豫
59、模糊集和整體屬性猶豫模糊集。步驟3:根據(jù)針對線性代數(shù)式變型的廣義猶豫模糊集標(biāo)準(zhǔn)距離公式,計(jì)算各類猶豫 模糊集之間的距離,得到待評價(jià)線性代數(shù)式間的相似度完成排序?;讵q豫模糊集的線性代數(shù)式評價(jià)流程圖如圖6所示。圖6線性代數(shù)式評價(jià)流程圖3.4線性代數(shù)式相似度評價(jià)相似度評價(jià)是否合理與特征的選取以及隸屬度函數(shù)的構(gòu)造密切相關(guān),所以在進(jìn)行線 性代數(shù)式相似度評價(jià)時(shí),要綜合考慮其各方面的特征,全面地對線性代數(shù)式的各個特征 1 ax 2進(jìn)行刻畫。例如,線性代數(shù)式的子式的位置特征,“,c ”和“ c ”都含有子式“2”,b 23 ),但“2”位于“”的第二行第二列,位于“”的第一行第二列,即它在兩個線性代數(shù)式中所
60、處的位置不同,在考察它們與待查詢線性代數(shù)式的相似度時(shí)要考慮到子 式的位置關(guān)系;線性代數(shù)式的規(guī)模特征,例如:2x2矩陣和3x3矩陣,二者的規(guī)模不同, 影響著它們與待查詢線性代數(shù)式的相似程度。本文將線性代數(shù)式屬性特征歸納為兩部分,分別是局部屬性特征和整體屬性特征。 其中,局部屬性特征包括結(jié)構(gòu)屬性、運(yùn)算數(shù)屬性、運(yùn)算符屬性,整體屬性包括矩陣變換 屬性、行列式變換屬性、行列式的值屬性、規(guī)模屬性、相同子式數(shù)量屬性。每個評價(jià)屬 性分別包含一個或多個評價(jià)標(biāo)準(zhǔn),不同的檢索模式評價(jià)標(biāo)準(zhǔn)不同,將個別屬性設(shè)置為1 來表示該屬性值對該匹配模式的相似度評價(jià)沒有影響,如表4所示。表4線性代數(shù)式評價(jià)屬性表屬性種類評價(jià)屬性評價(jià)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度砂石料開采與環(huán)境保護(hù)合作協(xié)議3篇
- 二零二五年度個人消費(fèi)分期貸款質(zhì)押擔(dān)保合同書2篇
- 2025版鐵路貨運(yùn)特點(diǎn)與業(yè)務(wù)流程規(guī)范合同3篇
- 香煙店衛(wèi)生標(biāo)準(zhǔn)規(guī)范
- 二零二五年度高??蒲谐晒D(zhuǎn)化委托實(shí)施協(xié)議3篇
- 2025版環(huán)保設(shè)備維修與改造承包協(xié)議書2篇
- 二零二五版學(xué)生頂崗實(shí)習(xí)實(shí)習(xí)單位實(shí)習(xí)教育與培訓(xùn)合作協(xié)議3篇
- 二零二五年大學(xué)食堂食品安全保障協(xié)議范本3篇
- 二零二五版新風(fēng)機(jī)銷售與技術(shù)支持合作合同2篇
- 二零二五年度個人二手房交易房屋租賃續(xù)約合同
- (正式版)FZ∕T 80014-2024 潔凈室服裝 通 用技術(shù)規(guī)范
- 剪映專業(yè)版:PC端短視頻制作(全彩慕課版) 課件 第3章 短視頻剪輯快速入門
- 湖南省長沙市開福區(qū)青竹湖湘一外國語學(xué)校2023-2024學(xué)年九年級下學(xué)期一模歷史試題
- 風(fēng)電場事故案例分析
- 八年級上冊-2024年中考?xì)v史總復(fù)習(xí)核心考點(diǎn)與重難點(diǎn)(部編版)
- 醫(yī)院科室人才建設(shè)規(guī)劃方案
- 護(hù)理飲食指導(dǎo)整改措施及方案
- 全國大學(xué)生英語競賽詞匯大綱
- 胸外科手術(shù)圍手術(shù)期處理
- 《企業(yè)管理課件:團(tuán)隊(duì)管理知識點(diǎn)詳解PPT》
- 配網(wǎng)設(shè)備缺陷分類及管理重點(diǎn)標(biāo)準(zhǔn)
評論
0/150
提交評論