【畢業(yè)學位論文】基于 SOM 的專利可視化方法研究_第1頁
【畢業(yè)學位論文】基于 SOM 的專利可視化方法研究_第2頁
【畢業(yè)學位論文】基于 SOM 的專利可視化方法研究_第3頁
【畢業(yè)學位論文】基于 SOM 的專利可視化方法研究_第4頁
【畢業(yè)學位論文】基于 SOM 的專利可視化方法研究_第5頁
已閱讀5頁,還剩68頁未讀, 繼續(xù)免費閱讀

【畢業(yè)學位論文】基于 SOM 的專利可視化方法研究.pdf 免費下載

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

北京理工大學碩士學位論文 I 摘要 專利情報作為重要的信息資源,如果加以合理利用就可以提供相關的技術、經(jīng)濟、市場和法律等方面信息,從而為企業(yè)決策提供依據(jù)。近年來,新技術的不斷涌現(xiàn)、技術更新?lián)Q代頻率的加劇,以及對于知識產(chǎn)權問題的日益重視,都促使專利信息以前所未有的速度迅猛增長。然而與信息的快速增長所不和諧的是專利分析方法的發(fā)展并不盡人意。 本論文以法為基礎開展信息可視化的相關技術研究,嘗試使用信息可視化、數(shù)據(jù)挖掘等技術手段進行專利信息的挖掘,從而提高專利分析水平,進一步發(fā)覺潛在信息。 本文根據(jù)專利信息本身的特點,提出了基于時結合專利信息本身特點對其可以更好地挖掘隱含信息,然后通過中國專利信息的集成電路封裝技術領域數(shù)據(jù)進行驗證;接著本文根據(jù)作者提出的可視化圖形生成原則,設計了可視化圖形生成算法,并采用等高線圖譜將挖掘的信息展現(xiàn)出來。最后本文對集成電路封裝技術領域開展實證研究,在實證中對本文提出的模型和可視化算法全部進行了驗證和分析。 關鍵詞 專利情報,視化數(shù)據(jù)挖掘、可視化模型 北京理工大學碩士學位論文 as an if it be it be as a of at a in of up of on to s of is is OM to a on We as to of to of we a OM of we by C on of a a At a C in be of 北京理工大學碩士學位論文 錄 摘要. . 1 . 1 究意義. 3 . 4 究方法. 4 究難點. 4 文結構及安排. 5 2 相關理論研究. 7 . 7 利情報分析的意義. 7 利分析流程. 8 于. 9 利情報可視化方法綜述. 11 息可視化. 11 利信息可視化可行性研究. 13 . 15 3基于. 18 . 18 . 20 章小結. 23 4可視化模型研究. 24 據(jù)處理方法研究. 24 據(jù)準備. 24 據(jù)預處理. 27 視化訓練集的生成. 28 視化結果實現(xiàn). 28 . 29 視化圖譜二維坐標計算. 30 視化圖譜設計原則. 31 . 32 章小結. 37 5 實證分析:集成電路封裝技術可視化挖掘. 38 證分析背景介紹. 38 成電路封裝技術介紹. 38 取集成電路封裝技術的意義. 38 據(jù)獲取. 39 北京理工大學碩士學位論文 數(shù)據(jù)源選擇. 39 利信息獲取與存儲. 39 據(jù)預處理. 40 據(jù)清洗. 40 性轉換. 41 據(jù)庫整合. 41 練集生成. 42 家層面. 43 業(yè)層面. 44 據(jù)歸一化. 44 . 47 家層面分析. 47 業(yè)層面分析. 53 . 58 章小結. 61 6 總結與展望. 62 文的研究意義. 62 文的創(chuàng)新點. 62 一步工作. 62 致謝. 63 攻讀碩士期間發(fā)表的學術論文. 64 參考文獻:. 65 北京理工大學碩士學位論文 V 圖目錄 圖1- 1 2維10*10節(jié)點的專利主題局部地形視圖.1- 2基于.1- 3 論文框架.2- 1專利分析流程.2- 2可視化挖掘流程.3- 1 .3- 2基于.3- 3可視化流程設計.4- 1 數(shù)據(jù)監(jiān)測、集成流程.4- 2 中國專利信息網(wǎng)絡數(shù)據(jù).4- 3法律狀態(tài)信息網(wǎng)絡數(shù)據(jù).4- 4基于.4- 5六邊形.4- 6 .4- 7可視化效果圖.5- 1數(shù)據(jù)整合.5- 2未處理指標單位帶來的影響.5- 3前十高產(chǎn)國家/地區(qū)專利申請年份分布.5- 4專利國家分布圖.5- 5高產(chǎn)國家維持年份分析圖.5- 6 .5- 7國家層面的四象限圖.5- 8 封裝技術中國專利申請人.5- 9 .5- 10公司間聚類分析.5- 11 層次聚類冰柱圖.5- 12 國家層面聚類分析樹形圖.5- 13 企業(yè)層面聚類分析樹形圖.京理工大學碩士學位論文 目錄 表格5- 1中國專利數(shù)據(jù)庫設計.格5- 2 擴展的屬性.格5- 3國家領域訓練集生成原則.格5- 4 前十高產(chǎn)國家/地區(qū)專利申請數(shù)量分布表.格5- 5 前十家高產(chǎn)機構申請專利分布表.格5- 6公司.格5- 7國家層次聚類的結果分析.格5- 8國家層次聚類的結果分析.京理工大學碩士學位論文 1 1)專利信息作為情報資源日益重要。 隨著經(jīng)濟的全球化發(fā)展,我國企業(yè)將面臨著來自國內(nèi)外的競爭壓力。知己知彼,百戰(zhàn)不殆,企業(yè)只有明確自身的地位和作用才能獲得競爭的主動權。在此情況下,許多大公司、企業(yè)都在不斷調(diào)整自己的技術路線1,重點關注高新技術的專利信息作用。 專利情報作為重要的信息資源,如果加以合理利用就可以提供相關的技術信息、經(jīng)濟信息、市場信息和法律信息,作為企業(yè)決策的依據(jù)。 (2)專利信息增長迅速,分析方法體系并不完善。 隨著新技術的不斷涌現(xiàn)、技術更新?lián)Q代頻率的加劇,以及對于知識產(chǎn)權問題的日益重視,專利的申請數(shù)量每年都在遞增。僅2006年申請專利數(shù)就為357899件,2007年則申請為50223件。如何利用好這些龐大的資源,挖掘出企業(yè)所需的信息一直備受關注。 然后目前專利數(shù)據(jù)庫豐富的同時,分析手段和決策支持的功能表現(xiàn)不足,對現(xiàn)有信息的利用不足,不能很好的發(fā)掘出數(shù)據(jù)的內(nèi)在聯(lián)系。以往的方法主要是建立在統(tǒng)計分析基礎上。在專利數(shù)據(jù)到信息,情報和知識轉化不足;沒有動態(tài)更新的技術識別能力;關鍵技術,競爭技術,輔助技術等技術識別方法欠缺。 (3)目前專利分析中所面臨的主要問題 在日益激烈的競爭中,為了獲取競爭的主動權,企業(yè)必須明確自身在競爭環(huán)境中所處的地位與狀態(tài)。反映在專利信息領域,人們的期望就不僅僅不停留在對專利表面信息的挖掘上。為了制定更加合理的專利戰(zhàn)略上,企業(yè)需要對其在某領域的專利地位,以及競爭對手的狀況有詳細的認識。但是目前的專利分析方法對專利品質(zhì)分類方面的挖掘并不完善,并不能滿足企業(yè)對其的需求。 因此本文旨在結合實驗室目前的專利數(shù)據(jù)庫現(xiàn)狀,從可視化的特點出發(fā),對專利信息進行挖掘、揭示和說明,彌補傳統(tǒng)分析方面的缺陷。 (4)信息可視化技術的研究現(xiàn)狀 可視化技術(利用計算機圖形學和圖像處理技術,將數(shù)據(jù)轉換成圖形或圖像在屏幕上顯示出來,并進行交互處理的理論、方法和技術10。人們獲取北京理工大學碩士學位論文 2 和處理信息的效果與信息的展現(xiàn)方式密切相關。有人做過試驗,如果把大量的數(shù)據(jù)排列成易于辨認的圖案,人們可以在瞬間理解數(shù)億比特的信息,大大提高了人們的認知率。這也說明信息只有通過有效的展現(xiàn)才能發(fā)揮他的本來意義9。 國內(nèi)外的學者在可視化技術應用于科技信息知識發(fā)現(xiàn)方面做了大量的研究,陳超美1999年在“A 中提出一種語義為中心的信息可視化方法,通過對個人文獻集合以語義為中心的方法集中揭示信息空間的內(nèi)在聯(lián)系。在“中提出一種基于虛擬現(xiàn)實表達語義結構的知識管理系統(tǒng)。 2001年“a s 出并實現(xiàn)了通過科技文獻抽取模式進行作者引文分析,利用計算機圖形技術將分析結果繪制為3與印第安納大學的文中對包括降維技術、聚類分析與空間配置等在內(nèi)的可視化關鍵技術做了系統(tǒng)的闡述。俄克拉何馬州立大學電子與計算機工程系a 中提出一種據(jù)庫信息可視化與分析系統(tǒng),針對科技預測對文獻和專利信息進行二維的可視化,該系統(tǒng)的過程模型是:獲取文獻、繪制文獻圖、聚類分析、關系挖掘和生成總結與趨勢表達。美國亞里桑那大學的黃贊等2003年在“中運用內(nèi)容圖譜分析和引文網(wǎng)絡分析等技術對納米領域的專利進行分析并進行可視化表達。法國of a of 文中著重闡述了神經(jīng)網(wǎng)絡方法在科學技術信息圖譜中的應用,并將基于神經(jīng)網(wǎng)絡的復合自組織工具應用于信息分析和復合圖形表達。如圖1朱東華與of 中指出科技信息管理的關鍵在于獲取大量數(shù)據(jù)、快速處理和有效的結果表達,并在“中對信息可視化在技術機會分析和技術預測中的應用做了深入的研究。 北京理工大學碩士學位論文 3 圖1- 1 2維10*10節(jié)點的專利主題局部地形視圖 究意義 目前對專利的分析主要是集中在數(shù)理統(tǒng)計分析基礎之上,結合專利分析方法的調(diào)研結合以往專利分析工作的經(jīng)驗,發(fā)現(xiàn)在現(xiàn)在的專利分析方法中,主要采用的方法有: 傳統(tǒng)的統(tǒng)計方法 計量分析方法 技術生命周期分析法 技術矩陣分析法 引證分析法 關聯(lián)分析法 這些方法對專利信息進行的挖掘。但是這些方法卻有著固有的缺陷:在專利數(shù)據(jù)到信息,情報和知識轉化不足;沒有動態(tài)更新的技術識別能力;關鍵技術,競爭技術,輔助技術等技術識別方法欠缺等。 特別是在對技術組群的識別中,在對競爭技術的分析過程中缺乏有效的判定方式。在技術組群識別中,我們常采用關聯(lián)和引用網(wǎng)絡分析,但是這些方法本身是有其不可避免的缺陷的。關聯(lián)分析法受分詞準確與否的影響較大,但是目前存在的分詞算法對于某些科技術語的抽取還是比較薄弱;引用分析受制于其引用專利的給出,在目前我們所得的專利數(shù)據(jù)庫中只有美國專利對引用給出了比較詳細的描述,這就限制了其對其他專利數(shù)據(jù)的利用,再次基于引用構造的技術組群更多的反應了技術的一個演變形式,對于相似技術的一個競爭合作關系并沒有描述。 因此,在這種前提要,就需要我們來找尋另一種有效方式來填充其分析的空白。而通過對以提高專利分析的效率和正確性,北京理工大學碩士學位論文 4 提高知識的準確性和可理解性;可以幫助企業(yè)理解和分析專利技術的之間的相互關系,以獲得本行業(yè)或本企業(yè)的技術策略、技術熱點領域、技術競爭態(tài)勢、競爭企業(yè)情況等情報內(nèi)容,為自身的決策提供十分重要的輔助參考,具有重大的研究和實用意義。 論文的主要內(nèi)容是,通過利用到大量專利情報背后隱藏的重要規(guī)律,獲得企業(yè)或行業(yè)中專利技術策略、技術實力和技術特點等專利情報信息,以起到輔助決策的作用,如圖1圖1- 2基于體研究內(nèi)容有:對特定數(shù)據(jù)源專利數(shù)據(jù)的獲取及預處理;視化模型的設計和實現(xiàn);以及某一領域的專利實證分析。 究方法 本論文主要從科學技術角度,結合定性和定量分析方法,利用宏觀和微觀層面對專利信息進行獲取、分析、可視化和評價。在已有模型基礎上對結果進行分析,得出無法從大量專利數(shù)據(jù)中直觀得到的信息。 在實證方面,以集成電路的封裝技術領域為例,結合北京理工大學知識發(fā)現(xiàn)與數(shù)據(jù)分析實驗室專利分析平臺的前期研究成果,集成獲取該領域中專利信息,利用專利信息進行深層次的挖掘。 究難點 北京理工大學碩士學位論文 5 專利數(shù)據(jù)的格式化和標準化。基于于直接使用,所以必須進行格式化和標準化統(tǒng)一,并集成到專利數(shù)據(jù)庫中,最后形成合理規(guī)范的業(yè)務數(shù)據(jù)集;同時,由于學習網(wǎng)絡30,輸入層的選擇可以說對結果的產(chǎn)生具有非常重要的影響。因此,輸入層變量的選擇問題將是本次研究中的要點難點。 專業(yè)知識的淡化,規(guī)律的凸現(xiàn)。因為本研究旨在為企業(yè)、機構,或相關政府部門提供輔助決策的信息,然而專利的基礎知識比較復雜和繁多,因此挖掘后的結果展示和分析應該盡量通俗易懂,簡潔明了,所以必須考慮到對專利專業(yè)知識的淡化處理,而著重凸出規(guī)律性的結論。 由于本課題綜合了目前先進的信息技術和專利技術進行探索性研究工作,所以在研究不斷深入的過程必然會出現(xiàn)更多的潛在問題,對這些問題的有效解決也將成為本課題的重要研究內(nèi)容。 文結構及安排 圖1- 3 論文框架 本論文主要從理論層面、方法層面和應用層面進行了劃分。前兩個部分主要來探北京理工大學碩士學位論文 6 討基于術及以模型的探討研究,最后一部分通過實證應用來驗證方法的可行性。 第一部分,理論層面的研究,也即論文緒論的介紹。主要介紹了論文的選擇依據(jù)以及研究意義;著眼于信息可視化技術以及專利情報分析領域的發(fā)展情況,提出論文的研究方法以及研究過程中的難點與重點。最后對論文研究提出簡要框架。 第二部分,方法層面的研究,這也是整個論文的核心。通過對以往的專利分析工作的優(yōu)缺點的比較,以及針對以往工作的不足,為了更好地利用專利情報挖掘隱含信息,本文提出了“基于然后在整體模型的基礎上,對成了論文的整個方法體系。 最后,實證分析,將已有模型應用到集成電路封裝技術領域,對得到的結果進行分析,來驗證本模型的正確性以及合理性。北京理工大學碩士學位論文 7 2 相關理論研究 發(fā)明、實用新型或外觀設計向果務院專利行政部門提出專利申請,經(jīng)依法審查合格后,向專利申請人授予的在規(guī)定的時間內(nèi)對該項發(fā)明創(chuàng)造享有的專有權3。 然而企業(yè)在專利申請上并不是一味的盲目7,會從市場、競爭前景、技術等方面進行考慮。也及在市場方面:它必須具有市場價值,也即企業(yè)需要通過從中來獲得經(jīng)濟效益;競爭因素:如果與同類技術相比并不具有優(yōu)勢,形成不了足夠強大的市場,那么也沒有必要申請專利;技術因素:主要考慮該項技術創(chuàng)造仿制程度的難易。綜上可知,專利情報是一種重要的信息,通過它可以獲得相關技術、經(jīng)濟、市場方面的信息。本論文的可視化技術也是建立在專利的基礎上的。 利情報分析的意義 今天的社會是信息激增的社會。僅近三十年來的科學技術成果就超過以往人類歷史兩千年成果的總和。國外有的學者把信息同能源和材料并稱為今日社會進步的三大技術支柱,把當今的社會稱之為“情報社會”。以情報信息為對象,對其內(nèi)容進行識別、整理、分析、綜合、選擇、推薦或加工出新的信息來服務于社會創(chuàng)造活動,這便是廣義情報研究的任務3。情報研究是以當代科學技術的新成就為主要對象。判斷這些成就的價值,發(fā)現(xiàn)問題啟發(fā)思路,預告未來,提出建議。 文獻情報研究是情報學的重要內(nèi)容,屬于情報服務中的高層次活動。它既包括文獻研究,又在一定程度上涉及可行性分析和科學預測等領域6。文獻情報研究作為一個以大量收集各種有關文獻情報信息,經(jīng)過加工、分析而提出有針對性的研究報告這樣一種研究工作,與生產(chǎn)、科研、經(jīng)濟、政治等活動也有著非常密切的聯(lián)系。毫無疑間,隨著我國政治、經(jīng)濟、文化的發(fā)展,文獻情報分析研究必將受到社會各界愈來愈大的重視,它的發(fā)展前景是十分廣泛闊的。 北京理工大學碩士學位論文 8 利分析流程 考慮到研究領域的不同、分析的目、要求不同,因此在研究過程中信息收集的范圍,所采用的方法,以及最后結果的呈現(xiàn)方式都大相徑庭。但是所有研究工作的分析流程都是大同小異的,具體圖2圖2- 1專利分析流程 (1) 針對分析工作的目的,首先確定監(jiān)測需求,初步選取監(jiān)測對象。利用下

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論