開題報告-空間聚類_第1頁
開題報告-空間聚類_第2頁
開題報告-空間聚類_第3頁
開題報告-空間聚類_第4頁
開題報告-空間聚類_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

各位博士、碩士、工程碩士碩士:為做好學(xué)位論文選題及開題匯報工作,在填寫背面的《碩士學(xué)位論文開題匯報登記表》前,請認(rèn)真閱讀下文《有關(guān)碩士學(xué)位論文選題及開題匯報的規(guī)定》。登記表僅作為開題匯報的格式,所留的空格不夠時請自行加頁。根據(jù)《中華人民共和國學(xué)位條例暫行實行措施》中“碩士學(xué)位論文開題、答辯一般應(yīng)公開舉行,保密專業(yè)除外”的規(guī)定,我院研制了“碩士學(xué)位論文開題、答辯網(wǎng)上公告系統(tǒng)”,現(xiàn)已上網(wǎng)運行。請全體碩士注意在張貼開題、答辯布告的同步,使用此系統(tǒng)。從1月1日起開題、答辯的碩士都須在網(wǎng)上公告,否則開題及答辯無效。在完畢表格中的論證內(nèi)容、導(dǎo)師簽訂意見、通過評議組專家評議、教研室以及院系簽訂意見后,請將《登記表》用A4紙打印1份,碩士生、工程碩士生請?zhí)峤唤o所在院系碩士秘書,博士生請?zhí)峤唤o碩士院學(xué)位辦(從9月開始規(guī)定博士生到設(shè)在校圖書館的查新站對開題匯報進(jìn)行查新工作,故請同步提交查新成果1份)。有關(guān)碩士學(xué)位論文選題及開題匯報的規(guī)定碩士學(xué)位論文工作是碩士培養(yǎng)的重要環(huán)節(jié)和重要內(nèi)容。學(xué)位論文是碩士尤其是博士生學(xué)術(shù)水平和科研成果的集中體現(xiàn),是衡量碩士培養(yǎng)質(zhì)量和水平的重要標(biāo)志之一,而做好學(xué)位論文選題和開題匯報又是完畢學(xué)位論文的前提和基礎(chǔ)。因此,為了切實保證碩士的學(xué)位論文質(zhì)量,做好學(xué)位論文選題及論文開題匯報是十分必要的。一、學(xué)位論文選題選題是學(xué)位論文成敗的關(guān)鍵。因此規(guī)定導(dǎo)師、導(dǎo)師組及碩士本人要十分重視選題工作。碩士應(yīng)在大量閱讀文獻(xiàn)、資料和充足調(diào)查研究的基礎(chǔ)上進(jìn)行選題。(一)博士學(xué)位論文選題規(guī)定到達(dá)前沿性、交叉性、急需性、實用性、創(chuàng)新性、可行性。詳細(xì)規(guī)定如下:1.選題必須具有學(xué)科的前沿性;2.在選題上要注意學(xué)科間的互相交叉滲透;3.選題要重視國家急需處理的重大課題;4.選題要重視實用性,要面向國民經(jīng)濟的主戰(zhàn)場;5.選題的指導(dǎo)思想、技術(shù)路線等,必須有創(chuàng)新性,同步還應(yīng)與科學(xué)發(fā)展趨勢相一致;6.選題要考慮到完畢論文的可行性(如:經(jīng)費、試驗儀器、設(shè)備、加工、資料等)。選題不易過大,要可以在規(guī)定的時間內(nèi)完畢學(xué)位論文。(二)碩士學(xué)位論文選題規(guī)定碩士學(xué)位論文選題的內(nèi)容、范圍要合適。目的明確,在理論上和應(yīng)用上要有相稱重要的意義。選題既要面向國民經(jīng)濟建設(shè)的需要,為社會主義建設(shè)服務(wù),同步又是本學(xué)科發(fā)展需要的理論或應(yīng)用研究,要在理論上和應(yīng)用上有相稱重要的意義。盡量與科研任務(wù)掛鉤,使碩士生處理實際問題的能力得到鍛煉,既有助于提高論文的質(zhì)量,增進(jìn)成果轉(zhuǎn)化,又能處理經(jīng)費來源。對自選題應(yīng)采用謹(jǐn)慎態(tài)度,個別自選題必須在看準(zhǔn)方向、目的明確并已具有一定物質(zhì)條件下才能考慮。(三)工程碩士論文選題工程碩士專業(yè)學(xué)位論文選題應(yīng)直接來源于生產(chǎn)實際或具有明確的工程背景,其研究成果要有實際應(yīng)用價值,論文擬處理的問題要有一定的技術(shù)難度和工作量,論文要具有一定的理論深度和先進(jìn)性。詳細(xì)可從如下幾種方面選用:1.技術(shù)攻關(guān)、技術(shù)改造、技術(shù)推廣與應(yīng)用;2.新工藝、新材料、新產(chǎn)品、新設(shè)備的研制與開發(fā);3.引進(jìn)、消化、吸取和應(yīng)用國外先進(jìn)技術(shù)項目;4.應(yīng)用基礎(chǔ)性研究、預(yù)研專題;5.一種較為完整的工程技術(shù)項目或工程管理項目的規(guī)劃或研究;6.工程設(shè)計與實行。二、學(xué)位論文開題匯報及查新開題匯報是對論文選題的科學(xué)性、先進(jìn)性、可行性等的論證,是提高學(xué)位論文質(zhì)量和準(zhǔn)時完畢學(xué)位論文的重要環(huán)節(jié)。各碩士培養(yǎng)單位、碩士導(dǎo)師、導(dǎo)師組和碩士本人必須從思想上予以高度重視,高原則,嚴(yán)規(guī)定,嚴(yán)格遵照本規(guī)定有關(guān)規(guī)定,否則,將不容許碩士進(jìn)入論文階段。(一)開題匯報的準(zhǔn)備工作:1.開題前,碩士必須做較全面深入的調(diào)研工作,并寫出詳細(xì)的調(diào)研匯報。2.碩士必須寫出開題匯報的書面論證材料和學(xué)位論文的工作計劃。3.凡需進(jìn)行論文開題的碩士,應(yīng)從碩士院網(wǎng)頁上下載并填寫《碩士學(xué)位論文開題匯報登記表》。(二)開題匯報的重要內(nèi)容:1.課題的來源、目的和意義;2.選題的國內(nèi)外研究現(xiàn)實狀況、發(fā)展趨勢及存在問題(附重要參照文獻(xiàn));3.選題研究目的、研究內(nèi)容和擬處理的關(guān)鍵問題;4.?dāng)M采用的研究措施、技術(shù)路線、試驗方案及可行性分析(已經(jīng)有的研究工作基礎(chǔ)和研究條件);5.選題的創(chuàng)新點(選題的前沿性、急需性、學(xué)科交叉性、應(yīng)用性等);6.選題研究及論文工作計劃;7.預(yù)期研究成果。(三)對開題匯報的查新工作:博士學(xué)位論文開題匯報完畢后,規(guī)定送交學(xué)?!敖逃靠萍疾樾鹿ぷ髡尽?設(shè)在校圖書館)進(jìn)行查新,并獲得查新成果。碩士學(xué)位論文開題匯報完畢后,鼓勵進(jìn)行查新工作。(四)開題網(wǎng)上公告:凡擬開題的碩士,必須提前1周在碩士院網(wǎng)頁上按規(guī)定的格式進(jìn)行公告。三、對學(xué)位論文開題匯報的管理1.碩士學(xué)位論文的開題匯報由學(xué)位辦負(fù)責(zé)管理,各院(所、部)詳細(xì)組織實行。2.各院(所、部)或教研室應(yīng)構(gòu)成開題匯報評議組對碩士的開題匯報進(jìn)行評議。博士生開題匯報評議組不少于5人,碩士生不少于3人,設(shè)組長1人,導(dǎo)師不能擔(dān)任組長。評議組的職責(zé)是:按照有關(guān)規(guī)定對開題匯報進(jìn)行嚴(yán)格認(rèn)真的評議,堅持高原則、嚴(yán)規(guī)定,對開題匯報提出詳細(xì)評議意見,并給出通過或暫不通過或重新做開題匯報的結(jié)論。3.凡未通過開題匯報,需重新做開題匯報的碩士,應(yīng)根據(jù)評議組意見,進(jìn)行認(rèn)真調(diào)研、充足準(zhǔn)備,在條件成熟時再次做開題匯報,直至通過。4.若未通過開題匯報而自行進(jìn)入學(xué)位論文階段的,碩士院學(xué)位辦將不接受其學(xué)位申請。5.已通過論文開題匯報的碩士,因某種原因更改選題,則需重新開題;若只是在原選題基礎(chǔ)上拓寬或縮小研究范圍,則須向?qū)W位辦提出書面匯報立案。6.碩士開題一般在第三學(xué)期進(jìn)行,但最晚必須在學(xué)位論文答辯前6個月完畢開題工作。7.開題匯報工作結(jié)束后,碩士、工程碩士將《學(xué)位論文開題匯報登記表》(1份)提交各院(所、部)碩士秘書,博士生將《學(xué)位論文開題匯報登記表》(1份)和學(xué)位論文開題匯報查新成果(1份)提交學(xué)位辦。選自《碩士管理工作手冊》(8月第四次修訂版))學(xué)號:10609中國地質(zhì)大學(xué)(武漢)碩士學(xué)位論文開題匯報登記表學(xué)科專業(yè):計算機科學(xué)應(yīng)用技術(shù)論文題目:空間聚類的研究與實現(xiàn)碩士姓名:余艷(碩士)導(dǎo)師姓名:周順平(專家)所在院系:信息工程學(xué)院開題日期:-11-1碩士院制

填表說明一、填表前,請認(rèn)真閱讀學(xué)?!队嘘P(guān)碩士學(xué)位論文選題及開題匯報的規(guī)定》。表中各項內(nèi)容,要實事求是,逐項認(rèn)真填寫。體現(xiàn)要明確、嚴(yán)謹(jǐn)。二、封面中“學(xué)科專業(yè)”請博士生、碩士生嚴(yán)格按規(guī)定的二級學(xué)科、專業(yè)名稱填寫,工程碩士生請將此項改為“工程領(lǐng)域”并填寫規(guī)定的工程領(lǐng)域名稱,工程碩士為雙導(dǎo)師制,故應(yīng)填寫兩位導(dǎo)師姓名。三、填寫表中第一頁“簡表”時:對于“選題類型、選題來源、經(jīng)費來源”三項內(nèi)容,請把各自所選字母填入項目背面的空格中。辨別基礎(chǔ)研究和應(yīng)用研究的重要標(biāo)志:具有特定的實際應(yīng)用目的的研究屬于后者;辨別科學(xué)研究(基礎(chǔ)研究和應(yīng)用研究)與開發(fā)研究的重要標(biāo)志:前者重要是為了增長科學(xué)技術(shù)知識,后者則是為了開辟新的應(yīng)用(如新材料、新技術(shù)、新工藝等)?!罢钡奶顚懻垏?yán)格按所留空格逐格填寫。四、表中第二頁、第三頁、第四頁所列項目是開題匯報的重要內(nèi)容,須逐項、逐條進(jìn)行詳細(xì)論證、填寫,所留空格不夠時,請自行加頁,頁碼按次序編。五、表中第五頁中各意見欄須由有關(guān)人員親筆填寫,不得打印。開題匯報評議小組構(gòu)成規(guī)定:博士生至少5人,碩士生至少3人,每組設(shè)組長1人,且碩士本人的導(dǎo)師不能擔(dān)任組長。六、表格完畢后,請用A4紙裝訂成冊1份,碩士生、工程碩士生交所在院系碩士秘書,同等學(xué)力人員交碩士院學(xué)位辦,博士生交碩士院學(xué)位辦(同步須提交1份查新匯報)。

一、簡表論文題目空間聚類的研究與實現(xiàn)選題類型A.基礎(chǔ)研究B.應(yīng)用研究C.開發(fā)研究D.其他B選題來源A.國家級項目B.省部級項目C.橫向項目D.自選項目C經(jīng)費來源A.課題B.資助C.自籌A碩士姓名余艷性別女學(xué)號導(dǎo)師姓名周順平性別男職稱專家研究內(nèi)容和意義摘要空間數(shù)據(jù)聚類是在一個較大的多維數(shù)據(jù)集中根據(jù)以某種度量為標(biāo)準(zhǔn)的相似性找出簇或稠密區(qū)域。空間統(tǒng)計分析可以從地理空間實體數(shù)據(jù)集中發(fā)現(xiàn)隱含的信息或知識。不同的聚類方法對數(shù)據(jù)的處理效果不一樣。本課題針對空間數(shù)據(jù)的特性選取有代表性的聚類方法實現(xiàn)空間數(shù)據(jù)的最佳聚類分析。主題詞1.主題詞數(shù)量不多于三個;2.主題詞之間空一格(英文用/分隔)中文空間數(shù)據(jù)聚類分析英文spatialdataclusteranalyze注:辨別基礎(chǔ)研究和應(yīng)用研究的重要標(biāo)志:具有特定的實際應(yīng)用目的的研究屬于后者;辨別科學(xué)研究(基礎(chǔ)研究和應(yīng)用研究)與開發(fā)研究的重要標(biāo)志:前者重要是為了增長科學(xué)技術(shù)知識,后者則是為了開辟新的應(yīng)用(如新材料、新技術(shù)、新工藝等)。-1-二、選題根據(jù)1.選題的來源、目的和意義選題的來源:空間數(shù)據(jù)表達(dá)的基本任務(wù),就是將以圖形模擬的空間物體表到達(dá)計算機可以接受的數(shù)字形式。空間數(shù)據(jù)有兩種基本的表達(dá)模型:柵格模型和矢量模型。在柵格模型中,地理空間被劃分為規(guī)則的小單元(像元),空間位置有像元的行、列號表達(dá)。像元的大小反應(yīng)了數(shù)據(jù)的辨別率即精度,空間物體由若干像元隱含描述。矢量模型將地理空間當(dāng)作一種空域,地理要素存在其間。在矢量模型中,各類地理要素根據(jù)其空間形態(tài)特性分為點、線、面三類。在用空間數(shù)據(jù)描述的地理信息中,有時需要根據(jù)某種原則將有用或人們感愛好的數(shù)據(jù)匯集和分類,來發(fā)現(xiàn)地理數(shù)據(jù)中隱含的信息或變化的趨勢。其中,聚類分析是用來研究和分析空間數(shù)據(jù)的首選。聚類分析是人類的一種重要行為。人類就是不停通過改善意識中的聚類模式來識別各類事物的。目前聚類分析已經(jīng)廣泛應(yīng)用于包括模式識別、數(shù)據(jù)分析、圖像處理、市場分析等領(lǐng)域,通過聚類分析,我們能識別密集和稀疏的區(qū)域,進(jìn)而發(fā)現(xiàn)全局的分布模式,以及數(shù)據(jù)屬性之間有趣的互相關(guān)系??臻g數(shù)據(jù)聚類是在一種較大的多維數(shù)據(jù)集中根據(jù)以某種度量為原則的相似性找出簇或稠密區(qū)域,在同一種簇中的對象之間具有較高的相似度,而不一樣簇中的對象差異較大。相異度是根據(jù)描述對象的屬性值來計算的,距離是常常采用的度量方式??臻g聚類對空間物體的集群性進(jìn)行分析,將其分為幾種不一樣的子群(類)。子群的形成是地理系統(tǒng)運作的成果,根據(jù)此可以揭示某種地理機制。此外,子群可以作為其他分析的基礎(chǔ)。例如:公共設(shè)施的建立一般的說是根據(jù)居民點群的分布,而不是詳細(xì)的居民住宅的分布來布置的,因此需要對居民點群進(jìn)行聚類分析以形成若干居民點子群,這樣便于簡化問題,突出重點。目的和意義:空間聚類分析可以從地理空間實體數(shù)據(jù)集中發(fā)現(xiàn)隱含的信息或知識,重要有地理空間實體凝聚的趨勢、分布規(guī)律和變化趨勢等。地理空間實體分布規(guī)律揭示了空間實體的群體定位特性。分布規(guī)律一般用分布密度與均值、分布中心、分布軸線和離散度參數(shù)來描述。空間聚類分析是揭示空間實體的群體定位特性的常用措施之一。地理空間實體發(fā)展變化趨勢是指空間實體的分布形狀與理論擴展形狀的差異特性、空間實體分布形狀隨時間變化的變化特性、空間實體的非空間屬性在2維或3維空間上的變化狀況。空間聚類分析規(guī)定能發(fā)現(xiàn)任意形狀的聚類,將得到的聚類形狀與理論擴展形狀(球形、橢圓形或方形)相比較可以發(fā)現(xiàn)許多故意義的隱含信息。2.選題的國內(nèi)外研究現(xiàn)實狀況、發(fā)展趨勢及存在問題(附重要參照文獻(xiàn))國內(nèi)外研究現(xiàn)實狀況:20世紀(jì)90年代中期,空間聚類重要集中在兩個方面:一是對初期算法的改善,二是開辟新的算法。例如,WaveCluster和DENCLUE等。然而,后期的研究發(fā)現(xiàn),聚類空間數(shù)據(jù)仍然面臨新的問題:(1)處理大量數(shù)據(jù)點;(2)處理高維數(shù)據(jù);(3)處理多噪聲。某些新的技術(shù),如取樣本,濃縮技術(shù)、索引技術(shù)和基于網(wǎng)絡(luò)的技術(shù)逐漸應(yīng)用到聚類中,某些性能較優(yōu)的算法也相繼的提出。重要有CLARANS,DBSCAN,BIRCH,STING,CLIQUE,CURE,OPTICS和CHAMELEON等算法。不過這些算法只能處理其中的一種或兩個問題,并不能處理以上三個問題。近幾年的某些新的研究著眼于對此前算法的深入改善和尋找新的聚類途徑。例如:STING+,MAFIA,OPTIGRID,AMOEBA,COD-CLARANS,DBCLUC,DBRS和DBRS+等,他們開辟了空間聚類的新方向。發(fā)展趨勢:目前聚類分析已經(jīng)廣泛應(yīng)用于包括模式識別、數(shù)據(jù)分析、圖象處理、市場分析等領(lǐng)域,通過聚類分析,我們能識別密集和稀疏的區(qū)域,進(jìn)而發(fā)現(xiàn)全局的分布模式,以及數(shù)據(jù)屬性之間有趣的互相關(guān)系。例如在市場分析中,聚類可以協(xié)助市場分析人員從客戶的基本信息中獲取各類不一樣的顧客群,從而指導(dǎo)市場營銷的方略;在模式識別上,通過聚類可以提取不一樣模式之間的共性特性,然后運用這些特性,用于識別同類模式和不一樣類模式;在生物信息學(xué)中,聚類可以指導(dǎo)生物的分類,可以通過對基因進(jìn)行分類,獲取對不一樣種群生物的特性的認(rèn)識。聚類分析在空間數(shù)據(jù)挖掘、web文檔分類、離群點檢測等方面也發(fā)揮著重要的作用。目前,伴隨人工智能和數(shù)據(jù)挖掘技術(shù)的不停深入,聚類分析得到了不停的發(fā)展,尤其是伴隨多種數(shù)據(jù)源的大量涌現(xiàn),如圖像數(shù)據(jù)、文本數(shù)據(jù)、DNA數(shù)據(jù)、時間序列數(shù)據(jù)、web數(shù)據(jù)等等,對聚類的研究已經(jīng)成為數(shù)據(jù)挖掘領(lǐng)域中一種非?;钴S的研究課題。存在問題:在人工智能和數(shù)據(jù)挖掘中,存在著大量的將數(shù)據(jù)劃分的問題,這些問題常常是沒有先驗知識的,這些問題的處理都需要聚類分析的參與,伴隨大量、不一樣數(shù)據(jù)類型的涌現(xiàn),對聚類分析的能力也提出了挑戰(zhàn)。評價聚類分析的能力重要有六個衡量原則:(1)處理大量數(shù)據(jù)的能力,許多算法在不不小于200個數(shù)據(jù)對象的小數(shù)據(jù)集合上工作很好,不過伴隨數(shù)據(jù)對象的增長,這些聚類算法的處理能力就會下降,因此一種好的聚類措施需要處理大量數(shù)據(jù)集合。(2)處理不一樣類型數(shù)據(jù)的能力,目前的聚類算法一般只是針對某種數(shù)據(jù)類型,不過聚類作為一種分析工具,應(yīng)當(dāng)能為不一樣類型數(shù)據(jù)進(jìn)行分析,從而提供一種較普適的模型。(3)能過發(fā)現(xiàn)任意形狀聚類的能力,許多聚類算法采用歐式距離來決定相似度,這種度量方式趨向于發(fā)現(xiàn)球(超球)簇,而現(xiàn)實種有著大量各類形狀的簇,因此需要聚類可以發(fā)現(xiàn)任意形狀的簇。(4)處理噪聲的能力,現(xiàn)實數(shù)據(jù)不可防止的存在各類噪聲,這些噪聲的出現(xiàn)不應(yīng)當(dāng)對聚類產(chǎn)生較強的影響,不過有些聚類算法對噪聲式敏感的,因此導(dǎo)致了較差的成果。(5)處理高維數(shù)據(jù)的能力,目前的數(shù)據(jù)集合具有各類不一樣屬性,這就使得數(shù)據(jù)處在高維空間中,人們對于三維如下的數(shù)據(jù)聚類狀況可以很好的鑒別聚類成果的好壞,不過在高維狀況下,考慮到數(shù)據(jù)分布也許很稀疏,并且高度傾斜,因此聚類這樣的數(shù)據(jù)對象是一種具有挑戰(zhàn)性的課題。(6)聚類成果的課解釋性,聚類是為分析數(shù)據(jù)服務(wù)的,人們期望通過聚類從數(shù)據(jù)中抽取給出某種特定語義的解釋,也就是聚類的成果應(yīng)當(dāng)是可解釋的、可理解和可用的。參照文獻(xiàn):[1]、《基于網(wǎng)絡(luò)的異常入侵檢測措施》作者:趙衛(wèi)偉,計算機工程與應(yīng)用[2]、《一種區(qū)域型模糊聚類算法》作者:黃曉斌,馬曉巖等,計算機工程與應(yīng)用.21[3]、《用于數(shù)據(jù)挖掘的聚類算法》作者:姜園、張朝陽等,電子信息學(xué)報[4]、《一種基于劃分的動態(tài)聚類算法》作者:萬志華、歐陽為民等,計算機工程與設(shè)計.1[5]、《一種改善的K-means算法》作者:張玉芳、毛嘉莉等,計算機應(yīng)用.8[6]、《一種新的聚類算法:等密度線算法》作者:趙艷廠、謝帆等,北京郵電大學(xué)學(xué)報.6[7]、《Web文檔聚類中K-means算法的改善》作者:王子興、馮志勇,微型機與應(yīng)用[8]、《基于簇中心動態(tài)遷移的一種聚類算法》作者:李麗珊,朱文興,福建農(nóng)林大學(xué)學(xué)報.12[9]、《基于網(wǎng)格距離的聚類算法的設(shè)計、實現(xiàn)和應(yīng)用》作者:田啟明,王麗珍等,計算機應(yīng)用.2[10]、《聚類問題的蟻群算法》作者:崇高等,計算機工程與應(yīng)用.8[11]、《中文文本分類器的設(shè)計》作者:陸建江,張文獻(xiàn),計算機工程與應(yīng)用.15[12]、《使用遺傳算法實現(xiàn)K-means聚類算法的K值選擇》作者:楊芳等,微機發(fā)展.1[13]、《數(shù)據(jù)聚類技術(shù)的研究》作者:張蓉,計算機工程與應(yīng)用,.16[14]、《文本聚類算法的分析與比較》作者:谷波,張永奎,電腦開發(fā)與應(yīng)用,[15]、《面向非球形分布數(shù)據(jù)的自適應(yīng)K近鄰聚類算法》作者:黃曉斌,萬建偉等,計算機工程,.7本欄填寫不下,可加續(xù)頁。-2-三、選題研究方案1.選題研究目的、研究內(nèi)容和擬處理的關(guān)鍵問題研究目的:重要的聚類措施及其聚類能力。選用不一樣的聚類算法對空間數(shù)據(jù)(分為地理數(shù)據(jù)和屬性數(shù)據(jù))聚類。分析聚類成果,找到最優(yōu)的聚類措施。完畢基于大型GIS平臺的空間數(shù)據(jù)聚類的可視化工具。完畢論文1-2篇。研究內(nèi)容:重要的聚類措施。不一樣聚類措施的合用數(shù)據(jù)類型和聚類能力。整頓經(jīng)典的較為完善和成熟的聚類算法以及部分改善了的能力較強的聚類算法。將空間數(shù)據(jù)分為描述實體地理位置的數(shù)據(jù)和屬性數(shù)據(jù)分別選用相對較合適的聚類措施進(jìn)行聚類。對同一空間數(shù)據(jù)選用不一樣的聚類算法比較聚類成果得到最優(yōu)算法。關(guān)鍵問題:不一樣聚類措施的合用數(shù)據(jù)類型和聚類能力。不一樣類型的空間數(shù)據(jù)找到最合適的聚類措施。2.?dāng)M采用的研究措施、技術(shù)路線、試驗方案及可行性分析(已經(jīng)有的研究工作基礎(chǔ)和研究條件)研究措施:由于本課題是面向應(yīng)用的,不僅是面向數(shù)據(jù)庫的簡樸檢索查詢調(diào)用,并且要對這些數(shù)據(jù)進(jìn)行微觀、中觀乃至宏觀的記錄、分析、綜合和推理,以指導(dǎo)實際問題的求解,企圖發(fā)現(xiàn)事件間的互相關(guān)聯(lián),甚至運用已經(jīng)有的數(shù)據(jù)對未來的活動進(jìn)行預(yù)測,因此,我打算從基本入手。首先熟悉基本概念和有關(guān)背景,接著搜集和整頓已經(jīng)有的聚類措施,包括每種聚類措施合用的數(shù)據(jù)類型、聚類能力和聚類效果等,接下來,將空間數(shù)據(jù)分為矢量數(shù)據(jù)和屬性數(shù)據(jù),針對它們不一樣的特性分別選用較為合適的聚類措施進(jìn)行聚類,并比較聚類成果進(jìn)而得到最優(yōu)解,最終,設(shè)計和實現(xiàn)數(shù)據(jù)聚類儀。技術(shù)路線:對空間數(shù)據(jù)的聚類重要分兩類:一類是直接根據(jù)空間目的的幾何數(shù)據(jù)進(jìn)行聚類,其相似性的鑒別原則重要是距離,另一類是對空間目的關(guān)聯(lián)的屬性數(shù)據(jù)進(jìn)行聚類,其措施是將屬性數(shù)據(jù)看作低維或高維的幾何數(shù)據(jù),其相似性的鑒別原則重要是歐氏距離。試驗方案:1、將幾何數(shù)據(jù)用劃分措施、層次措施、基于密度的措施和基于模型的措施中的經(jīng)典聚類算法進(jìn)行聚類,得到的聚類成果均有不理想的地方。2、由于經(jīng)典的聚類措施有其局限性,逐漸引入改善了的聚類措施對幾何數(shù)據(jù)聚類。3、比較用不一樣的聚類措施得到的聚類成果,得到不一樣數(shù)據(jù)的最優(yōu)聚類措施。4、將屬性數(shù)據(jù)當(dāng)作低維或高維的幾何數(shù)據(jù),用幾何數(shù)據(jù)聚類的措施得到最優(yōu)成果??尚行苑治?本課題實現(xiàn)的關(guān)鍵在于聚類相似度的選用和聚類算法思想確實立。幾何數(shù)據(jù)的聚類相似度一般選用歐氏距離,但在將聚類行為看作動態(tài)過程的聚類措施中,歐氏距離不能作為唯一的相似度,這時需要用勢函數(shù)作為鑒別聚類的原則。在用經(jīng)典的劃分措施對數(shù)據(jù)進(jìn)行聚類時,聚類成果對聚類個數(shù)和數(shù)據(jù)輸入的次序敏感,采用動態(tài)聚類算法能很好的處理此問題,在聚類的大小相差懸殊或聚類形狀非凸時,MMC聚類措施能得到較優(yōu)的成果。本欄填寫不下,可加續(xù)頁。-3-3.本選題的創(chuàng)新點(選題的前沿性、急需性、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論