版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
題目:數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告學(xué)院:電子工程學(xué)院專業(yè):智能科學(xué)與技術(shù)學(xué)生姓名:**學(xué)號(hào):02115***?數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告——密度聚類DBSCAN問(wèn)題介紹用DBSCAN的方法對(duì)雙層正方形數(shù)據(jù)和三維同心球數(shù)據(jù)進(jìn)行聚類。其中樣本個(gè)數(shù)為20230,且為均勻分布。算法描述輸入:
espilong—
半徑
MinPts—
給定點(diǎn)在espilong鄰域內(nèi)成為核心對(duì)象的最小領(lǐng)域點(diǎn)數(shù)
data
—
集合輸出:目的類簇集合;聚類數(shù)方法:標(biāo)記所有對(duì)象為unvisited;do隨機(jī)選擇一個(gè)unvisited對(duì)象p;標(biāo)記p為visited;ifp的espilong鄰域至少有MinPts個(gè)對(duì)象創(chuàng)建一個(gè)新簇C令N為p的espilong鄰域中的對(duì)象的集合forN中的每個(gè)點(diǎn)p’ifp’是unvisited標(biāo)記p’為visitedifp’的espilong鄰域至少有MinPts個(gè)對(duì)象把這些對(duì)象添加到N中ifp’還不是任何簇的成員把p’添加到cendforelse標(biāo)記p為噪聲until沒(méi)有標(biāo)記為unvisited的對(duì)象實(shí)驗(yàn)結(jié)果由于考慮到內(nèi)存問(wèn)題,所以這里只取2023個(gè)數(shù)據(jù)雙層正方形數(shù)據(jù)由多次實(shí)驗(yàn)可知epsilong=10MinPts=20三維同心球數(shù)據(jù)由多次實(shí)驗(yàn)可知epsilong=5MinPts=7實(shí)驗(yàn)代碼DBSCAN%%%%%%%%%%DBSCAN%%%%%%%輸入:%dat(yī)a——包含n個(gè)對(duì)象的數(shù)據(jù)集%epsilon——半徑參數(shù)%MinPts——鄰域密度閾值%輸出:%y——基于密度的簇的分類%c——類別數(shù)function[yc]=DBSCAN(data,epsilong,MinPts)num=size(data,1);N=zeros(1,1);c=1;visited=zeros(num,2);dis=zeros(num,num);fori=1:numforj=1:numdis(i,j)=norm(data(i,:)-dat(yī)a(j,:));endendwhile(min(visited(:,1))==0)%隨機(jī)選擇一個(gè)未訪問(wèn)過(guò)的對(duì)象pwhile(1)p=round(num*rand);if(p==0)p=1;endif(visited(p,1)==0)break;endend%標(biāo)記p為visitedvisited(p,1)=1;%判斷p的epsilong鄰域內(nèi)對(duì)象的個(gè)數(shù)[rowcol]=find(dis(p,:)<=epsilong);n=size(col,2);if(n<MinPts)visited(p,2)=-1;%標(biāo)記為噪聲elsevisited(p,2)=c;%為p創(chuàng)建一個(gè)新的簇cN=cat(yī)(2,N,col);%將p的epsilong鄰域內(nèi)的所有對(duì)象放到候選集合N中%迭代的將N中不屬于其它簇的對(duì)象添加到c中while(size(N,2)>1)pp=N(1,2);if(visited(pp,1)==0)visited(pp,1)=1;[prowpcol]=find(dis(pp,:)<=epsilong);nn=size(pcol,2);if(nn>=MinPts)N=cat(2,N,pcol);endendif((visited(pp,2)==0)||(visited(pp,2)==-1))visited(pp,2)=c;endv=size(N,2);N=N(:,2:v);end%簇c生成c=c+1;endendy=visited(:,2);c=c-1;endcreat(yī)data_squareclear;clc;%數(shù)據(jù)生成num=2023;data=zeros(num,2);fori=1:num/2data(i,1)=-50+100*rand;data(i,2)=-50+100*rand;endwhile(i~=num)x=-100+200*rand;y=-100+200*rand;if(x>=-50&&x<=50&&y>=-50&&y<=50)i=i;elsei=i+1;data(i,1)=x;data(i,2)=y;endend%運(yùn)用DBSCAN進(jìn)行聚類epsilong=10;MinPts=20;[yc]=DBSCAN(dat(yī)a,epsilong,MinPts);%結(jié)果顯示disp(sprintf('聚類數(shù)為%d',c));linetype={'r*','b*','g*','k*','y*','c*','r<','k<','b<','g<','y<','c<'};fori=1:numif(y(i,1)~=-1)plot(data(i,1),data(i,2),linetype{y(i,1)});elseplot(data(i,1),data(i,2),linetype{c+1});endholdon;endaxis([-100100-100100]);creatdata_circleclear;clc;%數(shù)據(jù)生成num=2023;data=zeros(num,3);fori=1:num/2rho=50*rand;theta=2*pi*rand;phi=pi*rand;data(i,1)=rho*sin(phi)*cos(theta);data(i,2)=rho*sin(phi)*sin(theta);dat(yī)a(i,3)=rho*cos(phi);endforj=1:num/2i=j+num/2;rho=50+50*rand;theta=2*pi*rand;phi=pi*rand;data(i,1)=rho*sin(phi)*cos(theta);data(i,2)=rho*sin(phi)*sin(theta);data(i,3)=rho*cos(phi);end%運(yùn)用DBSCAN進(jìn)行分類epsilong=5;MinPts=7;[yc]=DBSCAN(data,epsilong,MinPts);%?á1???ê?disp(sprintf('聚類數(shù)為%d',c));linetype={'r*','b*','g*','k*','c*','y*','r<','k<','b<','g<','y<','c<'};fori=1:numif(y(i,1)~=-1)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 農(nóng)副食品采購(gòu)合同
- 2025年西寧晚報(bào)數(shù)字報(bào)刊版權(quán)保護(hù)與維權(quán)合同3篇
- 2025北京市房屋的買賣合同范本
- 二零二五年度鍋爐房運(yùn)營(yíng)維護(hù)外包合同3篇
- 2025年度裝配式建筑小型土建施工合同2篇
- 2025-2030年(全新版)中國(guó)潤(rùn)腸茶行業(yè)競(jìng)爭(zhēng)格局及未來(lái)投資趨勢(shì)分析報(bào)告
- 2025-2030年中國(guó)錫礦石產(chǎn)業(yè)前景展望及投資建議研究報(bào)告
- 2025-2030年中國(guó)鈷礦冶煉產(chǎn)業(yè)市場(chǎng)現(xiàn)狀分析及投資前景規(guī)劃研究報(bào)告
- 2025-2030年中國(guó)金銀花提取物行業(yè)發(fā)展動(dòng)態(tài)及前景規(guī)劃研究報(bào)告
- 2025-2030年中國(guó)連鎖藥店行業(yè)發(fā)展現(xiàn)狀及前景趨勢(shì)分析報(bào)告
- 割接方案的要點(diǎn)、難點(diǎn)及采取的相應(yīng)措施
- 2025年副護(hù)士長(zhǎng)競(jìng)聘演講稿(3篇)
- 2025至2031年中國(guó)臺(tái)式燃?xì)庠钚袠I(yè)投資前景及策略咨詢研究報(bào)告
- 原發(fā)性腎病綜合征護(hù)理
- 第三章第一節(jié)《多變的天氣》說(shuō)課稿2023-2024學(xué)年人教版地理七年級(jí)上冊(cè)
- 2025年中國(guó)電科集團(tuán)春季招聘高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025年度建筑施工現(xiàn)場(chǎng)安全管理合同2篇
- 建筑垃圾回收利用標(biāo)準(zhǔn)方案
- 2024年考研英語(yǔ)一閱讀理解80篇解析
- 樣板間合作協(xié)議
- 福建省廈門市2023-2024學(xué)年高二上學(xué)期期末考試語(yǔ)文試題(解析版)
評(píng)論
0/150
提交評(píng)論