基于大數(shù)據(jù)的礦井管理系統(tǒng)設(shè)計開題報告_第1頁
基于大數(shù)據(jù)的礦井管理系統(tǒng)設(shè)計開題報告_第2頁
基于大數(shù)據(jù)的礦井管理系統(tǒng)設(shè)計開題報告_第3頁
基于大數(shù)據(jù)的礦井管理系統(tǒng)設(shè)計開題報告_第4頁
基于大數(shù)據(jù)的礦井管理系統(tǒng)設(shè)計開題報告_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、開題報告1.研究(設(shè)計)目的意義及國內(nèi)外研究狀況和應(yīng)用前景(附參考文獻):研究(設(shè)計)目的意義隨著我國經(jīng)濟的快速發(fā)展,各行各業(yè)的信息量正呈現(xiàn)爆發(fā)性增長趨勢,其中極具代表性的是數(shù)據(jù)量以50%以上的年成長量不斷刷新紀(jì)錄。為了應(yīng)對數(shù)據(jù)成長的壓力,人們需要更多的技術(shù)與產(chǎn)品來滿足數(shù)據(jù)成長的需要。而數(shù)據(jù)挖掘技術(shù)恰恰能做到這一點。近年來,隨著計算機技術(shù)、信息技術(shù)的飛速發(fā)展,生活中涌現(xiàn)眾多的各種形式的數(shù)據(jù),我們采用多種方式整理以及儲存。而數(shù)據(jù)的大量增長采用普通的數(shù)據(jù)統(tǒng)計方式難以滿足大數(shù)據(jù)的收集以及整理需求,數(shù)據(jù)庫能夠?qū)?shù)據(jù)進行統(tǒng)計、查詢以及錄入等作用,然而數(shù)據(jù)之間的關(guān)系以及數(shù)據(jù)內(nèi)部存在的規(guī)律,甚至于數(shù)據(jù)未來的

2、發(fā)展趨勢,采用數(shù)據(jù)庫難以進行預(yù)測以及提取?,F(xiàn)實生活中爆炸式的大數(shù)據(jù)采用傳統(tǒng)的數(shù)據(jù)統(tǒng)計方式難以達(dá)到預(yù)期目的,因而,人們急需一種新型技術(shù)或者數(shù)據(jù)整理工具,從而協(xié)助人們從大量的數(shù)據(jù)信息當(dāng)中找到自己最感興趣的信息或者總結(jié)出對自己有益的規(guī)律,數(shù)據(jù)挖掘技術(shù)應(yīng)運而生。數(shù)據(jù)挖掘是一門新型的、發(fā)展快而形成成熟的學(xué)科,其又被稱之為數(shù)據(jù)信息當(dāng)中的知識發(fā)現(xiàn),其主要過程是采用某種科學(xué)的方法或知識,在大量的數(shù)據(jù)信息當(dāng)中找出數(shù)據(jù)內(nèi)在的規(guī)律以及聯(lián)系,從而進行數(shù)據(jù)分析獲得對人們有益的內(nèi)在信息,按照不同的情形構(gòu)建不同的數(shù)據(jù)挖掘模型,并且獲得所需的知識。同時,挖掘出的這些隱藏的信息作為決策者的決策依據(jù),成為決策者策略的制定的重要依

3、據(jù)。數(shù)據(jù)挖掘為一門綜合性的學(xué)科,其綜合采用數(shù)據(jù)可視化、高性能計算、智能技術(shù)、模式識別技術(shù)、數(shù)據(jù)庫存儲技術(shù)、網(wǎng)絡(luò)技術(shù)等多個領(lǐng)域的知識完善其自身的知識范疇。通過數(shù)據(jù)挖掘形成的信息以及數(shù)據(jù)廣泛應(yīng)用在科學(xué)研究、商務(wù)決策及其電子商務(wù)等各個領(lǐng)域,除此之外計算機網(wǎng)絡(luò)、銀行業(yè)務(wù)、金融等各個領(lǐng)域得到推廣。數(shù)據(jù)挖掘不同于數(shù)據(jù)庫系統(tǒng)的簡單統(tǒng)計、查詢功能,其通過一定的算法將數(shù)據(jù)當(dāng)中內(nèi)在的規(guī)律或模式找出,將有使用價值的模式當(dāng)作處理實際問題的參考依據(jù)或者決策依據(jù),同時采用現(xiàn)有的信息或知識預(yù)測對象的發(fā)展趨勢。本文以礦井人員為源數(shù)據(jù)。球員數(shù)據(jù)當(dāng)中包含眾多的數(shù)據(jù),通過對該類數(shù)據(jù)進行聚類分析。這些數(shù)據(jù)中記錄了幾十次的數(shù)據(jù)調(diào)用,其

4、中考慮了下面不同的因素:姓名、身高、體重、所屬班組、所屬工種、職務(wù)、本人照片、血型等因素,因此可以基本滿足完備性的要求。國內(nèi)外研究狀況數(shù)據(jù)挖掘技術(shù)使得在大量數(shù)據(jù)中找出有價值的內(nèi)在的規(guī)律以及知識成為現(xiàn)實,當(dāng)前國內(nèi)外眾多學(xué)者從事該數(shù)據(jù)挖掘技術(shù)的研究,國外較為成功的有R.Aggrawal所帶領(lǐng)的IBM Almaden實驗室,加拿大SimonFraster大學(xué)成立的KDD課題研究小組,其研究了多種數(shù)據(jù)挖掘算法,在各個行業(yè)取得了較為成功的應(yīng)用,同時也吸引了眾多的商業(yè)機構(gòu)以及研究學(xué)者開展數(shù)據(jù)挖掘技術(shù)的研究,同時也涌現(xiàn)出各種類型的數(shù)據(jù)挖掘系統(tǒng),并且成功的在金融、經(jīng)濟、商業(yè)等行業(yè)取得成功應(yīng)用。近年來,國外數(shù)據(jù)

5、挖掘的研究趨勢主要為數(shù)據(jù)挖掘技術(shù)算法的研究,例如,重點研究了Bayes(貝葉斯)方法和Boosting方法深入研究;數(shù)據(jù)挖掘技術(shù)中融入了傳統(tǒng)的統(tǒng)計學(xué)回歸方法;數(shù)據(jù)庫技術(shù)與數(shù)據(jù)挖掘技術(shù)的緊密融合。數(shù)據(jù)挖掘技術(shù)應(yīng)用方面主要為數(shù)據(jù)挖掘商業(yè)應(yīng)用軟件的逐步完善與提升,重點關(guān)注系統(tǒng)的研究,并非某個點的研究。數(shù)據(jù)挖掘商業(yè)軟件主要應(yīng)用在金融行業(yè)、保險業(yè)務(wù)以及電信業(yè)務(wù)等方面。國外目前著名的計算機企業(yè)在數(shù)據(jù)挖掘方面投入大量的資源,其中微軟、IBM都成立了該方面的研究中心,并且研制出了類似Platinum、BO以及IBM等數(shù)據(jù)挖掘軟件。通過軟件實現(xiàn)數(shù)據(jù)挖掘是當(dāng)前信息化技術(shù)發(fā)展的結(jié)果,當(dāng)目前為止,數(shù)據(jù)挖掘軟件歷經(jīng)了4

6、個發(fā)展階段。第一個階段的數(shù)據(jù)挖掘程序僅能支持單個或少數(shù)數(shù)據(jù)挖掘算法,其中較為經(jīng)典的數(shù)據(jù)挖掘系統(tǒng)有Salford Systems研制的CART數(shù)據(jù)挖掘系統(tǒng)。在數(shù)據(jù)信息量巨大,且數(shù)據(jù)變化頻率大的情況下,必須通過運用數(shù)據(jù)倉庫或者數(shù)據(jù)庫系統(tǒng)進行統(tǒng)一管理,顯然該階段的數(shù)據(jù)挖掘系統(tǒng)功能不能滿足要求?;诘谝浑A段的數(shù)據(jù)挖掘軟件,通過增添多種挖掘算法,不斷推出了第二階段的數(shù)據(jù)挖掘應(yīng)用程序。該階段的數(shù)據(jù)挖掘軟件集成了數(shù)據(jù)庫管理系統(tǒng),能夠?qū)?shù)據(jù)倉庫以及數(shù)據(jù)庫進行支持,可以與其他應(yīng)用軟件進行連接,系統(tǒng)擴展性較強,其另一個特點為能夠?qū)Υ髷?shù)據(jù)集和復(fù)雜的數(shù)據(jù)集進行數(shù)據(jù)挖掘。在此基礎(chǔ)上系統(tǒng)靈活性更強,采用了數(shù)據(jù)挖掘查詢語言

7、以及挖掘模式。其中最為常見的為DB Miner數(shù)據(jù)挖掘系統(tǒng),其能夠采用DMQL數(shù)據(jù)挖掘語言開展數(shù)據(jù)挖掘工作。然而,該階段的數(shù)據(jù)挖掘軟件的缺點在于側(cè)重模型的形成,并且就模型系統(tǒng)的集成形成了第三階段以及第四階段的數(shù)據(jù)挖掘軟件的形成。1韓王瑩. 基于數(shù)據(jù)挖掘技術(shù)的人力資源信息管理系統(tǒng)設(shè)計J. 電子設(shè)計工程, 2015(15):54-56.2裴新明. 基于數(shù)據(jù)挖掘的人力資源考核系統(tǒng)分析J. 企業(yè)改革與管理, 2016(18):57-58.3楊帆. 基于數(shù)據(jù)挖掘技術(shù)的人力資源信息化管理J. 信息通信, 2017(4):152-153.4李妹琴. 試論人力資源管理中數(shù)據(jù)挖掘技術(shù)的應(yīng)用J. 財經(jīng)界:學(xué)術(shù)版,

8、 2016(27).5徐毅. 數(shù)據(jù)挖掘技術(shù)在人力資源管理中的應(yīng)用研究J. 中國市場, 2017(32).6王琳. 基于數(shù)據(jù)挖掘的Y汽車學(xué)院教科研人員管理對策研究D. 大連海事大學(xué), 2016.7李會欣. 數(shù)據(jù)倉庫為中心的人力資源統(tǒng)計信息系統(tǒng)運用探究J. 關(guān)愛明天, 2016(5).8張金艷. 數(shù)據(jù)挖掘在人力資源離職管理中的應(yīng)用以GST公司為例D. 首都經(jīng)濟貿(mào)易大學(xué), 2016.2.主要內(nèi)容、研究方法和思路近年來,計算機網(wǎng)絡(luò)技術(shù)、數(shù)據(jù)庫技術(shù)的不斷發(fā)展,信息數(shù)據(jù)的日益膨脹,在巨大的數(shù)據(jù)信息當(dāng)中找出自身最為關(guān)注的信息已經(jīng)成為當(dāng)前的一個極為重要的研究熱點,在此基礎(chǔ)上數(shù)據(jù)挖掘技術(shù)引起了信息產(chǎn)業(yè)界的極大關(guān)

9、注。聚類分析技術(shù)是一種將數(shù)據(jù)集劃分為多個簇的技術(shù),確保同一個簇中的數(shù)據(jù)特征盡量保持一致,不同簇間的數(shù)據(jù)特征盡量相異的一項技術(shù)。本文分析了數(shù)據(jù)挖掘中的聚類算法類型,闡述了現(xiàn)有聚類算法的性能特點。為驗證改進的K-means算法的效果,本文利用JAVA作為開發(fā)語言,以礦井人員統(tǒng)計數(shù)據(jù)為基礎(chǔ),運用基于改進的K-means聚類算法,將球員數(shù)據(jù)對象進行分類,通過對比分析傳統(tǒng)K-means算法結(jié)果,改進后的K-means算法效果更好。前言1數(shù)據(jù)挖掘1.1數(shù)據(jù)挖掘定義1.2數(shù)據(jù)挖掘過程2數(shù)據(jù)挖掘中的K-means聚類算法及改進2.1 K-means算法原理及其聚類過程2.1.1傳統(tǒng)K-means算法2.1.2

10、 基于平均誤差準(zhǔn)則函數(shù)的k-means算法2.2 K-means算法聚類要素及其優(yōu)缺點2.2.1 k-means聚類算法要素分析2.2.2 k-means聚類算法優(yōu)劣勢分析2.3 基于初始聚類中心選取的K-means算法改進2.3.1 改進初始聚類中心的選取2.3.2 基于規(guī)則初始聚類中心的k-means聚類算法2.3.3 對噪聲以及孤立點處理能力的改進2.3.4 基于改進算法的實驗分析3基于數(shù)據(jù)挖掘技術(shù)的礦井人員管理系統(tǒng)設(shè)計3.1 基于改進的K-means聚類算法的礦井人員管理系統(tǒng)3.1.1軟件總體功能結(jié)構(gòu)方案3.1.2系統(tǒng)軟件實現(xiàn)流程3.2運行界面及結(jié)果分析3.2.1 系統(tǒng)運行情況分析3.2.2基于改進的K-means聚類結(jié)果分析4結(jié)論參考文獻3.總體安排和進度(包括階段性工作內(nèi)容及完成日期):

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論