大數(shù)據(jù)建模概述_第1頁
大數(shù)據(jù)建模概述_第2頁
大數(shù)據(jù)建模概述_第3頁
大數(shù)據(jù)建模概述_第4頁
大數(shù)據(jù)建模概述_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

大數(shù)據(jù)建模概述基本過程是通過多個學(xué)科技術(shù)的融合,實現(xiàn)數(shù)據(jù)的抽取、管理和分析,達(dá)到發(fā)現(xiàn)新知識和規(guī)律的目的。信息挖掘是機器學(xué)習(xí)與數(shù)據(jù)庫技術(shù)的交叉;利用機器學(xué)習(xí)的技術(shù)分析海量的數(shù)據(jù);利用數(shù)據(jù)庫技術(shù)來管理海量的數(shù)據(jù)。大數(shù)據(jù)建模過程

模型構(gòu)建通常包括模型建立、模型訓(xùn)練、模型驗證和模型預(yù)測四個步驟,但根據(jù)不同的數(shù)據(jù)挖掘類型,在應(yīng)用上會有一些細(xì)微的不同。

模型的建立是一個反復(fù)的過程,需要仔細(xì)考察不同的模型以判斷哪個模型對問題是最有用的。模型構(gòu)建流程大數(shù)據(jù)建模的技術(shù)人工智能機器學(xué)習(xí)分布式計算統(tǒng)計學(xué)數(shù)據(jù)庫技術(shù)推薦算法商務(wù)智能模式識別聯(lián)機分析處理目前大數(shù)據(jù)有一個前提就是數(shù)據(jù)。醫(yī)療領(lǐng)域的數(shù)據(jù)有幾種類型,比較完整的是醫(yī)學(xué)影像的數(shù)據(jù),像X光、CT,甚至還包括B超、腦電。這個領(lǐng)域有一些研究,比如說如何通過醫(yī)學(xué)影像的自動分析來確定病變的位置,現(xiàn)在有很多放射治療要對癌細(xì)胞的位置進行輻射,范圍越小,接受的輻射量就越小,對病人本身的損害就越小,利用大數(shù)據(jù)的分析方法可以確定這個范圍。這個技術(shù)現(xiàn)在剛剛產(chǎn)生,按照剛才的推斷,醫(yī)學(xué)技術(shù)的產(chǎn)生到使用的時間段越來越短,我們預(yù)測到2025年,一個技術(shù)的產(chǎn)生到使用基本上可以在一年之內(nèi)完成。這是醫(yī)學(xué)影像的數(shù)據(jù)。醫(yī)學(xué)大數(shù)據(jù)建模應(yīng)用還有一類數(shù)據(jù)是電子病例、電子健康檔案。這類數(shù)據(jù)的獲取還是非常多的,有些技術(shù)是基于病人的相似度,比較兩個患者的病例,如果相似的話,可以找到一群相似的病人,然后分析有效的治療手段是什么。像這樣的技術(shù),IBM已經(jīng)把它變成了產(chǎn)品。這依賴于大量的數(shù)據(jù)積累,要依靠電子病例、電子醫(yī)療檔案的完善,需要搜集準(zhǔn)確的信息。中國的醫(yī)改已經(jīng)有很好的目標(biāo),需要順利實現(xiàn)電子病例的完善過程。醫(yī)學(xué)大數(shù)據(jù)建模應(yīng)用第三個領(lǐng)域是跟基因組學(xué)、蛋白組學(xué)新的治療技術(shù)相關(guān)。這些技術(shù)已經(jīng)發(fā)展到了應(yīng)用的邊緣。像人類的基因組測序,以前人類基因組花了十年的時間研究,現(xiàn)在只要花一千美元,不到一周的時間就可以測出一個人的基因組。這些數(shù)據(jù)就可以應(yīng)用到個性化診斷治療。這個對大數(shù)據(jù)的推動也是非常大的。醫(yī)學(xué)大數(shù)據(jù)建模應(yīng)用[1]SetonHealthcare是采用IBM最新沃森技術(shù)醫(yī)療保健內(nèi)容分析預(yù)測的首個客戶。該技術(shù)允許企業(yè)找到大量病人相關(guān)的臨床醫(yī)療信息,通過大數(shù)據(jù)處理,更好地分析病人的信息。醫(yī)學(xué)大數(shù)據(jù)建模應(yīng)用案例[2]在加拿大多倫多的一家醫(yī)院,針對早產(chǎn)嬰兒,每秒鐘有超過3000次的數(shù)據(jù)讀取。通過這些數(shù)據(jù)分析,醫(yī)院能夠提前知道哪些早產(chǎn)兒出現(xiàn)問題并且有針對性地采取措施,避免早產(chǎn)嬰兒夭折。醫(yī)學(xué)大數(shù)據(jù)建模應(yīng)用案例[3]它讓更多的創(chuàng)業(yè)者更方便地開發(fā)產(chǎn)品,比如通過社交網(wǎng)絡(luò)來收集數(shù)據(jù)的健康類App。也許未來數(shù)年后,它們搜集的數(shù)據(jù)能讓醫(yī)生給你的診斷變得更為精確

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論