數(shù)據(jù)挖掘技術(shù)在中醫(yī)診斷學(xué)中的應(yīng)用_第1頁
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診斷學(xué)中的應(yīng)用_第2頁
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診斷學(xué)中的應(yīng)用_第3頁
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診斷學(xué)中的應(yīng)用_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)挖掘技術(shù)在中醫(yī)診斷學(xué)中的應(yīng)用

中醫(yī)學(xué)是中華民族的瑰寶。有關(guān)中醫(yī)藥的古醫(yī)籍和現(xiàn)代期刊為中醫(yī)的發(fā)展積累了大量的原始數(shù)據(jù),但這些數(shù)據(jù)大多都以零散的形式,存儲(chǔ)在各種各樣的文獻(xiàn)或資料中。面對(duì)如此海量而且無序的數(shù)據(jù),僅憑個(gè)人思維綜述分析結(jié)果,會(huì)受主觀因素、認(rèn)識(shí)水平、思維方式及其研究范圍和研究方法的限制,缺乏全面系統(tǒng)的總結(jié)。在知識(shí)經(jīng)濟(jì)時(shí)代的今天,利用先進(jìn)的信息技術(shù),加速中醫(yī)藥信息的全球性傳播和利用,加快有效信息轉(zhuǎn)化為知識(shí),促進(jìn)中醫(yī)藥知識(shí)快速更新,已成為中醫(yī)藥學(xué)向前發(fā)展的關(guān)鍵所在。數(shù)據(jù)挖掘(DataMining,DM)是為了解決“數(shù)據(jù)豐富,知識(shí)貧乏”狀況應(yīng)運(yùn)而生的,是從海量數(shù)據(jù)中獲取知識(shí)的可靠技術(shù)。隨著數(shù)據(jù)庫技術(shù)的飛速發(fā)展及數(shù)據(jù)庫管理系統(tǒng)的廣泛應(yīng)用,各個(gè)領(lǐng)域的數(shù)據(jù)庫或數(shù)據(jù)倉庫里面都收集了海量數(shù)據(jù),現(xiàn)在人們已經(jīng)不再滿足于對(duì)數(shù)據(jù)庫進(jìn)行簡單的查詢,而是希望借助現(xiàn)代信息處理技術(shù),能夠得到隱藏在數(shù)據(jù)中反映事物本質(zhì)和預(yù)測事物發(fā)展趨勢(shì)的有用知識(shí),并以這些知識(shí)為基礎(chǔ)輔助科學(xué)決策。正確的診斷對(duì)于確立治則、指導(dǎo)用藥及調(diào)理康復(fù)無疑是非常重要的。在臨床中有些疾病錯(cuò)綜復(fù)雜,數(shù)據(jù)挖掘的有關(guān)分類分析可以應(yīng)用于疾病的診斷,如采用貝葉斯學(xué)習(xí)分類法對(duì)男女患者的CT圖像進(jìn)行自動(dòng)診斷;用推導(dǎo)機(jī)器學(xué)習(xí)方法對(duì)重癥監(jiān)護(hù)者呼吸的壓力、體積曲線進(jìn)行分析等。數(shù)據(jù)挖掘作為中醫(yī)藥現(xiàn)代化研究的重要組成部分,在中醫(yī)診斷學(xué)中同樣有著非常廣泛的應(yīng)用,主要體現(xiàn)在中醫(yī)四診客觀化和中醫(yī)證候規(guī)范化兩個(gè)方面。1對(duì)當(dāng)代麻黃同病的相關(guān)研究四診客觀化是中醫(yī)診斷客觀化的基礎(chǔ)條件,對(duì)古今大量四診文獻(xiàn)進(jìn)行數(shù)據(jù)挖掘也是四診客觀化的一種手段。如將中醫(yī)醫(yī)案與中醫(yī)的舌診、脈診理論相結(jié)合,通過建立中醫(yī)病案OLAP系統(tǒng),對(duì)從一些著名醫(yī)案著作中收集到的上千例案例進(jìn)行實(shí)例研究,從而了解當(dāng)代名醫(yī)大家對(duì)于舌脈診的認(rèn)識(shí),舌脈象與病證的相關(guān)性。對(duì)脈診的客觀化研究也是中醫(yī)診斷領(lǐng)域中的一個(gè)重要內(nèi)容。如利用脈圖數(shù)據(jù)對(duì)平、弦、滑等脈的診斷,采用逐步判別分析法、最大似然法、Fisher逐層判別分析法等3種多因素分析方法建立判別式,結(jié)果符合程度較高。也有研究將明清及近現(xiàn)代3000例醫(yī)案的相關(guān)內(nèi)容分為病名、證型、舌象、脈象、癥狀等5種模式,嘗試采用Fayyad模型,成功建立了病名與脈象之間、脈象與病名之間、證型與脈象之間、脈象與證型之間的聯(lián)系。這種將傳統(tǒng)的研究方法與數(shù)據(jù)庫技術(shù)、人工智能技術(shù)、統(tǒng)計(jì)學(xué)知識(shí)的有機(jī)結(jié)合,將是解決大量數(shù)據(jù)難以處理這一研究瓶頸的行之有效的方法,將其運(yùn)用于中醫(yī)四診的研究中,可促進(jìn)中醫(yī)診斷學(xué)的規(guī)范化研究,也為中醫(yī)的現(xiàn)代化注入了新的活力。2工具領(lǐng)域的證候研究從20世紀(jì)50年代起,醫(yī)學(xué)界就開始了對(duì)中醫(yī)證候規(guī)范化的研究,其方法和手段層出不窮。數(shù)據(jù)挖掘這個(gè)新興的工具問世以來,從開始單純的技術(shù)層面,逐漸進(jìn)入了證候的研究領(lǐng)域。有學(xué)者提出了面向中醫(yī)辨證規(guī)范的數(shù)據(jù)挖掘基本內(nèi)容,其中病證所屬癥狀體征的規(guī)范包括病證所屬癥狀術(shù)語規(guī)范、癥狀間邏輯關(guān)系規(guī)范、癥狀體征分級(jí)規(guī)范(三級(jí)量表的建立)、癥狀體征測量方法規(guī)范、癥狀體征診斷規(guī)范、體征(舌、脈象)診斷客觀化等,很有指導(dǎo)意義。2.1中醫(yī)藥研究中多元分析方法概述多元分析是定量分析事物復(fù)雜關(guān)系的一種數(shù)理統(tǒng)計(jì)方法。目前人們?cè)谥嗅t(yī)藥研究中運(yùn)用的多元分析方法主要有聚類分析法、判別分析法、回歸分析法、因子分析法、相關(guān)分析法等。多元分析在中醫(yī)藥研究中,尤其在中醫(yī)證候?qū)W研究方面的應(yīng)用日趨廣泛并顯現(xiàn)出其重要性。2.1.1中醫(yī)證型聚類分析聚類分析是研究“物以類聚”的數(shù)理統(tǒng)計(jì)方法。如將與心氣虛證所含癥狀有重疊的常見中醫(yī)證候進(jìn)行聚類挖掘,通過分析它們與心氣虛證的相似程度,證明肺氣虛證與心氣虛證的相似程度最高。或運(yùn)用流行病學(xué)和變量聚類分析的數(shù)理統(tǒng)計(jì)方法,將中醫(yī)肝證的幾個(gè)主要證型最后分類為實(shí)證、風(fēng)證和虛證等3類。研究結(jié)果不僅科學(xué)地解決了中醫(yī)肝證的分類層次問題,而且從統(tǒng)計(jì)學(xué)角度明確了中醫(yī)肝證分類的正確性。2.1.2中藥研究中的計(jì)量研究是以診斷、證候以及病的研究為特點(diǎn)判別分析法是根據(jù)某些指標(biāo)的觀測值對(duì)所研究的對(duì)象判斷其歸屬類別的一種統(tǒng)計(jì)分析方法,在中醫(yī)理論研究中,多類判別較為常用,這主要是由于中醫(yī)學(xué)認(rèn)識(shí)事物的方法和特點(diǎn)所決定,中醫(yī)藥研究中的應(yīng)用主要集中在診斷、證候以及病的計(jì)量研究方面。如應(yīng)用貝葉斯網(wǎng)絡(luò)方法通過分析上百例血瘀證臨床診斷數(shù)據(jù)進(jìn)行血瘀證定量診斷,發(fā)現(xiàn)了血瘀證的7個(gè)關(guān)鍵癥狀,并定量計(jì)算其診斷貢獻(xiàn)度,基于這些關(guān)鍵癥狀建立的簡單貝葉斯分類器模型對(duì)血瘀證診斷的準(zhǔn)確率達(dá)到96.6%。2.1.3對(duì)證候的診斷和鑒別回歸分析是研究隨機(jī)變量之間的統(tǒng)計(jì)相關(guān)關(guān)系的一種數(shù)理統(tǒng)計(jì)方法。近年來回歸分析在中醫(yī)學(xué)中的應(yīng)用主要集中在對(duì)于證候的診斷和鑒別上。如對(duì)多種疾病的脾氣虛證的診斷因素做逐步回歸分析,對(duì)回歸方程中的17個(gè)脾氣虛證的診斷因素進(jìn)行了分析,并將這17種因素確立為脾氣虛證診斷標(biāo)準(zhǔn)的主要參考因素。也可用Logistic逐步回歸分析方法模擬專家對(duì)疾病診斷過程,結(jié)果與專家診斷的總符合率很高。2.2證候分類及療效評(píng)估的方法神經(jīng)網(wǎng)絡(luò)方法是繼機(jī)器學(xué)習(xí)方法、統(tǒng)計(jì)學(xué)方法之后的另外一種數(shù)據(jù)挖掘的手段。由于傳統(tǒng)的醫(yī)學(xué)統(tǒng)計(jì)方法具有局限性,研究者們開始嘗試運(yùn)用模糊智能技術(shù)探索中醫(yī)證候分類及療效評(píng)估的方法,并用實(shí)驗(yàn)的方法論證了其方法上的可行性。如有研究構(gòu)造了一個(gè)神經(jīng)網(wǎng)絡(luò)分級(jí)系統(tǒng),并用于類風(fēng)濕性關(guān)節(jié)炎寒熱錯(cuò)雜證的病情分級(jí)診斷,獲得了很好的臨床吻合率。說明應(yīng)用數(shù)學(xué)建模、神經(jīng)網(wǎng)絡(luò)、基于案例的推理、圖像處理、遺傳算法、智能數(shù)據(jù)與時(shí)序分析、模式識(shí)別等多種技術(shù)深入地研究某種疾病,以建立更為實(shí)用、高效的疾病診斷智能系統(tǒng)。同時(shí)還可對(duì)療效評(píng)價(jià)、方案選優(yōu)之類的問題進(jìn)行輔助決策,充分發(fā)揮了數(shù)值分析的優(yōu)勢(shì),即定量和定性的分析。3中醫(yī)藥基本粒子和基本組織的數(shù)據(jù)挖掘?qū)χ嗅t(yī)藥信息進(jìn)行文本數(shù)據(jù)挖掘是促進(jìn)中醫(yī)藥信息結(jié)構(gòu)化的途徑之一。中醫(yī)的特殊性決定了其從中醫(yī)診斷、辨證到組方的各個(gè)環(huán)節(jié),文字描述的定性內(nèi)容占很大比例,使中醫(yī)信息在一定程度上具有不確定和不完全性,同時(shí)也使對(duì)這些定性的內(nèi)容進(jìn)行計(jì)算機(jī)量化顯得尤為困難。因此,選擇合適的工具對(duì)中醫(yī)藥大量數(shù)據(jù)進(jìn)行多層面智能分析,是進(jìn)一步更新和完善中醫(yī)藥知識(shí)的有效途徑。對(duì)以古語言和純文本為主的中醫(yī)藥理論和實(shí)踐進(jìn)行結(jié)構(gòu)化解析是中醫(yī)藥信息化研究的重要內(nèi)容,其中的某些內(nèi)容可以通過對(duì)文本的數(shù)據(jù)挖掘來實(shí)現(xiàn)。數(shù)據(jù)挖掘在中醫(yī)學(xué)上的應(yīng)用遠(yuǎn)遠(yuǎn)不止中醫(yī)診斷這個(gè)領(lǐng)域,它幾乎涉獵了中醫(yī)學(xué)的所有內(nèi)容,無論是對(duì)古醫(yī)籍的整理,還是對(duì)臨床疾病診斷、治療、方劑和中藥的探索,各領(lǐng)域的學(xué)者們都做了大量的努力,使中醫(yī)現(xiàn)代化研究越來越活躍。盡管如此,數(shù)據(jù)挖掘技術(shù)仍然面臨著許多問題和挑戰(zhàn)??偨Y(jié)起來,應(yīng)該注意以下幾個(gè)方面。3.1關(guān)鍵養(yǎng)成期對(duì)中醫(yī)經(jīng)典運(yùn)用的價(jià)值數(shù)據(jù)挖掘的結(jié)果最終需要轉(zhuǎn)換成為能夠被用戶理解的知識(shí),并加以解釋和評(píng)價(jià),確定所發(fā)現(xiàn)的東西是否有價(jià)值。脫離了中醫(yī)理論指導(dǎo)的挖掘結(jié)果是沒有意義的。我們所挖掘到的知識(shí)必須是精確的,而且使用者是可以理解的,合乎醫(yī)學(xué)常識(shí)的,可以為使用者進(jìn)行決策提供堅(jiān)實(shí)的基礎(chǔ),這就決定了整個(gè)挖掘過程需要醫(yī)學(xué)專家的審查和指導(dǎo),使醫(yī)學(xué)數(shù)據(jù)庫知識(shí)發(fā)現(xiàn)和醫(yī)學(xué)專家知識(shí)之間真正達(dá)成一致。3.2要熟悉知識(shí)的特性數(shù)據(jù)挖掘要求所需要挖掘的原始數(shù)據(jù)應(yīng)該涵蓋可以影響挖掘目標(biāo)的所有的知識(shí)元,以保證數(shù)據(jù)的完整性,這就要求收集資料的人員應(yīng)該非常熟悉相關(guān)領(lǐng)域的背景知識(shí)。而有效性是指在數(shù)據(jù)篩選和預(yù)處理過程中,盡量保持?jǐn)?shù)據(jù)的一致性,去除可能會(huì)影響到結(jié)果的噪音數(shù)據(jù),如有需要可單獨(dú)分析。3.3數(shù)據(jù)的清洗中醫(yī)的文獻(xiàn)描述多數(shù)是主觀的、模糊的、定性的,比如:納差、納呆、厭食、少食等。而進(jìn)行數(shù)據(jù)挖掘的資料必須是經(jīng)過標(biāo)準(zhǔn)化之后的定量數(shù)據(jù)或者是二分類數(shù)據(jù),因此,如何使數(shù)據(jù)經(jīng)過清洗后仍然保留最多的信息,也是當(dāng)今數(shù)據(jù)挖掘

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論