(計算機(jī)應(yīng)用技術(shù)專業(yè)論文)基于DNA微陣列基因表達(dá)譜數(shù)據(jù)的癌癥檢測研究.pdf_第1頁
(計算機(jī)應(yīng)用技術(shù)專業(yè)論文)基于DNA微陣列基因表達(dá)譜數(shù)據(jù)的癌癥檢測研究.pdf_第2頁
(計算機(jī)應(yīng)用技術(shù)專業(yè)論文)基于DNA微陣列基因表達(dá)譜數(shù)據(jù)的癌癥檢測研究.pdf_第3頁
(計算機(jī)應(yīng)用技術(shù)專業(yè)論文)基于DNA微陣列基因表達(dá)譜數(shù)據(jù)的癌癥檢測研究.pdf_第4頁
(計算機(jī)應(yīng)用技術(shù)專業(yè)論文)基于DNA微陣列基因表達(dá)譜數(shù)據(jù)的癌癥檢測研究.pdf_第5頁
已閱讀5頁,還剩120頁未讀, 繼續(xù)免費(fèi)閱讀

(計算機(jī)應(yīng)用技術(shù)專業(yè)論文)基于DNA微陣列基因表達(dá)譜數(shù)據(jù)的癌癥檢測研究.pdf.pdf 免費(fèi)下載

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

博i 學(xué)伊滄文 摘要 癌癥治療面臨的重大挑戰(zhàn)是如何針對病原上各自獨特的癌癥類型制定具體的 治療方法,以達(dá)到最大療效的同時降低藥物的副作用。因此,癌癥檢測或癌癥分 類成為癌癥治療的中心環(huán)節(jié)。一直以來,癌癥檢測主要基于腫瘤的形態(tài)表觀,但 這種檢測方式有很大的局限性,因為具有相似組織病理學(xué)表觀的腫瘤可能表現(xiàn)出 很不相同的臨床發(fā)展過程,或者對同種治療呈現(xiàn)出不同反應(yīng)。近年來,d n a 微陣 列技術(shù)的發(fā)展產(chǎn)生了海量的基因表達(dá)譜數(shù)據(jù),為尋找基因之間表達(dá)調(diào)控的復(fù)雜關(guān) 系網(wǎng)絡(luò),研究功能基因組和癌癥檢測提供依據(jù)。目前,利用基因表達(dá)譜進(jìn)行癌 癥檢測成為癌癥研究的重點之一。但是基因表達(dá)譜數(shù)據(jù)具有高維性,高噪聲, 高冗余,數(shù)據(jù)分布不均衡等特點,對基因數(shù)據(jù)分析方法提出了更高要求,對基 于d n a 微陣列基因表達(dá)譜的癌癥檢測帶來了挑戰(zhàn)。 本論文從基因表達(dá)譜數(shù)據(jù)的分析著手,以挖掘基因表達(dá)模式和癌癥檢測研究 為主要目標(biāo),研究癌癥檢測中基因表達(dá)數(shù)據(jù)的預(yù)處理、特征基因的選取、癌癥組 基因表達(dá)模式的分析以及建立合適的基因診斷模型的問題。本文的主要工作歸納 如下: 第一,針對基因表達(dá)數(shù)據(jù)的特點,提出一種基于c m s t 聚類方法的分步的特 征基因選擇方法,然后,在分步的特征基因選擇方法中引入“g a ps t a t i s t i c ”理 論,以確定特征基因數(shù)目,提出一種自適應(yīng)的特征基因的選擇方法,彌補(bǔ)目前的 特征基因選擇算法中缺乏較好的基因數(shù)目預(yù)置機(jī)制的不足。 第二,利用主分量分析方法( p c a ) 和獨立分量分析方法( i c a ) 挖掘基因 表達(dá)譜中隱含的基因表達(dá)模式,揭示癌癥中基因的調(diào)控機(jī)制,通過抽樣來選取特 征基因子集以減少噪聲對p c a f 和i c a p 的影響,并且根據(jù)基因子集中隱含模式的 相似性來重構(gòu)基因表達(dá),提出一種基于隱含變量模型的癌癥檢測算法。 第三,利用癌癥組基因表達(dá)存在的局部特征相關(guān)性的生物病理特點,提 出d n a 微陣列基因表達(dá)譜中癌癥組關(guān)聯(lián)空間的概念,抽取不同癌癥組基于關(guān)聯(lián)空 間的基因特征模式,研究與癌癥組相關(guān)聯(lián)的基因表達(dá)模式在癌癥組中的表達(dá)以及 調(diào)控,并提出適合癌癥組相關(guān)聯(lián)的基因表達(dá)模式的癌癥預(yù)測算法,有效緩解基因 數(shù)據(jù)集中“維數(shù)災(zāi)難”的問題。 第四,由于不同的特征選擇方法采用不同的搜索機(jī)制和評價策略,挑選出的 特征基因偏向癌癥特征的不同方面,因此不同方法選擇的特征基因明顯不同,導(dǎo) 致分類器的識別結(jié)果不穩(wěn)定。針對癌癥組基因數(shù)據(jù)和基因組數(shù)據(jù)構(gòu)建一組具有互 補(bǔ)性分類器,提出一種組合分類算法提高癌癥分類算法的泛化性能。 萆十儆辨別蘋嘲發(fā)迓譜數(shù)掘, 勺穗痹搶測研究 第五,從基因之間的協(xié)同表達(dá)來分析基因數(shù)據(jù),研究具有可解釋的基因表達(dá) 模式。在顯現(xiàn)模式的提取中增加虛擬樣本以挖掘具有更高辨識能力的顯現(xiàn)模式, 并在候選分割點選擇策略中通過高斯分布來模擬分割點的分布,提高分割點選擇 的可靠性,然后提出兩種基于顯現(xiàn)模式的癌癥檢測算法。 關(guān)鍵詞:d n a 微陣列;基因表達(dá)譜;癌癥檢測;特征基因;基因調(diào)控;基因表 達(dá)模式 1 l 博f 學(xué)伊論文 a b s t r a c t t h eg r e a tc h a l l e n g ei nc a n c e rt r e a t m e n ti sh o wt od i r e c ts p e c i f i ct r e a t m e n tt op a r t i c u l a rt u m o u l i no r d e rt oa c h i e v et h eb e r e rt h e r a p ye f f e c tw h i l et h el o w e rt o x i c i t y s ot h e c a n c e rd e t e c t i o no rc a n c e rc l a s s i f i c a t i o nb e c o m e so n ek e yp o i n tf o rc a n c e rt h e r a p y f o ra l o n gt i m e ,t h ec l a s s i f i c a t i o nl i e so nt h es a m p l em o r p h o l o g y , w h i c hi sn o t e f f i c i e n ti nm a n y c a s e s b e c a u s et u m o u r si nd i f f e r e n ts t a g e sm a y p r e s e n ts i m i l a rp a t h o m o r p h i s ma n dt u m o u e sw i t hs i m i l a rp a t h o m o r p h i s mm a yr e a c td i f f e r e n t l yt ov a r i o u st h e r a p i e s n o wc a n c e r d e t e c t i o nu s i n gg e n ee x p r e s s i o nd a t ai sa ni m p o r t a n ta s p e c ti nc a n c e rr e s e a r c h r e c e n t l y , w i t ht h ed e v e l o p m e n to fm i c r o a r r a yt e c h n o l o g ym a s s i v eo fg e n ee x p r e s s i o nd a t ai sp r o d u c e d , w h i c hi sh e l pf o re x p l o r i n gc o m p l i c a t e dg e n e t i cr e g u l a t i n gn e t w o r k , i n v e s t i g a t i n g f u n c t i o n a lg e n o m ea n ds t u d y i n go nc a n c e rd e t e c t i o n h o w e v e r , t h e r ea r ec h a r a c t e r si ng e n e e x p r e s s i o nd a t a , s u c ha sh i g hd i m e n s i o n a l i t y , h u g en o i s e ,h u g er e d u n d a n c ya n dn o n e q u i l i b r i u md i s t r i b u t i o n , w h i c hi m p o s e sc h a l l e n g e sf o rd e v e l o p m e n to f t h ea s s o c i a t e dd a t am i n i n g t e c h n i q u e sa n dc a n c e rd e t e c t i o n i nt h i sd i s s e r t a t i o n , w ee m p h a s i z eo na n a l y s i so fg e n ee x p r e s s i o nd a t a o u rm a j o r g o a l sa x ef o rg e n ee x p r e s s i o nm o d em i n i n ga n dc a n c e rd e t e c t i o n w ee x p l o r et h eg e n e e x p r e s s i o nd a t ap r e - p r o c e s s i n g ,t h ef e a t u r eg e n es e l e c t i o n , a n a l y s i so fg e n ee x p r e s s i o n m o d e lt oc a n c e ra n db u i l d i n gt h ec a n c e rd e t e c t i o nm o d e l t h em a i nc o n t r i b u t i o n so ft h i s d i s s e r t a t i o na l es u m m a r i z e da f t ;b e l o w : f i r s t l y , t h ec h a r a c t e r so fg e n ee x p r e s s i o np r o f i l ea r ea n a l y z e da n d ac m s t c l u s t e r i n g b a s e dm u l t i s t e pg e n es e l e c t i o ns c h e m ei sp r o p o s e d ,t h e n ”g a ps t a t i s t i c i si n t r o d u c e d i n t ot h i sf e a t u r eg e n es e l e c t i o nt od e t e r m i n et h en u m b e ro ff e a t u r eg e n e s ,s ow ed e v e l o p as e l f - a d a p t i v eg e n es e l e c t i o nm e t h o d , w h i c hm a k e sag r e a ti m p r o v e m e n tc o m p a r e dt ot h e m e c h a n i s mo fs e t t i n gt h en u m b e ro ff e a t u r eg e n e sa r b i t r a r i l y s e c o n d l y , p c aa n di c a i sa p p l i e dt oa n a l y z et h eg e n ee x p r e s s i o nd a t aa n di n v e s t i g a t e t h eu n d e r l y i n gr e g u l a t i n gf a c t o ra n dg e n er e g u l a t i n gn e t w o r k i n gi nc a n c e r s a m p l i n gi s u s e dt op r o d u c et h eg e n es u b s e t s ,a n di nt h ep c a pa n di c a po f s u b s e t st h en o n i n f o r m a t i v e f e a t u r e sa r er e d u c e d , t h e nt h eg e n ee x p r e s s i o nm o d e sa r er e c o n s t r u c t e da n dah i d d e ng e n e e x p r e s s i o nm o d e lb a s e dc a n c e rd e t e c t i o ni sp r e s e n t e d t h i r d l y , t h eb i o l o g i c a ll o c a l i t yo fg e n ee x p r e s s i o nt ot h ec a n c e ri se x p l o r e d , a n da c o n c e p to f r e l a t i v es p a c e t oac a n c e ri sp r o p o s e d , t h e nt h ec a n c e r o g e n i cg e n em o d eb a s e d o nr e l a t i v es p a c ei se x t r a c t e d , a n dt h er e g u l a t i o nw i t l lc a n c e r o g e n i cg e n em o d ei sd i s c u s s e d 1 1 1 棼卡微弦硎革田表達(dá)譜數(shù)搦的瘸瘁撿測研究 t h e nac a n c e rd e t e c t i o na l g o r i t h mw i t hr e l a t i v eg e n ee x p r e s s i o nm o d ei sp r o p o s e d ,i n w h i c ht h ep r o b l e mo f c u r s eo f d i m e n s i o n a l i t y i sr e l i v e d f o u r t h l y , w h e n d i f f e r e n tf e a t u r es e l e c t i o n sa r eu s e d ,a st h er e s e a r c h i n gm e c h a n i s ma n d e v a l u a t i o ns t r a t e g ya r ed i f f e r e n tt h ed i s t i n c tf e a t u r eg e n e s ,w h i c ht e n dt od i f f e r e n ta s p e c t s o f c a n c e r , a l es e l e c t e d t h ec l a s s i f i c a t i o nr e s u r su s i n g t h e s ec l a s s i f i e r sw i t hd i s t i n c tg e n e s v a r i e dal o t s oa g r o u p o fc o m p l e m e n t a lg e n ec l a s s i f i e r sa r ec o n s t r u c t e d ,a n dae n s e m b l e c a n c e rc l a s s i f i c a t i o na l g o r i t h mi sp r o p o s e d f i f t h l y , t h eg e n ec o e x p r e s s i o na n de x p l a i n a b l ee m e r g i n gp a t t e r na r ee x p l o r e d t h e v i r t u a ls a m p l e si sa d d e dt ot oi m p r o v ed i s t i n g u i s h m e n to fe m e r g i n gp a t t e r n ,a n di nt h e s t r a t e g yo fc h o o s i n gc u tp o i n tt h ed i s t r i b u t i o no fc u tp o i n ti sa s s u m e dt ob et h eg a u s s i a n d i s t r i b u t i o nf o ri m p r o v i n gt h er e l i a b i l i t yo fe m e r g i n gp a t t e r na n dt w oe m e r g i n gp a t t e m b a s e dc a n c e rd e t e c t i o n sa l ep r e s e n t e d k e y w o r d s :d n am i e r o a r r a y ;g e n ee x p r e s s i o np r o f i l e ;c a n c e rd e t e c t i o n ;f e a t u r e g e n e ;g e n er e g u l a t i o n ;g e n ee x p r e s s i o nm o d e i v 圖1 1d n a 微陣列技術(shù)及應(yīng)用 圖1 2 基因表達(dá)譜數(shù)據(jù) 插圖索引 圖2 1 雙向?qū)哟尉垲悎D 圖2 2 自組織映射 圖2 3g s 法 圈3 1 自組織樹算法 圖3 2 0 s c m s t 在b u d d i n g y e a s t d a t a s e t 上的實驗結(jié)果 圖3 3 0 s c m s t 在y e a s t f u n c t i o n a l g e n o m e 上的實驗結(jié)果 圖3 4o s c m s t 在a l i z a d e h 上的實驗結(jié)果 圖4 1 癌癥組織中基因表達(dá)的混合模型 圖4 2 癌癥組織中基因表達(dá)的解混模型 圖4 3 基于i c a 隱含變量的基因表達(dá)模型 圖4 4 在y e a s t 中七類基因的平均表達(dá)譜 圖4 5 在y e a s t 中i c a e 模型的基因表達(dá)模式i c a p 圖4 6 在y e a s t 中的基因表達(dá)模式e i c a p 圖4 7 在y e a s t 中p c a e 模型的基因表達(dá)模式p c a p 圖4 8 在y e a s t 中的基因表達(dá)模式e p c a p 圖5 1 樣本在i 維,i i 維和i i i 維空間下的分布情況比較 圖5 2 癌癥模式p 和q 中致癌因子的局部相關(guān)性 圖5 3l e u k e m i ad a t a s e t 中平均正確率隨d 的變化情況 圖5 4 c o l o n d a t a s e t 中平均正確率隨d 的變化情況 圖5 5a l l 和a m l 在g a l l 下的分布 圖5 6 a l l 和a m l 在g a m l 下的分布 圖5 7 t c t 和n c t 在t 下的分布 圖5 8t c t 和n c t 在 ,凹下的分布 圖6 1 基因特征選擇和分類器組合 圖6 2 癌癥識別中的全局分量模型 圖6 3 癌癥識別中的癌癥組分量模型 圖6 4c c m 的癌癥組分量和g c m 的全局分量 圖6 5 基于組合g c m 和c c m 的癌癥識別 圖6 6 基于組合g c m 和c c m 的解決方案 圖6 7 獨立測試實驗結(jié)果 圖6 8l o o c v 交叉測試實驗結(jié)果 圖6 9f f c v 交叉測試實驗結(jié)果 圖7 1 分割點的分類性能比較1 0 4 v 四加n ” 鋁鑼鉀舛舛鮐” 鼴鼴:2的卯鋸鈔田 記弭踮盯盯 萆十徽斛列萆田表選譜數(shù)瓤的稚疼傳測研完 附表索引 表3 1b u d d i n g y e a s t d a t a s e t 表3 2 y e a s t f u n c t i o n a l g e n o m e 表3 3 a l i z a d e h s d a t a s e t 表3 4 在b u d d i n g y e a s t d a t a s e t 數(shù)據(jù)集上的基因聚類結(jié)果比較 表3 5 在b u d d i n g y e a s t d a t a s e t 上的聚類結(jié)果 表3 6 在y e a s t f u n c t i o n a l g e n o m e 上的聚類結(jié)果 表3 7 經(jīng)不同基因預(yù)處理后的癌癥識別結(jié)果( a ) 表3 8 經(jīng)不同基因預(yù)處理后的癌癥識別結(jié)果( b ) 表3 9 分類結(jié)果比較 表4 1l o o c v 測試實驗結(jié)果( s v m ) 表4 2l o o c v 測試實驗結(jié)果( k n n ) 表5 1l e u k e m i ad a t a s e t 中l(wèi) o o c v 的實驗結(jié)果比較 表5 2 c o l o n d a t a s e t 中l(wèi) o o c v 的實驗結(jié)果比較 5 6 5 6 6 7 6 8 表6 1 基因表達(dá)譜數(shù)據(jù)集8 2 表6 2 噪聲基因過濾8 3 表6 3 混亂矩陣8 3 表6 4 獨立測試實驗結(jié)果8 4 表6 5l o o c v 測試實驗結(jié)果8 6 表6 6 f f c v 測試實驗結(jié)果8 6 表7 1 離散方法分離出的前2 5 個特征基因及分割點 表7 2 基于m - 估計的離散方法分離出的前2 5 個特征基因及分割點 表7 3 顯現(xiàn)模式中的三個特征基因在分割點的類別信息熵 表7 4 增強(qiáng)顯現(xiàn)模式中的三個特征基因在分割點的類別信息熵 表7 5 測試集樣本在基因表達(dá)規(guī)則上的分布情況 表7 6 測試集樣本在增強(qiáng)基因表達(dá)規(guī)則上的分布情況 表7 7a l l 樣本中增長率最大的前2 5 個e p i s 表7 8a m l 樣本中增長率最大的前2 5 個e p i s 表7 9 試驗結(jié)果比較 表7 1 0 a l l 中增長率最大的前2 0 個e p a s 表7 1 1a m l 中增長率最大的前2 0 個e p a s 表7 1 2 試驗結(jié)果比較 孫n弘孫弘拍詣 鱷卯卯粥:兮 湖南大學(xué) 學(xué)位論文原創(chuàng)性聲明 本人鄭重聲明:此處所呈交的論文基于d n a 微陣列基因表達(dá)譜數(shù) 據(jù)的癌癥檢測研究,是本人在導(dǎo)師的指導(dǎo)下獨立進(jìn)行研究所取得的成 果。除了文中特別加以標(biāo)注引用的內(nèi)容外,本論文不包含任何其他個人 或集體已經(jīng)發(fā)表或撰寫的成果作品。對本文的研究做出重要貢獻(xiàn)的個人 和集體,均已在文中以明確方式標(biāo)明。本人完全意識到本聲明的法律后 果由本人承擔(dān)。 作者躲知詞 日期矽。7 年,f 月- 乒日 學(xué)位論文版權(quán)使用授權(quán)書 本學(xué)位論文作者完全了解學(xué)校有關(guān)保留、使用學(xué)位論文的規(guī)定,同 意學(xué)校保留并向國家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和電子版,允許 論文被查閱和借閱。本人授權(quán)湖南大學(xué)可以將本學(xué)位論文的全部或部分 內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù)制手段 保存和匯編本學(xué)位論文。 本學(xué)位論文屬于 1 、保密口,在年解密后試用本授權(quán)書。 2 、不保密囪。 ( 請在以上相應(yīng)方框內(nèi)打“”) 日期p 0 7 年九月 爭日 醐。1 q 一7 日 司弋 蓯并 孫銃套鴦 者師惻副 第1 章緒論 在多年的癌癥( 疾病) 研究中,科學(xué)家和醫(yī)學(xué)工作者們認(rèn)識到,癌癥并不只 是某一種疾病,在它的背后,隱藏著形形色色,變化多端的種類,存在著幾百種 這樣的癌癥。它們?yōu)槭裁匆恢彪y以攻克呢? 其主要的原因是由于每一種癌癥都有 自己的特點,一種藥物并不能對各個不同組織的癌癥都能產(chǎn)生療效,有些能抑制 住腫瘤細(xì)胞,但有些卻毫無作用,甚至在病癥上相同的癌癥,也無法用一種藥物 達(dá)到治療的目的。隨著人類生命科學(xué)的發(fā)展,人們對于基因這一有關(guān)人類生長、 發(fā)育、衰老、遺傳的最重要和最本質(zhì)的因素,有了新的認(rèn)識,并逐漸開始將基因 引入對疾病的診斷、治療、藥物研制、藥物篩選等方面。因此,基因診斷、基因 治療,藥物基因組圖等應(yīng)運(yùn)而生。通過基因進(jìn)行疾病診治是對傳統(tǒng)診治方法提出 的巨大挑戰(zhàn),成為人們關(guān)注的焦點。 2 0 世紀(jì)9 0 年代初開始實施的人類基因組計劃( h u m a ng e n o m ep r o j e c t ,h g p ) 與2 0 世紀(jì)4 0 年代制定的曼哈頓原子彈計劃( m a n h a t t a np r o j e c t ) 以及6 0 年代制定的 阿波羅登月計劃( a p o l l op r o j e c t ) 并稱為美國的三大國家計劃。人類基因組計劃 是由美國科學(xué)家于1 9 8 5 年率先提出”“,旨在闡明人類基因組3 0 億個堿基對( b a s e p a i t s ) 的序列,發(fā)現(xiàn)所有人類基因,并搞清其在染色體( c h r o m o s o m e ) 上的位 置,破譯人類全部遺傳信息,讓人類第一次在分子水平上全面地認(rèn)識自我,該計 劃1 9 9 0 年正式啟動。英、日、德、法隨后相繼加入該計劃,值得關(guān)注的是1 9 9 9 年 中科院基因組中心代表中國正式加入該計劃,承擔(dān)了1 人類基因組的測序任 務(wù)。2 0 0 1 年2 月,人類基因組草圖宣布完成“。隨著以測序為主的結(jié)構(gòu)基因組計 劃( s t r u c t u r a lg e n o m i c sp r o j e c t ) 的完成,生命科學(xué)研究的重點也逐漸的轉(zhuǎn)變?yōu)橐?對基因功能研究為主的功能基因組計劃( f u n c t i o n a lg e n o m i c sp r o j e c t ) 。功能基 因組計劃的主要任務(wù)之一是尋找調(diào)控疾病的相關(guān)基因,研究與疾病相關(guān)基因功 能,進(jìn)行基因功能鑒定,研究通過基因表達(dá)實現(xiàn)疾病診斷和基因治療。在“九 五”“十五”期間,功能基因組計劃研究已被列為國家高科技計劃8 6 3 和9 7 3 重大 專項。 一項類似于計算機(jī)芯片技術(shù)的新興生物高技術(shù)一d n a 微陣列( m i c r o a r r a y ) 技術(shù),或稱為生物芯片( b i o c h i p ) 、d n a 芯片( d n ac h i p ) 、基因芯片( g e n e c h i p ) “”,隨著人類基因組研究的進(jìn)展應(yīng)運(yùn)而生。自從1 9 9 1 年a f f y m e t r i x 公司 的f o a o r 博士等人”提出基因芯片的概念后,已有多種不同功用的基因芯片問世, 并在生命科學(xué)研究中開始發(fā)揮重要作用。近年來d n a 微陣列技術(shù)”1 得到了迅猛 發(fā)展,產(chǎn)生了大量基因序列和基因表達(dá)水平數(shù)據(jù)。如何利用d n a 微陣列技術(shù)研究 輩十儆礦砷k 四五讓啦數(shù)批7 兜弼礦拎刪職了: 基因的功能、基因的調(diào)控,以及在疾病中的基因變異和基因表達(dá)。因此,研究者 提出了后基因組計劃、蛋白組計劃、疾病基因組計劃以破澤人類基因這部天書。 生物體發(fā)育、分化、生長相代謝的過程,始終足遺傳信息從儲有到表達(dá)、加 工及傳遞的過程;實質(zhì)上,主要是基因中m r n a ( c d n a ) 信息的傳遞過程。而 生物體的遺傳、變異和進(jìn)化問題則主要體現(xiàn)在遺傳信息的復(fù)制、重組、變異和選 擇。d n a 微陣列利用成千上萬密集排列的基因探針,通過己知堿基順序的d n a 片 段,并結(jié)合堿基互補(bǔ)的原則檢測細(xì)胞基因m r n a ( c d n a ) 表達(dá)水平。不同個體 基因變異、不同組織、不同時間、不同生命狀態(tài)等基因表達(dá)的分析是基因組計 劃、蛋白組計劃和疾病基因組計劃中最重要的一個環(huán)節(jié)。d n a 微陣列基因表達(dá)數(shù) 據(jù)在疾病診斷、基因治療、藥物篩選、給藥個性化、新基因發(fā)現(xiàn)、d n a 計算機(jī)研 究等領(lǐng)域發(fā)揮重要的作用。 d n a 微陣列具有高速度、高通量、集約化的特點,所以我們可以通過微陣列 一次性對大量序列進(jìn)行檢測和基因分析,獲取高維的基因表達(dá)數(shù)據(jù)”?!? 。通過基 因表達(dá)數(shù)據(jù)研究人員能夠在基因組層次上研究任何種類細(xì)胞在任何時間、任何給 定條件下的基因表達(dá)模式,可以幫助我們深入研究和了解生物過程的本質(zhì)。通過 分析基因表達(dá)數(shù)據(jù),我們可以了解疾病在基因級別的發(fā)病機(jī)理、疾病的診斷、基 因級別的藥物研制以及基因治療。當(dāng)前的腫瘤檢測和分類技術(shù)高度依賴于病理學(xué) 工作者對癌癥組織的主觀判斷,而基于微陣列技術(shù),即使一些組織沒有顯著變 化,利用基因表達(dá)數(shù)據(jù)也可以對之做出早期診斷”。如何利用基因表達(dá)數(shù)據(jù)揭示 基因在影響和調(diào)控癌癥組織產(chǎn)生的變異? 如何利用基因表達(dá)數(shù)據(jù)有效地識別癌癥 組織,并為人類最終戰(zhàn)勝各種病魔提供有效武器? 然而,基于微陣列數(shù)據(jù)的分析 方法和基于微陣列數(shù)據(jù)的癌癥檢測的發(fā)展才剛剛起步,解決上述問題具有巨大的 挑戰(zhàn)“。 1 1d n a 微陣列技術(shù)簡介 d n a 微陣列技術(shù)是融微電子學(xué)、生物學(xué)、物理學(xué)、化學(xué)、計算機(jī)科學(xué)于一體 的高度交叉的新興技術(shù)。d n a 微陣列技術(shù)已被公認(rèn)將會給2 1 世紀(jì)的生命科學(xué)和醫(yī) 學(xué)研究帶來一場革命,并因此成為學(xué)術(shù)界和工藝界研究的一個熱點。美國總統(tǒng)克 林頓在1 9 9 8 年1 月的國情咨文演講中指出:“在未來的1 2 年內(nèi),基因芯片將為我 們一生中的疾病預(yù)防指點迷津”。另外,美國商界權(quán)威刊物f o r t u n e 對其重大意義 作了如下闡述:“微處理器在本世紀(jì)使我們的經(jīng)濟(jì)結(jié)構(gòu)發(fā)生了根本改變,給人類 帶來了巨大的財富,改變了我們的生活方式。然而,生物芯片給人類帶來的影響 可能會更大,它可能從根本上改變我們的醫(yī)學(xué)行為和生活質(zhì)量,從而改變世界的 面貌“。由于生物芯片技術(shù)領(lǐng)域的飛速發(fā)展,美國科學(xué)促進(jìn)協(xié)會于1 9 9 8 年底將 生物芯片評為1 9 9 8 年的十大科技突破之一“。 基因芯片就是利用點樣技術(shù)、現(xiàn)代探針固相原位合成技術(shù)、照相平板印刷技 術(shù)等微電子技術(shù)在有限的空間內(nèi),將成千上萬種基因的d n a 片段有組織的點在固 相片基上作為可尋址識別的基因探針。在微陣列實驗中,所有的r n a 被反轉(zhuǎn)錄成 帶有放射性同位素或熒光標(biāo)記的e d n a 。然后,c d n a 與由基因片段組成的、固相 片基上的大型d n a 文庫雜交。最后,采用熒光或其他成像技術(shù)測定上千個基因在 各種不同實驗條件下的表達(dá),以檢測不同組織或不同細(xì)胞的基因表達(dá)情況,為疾 病診斷和基因治療提供大量的遺傳變化信息”1 ,如圖1 1 所示。按照芯片的制作原 理,基因芯片可以分為很多類,但目前真正成熟的,且廣泛應(yīng)用的有使用原位合 成和合成點樣技術(shù)的微陣列( m i c r o a r r a y ) 。 圖1 1d n a 微陣列技術(shù)及應(yīng)用 1 1 1d n a 微陣列的制備技術(shù) d n a 微陣列的實質(zhì)是高度集成的寡核苷酸陣列,制造基因芯片首先要解決的 技術(shù)是如何在芯片片基上定位合成高密度的核酸探針。目前,基因芯片的制備技 術(shù)主要有以下幾種: 茸十做阱硎革罰女達(dá)講數(shù)批叼彬癌盼例碳完 1 1 1 1 原位合成法 原位合成( h as i r es y n t h e s i s ) 是指直接在芯片上用四種核苷酸合成所需探針 的基因芯片制備技術(shù)。原位合成方法可以制作高密度基因芯片,但是,需要的技 術(shù)設(shè)備復(fù)雜,成本較高并且合成的效率較低。主要包括: 1 原位光刻 美國a f f y m e t r i x 公司結(jié)合了半導(dǎo)體工業(yè)的光刻技術(shù)$ 1 d n a 合成技術(shù)制造發(fā)展 的一項高密度核酸陣列的基因芯片制備技術(shù)。它利用光保護(hù)基團(tuán)修飾芯片片基表 面堿基單體的活性羥基,通過設(shè)計特定的光刻掩膜和不斷地更換曝光區(qū)域,直接 在片基上合成所需高密度寡核昔酸陣列,探針數(shù)目在合成循環(huán)中呈指數(shù)增長。 2 原位噴印合成 原位噴印合成原理與噴墨打印類似,不過芯片噴印頭和墨盒有多個,墨盒中 裝的是四種堿基等液體而不是碳粉;采用的化學(xué)原理與傳統(tǒng)的d n a 固相合成一 致,因此不需要特殊制備的化學(xué)試劑。 3 分子印章多次壓印 根據(jù)所需微陣列,設(shè)計有凹凸的微印章,然后根據(jù)預(yù)先設(shè)計在制備的各級印 章上涂上對應(yīng)的單核苷酸;按照設(shè)計的順序?qū)⒉煌奈⒂≌轮饌€依次壓印在同一 基片上,得至u 2 5 6 2 5 6 陣列的高密度基因芯片。 1 1 1 2 合成點樣法 合成點樣法( o f f - c h i pd n as y n t h e s i s ) 是指將合成好的探針、c d n a 或基因 組d n a 通過特定的高速點樣機(jī)器人直接點在芯片片基上。制作基因芯片的密度 低,需要的設(shè)備簡單,成本較低,適用于多數(shù)實驗室制作基因芯片。目前, 除a f f y m e t r i x 等研究和生產(chǎn)基因芯片的少數(shù)大公司使用原位合成法外,其他中小 型公司和實驗室研究中普遍采用合成點樣法。 1 微型機(jī)械點樣法 該技術(shù)是由s h a l o n 和b r o w n 于1 9 9 5 年發(fā)展起來的一類芯片制備技術(shù),而后由 美國s y n t e n i 公司開發(fā)出商品儀器。該方法通過毛細(xì)作用使用點樣針將生化物質(zhì)轉(zhuǎn) 移到固體基底表面( 點樣針與基底表面接觸) ,每一輪結(jié)束后,清洗點樣針進(jìn)行 下一輪操作,而且機(jī)器人控制系統(tǒng)可使其實現(xiàn)自動化生產(chǎn)。 2 化學(xué)噴射法 將合成好的寡核苷酸探針定點噴射到芯片片基上來制作d n a 芯片。該技術(shù) f l j i n c y t ep h a r m a c e u t i c a l s 和p r o t o g e n e 公司等發(fā)展。該方法通過應(yīng)用與壓電接口相連 的微型噴嘴將生化物質(zhì)噴向基底,通過電流控制使樣品體積得到精確控制。 1 1 2d n a 微陣列技術(shù)的主要特點 d n a 微陣列技術(shù)將成千上萬的核酸探針固定于芯片片基上與標(biāo)記的樣品分子 進(jìn)行雜交,通過檢測每個探針分子的雜交信號強(qiáng)度獲取樣品分子中的基因表達(dá)水 平。相對于傳統(tǒng)的基因檢測技術(shù),d n a 微陣列技術(shù)的具有以下特點:技術(shù)操作簡 單、自動化程度高、檢測基因數(shù)量大、檢測效率高、應(yīng)用范圍廣、成本相對低。 1 2d n a 微陣列技術(shù)的應(yīng)用 d n a 微陣列技術(shù)將生命科學(xué)研究中許多不連續(xù)的分析過程,如樣本制備、生 化反應(yīng)和定性、定量檢測等,集中到指甲蓋大小的芯片上,使基因分析過程全自 動化,被稱為“芯片實驗室”( l a b o n - ac h i p ) 。該技術(shù)成千上萬倍提高基因分 析效率的同時,大大減少了樣品和試劑,并且實驗結(jié)果更具全面性、直觀性和 可重復(fù)性。因此,d n a 微陣列技術(shù)廣泛地應(yīng)用于分子生物學(xué)及醫(yī)學(xué)研究的各個方 面。 1 2 1 基因組測序 d n a 微陣列的思想是在基因測序的早期提出的,由于傳統(tǒng)的基因測序方法難 以解決人類基因組計劃如此繁重的工作,因此d n a 微陣列早期主要用來研究基因 組結(jié)構(gòu)。d n a 微陣列技術(shù)可在一次實驗中利用探針與待測樣本分子進(jìn)行大量雜交 反應(yīng),并分析雜交反應(yīng)產(chǎn)生的雜交圖譜而排列出待測樣品的序列。h a c i a 在n a t u r e g e n e t i c s 上對用寡核苷酸微陣列進(jìn)行基因重復(fù)測序和基因突變分析進(jìn)行了較為詳 細(xì)的敘述川。 1 2 2 基因表達(dá)分析 基因表達(dá)( g e n ee x p r e s s i o n ) 是指儲存遺傳信息的基因經(jīng)過一系列步驟表現(xiàn) 出其生物功能的整個過程。典型的基因表達(dá)是基因經(jīng)過轉(zhuǎn)錄、翻譯,產(chǎn)生有生物 活性的蛋白質(zhì)的過程。d n a 微陣列已被用來測定菌類、植物、動物和人類樣品中 的基因表達(dá)水平。 斯坦福大學(xué)的s c h e n a 于1 9 9 5 年首先使用d n a 微陣列研究擬南芥( a r a b i d o p s i s t h a l i a n a ) 基因表達(dá),通過芯片雜交分析擬南芥根與葉兩種組織中基因的差異表 達(dá)嘲。 d e r i s i 等“”應(yīng)用釀酒酵母( s a c c h a r o m v c e sc e r e v i s i a e ) e d n a 基因芯片研究孢 子在有絲分裂狀態(tài)下基因轉(zhuǎn)錄和表達(dá)水平的差異。斯坦福大學(xué)的b r o w n 研究小組 應(yīng)用合成點樣法制備釀酒酵母c d n a 微陣列,獲得酵母在不同細(xì)胞周期狀態(tài)以及 職十徽阱列菲習(xí)衷地誥戡荊均癬癢_ 陀測研究 在熱休克冷休克處理后其2 4 7 3 個基因的表達(dá)譜,較直觀地反應(yīng)了不同條件和狀態(tài) 下基因轉(zhuǎn)錄調(diào)控水平,為尋找基因調(diào)控的機(jī)理提供了一條有效的途徑。 t a n a k a 等“”利用基因芯片技術(shù)檢測了1 5 0 0 只小鼠妊娠中期子宮及胚胎發(fā)育過 程中基因的表達(dá)情況,從而了解到哺乳類動物胚胎發(fā)育過程中基因表達(dá)的動態(tài)變 化。 g o l u b 等”分析了人類白血病的6 8 1 7 個基因表達(dá)譜,利用基因表達(dá)水平的差 異將7 2 個白血病樣本分成a m l 和a l l 兩組,并取得了較好的準(zhǔn)確性。b u l l 等”1 用 包含前列腺癌、損害前身和正常組織的e d n a 微陣列研究前列腺癌中基因表達(dá)。 標(biāo)記從前列腺電切術(shù)( t u r p ) 或前列腺根治術(shù)得到的腫瘤樣品的e d n a ,分析其 表達(dá),揭示了許多上調(diào)轉(zhuǎn)錄和基因過表達(dá) 1 2 3 發(fā)現(xiàn)新基因 微陣列技術(shù)是一項發(fā)現(xiàn)新基因及分析各個基因在不同時空表達(dá)方面 十分有用的技術(shù),它具有樣品用量極少,自動化程度高等優(yōu)點,便于大 量篩選新基因。h e l e r 等”1 利用e d n a 芯片比較了炎證性疾病類風(fēng)濕關(guān)節(jié)炎 和腸炎組織中基因表達(dá)的不同,并導(dǎo)致進(jìn)一步發(fā)現(xiàn)了炎癥相關(guān)基因i l 3 ,g r o - a 等。b u a t e s 等“”鑒定了由激活因子( s 2 8 4 6 3 ) 誘導(dǎo)表達(dá)的一系列基 因。s c h e n a 等用包含1 0 5 6 個c d n a 的芯片與熱休克作用和佛波酯處理的t 細(xì)胞 的c d n a 雜交,發(fā)現(xiàn)了4 個新基因。目前,人類基因數(shù)據(jù)庫中有4 0 0 0 0 0 個基因表 達(dá)序列標(biāo)簽( e x p r e s s e ds e q u e n c et a g ,e s t ) 。成千上萬的e s t s 微陣列為人類基 因表達(dá)研究提供強(qiáng)有力的分析工具,加速人類基因組的功能分析。 1 2 4 在疾病診斷中的應(yīng)用 疾病的發(fā)生和發(fā)展實際是多種疾病相關(guān)基因表達(dá)失?;蛟S多疾病抑制基因失 活所致。利用基因微陣列技術(shù),可以找到與該疾病相關(guān)的基因,實現(xiàn)對該疾病快 速、簡便、高效的診斷。人類惡性腫瘤的6 0 與人類尸5 3 抑癌基因的突變有關(guān), 對癌癥樣本的基因突變和異常表達(dá)進(jìn)行檢測可以作為診斷的重要指標(biāo)。 k a u r a n i e m i 等利用e d n a 芯片技術(shù)和n o r t h e r n 雜交技術(shù)檢測了b r c a l 乳腺癌 患者m y b 基因m r n a 的表達(dá)情況,發(fā)現(xiàn)在b r c a l 突變型中m y b 基因表達(dá)較常 見”。o k u s t s u 等從7 6 例急性細(xì)胞白血病( a m l ) 患者獲得2 3 0 4 0 個基因構(gòu)成的腫 瘤細(xì)胞基因表達(dá)譜,結(jié)果a m l 患者有6 3 個基因過表達(dá),3 7 2 個基因的表達(dá)受到 抑制,這些基因可能調(diào)控與a m l 發(fā)病分子機(jī)制有關(guān)的關(guān)鍵因子,也成為a m l 藥 物治療的潛在靶基因。同時通過比較a m l 患者對化療敏感者與對化療不敏感 患者的基因表達(dá)情況發(fā)現(xiàn)有2 8 個基因的表達(dá)水平不同,基于此基礎(chǔ)建立一個 個體抗腫瘤藥物的敏感系統(tǒng),預(yù)示化療最終走向個性化治療的目標(biāo)”。k a n 等 把人食管癌細(xì)胞系和人食管組織點在c d n a 微陣列上,把k y a z 和o e 3 3 ( 腺癌) 從k y s e 系( 鱗狀細(xì)胞癌) 中區(qū)分出來,識別了在k y a z 和o e 3 3 中特征性表達(dá) 的基因”“。l o s s o s 等在一項獨立研究中發(fā)現(xiàn),根據(jù)i g 基因超突變的有無,可將 彌漫性大b 細(xì)胞淋巴瘤( d i f u s el a r g eb c e l ll y m p h o m a ,d l b c l ) 分為兩個亞 型。b r o w n 等運(yùn)用d n a 微陣列技術(shù)對脆x 綜合癥( f r a g i l e - xs y n d r o m e ,f r ax ) 的分子生物學(xué)機(jī)制及早期診斷進(jìn)行了研究”“。 d n a 微陣列技術(shù)為臨床疾病的診斷提供了一種全新的概念,它不僅使實驗檢 測的高通量、高自動化,微量化得以實現(xiàn),并且在臨床上對使某些疑難疾病的準(zhǔn) 確診斷成為可能。 1 2 5 在藥物研究中的應(yīng)用 基因芯片技術(shù)在新藥開發(fā)、藥物靶標(biāo)的發(fā)現(xiàn),多靶位藥物篩選、藥物作用 的分子機(jī)理研究、藥物療效及副作用等方面具有明顯優(yōu)勢,還可以將藥物的生 物效應(yīng)和基因變化密切相聯(lián)系,從而為藥物的研究和開發(fā)注入了新的生機(jī)和活 力。k u m a r - s i n h a 等利用d n a 芯片篩選發(fā)現(xiàn)脂酸合酶( f a s ) 基因及其相應(yīng)的信 號通路與乳腺癌的發(fā)生相關(guān),提示該通路可能被用來作為治療或藥物篩選的新靶 標(biāo)”1 。r o g e r s 等通過d

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論