




免費(fèi)預(yù)覽已結(jié)束,剩余1頁(yè)可下載查看
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
基化分析 基于人類九種細(xì)胞系和 15 種組織的單堿基精度的甲基化數(shù)據(jù),計(jì)算了基因范圍六個(gè)功能區(qū)域(轉(zhuǎn)錄起始區(qū)域、第一外顯子、中間外顯子、最后外顯子、內(nèi)含子和轉(zhuǎn)錄終止區(qū)域)的甲基化水平,分析了各功能區(qū)域甲基化的分布,并采用離散增量和歐式距離兩類參數(shù)分別計(jì)算了細(xì)胞系和組織間的基因的甲基化差異,并對(duì)具有較高差異水平的前 20 個(gè)基因在六類細(xì)胞系的表達(dá)進(jìn)行了分析。 基因表達(dá)是一個(gè)多因素調(diào)控的復(fù)雜過程。 在多細(xì)胞生物的發(fā)育過程中,基因支持著 生命 的基本構(gòu)造和性能。生物體的生、老、病、成長(zhǎng)等一切的生命現(xiàn)象都與基因有關(guān)。其內(nèi)部的基因表達(dá)模式很大程度上決定著細(xì)胞如何分化 。而基因的表達(dá)不僅僅依賴于儲(chǔ)存于 的遺傳信息, 轉(zhuǎn)錄因子的調(diào)控作用,還與組蛋白修飾 、 基化等表觀遺傳因素相關(guān) 。 基化是表觀遺傳學(xué)研究?jī)?nèi)容之一,是指胞嘧啶第五位碳原子在 基轉(zhuǎn)移酶 )作用 下被甲基化修飾,修飾之后的堿基就叫做“ 5簡(jiǎn)稱為 5。 甲基化參與 了 基因的表達(dá)調(diào)控、發(fā)育調(diào)節(jié)、基因組印跡和 x 染色體 失 活 等生命活動(dòng) 2。 人們發(fā)現(xiàn) 基化與癌癥或人類嚴(yán)重疾病有著密切聯(lián)系。 在髓細(xì)胞性白血病中發(fā)現(xiàn)了大量異常超甲基化的基因,并認(rèn)為癌細(xì)胞中的甲基化模式顯著不同于正常細(xì)胞 。因此, 式的研究與 異常 甲基化的探測(cè)具有重要的生物學(xué)意義,能夠?qū)δ[瘤的治療提供幫助。 基化在轉(zhuǎn)錄水平 上 調(diào)控 著 基因 的 表達(dá) (主要是在轉(zhuǎn)錄起始階段 )。 例如, 通過基因啟動(dòng)子及其 附近區(qū)域內(nèi) 胞嘧啶的甲基化可以關(guān)閉某種組織或細(xì)胞不必要的基因,而去甲基化作用則可指導(dǎo)組織特異性或階段特異性基因的活化,使基因表達(dá)具有時(shí)空 特點(diǎn) 3。通常情 況下,啟動(dòng)子區(qū)域 甲基化不僅伴隨著轉(zhuǎn)錄抑制,并且高甲基化水平的基因表現(xiàn)出低表達(dá)現(xiàn)象,反之,低甲基化水平的基因表現(xiàn)出活躍表達(dá)的現(xiàn) 象 4。對(duì)哺乳動(dòng)物來說,正確的基化模式對(duì)其生育能力和后代存活率是必不可 少的 5 因此 , 對(duì) 基化的研究將增進(jìn)我們對(duì)基因調(diào)控和人類基因組的認(rèn)識(shí)。 近年來, 基化方面的研究?jī)?nèi)容包括 : 1、全基因 組和功能區(qū)域 基化差異分析; 2、 功能區(qū)域的甲基化 水平的預(yù)測(cè); 3、 基化 對(duì)基因表達(dá) 調(diào)控的 作用; 基化與其他因子的相互作用 。 5、 基化對(duì)癌癥發(fā)生的影響。 運(yùn)用 M&M 算法整合 據(jù)識(shí)別了全基因組甲基化差異區(qū)域,發(fā)現(xiàn)組織和細(xì)胞的增強(qiáng)子區(qū)差異甲基化伴隨著轉(zhuǎn)錄因子結(jié)合和組蛋白修飾的變化,而啟動(dòng)子甲基化特征與維持基本的生物學(xué)功能相關(guān)。 u 等提出了基于高通量單堿基精度的甲基化數(shù)據(jù)識(shí)別和分析基因組區(qū)域甲基化模式的算法,并發(fā)現(xiàn)了細(xì) 胞系特異的甲基化模式 10。另外,還有 基化特征在細(xì)胞分化時(shí)的保守性和動(dòng)力學(xué)研究 11, 基化與轉(zhuǎn)錄因子結(jié)合的關(guān)聯(lián) 12,全基因組 甲基化和基因間區(qū)域去甲基化特征研究 13, 14,15,以及 基化對(duì)共轉(zhuǎn)錄剪接過程的影響 16。 高通量測(cè)序方法實(shí)現(xiàn)了整個(gè)基因組范圍內(nèi)高精度的甲基化檢測(cè),如,亞硫酸氫鹽測(cè)序方法( 10、甲基化 疫共沉淀測(cè)序方法( 甲基結(jié)合蛋白測(cè)序方法。 本文從 ) 下載了 9 類細(xì)胞系和 15種組織的 基化數(shù)據(jù),是由 法獲得的具有全基因組單堿基分辨率的甲基化數(shù)據(jù)。首先,對(duì)來自 )全基因組且外顯子的個(gè)數(shù)大于等于 3的 21740 個(gè)基因,分為轉(zhuǎn)錄起始區(qū)、第一外顯子、中間外顯子、最后外顯子、內(nèi)含子和轉(zhuǎn)錄終止區(qū)六個(gè)功能區(qū)域,統(tǒng)計(jì)了每個(gè)區(qū)域內(nèi)的甲基化水平分布,發(fā)現(xiàn)每個(gè)區(qū)域的甲基化水平具有明顯的差異?;诿總€(gè) 基因在六個(gè)區(qū)域的甲基化值,利用離散增量和歐式距離兩類參數(shù)分別計(jì)算了基因在不同細(xì)胞系和組織間的甲基化差異,得到了在細(xì)胞系和組織間具有較高甲基化差異的基因,并對(duì)前 20 個(gè)基因的表達(dá)進(jìn)行了分析。結(jié)果表明,管家基因甲基化差異值都比較小,始終保持著較低水平的甲基化,是維持細(xì)胞基本代謝所必須并且一直處于活性轉(zhuǎn)錄狀態(tài)的基因。 人類基因組序列和 因注釋信息來自 )的 本,包括基因 49611 個(gè)轉(zhuǎn)錄本,經(jīng)過篩選之后剩余 21740 個(gè)( +鏈為 11054 個(gè), 0686 個(gè))作為研究對(duì)象。篩選條件為:一、轉(zhuǎn)錄起始位點(diǎn)相同的轉(zhuǎn)錄本,選取第一個(gè),刪除其余的轉(zhuǎn)錄本;二、轉(zhuǎn)錄本的外顯子的個(gè)數(shù)滿足大于等于 3。對(duì)其中的每個(gè)基因,看成由六個(gè)區(qū)域構(gòu)成:轉(zhuǎn)錄起始區(qū),即轉(zhuǎn)錄起始位點(diǎn)前 2轉(zhuǎn)錄起始位點(diǎn)間的區(qū)域 (第一外顯子區(qū) (中間外顯子區(qū) (內(nèi)含子區(qū) (最后外顯子區(qū) (以及轉(zhuǎn)錄終止區(qū)域,即轉(zhuǎn)錄終止位點(diǎn)到轉(zhuǎn)錄終止位點(diǎn)后 2的區(qū)域 ( 基化數(shù)據(jù)來自 ), 共下載了 9 類細(xì)胞系和 15 種組織 (分別為 H1 H1 1 H1 式的 基化數(shù)據(jù)( 件)。據(jù)來自 劃( ),由于數(shù)據(jù)庫(kù)提供的數(shù)據(jù)有限,只下載了 6 類細(xì)胞系 (分別為 H1 H1 H1 表達(dá)數(shù)據(jù)。 考慮到樣本的測(cè)序深度差異,以及不同區(qū)域中 聯(lián)體的含量的不同,定義區(qū)域的甲基化水平為其中, C 為測(cè)序深度,i 個(gè) 點(diǎn)的甲基化數(shù)值, n 是區(qū)域中的 點(diǎn)總數(shù),N 代表對(duì)應(yīng)功能序列中 聯(lián)體的個(gè)數(shù)。對(duì)正負(fù)鏈上的每一轉(zhuǎn)錄本的 6 個(gè)功能區(qū)域,分別計(jì)算了其甲基化值。特別是,對(duì)含有多個(gè)中間外顯子的轉(zhuǎn)錄本,將轉(zhuǎn)錄本中的所有中間外顯子(或內(nèi)含子)連接,看作是中間外顯子(或內(nèi)含子)區(qū)域來進(jìn)行計(jì)算。正鏈的結(jié)果如圖 1 所示,橫軸為各個(gè)功能區(qū)域的甲基化值,最小值為 0,每隔 一個(gè)區(qū)間,縱 軸為處于該甲基化 總體上,每個(gè)功能區(qū)域 基化分布在正負(fù)鏈的結(jié)果基本一致。從圖 1 看,對(duì)中間外顯子 (最后外顯子 (具有 基化水平的樣本最多而具有較 低甲基化和高于 基化水平的樣本較少,對(duì)內(nèi)含子 (轉(zhuǎn)錄終止區(qū) (分別在 基化水平的樣本最多而具有較低甲基化和高于 基化的樣本較少。其中, 峰值比其余的細(xì)胞系要低; 峰值比其余的組織要高。對(duì)轉(zhuǎn)錄起始區(qū)域 (樣本的甲基化基本分布在 ,樣本在這個(gè)區(qū)間的分布較為均勻, 9 類細(xì)胞系和 15 種組織的轉(zhuǎn)錄起始區(qū)域分別在 近、 間的樣本數(shù)達(dá)到最大,呈現(xiàn)兩個(gè)峰;其中, 第二峰分布的樣本個(gè)數(shù)比其余的少, 第二峰分布的樣本個(gè)數(shù)比其余的多。對(duì)第一外顯子區(qū)域 (樣本的甲基化范圍較其他 5 個(gè)區(qū)域低,基本分布在 圍內(nèi)。其中, 間分布的樣本多, 0 值分布的樣本多,其余在 間分布的樣本多。而且,比較 9 類細(xì)胞系和 15 種組織的結(jié)果, 9 種細(xì)胞系的峰值比 15 種組織的峰值要高,對(duì)應(yīng)區(qū)域趨勢(shì)基本上是一致的。 以上結(jié)果說明,六個(gè)功能區(qū)域的 基化 水平是不同的??傮w上,在中間外顯子 (最后外顯子 (內(nèi)含子 (轉(zhuǎn)錄終止 (個(gè)區(qū)域的 基化水平偏高,第一外顯子區(qū)域 (甲基化水平偏低,轉(zhuǎn)錄起始區(qū)域 ( 基化水平分布在一定的區(qū)間范圍。其中, 胞系 (甲基化分布與其他細(xì)胞系差別較大,可能因該細(xì)胞系為女性胎兒,與其余不同。我們推測(cè),啟動(dòng)子區(qū)域的甲基化水平是基因的甲基化差異的主要原因。 基化差異基因 表觀遺傳學(xué)是研究序列一致的條件下,發(fā)生的可遺傳變異。因此,對(duì) 21740 個(gè)基因,具有一致的序列,分析它們?cè)诓煌N細(xì)胞系和組織中甲基化的差異,尋找差異表達(dá),有助于研究基因的特異性表達(dá),能夠?qū)虻谋磉_(dá)調(diào)控研究提供基礎(chǔ)。 散增量法 對(duì)每一個(gè)基因,由 個(gè)功能區(qū)域構(gòu)成。計(jì)算基因 為 ( 1 , . . . , 2 4 ; 1 , . . . , 6 )i j r,其中 i 代表第i 種細(xì)胞系或組織, j 代表第 j 個(gè)功能區(qū)域。設(shè) ( ; 1 , . . . , 6 )i m jg 在第 m 類細(xì)胞系或組織中的甲基化值, ( ; 1 , . . . , 6 )i n jg 在第 n 類細(xì)胞系或組織中的甲基化值。則第 n 類細(xì)胞系或組織中甲基化值的離散量為: 六個(gè)功能區(qū)域甲基化水平的分布結(jié)果表明,不同區(qū)域的甲基化值具有較顯著的差異。因此得到標(biāo)準(zhǔn)化后的甲基化值。其中,m 類細(xì)胞系或組織第 j 類功能區(qū)域甲基化值的標(biāo)準(zhǔn)差,對(duì)所有細(xì)胞系或組織中基因的六個(gè)功能區(qū)域分別計(jì)算,得到每一基因 6 個(gè)區(qū)域的標(biāo)準(zhǔn)甲基化值 ( 1, . . . , 2 4 ; 1, . . . , 6 )i j, g 的第 j 個(gè)功能區(qū)域在第 m 類細(xì)胞系或組織中的 標(biāo)準(zhǔn)甲基化值; )6,.,1;( g 的第 j 個(gè)功能區(qū)域在第 n 類細(xì)胞系或組織中的標(biāo)準(zhǔn)甲基化值,則歐式距離 得到 基因 g 在細(xì)胞系和組織 m 和 n 之間的甲基化差異水平,由 (5)和 (9)式的結(jié)果,定義基因 g 在所有細(xì)胞系或組織的總體差異性水平為得到基因 g 在不同種細(xì)胞系和組織的總體差異化數(shù)值。值越大,表明該基因在不同種細(xì)胞系和組織中差異化程度越高,兩種算法中每個(gè)基因的差異化數(shù)值的分布如圖 2 所示。圖 2 是離散增量和歐式距離兩種算法得到的基因的 基化差異的分布結(jié)果。橫軸表示差異化數(shù)值區(qū)間;離散增量法中,最小值為 0,每隔 10 為一個(gè)區(qū)間;歐式距離法中,最小值為 0,每隔 25 為一個(gè)區(qū)間;縱軸表示在相應(yīng)區(qū)間內(nèi)基因的個(gè)數(shù);黑白分別表示相應(yīng)的正 負(fù)鏈。采用離散增量法,差異化數(shù)值 0間基因的個(gè)數(shù)居多;采用歐式距離法,差異化數(shù)值 100間基因的個(gè)數(shù)居多。將兩種算法中的管家基因提取出來,管家基因的差異化數(shù)值分布情況如表 1 所示。通過觀察表 1,可以看出無論是哪種方法、正負(fù)鏈,管家基因都分布在數(shù)值小的區(qū)域,說明在 9 種細(xì)胞系和 15 種組織中管家基因差別很小,在各個(gè)細(xì)胞系和組織中幾乎不發(fā)生改變,對(duì)保持細(xì)胞的基本代謝是至關(guān)重要的。為了比較這兩種算法的計(jì)算結(jié)果是否具有一致性,對(duì)兩種計(jì)算方式的結(jié)果討論其相關(guān)性(如圖 3 所示)。橫坐標(biāo)為離散增量方法計(jì)算得到的基 因的差異化數(shù)值;縱坐標(biāo)為歐式距離方法計(jì)算得到的基因的差異化數(shù)值。由圖可知,兩種算法得到的差異甲基化基因具有一致性,正負(fù)鏈的相關(guān)性系數(shù)分別為 基化差異基因的表達(dá)分析 通過以上兩種算法,找出差異化數(shù)值最大的前 20 個(gè)基因,基因概況如表 2 所示,計(jì)算每個(gè)細(xì)胞系和組織中差異化基因的表達(dá)值,基因的表達(dá)水平用 來衡量 17 (11) 公式中,i 外顯子的 , C 為測(cè)序深度, 6 種細(xì)胞系中具有甲基化差異的前 20 個(gè)基因的表達(dá)值進(jìn)行比較,結(jié)果如圖 4 所示。(a)圖為運(yùn)用離散增量法得到的甲基化差異基因的表達(dá)值, (b)圖為運(yùn)用歐式距離法得到的甲基化差異基因的表達(dá)值,橫軸為 20 個(gè)差異化基因(按照差異化數(shù)值從大(左)到小(右)排列),縱軸為其表達(dá)值。離散增量法發(fā)現(xiàn) 因表達(dá)值差異最大且均表達(dá),距離參數(shù)法發(fā)現(xiàn) 達(dá)值差異最大且均表達(dá)。通過分析, 轉(zhuǎn)錄因子與抑制細(xì)胞凋亡 ,促進(jìn)細(xì)胞增殖分裂。 族基因編碼的轉(zhuǎn)錄因子參與調(diào)節(jié)胚胎的發(fā)生和胚外發(fā)展 18。 胎癌衍生的生長(zhǎng)因子 要表達(dá)于胚胎發(fā)育早期階段,調(diào)節(jié)細(xì)胞分化和胚胎發(fā)育,在成年人體一般不表達(dá),當(dāng)細(xì)胞發(fā)生惡變時(shí)又重新表達(dá);其編碼的蛋白質(zhì)是一個(gè)細(xì)胞外,膜結(jié)合信號(hào)蛋白在胚胎發(fā)育和腫瘤生長(zhǎng)中起重要作用。 在于原始哺乳動(dòng)物的性染色體, 因被保持用來彌補(bǔ)兩性之間的基因差異,因?yàn)槠涫潜3趾颂?體活性所必需的。 因是編碼腫瘤壞死因子受體超家族的成員之一,所編碼的蛋白在淋巴和其他器官,脂質(zhì)代 謝,免疫反應(yīng),和程序性細(xì)胞死亡的發(fā)展期間起發(fā)信號(hào)的作用,該受體的活性也與癌癥發(fā)生有關(guān)。 因編碼定位于高爾基體短卷曲螺旋結(jié)構(gòu)域的蛋白,所編碼的蛋白質(zhì)與 糖基化因
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 幼兒園教職工崗位職責(zé)職責(zé)劃分研究
- 2025企業(yè)英語培訓(xùn)教研組計(jì)劃
- 部編版三年級(jí)語文文化拓展計(jì)劃
- 小學(xué)五年級(jí)班主任學(xué)生行為規(guī)范計(jì)劃
- 上饒職業(yè)技術(shù)學(xué)院《復(fù)調(diào)基礎(chǔ)(2)》2023-2024學(xué)年第一學(xué)期期末試卷
- 包裝機(jī)械的智能傳感網(wǎng)絡(luò)考核試卷
- 四川省廣元市劍閣縣2025屆數(shù)學(xué)八上期末檢測(cè)模擬試題含解析
- 體育場(chǎng)館鋼結(jié)構(gòu)安裝安全防護(hù)措施
- 配送環(huán)節(jié)成品保護(hù)措施
- 吉利學(xué)院《跆拳道教學(xué)與實(shí)踐》2023-2024學(xué)年第一學(xué)期期末試卷
- 2024年安徽省合肥市北城片區(qū)七年級(jí)數(shù)學(xué)第一學(xué)期期末學(xué)業(yè)水平測(cè)試試題含解析
- 2025至2030中國(guó)銅冶煉行業(yè)發(fā)展現(xiàn)狀及應(yīng)用需求現(xiàn)狀分析報(bào)告
- 農(nóng)業(yè)保險(xiǎn)培訓(xùn)課件
- 茶園租賃合同(含茶葉加工銷售)
- 2025至2030全球及中國(guó)浮式液化天然氣行業(yè)產(chǎn)業(yè)運(yùn)行態(tài)勢(shì)及投資規(guī)劃深度研究報(bào)告
- 藥品連鎖總部管理制度
- 2025至2030中國(guó)家用清潔工具行業(yè)發(fā)展趨勢(shì)分析與未來投資戰(zhàn)略咨詢研究報(bào)告
- 20250617國(guó)金證券機(jī)器人行業(yè)研究垂直領(lǐng)域具身智能機(jī)器人的野望416mb
- 物理●湖北卷丨2024年湖北省普通高中學(xué)業(yè)水平選擇性考試物理試卷及答案
- 仿制藥生物等效性試驗(yàn)指導(dǎo)原則(日本)
- 一諾LZYN質(zhì)量流量計(jì)使用說明書-2009版
評(píng)論
0/150
提交評(píng)論