版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
中文摘要肝癌是全球惡性腫瘤死亡的重要原因之一,其中肝細(xì)胞癌是最常見(jiàn)的原發(fā)性肝癌類型,占所有原發(fā)性肝癌的90%。在中國(guó),肝細(xì)胞癌的發(fā)病率和死亡率分別位列惡性腫瘤第四和第三位,屬于惡性程度較高的類型。因此,本研究將基于加權(quán)平均共表達(dá)網(wǎng)絡(luò)的構(gòu)建,探究與肝細(xì)胞癌進(jìn)展相關(guān)的關(guān)鍵基因,以期為此類肝癌的臨床治療提供有力的幫助。我們對(duì)TCGA中獲得的HCC轉(zhuǎn)錄組數(shù)據(jù)以及樣本臨床信息數(shù)據(jù)進(jìn)行了預(yù)處理和差異表達(dá)分析,并利用加權(quán)平均共表達(dá)網(wǎng)絡(luò)篩選出與肝細(xì)胞癌進(jìn)展相關(guān)的關(guān)鍵模塊。基于前期研究,我們將關(guān)鍵模塊的基因和差異基因進(jìn)行比較,從而確定最佳的關(guān)鍵基因,并運(yùn)用單因素Cox回歸和Lasso回歸,構(gòu)建出預(yù)測(cè)模型。通過(guò)計(jì)算關(guān)鍵基因的風(fēng)險(xiǎn)回歸系數(shù),我們獲得了樣本的風(fēng)險(xiǎn)評(píng)分,將樣本按風(fēng)險(xiǎn)評(píng)分進(jìn)行分組,并進(jìn)行K-M生存分析。最終,我們采用高低風(fēng)險(xiǎn)分組的差異表達(dá)分析、單多因素Cox回歸以及對(duì)外部驗(yàn)證集進(jìn)行驗(yàn)證模型等多項(xiàng)評(píng)價(jià),證明了所建立的肝細(xì)胞癌風(fēng)險(xiǎn)預(yù)后模型的良好預(yù)測(cè)能力。經(jīng)過(guò)分析,我們發(fā)現(xiàn)16905個(gè)基因的表達(dá)水平存在顯著的變化,為此,我們利用超幾何分析、功能富集等方法,創(chuàng)建出一個(gè)加權(quán)的基因共表達(dá)網(wǎng)絡(luò),從而確定出一些具有重要意義的關(guān)鍵模塊。最后,通過(guò)對(duì)這些關(guān)鍵模塊的比較,我們確定出最佳的候選基因。通過(guò)使用Cox和Lasso回歸技術(shù),我們可以確定重要的基因。我們還可以對(duì)這些基因進(jìn)行K-M生存率測(cè)定,比較不同風(fēng)險(xiǎn)水平的表達(dá)情況,同時(shí)還可以對(duì)其他兩種方法的結(jié)果進(jìn)行比較,最后通過(guò)外部驗(yàn)證來(lái)ACK結(jié)果的準(zhǔn)確性。結(jié)果證明低風(fēng)險(xiǎn)患者預(yù)后相對(duì)高風(fēng)險(xiǎn)患者要好,從而證明了我們所建立的模型具有良好的預(yù)后效能。我們獲得了16905個(gè)基因的表達(dá)值進(jìn)行差異表達(dá)分析,在其基礎(chǔ)上構(gòu)建加權(quán)基因共表達(dá)網(wǎng)絡(luò)得到多個(gè)模塊,并通過(guò)超幾何分析和功能富集篩選關(guān)鍵模塊。將關(guān)鍵模塊與差異基因取交可得到候選關(guān)鍵基因。利用單因素Cox及Lasso回歸篩選關(guān)鍵基因并建立模型,根據(jù)模型將樣本進(jìn)行分組,進(jìn)行K-M生存分析、高低風(fēng)險(xiǎn)組的差異表達(dá)分析以及單、多因素Cox分析以及外部驗(yàn)證集驗(yàn)證等多項(xiàng)評(píng)價(jià)。結(jié)果證明低風(fēng)險(xiǎn)患者預(yù)后相對(duì)高風(fēng)險(xiǎn)患者要好,從而證明了我們所建立的模型具有良好的預(yù)后效能。經(jīng)過(guò)深入研究,我們發(fā)現(xiàn)在HCC的發(fā)展歷史上,一系列重要的基因起著至關(guān)重要的作用,而且它們的表達(dá)水平也會(huì)對(duì)HCC的預(yù)后產(chǎn)生重要影響,從而為hcc的診斷、治療以及預(yù)后評(píng)估提供重要的參考依據(jù)。關(guān)鍵詞:肝細(xì)胞癌;WGCNA;關(guān)鍵基因;預(yù)后模型
Identificationofkeygenesdrivingtheprogressionofhepatocellularcarcinomabasedonweightedaverageco-expressionnetworksAbstractGlobally,livercancerisamajorcontributortothedeathofmalignanttumors,withHepatocellularCarcinoma(HCC)beingthemostprevalent,accountingfor90%ofallprimarylivercancers.InChina,HCCisfourthinincidenceandthirdinmortalityrates,andisdeemedahighlymalignanttype.ExploringkeygenesrelatedtoHCCprogressionthroughtheconstructionofaweightedgeneco-expressionnetwork,thisstudyseekstoproviderobustbackingforclinicaltreatmentofthistypeoflivercancer.WepreprocessedanddifferentiallyexpressedHCCtranscriptomedataandsampleclinicalinformationdataobtainedfromTCGA,andusedweightedmeanco-expressionnetworktoscreenoutkeymodulesassociatedwithHCCprogression.Onthisbasis,theintersectionofkeymodulegenesanddifferentialgeneswasselectedascandidatekeygenes,andtherequiredkeygeneswerefurtherscreenedbysingle-factorCoxregressionandLassoregressiontoestablishthepredictionmodel.Bycalculatingtheriskregressioncoefficientsofkeygenes,weobtainedtheriskscoresofthesamples,groupedthesamplesaccordingtotheriskscores,andconductedK-Msurvivalanalysis.Finally,weuseddifferentialexpressionanalysisofhighandlowriskgroups,singleandmulti-factorCoxregressionandvalidationmodelofexternalvalidationsetstoprovethegoodpredictiveabilityoftheestablishedhepatocellularcarcinomariskandprognosismodel.Weobtained16905geneexpressionvaluesfordifferentialexpressionanalysis,basedonwhichaweightedgeneco-expressionnetworkwasconstructedtoobtainmultiplemodules,andthekeymoduleswerescreenedbyhypergeometricanalysisandfunctionalenrichment.Candidatekeygenescanbeobtainedbycrossingkeymoduleswithdifferentialgenes.Single-factorCoxandLassoregressionwereusedtoscreenkeygenesandestablishamodel.Accordingtothemodel,thesamplesweregrouped,andanumberofevaluationsincludingK-Msurvivalanalysis,differentialexpressionanalysisofhigh-lowriskgroups,singlefactorCoxanalysisandmulti-factorCoxanalysisandexternalvalidationsetverificationwereconducted.Theresultsshowthattheprognosisoflow-riskpatientsisbetterthanthatofhigh-riskpatients,whichprovesthatourmodelhasgoodprognosticefficacy.Ourin-depthstudyrevealedthatanumberofessentialgenesareessentialtothehistoryofHCC,andtheirexpressionlevelswillhaveamajoreffectontheprognosisofHCC,thusmakingthemacrucialreferencefordiagnosing,treatingandevaluatinghcc.Keywords:Hepatocellularcarcinoma;WGCNA;Keygenes;Prognosticmodel1、文獻(xiàn)綜述1.1研究背景和國(guó)內(nèi)外研究現(xiàn)狀肝癌已被證實(shí)為全球惡性腫瘤死亡的首要原因,其中肝細(xì)胞癌(HCC)是最常見(jiàn)的原發(fā)性癌癥,它不僅可能與肝硬化有關(guān)ADDINEN.CITEADDINEN.CITE.DATA[1],而且還可能與酗酒、慢性乙型肝炎、丙型肝炎以及攝入黃曲霉毒素等有毒物質(zhì)有關(guān)ADDINEN.CITEADDINEN.CITE.DATA[2]。肝細(xì)胞癌是一種常見(jiàn)的惡性腫瘤,在中國(guó)和世界其他地方發(fā)病率和死亡率都很高。肝細(xì)胞癌的治療效果不佳,僅10-20%的病例能夠通過(guò)外科技術(shù)獲得徹底的治療ADDINEN.CITEADDINEN.CITE.DATA[3],而且5年的總體治愈率也不超過(guò)18%。統(tǒng)計(jì)數(shù)據(jù)顯示,到2025年,每年將有超過(guò)1萬(wàn)肝癌新發(fā)病例,這對(duì)全球醫(yī)學(xué)領(lǐng)域構(gòu)成重大挑戰(zhàn)ADDINEN.CITE<EndNote><Cite><Author>Llovet</Author><Year>2021</Year><RecNum>8</RecNum><DisplayText><styleface="superscript"font="TimesNewRoman">[4]</style></DisplayText><record><rec-number>8</rec-number><foreign-keys><keyapp="EN"db-id="asvp9xx9kxe0rlex0wp5r5fxaepftrxd90ww"timestamp="1683808406">8</key><keyapp="ENWeb"db-id="">0</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>Llovet,JosepM.</author><author>Kelley,RobinKate</author><author>Villanueva,Augusto</author><author>Singal,AmitG.</author><author>Pikarsky,Eli</author><author>Roayaie,Sasan</author><author>Lencioni,Riccardo</author><author>Koike,Kazuhiko</author><author>Zucman-Rossi,Jessica</author><author>Finn,RichardS.</author></authors></contributors><titles><title>Hepatocellularcarcinoma</title><secondary-title>NatureReviewsDiseasePrimers</secondary-title></titles><periodical><full-title>NatureReviewsDiseasePrimers</full-title></periodical><volume>7</volume><number>1</number><dates><year>2021</year></dates><isbn>2056-676X</isbn><urls></urls><electronic-resource-num>10.1038/s41572-020-00240-3</electronic-resource-num></record></Cite></EndNote>[4]。因此,對(duì)肝細(xì)胞癌的研究非常重要?,F(xiàn)有一些研究表明,有一些基因在HCC的發(fā)展過(guò)程中發(fā)揮著極其重要的作用,可能成為肝細(xì)胞癌的藥物治療靶點(diǎn)和預(yù)后因子,為臨床治療和預(yù)后分析提供幫助。比如,TP53可以通過(guò)誘導(dǎo)細(xì)胞凋亡來(lái)調(diào)節(jié)肝癌干細(xì)胞的數(shù)量和活性,TP53的缺失或突變會(huì)導(dǎo)致肝癌干細(xì)胞的增殖和凋亡抵抗,從而促進(jìn)肝細(xì)胞癌的發(fā)生和進(jìn)展ADDINEN.CITE<EndNote><Cite><Author>Liu</Author><Year>2009</Year><RecNum>7</RecNum><DisplayText><styleface="superscript"font="TimesNewRoman">[5]</style></DisplayText><record><rec-number>7</rec-number><foreign-keys><keyapp="EN"db-id="asvp9xx9kxe0rlex0wp5r5fxaepftrxd90ww"timestamp="1683808336">7</key><keyapp="ENWeb"db-id="">0</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>Liu,Y.</author><author>Elf,S.E.</author><author>Asai,T.</author><author>Miyata,Y.</author><author>Liu,Y.</author><author>Sashida,G.</author><author>Huang,G.</author><author>DiGiandomenico,S.</author><author>Koff,A.</author><author>Nimer,S.D.</author></authors></contributors><auth-address>MolecularPharmacologyandChemistryProgram,Sloan-KetteringInstitute,MemorialSloan-KetteringCancerCenter,NewYork,NY,USA.</auth-address><titles><title>Thep53tumorsuppressorproteinisacriticalregulatorofhematopoieticstemcellbehavior</title><secondary-title>CellCycle</secondary-title></titles><periodical><full-title>CellCycle</full-title></periodical><pages>3120-4</pages><volume>8</volume><number>19</number><edition>2009/09/17</edition><keywords><keyword>Apoptosis</keyword><keyword>CellCycle</keyword><keyword>CellularSenescence</keyword><keyword>DNADamage</keyword><keyword>HematopoieticStemCells/*cytology/physiology</keyword><keyword>Proto-OncogeneProteinsc-mdm2/metabolism</keyword><keyword>TranscriptionFactors/metabolism</keyword><keyword>TumorSuppressorProteinp53/genetics/metabolism/*physiology</keyword></keywords><dates><year>2009</year><pub-dates><date>Oct1</date></pub-dates></dates><isbn>1551-4005(Electronic) 1538-4101(Print) 1551-4005(Linking)</isbn><accession-num>19755852</accession-num><urls><related-urls><url>/pubmed/19755852</url></related-urls></urls><custom2>PMC4637974</custom2><electronic-resource-num>10.4161/cc.8.19.9627</electronic-resource-num></record></Cite></EndNote>[5];CTNNB1的異常激活促進(jìn)肝癌細(xì)胞的凋亡和自噬ADDINEN.CITEADDINEN.CITE.DATA[6];c-Myc可以促進(jìn)肝癌細(xì)胞的增殖并且抑制細(xì)胞凋亡通路,c-Myc與多種信號(hào)通路相互作用和調(diào)控,如PI3K/Akt、Wnt等,從而參與了肝癌細(xì)胞的生長(zhǎng)、轉(zhuǎn)移和藥物敏感性ADDINEN.CITEADDINEN.CITE.DATA[7];SLC1A5在HBV相關(guān)肝細(xì)胞癌中扮演重要角色,通過(guò)調(diào)節(jié)免疫細(xì)胞浸潤(rùn)和產(chǎn)生免疫抑制微環(huán)境來(lái)發(fā)揮作用,SLC1A5誘導(dǎo)的免疫檢查點(diǎn)基因在HBV相關(guān)肝細(xì)胞癌中高表達(dá),可能抑制ICIs治療患者的治療反應(yīng)ADDINEN.CITE<EndNote><Cite><Author>Su</Author><Year>2023</Year><RecNum>5</RecNum><DisplayText><styleface="superscript"font="TimesNewRoman">[8]</style></DisplayText><record><rec-number>5</rec-number><foreign-keys><keyapp="EN"db-id="asvp9xx9kxe0rlex0wp5r5fxaepftrxd90ww"timestamp="1683808224">5</key><keyapp="ENWeb"db-id="">0</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>Su,H.</author><author>Liu,Y.</author><author>Huang,J.</author></authors></contributors><auth-address>DepartmentofClinicalLaboratory,InstituteofTranslationalMedicine,RenminHospitalofWuhanUniversity,Wuhan430060,China. WuxiSchoolofMedicine,JiangnanUniversity,Wuxi214122,China.</auth-address><titles><title>Ferroptosis-RelatedGeneSLC1A5IsaNovelPrognosticBiomarkerandCorrelateswithImmuneMicroenvironmentinHBV-RelatedHCC</title><secondary-title>JClinMed</secondary-title></titles><periodical><full-title>JClinMed</full-title></periodical><volume>12</volume><number>5</number><edition>2023/03/12</edition><keywords><keyword>Hbv</keyword><keyword>Hcc</keyword><keyword>Slc1a5</keyword><keyword>ferroptosis-relatedgene</keyword><keyword>tumormicroenvironment</keyword></keywords><dates><year>2023</year><pub-dates><date>Feb21</date></pub-dates></dates><isbn>2077-0383(Print) 2077-0383(Electronic) 2077-0383(Linking)</isbn><accession-num>36902506</accession-num><urls><related-urls><url>/pubmed/36902506</url></related-urls></urls><custom2>PMC10003624</custom2><electronic-resource-num>10.3390/jcm12051715</electronic-resource-num></record></Cite></EndNote>[8]。盡管與肝細(xì)胞癌進(jìn)展相關(guān)的關(guān)鍵基因的識(shí)別有了許多的發(fā)現(xiàn),但是仍然需要進(jìn)一步的進(jìn)行研究,這將有利于我們了解肝細(xì)胞癌,且有助于肝細(xì)胞癌的一些預(yù)后治療。WGCNA(加權(quán)基因共表達(dá)網(wǎng)絡(luò))技術(shù)被廣泛認(rèn)為是一種有效的系統(tǒng)生物學(xué)工具ADDINEN.CITE<EndNote><Cite><Author>Langfelder</Author><Year>2008</Year><RecNum>10</RecNum><DisplayText><styleface="superscript"font="TimesNewRoman">[9]</style></DisplayText><record><rec-number>10</rec-number><foreign-keys><keyapp="EN"db-id="asvp9xx9kxe0rlex0wp5r5fxaepftrxd90ww"timestamp="1683809353">10</key><keyapp="ENWeb"db-id="">0</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>Langfelder,P.</author><author>Horvath,S.</author></authors></contributors><auth-address>DepartmentofHumanGeneticsandDepartmentofBiostatistics,UniversityofCalifornia,LosAngeles,CA90095,USA.Peter.Langfelder@</auth-address><titles><title>WGCNA:anRpackageforweightedcorrelationnetworkanalysis</title><secondary-title>BMCBioinformatics</secondary-title></titles><periodical><full-title>BMCBioinformatics</full-title></periodical><pages>559</pages><volume>9</volume><edition>2008/12/31</edition><keywords><keyword>Algorithms</keyword><keyword>Animals</keyword><keyword>ComputationalBiology/*methods</keyword><keyword>ComputerGraphics</keyword><keyword>*ComputingMethodologies</keyword><keyword>Databases,Genetic</keyword><keyword>GeneExpressionProfiling/methods</keyword><keyword>Humans</keyword><keyword>Mice</keyword><keyword>OligonucleotideArraySequenceAnalysis/*methods</keyword><keyword>PatternRecognition,Automated</keyword><keyword>ProgrammingLanguages</keyword><keyword>*Software</keyword><keyword>SystemsBiology</keyword></keywords><dates><year>2008</year><pub-dates><date>Dec29</date></pub-dates></dates><isbn>1471-2105(Electronic) 1471-2105(Linking)</isbn><accession-num>19114008</accession-num><urls><related-urls><url>/pubmed/19114008</url></related-urls></urls><custom2>PMC2631488</custom2><electronic-resource-num>10.1186/1471-2105-9-559</electronic-resource-num></record></Cite></EndNote>[9]。該分析方法可以用來(lái)查找高度相關(guān)的基因簇,并以模塊為單位進(jìn)行分析,降低了運(yùn)算量,提高了準(zhǔn)確性。WGCNA首先計(jì)算基因表達(dá)譜中各基因間的相關(guān)性,并將高度相關(guān)的基因聚集成網(wǎng)絡(luò)模塊,然后,通過(guò)對(duì)取樣樣本信息的附加來(lái)探索這些模塊與重要的生物學(xué)特征之間的關(guān)系,最后,利用網(wǎng)絡(luò)拓?fù)浞治龇椒▽?duì)模塊進(jìn)行進(jìn)一步分析,以確定哪些模塊與感興趣的生物學(xué)過(guò)程相關(guān)。WGCNA最大的優(yōu)勢(shì)在于能揭示模塊的具體情況,可以從模塊級(jí)別上探索基因網(wǎng)絡(luò)與我們所研究的表型之間的關(guān)系和關(guān)鍵基因。該方法已經(jīng)被許多的學(xué)者用來(lái)研究各種癌癥及其潛在的靶點(diǎn),例如董鵬志等人通過(guò)WGCNA對(duì)三陰性乳腺癌(TNBC)的基因表達(dá)譜進(jìn)行分析,確定了幾個(gè)關(guān)鍵通路,包括PI3K/AKT信號(hào)通路、WNT信號(hào)通路、轉(zhuǎn)錄因子調(diào)控等,發(fā)現(xiàn)了一些新的潛在靶點(diǎn)和生物標(biāo)志物,如SLC7A5、NUSAP1、FAM83B等,這些基因可能對(duì)于TNBC的診斷和治療具有重要意義ADDINEN.CITEADDINEN.CITE.DATA[10];于維娜等人使用WGCNA方法對(duì)肺腺癌(LUAD)免疫治療耐藥性相關(guān)的基因表達(dá)譜進(jìn)行分析,鑒定出一組與免疫治療耐藥性顯著相關(guān)的基因,包括已知的與免疫逃逸和抗原呈遞等過(guò)程相關(guān)的基因,如PD-L1、CTLA-4、CD276等,還識(shí)別出一些新的潛在靶點(diǎn)和生物標(biāo)志物,如FADS2、SLC7A5、CENPF等ADDINEN.CITE<EndNote><Cite><Author>Yu</Author><Year>2021</Year><RecNum>12</RecNum><DisplayText><styleface="superscript"font="TimesNewRoman">[11]</style></DisplayText><record><rec-number>12</rec-number><foreign-keys><keyapp="EN"db-id="asvp9xx9kxe0rlex0wp5r5fxaepftrxd90ww"timestamp="1683810881">12</key><keyapp="ENWeb"db-id="">0</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>Yu,W.</author><author>Liu,F.</author><author>Lei,Q.</author><author>Wu,P.</author><author>Yang,L.</author><author>Zhang,Y.</author></authors></contributors><auth-address>BiotherapyCenterandCancerCenter,TheFirstAffiliatedHospitalofZhengzhouUniversity,Zhengzhou,China. HenanKeyLaboratoryforTumorImmunologyandBiotherapy,ZhengzhouUniversity,Zhengzhou,China. StateKeyLaboratoryofEsophagealCancerPreventionandTreatment,ZhengzhouUniversity,Zhengzhou,China. SchoolofLifeSciences,ZhengzhouUniversity,Zhengzhou,China.</auth-address><titles><title>IdentificationofKeyPathwaysandGenesRelatedtoImmunotherapyResistanceofLUADBasedonWGCNAAnalysis</title><secondary-title>FrontOncol</secondary-title></titles><periodical><full-title>FrontOncol</full-title></periodical><pages>814014</pages><volume>11</volume><edition>2022/01/25</edition><keywords><keyword>Luad</keyword><keyword>Tide</keyword><keyword>Wgcna</keyword><keyword>cancerstemcell</keyword><keyword>immunotherapyresistance</keyword><keyword>commercialorfinancialrelationshipsthatcouldbeconstruedasapotential</keyword><keyword>conflictofinterest.</keyword></keywords><dates><year>2021</year></dates><isbn>2234-943X(Print) 2234-943X(Electronic) 2234-943X(Linking)</isbn><accession-num>35071018</accession-num><urls><related-urls><url>/pubmed/35071018</url></related-urls></urls><custom2>PMC8770266</custom2><electronic-resource-num>10.3389/fonc.2021.814014</electronic-resource-num></record></Cite></EndNote>[11]。因此我們也可以在本課題中基于WGCNA識(shí)別出與肝細(xì)胞癌進(jìn)展相關(guān)的關(guān)鍵基因?yàn)楦渭?xì)胞癌的臨床治療提供一定的價(jià)值。1.2研究?jī)?nèi)容及研究意義本課題通過(guò)加權(quán)平均共表達(dá)網(wǎng)絡(luò)的構(gòu)建,識(shí)別肝細(xì)胞癌進(jìn)展相關(guān)的關(guān)鍵基因并建立預(yù)后模型。通過(guò)對(duì)TCGA數(shù)據(jù)庫(kù)中肝細(xì)胞癌的RNA-seq數(shù)據(jù)進(jìn)行深入分析,我們?cè)噲D找到與肝細(xì)胞癌預(yù)后有關(guān)的基因,以期望獲得更準(zhǔn)確的預(yù)測(cè)結(jié)果。然后,使用加權(quán)平均表達(dá)網(wǎng)絡(luò)(WGCNA)方法構(gòu)建共表達(dá)網(wǎng)絡(luò)模塊,篩選關(guān)鍵模塊。此外,關(guān)鍵基因是通過(guò)單因素Cox和Lasso回歸分析確定的,并以此建立預(yù)測(cè)模型。根據(jù)模型計(jì)算風(fēng)險(xiǎn)得分,將樣本分為高低風(fēng)險(xiǎn)組并進(jìn)行KM生存分析、差異表達(dá)分析和通路富集分析等驗(yàn)證。研究表明,肝細(xì)胞癌的關(guān)鍵基因?qū)τ陬A(yù)測(cè)患者的預(yù)后和發(fā)病機(jī)制至關(guān)重要,它們不僅可以幫助我們更好地理解肝細(xì)胞癌的發(fā)展過(guò)程,而且還可以為臨床治療提供寶貴的指導(dǎo)。未來(lái),結(jié)合多種生物信息學(xué)技術(shù)和實(shí)驗(yàn)手段的綜合分析,可以進(jìn)一步深入探究這些關(guān)鍵基因在肝細(xì)胞癌的疾病機(jī)制和治療中的作用,為肝細(xì)胞癌的研究和治療提供更為全面的認(rèn)識(shí)和解決方案。
2、材料與方法2.1肝細(xì)胞癌數(shù)據(jù)處理本課題旨在研究與肝細(xì)胞癌進(jìn)展相關(guān)的分子機(jī)制,為深入探究該疾病的發(fā)生和發(fā)展提供基礎(chǔ)數(shù)據(jù)和參考。因此,我們從TCGA數(shù)據(jù)庫(kù)中獲取了421個(gè)肝細(xì)胞癌患者的轉(zhuǎn)錄組測(cè)序數(shù)據(jù),并進(jìn)行了初步的數(shù)據(jù)整合和篩選。首先,我們刪除了樣本名稱中包含“sample=02”的樣本,“sample=02”表示同一患者第二次采集的腫瘤組織樣本,即重復(fù)樣本,保留了正常樣本以及原發(fā)癌患者樣本共計(jì)419個(gè)進(jìn)行后續(xù)分析。然后,我們利用下載好的測(cè)序數(shù)據(jù)篩選出我們所要研究的蛋白編碼基因,并過(guò)濾掉在癌癥樣本中表達(dá)不足30%的基因,最終得到16905個(gè)基因在419個(gè)樣本的TPM值。為了消除不同基因和樣本之間的技術(shù)和批次差異,并便于后續(xù)分析和比較,我們采用log2(TPM+1)標(biāo)準(zhǔn)化方法對(duì)TPM數(shù)據(jù)進(jìn)行處理和轉(zhuǎn)換。通過(guò)這一步驟,我們得到了符合要求的基因集和表達(dá)數(shù)據(jù),為后續(xù)的數(shù)據(jù)挖掘和建模提供了可靠的基礎(chǔ)和參考。隨后,我們使用count數(shù)據(jù)與處理好的TPM數(shù)據(jù)進(jìn)行比對(duì),得到了16905個(gè)基因在419個(gè)樣本中的count表達(dá)值。綜上所述,通過(guò)對(duì)TCGA數(shù)據(jù)庫(kù)中的RNA-seq數(shù)據(jù)進(jìn)行整合和篩選,我們得到了符合要求的基因集和表達(dá)數(shù)據(jù),并使用標(biāo)準(zhǔn)化方法對(duì)TPM數(shù)據(jù)進(jìn)行處理和轉(zhuǎn)換。隨后,我們使用count數(shù)據(jù)與處理好的TPM數(shù)據(jù)進(jìn)行比對(duì),得到了16905個(gè)基因在419個(gè)樣本中的count表達(dá)值,為后續(xù)的數(shù)據(jù)挖掘和建模提供了可靠的基礎(chǔ)和參考。2.2差異表達(dá)分析及功能富集2.2.1差異表達(dá)分析為了探究肝細(xì)胞癌的分子機(jī)制和生物學(xué)特征,我們利用TCGA數(shù)據(jù)庫(kù)中的轉(zhuǎn)錄組測(cè)序數(shù)據(jù)進(jìn)行差異表達(dá)分析。首先,我們根據(jù)樣本的命名將樣本以正常和癌癥兩組分別進(jìn)行分類,其中包括50個(gè)正常樣本和369個(gè)癌癥樣本。接下來(lái),我們以這些樣本的count表達(dá)數(shù)據(jù)作為輸入文件,并進(jìn)行取整操作。經(jīng)過(guò)DeSeq2包的比較,以及結(jié)合foldchange和t檢驗(yàn)的方法,最終確定了腫瘤患者的某些特定基因的表達(dá)水平明顯高于健康人群。在這些研究中,p值低于0.05,而log2foldchange值高于1或者低于-1的基因可能具有顯著的遺傳變化。具體而言,我們采用log2foldchange值來(lái)衡量基因的表達(dá)變化程度。當(dāng)log2foldchange大于1時(shí),表示該基因在癌癥樣本中的表達(dá)顯著上調(diào);而當(dāng)log2foldchange值小于-1時(shí),則表示該基因在癌癥樣本中表達(dá)顯著下調(diào)。這些差異表達(dá)基因的篩選,為我們進(jìn)一步研究肝細(xì)胞癌的分子機(jī)制和生物學(xué)特征提供了重要的參考和依據(jù)。2.2.2差異基因的功能富集為了更深入地探索差異基因在HCC進(jìn)展中的作用,我們使用R中的clusterProfiler包對(duì)顯著差異的上下調(diào)基因分別進(jìn)行了功能富集分析。在進(jìn)行功能富集之前,我們需要對(duì)我們數(shù)據(jù)中的基因名稱進(jìn)行轉(zhuǎn)換,我們利用R中的org.Hs.eg.db包,將我們的基因名從genesymbol轉(zhuǎn)換為EntrezID,以便于后續(xù)功能富集分析。GO功能富集分析可幫助我們了解在不同的細(xì)胞、組織或環(huán)境條件下,參與特定生物過(guò)程、分子功能或細(xì)胞成分的基因或蛋白質(zhì)。KEGG則可以幫助我們發(fā)現(xiàn)哪些代謝途徑或信號(hào)通路在這些條件下得到了調(diào)節(jié)或激活。具體而言,我們將差異表達(dá)基因提交至clusterProfiler包進(jìn)行富集分析,篩選出p值小于0.05的富集結(jié)果,并采用氣泡圖對(duì)其進(jìn)行可視化展示。通過(guò)此分析,我們能夠進(jìn)一步了解差異表達(dá)基因的功能特征以及相關(guān)通路,并進(jìn)一步探索這些差異表達(dá)基因如何影響生物學(xué)功能和疾病發(fā)生的機(jī)制,從而有助于揭示肝細(xì)胞癌的發(fā)病機(jī)制和潛在治療靶點(diǎn),為后續(xù)研究提供重要參考。2.3基于加權(quán)平均共表達(dá)網(wǎng)絡(luò)篩選關(guān)鍵模塊及候選關(guān)鍵基因2.3.1處理數(shù)據(jù)格式在進(jìn)行WGCNA分析之前,我們需要對(duì)癌癥樣本的標(biāo)準(zhǔn)化后的TPM數(shù)據(jù)進(jìn)行篩選,并將其作為輸入文件。具體而言,我們應(yīng)該只選擇癌癥樣本的數(shù)據(jù),并且需要對(duì)表達(dá)矩陣進(jìn)行轉(zhuǎn)置,使得行名為樣本名,列名為基因名。這可以通過(guò)以下步驟來(lái)完成:從原始的TPM數(shù)據(jù)中選擇癌癥樣本的數(shù)據(jù),并將其保存到一個(gè)新的文件中。使用R中的read.table()函數(shù)將新文件中的數(shù)據(jù)讀入到一個(gè)數(shù)據(jù)框中,并使用t()函數(shù)對(duì)其進(jìn)行轉(zhuǎn)置。將轉(zhuǎn)置后的數(shù)據(jù)框保存到一個(gè)新的文件中,以作為后續(xù)WGCNA所需要的輸入文件。這些預(yù)處理步驟可以確保輸入數(shù)據(jù)的準(zhǔn)確性和一致性,提高分析結(jié)果的可靠性和有效性。2.3.2軟閾值的篩選WGCNA技術(shù)的核心思想在于通過(guò)計(jì)算皮爾森相關(guān)系數(shù)來(lái)確定兩兩基因的相互作用,并通過(guò)計(jì)算來(lái)提高模型的精確度,最終形成一種具有較高精確度的多維共表達(dá)網(wǎng)絡(luò),其中每?jī)蓛苫虻南嗷プ饔枚伎梢酝ㄟ^(guò)冪次計(jì)算來(lái)提高模型的精確度。通過(guò)采用軟閾值法,可以有效地改善模型的性能,其中,軟閾值的取值是決定模型性能的關(guān)鍵因素。為此,可以采取R2作為參考,當(dāng)R2值趨于1時(shí),模型的性能較好,趨于0時(shí),模型的性能較好,從而達(dá)到較好的模擬效果。通過(guò)WGCNA,我們能夠利用R包內(nèi)的pickSoftThreshold函數(shù),對(duì)相似度進(jìn)行power值加權(quán),從而獲得一個(gè)更優(yōu)的無(wú)尺度網(wǎng)絡(luò)適應(yīng)度,其中,當(dāng)power值達(dá)到0.9或更高的閾值時(shí),將會(huì)被認(rèn)為是最優(yōu)的。本函數(shù)不僅能夠提供直觀的輸出,而且能夠根據(jù)不同的節(jié)點(diǎn),提供準(zhǔn)確的power值,從而實(shí)現(xiàn)對(duì)多個(gè)基因的加權(quán)共表達(dá),從而更好地滿足用戶的需求。2.3.3識(shí)別加權(quán)平均共表達(dá)模塊經(jīng)過(guò)WGCNA分析,我們可以利用blockwiseModules函數(shù),構(gòu)建一個(gè)加權(quán)的基因共表達(dá)網(wǎng)絡(luò),從而實(shí)現(xiàn)基因相關(guān)性矩陣、加權(quán)優(yōu)化后的相關(guān)性鄰接矩陣和拓?fù)渲丿B矩陣(TOM)的有效結(jié)合。TOM的相關(guān)性鄰接矩陣不僅僅考慮了兩個(gè)基因之間的線性關(guān)系,而且還考慮到它們之間的復(fù)雜關(guān)系,從而構(gòu)建出一個(gè)更加復(fù)雜的網(wǎng)絡(luò),有助于更有效地將基因組織成更大的模塊。在執(zhí)行blockwiseModules函數(shù)時(shí),我們需要提供輸入數(shù)據(jù)和相應(yīng)的參數(shù)設(shè)置,包括power值、最小模塊大小、拓?fù)渲丿B閾值等。該函數(shù)將輸出構(gòu)建好的基因共表達(dá)模塊數(shù)量以及每個(gè)基因所屬的模塊信息等結(jié)果。在本次分析中,我們共得到15個(gè)基因共表達(dá)模塊。2.3.4加權(quán)平均共表達(dá)網(wǎng)絡(luò)的分析2.3.5超幾何分析篩選出富集到差異基因上的模塊為了進(jìn)一步探究不同的模塊與肝細(xì)胞癌的發(fā)生和發(fā)展之間的關(guān)系,我們可以通過(guò)超幾何分析計(jì)算每個(gè)模塊內(nèi)基因是否顯著富集到差異表達(dá)基因。具體而言,我們將差異基因與每個(gè)模塊中的基因行比對(duì),基于超幾何計(jì)算模塊內(nèi)的基因富集到差異表達(dá)基因上的程度。在這個(gè)過(guò)程中,p值越小,則說(shuō)明該模塊內(nèi)的基因與差異表達(dá)基因的聯(lián)系越顯著。通過(guò)調(diào)整p值閾值,我們可以有效地識(shí)別出具有明顯差異表達(dá)的基因,尤其是當(dāng)p值低于0.05時(shí),這種方法更加有效地促進(jìn)了基因組的聚合。2.3.6篩選關(guān)鍵模塊對(duì)得到的候選關(guān)鍵模塊進(jìn)行功能富集分析,可以幫助我們更好地理解不同模塊在肝細(xì)胞癌發(fā)生和發(fā)展中的作用。具體而言,我們可以先提取出每個(gè)模塊內(nèi)的基因,并使用R包AnnotationDbi中的enrichGO和enrichKEGG函數(shù)進(jìn)行GO和KEGG分析。該函數(shù)將輸出每個(gè)模塊所富集到的GO和KEGG通路以及相應(yīng)的p值等結(jié)果。為了更好地選擇關(guān)鍵模塊,我們可以根據(jù)模塊富集出的功能和信號(hào)通路的描述,結(jié)合文獻(xiàn)報(bào)道和實(shí)驗(yàn)驗(yàn)證等信息來(lái)進(jìn)行判斷。在選擇關(guān)鍵模塊時(shí),我們需要考慮多個(gè)因素,例如富集的通路與肝細(xì)胞癌發(fā)生發(fā)展的關(guān)系、模塊內(nèi)基因的相互作用網(wǎng)絡(luò)等信息。2.3.7篩選候選關(guān)鍵基因?yàn)榱诉M(jìn)一步篩選與肝細(xì)胞癌進(jìn)展相關(guān)的關(guān)鍵基因,我們可以將所篩選出的關(guān)鍵模塊與差異表達(dá)基因進(jìn)行取交集。這將得到既在差異表達(dá)基因列表中又在關(guān)鍵模塊中的基因。這些基因可能是較為重要的候選基因,因?yàn)樗鼈兺瑫r(shí)具有在癌癥組織中不同表達(dá)和參與特定功能或通路的特點(diǎn)。然后,我們可以對(duì)這些基因進(jìn)行更深入的分析,例如進(jìn)一步進(jìn)行生物信息學(xué)、基因表達(dá)調(diào)控網(wǎng)絡(luò)等方面的研究,以幫助我們理解其在肝細(xì)胞癌發(fā)生和發(fā)展中的作用。2.4基于生存分析篩選與HCC進(jìn)展相關(guān)的關(guān)鍵基因建立預(yù)后模型2.4.1單因素Cox及Lasso回歸分析篩選關(guān)鍵基因通過(guò)分析肝細(xì)胞癌患者的臨床信息文件,我們可以深入探究基因表達(dá)水平對(duì)其總生存期的影響。通過(guò)R包survival和coxph函數(shù),我們可以深入探究基因表達(dá)量對(duì)生存的影響,并利用單因素Cox回歸分析來(lái)更好地理解這種關(guān)系。我們將獲得每個(gè)基因的標(biāo)準(zhǔn)誤差(SE)、風(fēng)險(xiǎn)比(HR)以及p值等結(jié)果。為了篩選顯著與肝細(xì)胞癌進(jìn)展相關(guān)的關(guān)鍵基因,我們可以選擇p值小于0.005的基因作為候選關(guān)鍵基因。經(jīng)過(guò)深入探索,我們得出結(jié)論:這些基因可能會(huì)對(duì)肝細(xì)胞癌患者的總生存期產(chǎn)生顯著影響,需要進(jìn)一步研究其在癌癥發(fā)生和發(fā)展過(guò)程中的作用機(jī)制。在對(duì)肝細(xì)胞癌患者總生存期進(jìn)行單因素Cox回歸分析后,我們需要去除掉生存時(shí)間(OS.time)為缺失值的樣本。接著,我們可以利用Lasso回歸分析將具有代表性的、與生存顯著相關(guān)的關(guān)鍵基因篩選出來(lái)作為預(yù)測(cè)模型的輸入基因。Lasso回歸是一種使用L1正則化技術(shù)的線性回歸方法,它可以幫助我們篩選出最能夠解釋數(shù)據(jù)變異的重要特征。在進(jìn)行Lasso回歸分析時(shí),我們需要調(diào)整參數(shù)lambda來(lái)平衡模型的擬合度和模型的復(fù)雜度。我們可以使用R包glmnet中的cv.glmnet函數(shù)對(duì)Lasso模型進(jìn)行深入研究,結(jié)合多種方法的相互作用,以確定出更優(yōu)的lambda參數(shù)。經(jīng)過(guò)Lasso回歸分析篩選后,我們將得到具有代表性的、與生存顯著相關(guān)的關(guān)鍵基因,這些基因?qū)⒈挥米鹘⒏渭?xì)胞癌患者生存預(yù)測(cè)模型的輸入基因。2.4.2建立肝細(xì)胞癌風(fēng)險(xiǎn)預(yù)后模型經(jīng)過(guò)Lasso回歸分析篩選之后,我們得到了最終的關(guān)鍵基因以及它們?cè)谀P椭械幕貧w系數(shù)。通過(guò)Cox回歸模型,我們可以將多個(gè)關(guān)鍵基因整合在一起,從而構(gòu)建一個(gè)準(zhǔn)確的肝細(xì)胞癌風(fēng)險(xiǎn)預(yù)測(cè)模型。具體而言,我們可以使用coxph()函數(shù),結(jié)合回歸結(jié)果,計(jì)算出每位患者的風(fēng)險(xiǎn)評(píng)分,從而更好地掌握患者的病情變化。最終建立的預(yù)后模型將能夠根據(jù)患者的基因表達(dá)信息來(lái)預(yù)測(cè)其總生存期。該模型可通過(guò)將患者的基因表達(dá)數(shù)據(jù)輸入到模型中進(jìn)行評(píng)估,并給出相應(yīng)的風(fēng)險(xiǎn)評(píng)分和預(yù)測(cè)結(jié)果。2.4.3基于模型進(jìn)行生存分析通過(guò)對(duì)肝細(xì)胞癌患者的基因表達(dá)量和回歸系數(shù)的分析,我們建立了一套風(fēng)險(xiǎn)評(píng)估模型,并將其按照中位數(shù)的大小劃分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組。隨后,我們可以根據(jù)這兩個(gè)組別作為二分類變量,使用K-M方法來(lái)估計(jì)生存曲線,并進(jìn)行生存分析。通過(guò)應(yīng)用survival包的survfit()函數(shù),我們能夠有效地評(píng)估出各個(gè)群體的高低危機(jī)水平,從而實(shí)現(xiàn)K-M生存模型,而log-rank則是一種有效的統(tǒng)計(jì)方法,它能夠有效地揭示出各個(gè)群體的生存狀況。最終,我們將得到不同組別的生存曲線、存活率、中位生存時(shí)間等信息,從而更好地理解關(guān)鍵基因在肝細(xì)胞癌進(jìn)展中的作用。2.5預(yù)后模型驗(yàn)證2.5.1根據(jù)高低風(fēng)險(xiǎn)分組進(jìn)行差異表達(dá)分析并功能富集在將肝細(xì)胞癌患者分為高低風(fēng)險(xiǎn)組后,我們可以進(jìn)行差異表達(dá)分析以進(jìn)一步研究關(guān)鍵基因與肝細(xì)胞癌發(fā)展的相關(guān)性。通過(guò)t檢驗(yàn)與foldchange的相互配合,我們能夠比較出不同風(fēng)險(xiǎn)水平下的樣品的表現(xiàn),并選取p值小于0.05且log2foldchange值大于1或者小于-1的基因作為顯著差異表達(dá)基因。接下來(lái),我們需要使用R包AnnotationDbi的enrichGo和enrichKEGG函數(shù)來(lái)對(duì)GO和KEGG數(shù)據(jù)進(jìn)行深入的研究,這些函數(shù)有助于更好地理解不同的基因?qū)ο鄳?yīng)的生物學(xué)特征的影響。通過(guò)生物信息學(xué)分析,我們可以更好地理解差異表達(dá)基因在肝細(xì)胞癌發(fā)展中的作用,從而進(jìn)一步闡明不同基因和通路在肝細(xì)胞癌進(jìn)展過(guò)程中的調(diào)節(jié)機(jī)制和相互作用。2.5.2單因素cox回歸驗(yàn)證肝細(xì)胞癌風(fēng)險(xiǎn)模型預(yù)后效能肝細(xì)胞癌是一種常見(jiàn)的惡性腫瘤,其預(yù)后與多種因素密切相關(guān)。在臨床治療過(guò)程中,預(yù)測(cè)肝細(xì)胞癌患者的預(yù)后情況對(duì)于提高治療效果和生存率至關(guān)重要。單因素Cox回歸分析是評(píng)估患者預(yù)后情況的一種常用方法,可以通過(guò)驗(yàn)證不同因素在肝細(xì)胞癌患者預(yù)后中的預(yù)測(cè)效能,為制定更加個(gè)體化、精準(zhǔn)的治療方案提供依據(jù)。通過(guò)Cox回歸分析,我們可以對(duì)每一組的數(shù)據(jù)進(jìn)行排序,以確定哪些是最具危害性的,哪些是最安全的。接著,我們可以利用Cox回歸模型,對(duì)兩組的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)學(xué)處理,以確定它們的生存率,最終通過(guò)log-rank檢驗(yàn),對(duì)兩組的數(shù)值變化情況進(jìn)行對(duì)比。如果通過(guò)Cox回歸分析得出結(jié)論,即某種影響因子對(duì)于改善肝細(xì)胞癌病人的預(yù)后起著至關(guān)重要的作用,那么這種影響就不僅僅是影響病人的死亡率,而是影響其治療效果的關(guān)鍵指標(biāo)。需要注意的是,單因素Cox回歸分析僅考慮了單個(gè)因素對(duì)預(yù)后的影響,無(wú)法全面反應(yīng)多種因素相互作用對(duì)預(yù)后的影響。因此,在進(jìn)行肝細(xì)胞癌患者預(yù)后評(píng)估時(shí),還需要綜合考慮多種因素,如年齡、性別、臨床病期、治療方案等,采用多因素Cox回歸模型進(jìn)行分析,以便更準(zhǔn)確地評(píng)估患者的預(yù)后情況??傊?,單因素Cox回歸分析是評(píng)判HCC患者預(yù)后情況的常用方法之一,能夠有效地揭示不同因素對(duì)生存時(shí)間的影響程度,并驗(yàn)證預(yù)測(cè)模型的有效性。但在實(shí)踐應(yīng)用中,需要結(jié)合多種方法和技術(shù),綜合考慮多種因素對(duì)預(yù)后的影響,為肝細(xì)胞癌患者制定更加個(gè)體化、精準(zhǔn)的治療方案和生存指導(dǎo)。2.5.3多因素Cox回歸驗(yàn)證肝細(xì)胞癌風(fēng)險(xiǎn)模型預(yù)后效能為了驗(yàn)證我們所計(jì)算出來(lái)的風(fēng)險(xiǎn)評(píng)分是否是一個(gè)獨(dú)立的預(yù)后因素,不會(huì)因其他臨床因素而改變,我們繼而利用多因素Cox回歸分析檢驗(yàn)我們的模型。在生物信息分析中,多因素Cox回歸分析是用于驗(yàn)證肝細(xì)胞癌預(yù)后模型的常用方法之一。本研究旨在探究多種可能會(huì)改善患者預(yù)后的因子,通過(guò)survival包的coxph函數(shù),我們可以肝細(xì)胞癌的預(yù)后情況進(jìn)行深入的研究,該函數(shù)將多種可能對(duì)預(yù)后產(chǎn)生重大影響的因子作為自變量,包括但不限于性別、腫瘤大小、年齡、腫瘤分化程度等。具體而言,在R語(yǔ)言中,可以使用survival包中的coxph函數(shù)進(jìn)行多因素Cox回歸分析,其中自變量為多個(gè)可能影響預(yù)后的因素,因變量為生存狀態(tài)(status)以及生存時(shí)間(time)。通過(guò)比較各自變量的風(fēng)險(xiǎn)比(HR)和95%置信區(qū)間,來(lái)評(píng)估不同因素對(duì)生存時(shí)間以及生存狀態(tài)的相對(duì)影響力。如果在多因素Cox回歸分析中發(fā)現(xiàn),預(yù)先選定的風(fēng)險(xiǎn)因素能夠保持較強(qiáng)的影響力,并與其他臨床因素具有較弱的相關(guān)性,則說(shuō)明所建立的預(yù)后模型具有良好的預(yù)測(cè)效能。通過(guò)使用這一模型,我們能夠準(zhǔn)確地評(píng)估患者的死亡危機(jī),從而為他們?cè)O(shè)計(jì)出最佳的治療策略,從而大大改善他們的生活品質(zhì)和死亡率。2.5.4GEO數(shù)據(jù)集驗(yàn)證集驗(yàn)證預(yù)后模型為了充分驗(yàn)證肝細(xì)胞癌預(yù)后模型的預(yù)測(cè)效能,并評(píng)估其在不同數(shù)據(jù)集中的適用性,收集外部驗(yàn)證集并利用該數(shù)據(jù)集對(duì)模型進(jìn)行驗(yàn)證是一種常見(jiàn)方法。具體來(lái)說(shuō),我們可以從公共數(shù)據(jù)庫(kù)(如GEO)中收集其他研究組所發(fā)表的肝細(xì)胞癌數(shù)據(jù)集作為外部驗(yàn)證集,然后將這些樣本按照之前建立的模型進(jìn)行風(fēng)險(xiǎn)評(píng)分,并在此基礎(chǔ)上進(jìn)行生存分析和預(yù)測(cè)。如果經(jīng)過(guò)對(duì)比,發(fā)現(xiàn)與對(duì)照組相比,高危人群的生存率要遠(yuǎn)遠(yuǎn)降低,這表明這種預(yù)測(cè)方法非常準(zhǔn)確,而且它已經(jīng)被廣泛地應(yīng)用到了各種不同的研究領(lǐng)域。但需要注意,在將模型應(yīng)用于新的數(shù)據(jù)集時(shí),必須確保這些數(shù)據(jù)集與原始數(shù)據(jù)集在臨床特征和數(shù)據(jù)質(zhì)量方面具有相似性。例如,病人的年齡、性別、腫瘤分期等重要臨床信息要求分布情況相似,以確保結(jié)果的可靠性。此外,還應(yīng)注意混雜因素的影響,并結(jié)合實(shí)際情況和多個(gè)指標(biāo)進(jìn)行全面評(píng)估。經(jīng)過(guò)實(shí)際檢查,若發(fā)現(xiàn)與對(duì)照組相比,高危組的生存概率要大大降低,這表明這種預(yù)測(cè)方法可以準(zhǔn)確反映出病人的健康狀況,并且可以更加精確地識(shí)別出各種病情的危害程度。3、結(jié)果3.1肝細(xì)胞癌數(shù)據(jù)處理首先我們從TCGA數(shù)據(jù)庫(kù)中,獲得肝細(xì)胞癌的轉(zhuǎn)錄組測(cè)序數(shù)據(jù)并進(jìn)行整合,得到肝細(xì)胞癌的表達(dá)譜文件、注釋信息文件以及樣本的臨床信息文件(34156個(gè)基因,421個(gè)樣本)。首先根據(jù)樣本的名稱刪除了sample=02的樣本,sample=02的樣本為同一患者第二次采集的腫瘤組織樣本,即同一患者的轉(zhuǎn)移癌樣本或者說(shuō)是重復(fù)樣本,保留正常以及原發(fā)癌一共419個(gè)樣本繼而進(jìn)行后續(xù)的研究。利用我們下載好的測(cè)序數(shù)據(jù)篩選我們所要研究的蛋白編碼基因,剩余19044個(gè)基因,并過(guò)濾掉在癌癥樣本中表達(dá)不足30%的基因,最終得到16905個(gè)基因在419個(gè)樣本的TPM值。再對(duì)TPM數(shù)據(jù)進(jìn)行l(wèi)og2(TPM+1)標(biāo)準(zhǔn)化以便于后續(xù)分析,再用count與處理好的TPM進(jìn)行比對(duì)得到16905個(gè)基因在419個(gè)樣本中的count值(表3-1)。表3-1數(shù)據(jù)處理過(guò)程Table3-1Dataprocessingprocedure處理過(guò)程處理結(jié)果原始(樣本×基因)421×34156刪除sample=02419×34156篩選蛋白編碼基因419×19044過(guò)濾掉在cancer樣本中表達(dá)不足30%的樣本419×34156注:該表格為肝細(xì)胞癌數(shù)據(jù)的預(yù)處理過(guò)程,我們刪除了sample=02的樣本并只篩選了蛋白編碼基因,最后刪除在癌癥樣本中表達(dá)不足30%的基因。3.2差異表達(dá)分析及功能富集3.2.1差異表達(dá)分析使用DeSeq2R包,基于肝細(xì)胞癌的count表達(dá)數(shù)據(jù),經(jīng)過(guò)精確的計(jì)算,以及t檢驗(yàn)與foldchange的結(jié)合,最終得出P值低于0.05,log2foldchange高于1或低于-1的基因作為腫瘤的差異表達(dá)基因,最后得到了3085個(gè)顯著上調(diào)的基因和1165個(gè)顯著下調(diào)的基因(表3-2),并將差異表達(dá)基因按照P值排序?qū)η?0個(gè)差異表達(dá)基因的P值及上下調(diào)情況進(jìn)行了展示(表3-3)。根據(jù)以往的研究發(fā)現(xiàn):CENPF可以通過(guò)調(diào)節(jié)細(xì)胞周期、凋亡和Wnt/β-catenin等信號(hào)通路促進(jìn)肝癌的發(fā)生和發(fā)展ADDINEN.CITE<EndNote><Cite><Author>Huang</Author><Year>2021</Year><RecNum>13</RecNum><DisplayText><styleface="superscript"font="TimesNewRoman">[12]</style></DisplayText><record><rec-number>13</rec-number><foreign-keys><keyapp="EN"db-id="asvp9xx9kxe0rlex0wp5r5fxaepftrxd90ww"timestamp="1683858427">13</key><keyapp="ENWeb"db-id="">0</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>Huang,Y.</author><author>Chen,X.</author><author>Wang,L.</author><author>Wang,T.</author><author>Tang,X.</author><author>Su,X.</author></authors></contributors><auth-address>DepartmentofPathology,TaiheHospital,HubeiUniversityofMedicine,Hubei44200,China. DepartmentofImmunology,NankaiUniversitySchoolofMedicine,Tianjin300110,China.</auth-address><titles><title>CentromereProteinF(CENPF)ServesasaPotentialPrognosticBiomarkerandTargetforHumanHepatocellularCarcinoma</title><secondary-title>JCancer</secondary-title></titles><periodical><full-title>JCancer</full-title></periodical><pages>2933-2951</pages><volume>12</volume><number>10</number><edition>2021/04/16</edition><keywords><keyword>Cenpf</keyword><keyword>Hcc</keyword><keyword>bioinformaticsanalysis.</keyword><keyword>biomarker</keyword><keyword>hepatocellularcarcinoma</keyword><keyword>prognosticvalue</keyword><keyword>survival</keyword></keywords><dates><year>2021</year></dates><isbn>1837-9664(Print) 1837-9664(Electronic) 1837-9664(Linking)</isbn><accession-num>33854594</accession-num><urls><related-urls><url>/pubmed/33854594</url></related-urls></urls><custom2>PMC8040902</custom2><electronic-resource-num>10.7150/jca.52187</electronic-resource-num></record></Cite></EndNote>[12];NUF2可以通過(guò)多種信號(hào)通路促進(jìn)肝癌細(xì)胞的增殖、遷移和侵襲,包括NF-κB、Wnt/β-catenin、MAPK/ERK和PI3K/AKT等通路ADDINEN.CITE<EndNote><Cite><Author>Xie</Author><Year>2021</Year><RecNum>14</RecNum><DisplayText><styleface="superscript"font="TimesNewRoman">[13]</style></DisplayText><record><rec-number>14</rec-number><foreign-keys><keyapp="EN"db-id="asvp9xx9kxe0rlex0wp5r5fxaepftrxd90ww"timestamp="1683859738">14</key><keyapp="ENWeb"db-id="">0</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>Xie,X.</author><author>Jiang,S.</author><author>Li,X.</author></authors></contributors><auth-address>CollegeofPlantProtection,HenanAgriculturalUniversity,Zhengzhou,China. KeyLaboratoryofForensicToxicologyofHerbalMedicines,GuizhouEducationDepartment,SchoolofBasicMedicine,GuizhouUniversityofTraditionalChineseMedicine,Guiyang,China.</auth-address><titles><title>Nuf2IsaPrognostic-RelatedBiomarkerandCorrelatedWithImmuneInfiltratesinHepatocellularCarcinoma</title><secondary-title>FrontOncol</secondary-title></titles><periodical><full-title>FrontOncol</full-title></periodical><pages>621373</pages><volume>11</volume><edition>2021/03/27</edition><keywords><keyword>Nuf2</keyword><keyword>biomarkers</keyword><keyword>hepatocellularcarcinoma</keyword><keyword>prognosis</keyword><keyword>tumorimmunity</keyword><keyword>commercialorfinancialrelationshipsthatcouldbeconstruedasapotential</keyword><keyword>conflictofinterest.</keyword></keywords><dates><year>2021</year></dates><isbn>2234-943X(Print) 2234-943X(Electronic) 2234-943X(Linking)</isbn><accession-num>33767990</accession-num><urls><related-urls><url>/pubmed/33767990</url></related-urls></urls><custom2>PMC7985438</custom2><electronic-resource-num>10.3389/fonc.2021.621373</electronic-resource-num></record></Cite></EndNote>[13];THBS4可以通過(guò)FAK/PI3K/AKT信號(hào)通路激活I(lǐng)TGB1,從而促進(jìn)HCC的生長(zhǎng)和轉(zhuǎn)移ADDINEN.CITEADDINEN.CITE.DATA[14]等。接下來(lái)我們利用ggplot2R包繪制火山圖將我們所得的差異表達(dá)分析結(jié)果進(jìn)行可視化,通過(guò)使用藍(lán)色和紅色兩種顏色,我們能夠清晰地看到不同的基因,在這些基因中選取一些最顯著的,我們選取p<0.000001且log2foldchange>=10的基因?qū)ζ溥M(jìn)行基因名標(biāo)注(圖3-1A)。然后對(duì)這些基因進(jìn)行進(jìn)行了文獻(xiàn)查找,發(fā)現(xiàn)CTAG的表達(dá)上調(diào)與細(xì)胞周期通路相關(guān),CTAG2可能通過(guò)影響細(xì)胞周期來(lái)影響腫瘤大小,許多抗腫瘤藥物通過(guò)影響細(xì)胞周期起作用,而CTAG2通過(guò)影響細(xì)胞周期來(lái)促進(jìn)腫瘤生長(zhǎng),CTAG2可作為潛在的HCC治療靶點(diǎn)或預(yù)后生物標(biāo)志物,因此CTAG2高表達(dá)的患者應(yīng)進(jìn)行監(jiān)測(cè)和適當(dāng)治療ADDINEN.CITE<EndNote><Cite><Author>Liu</Author><Year>2019</Year><RecNum>16</RecNum><DisplayText><styleface="superscript"font="TimesNewRoman">[15]</style></DisplayText><record><rec-number>16</rec-number><foreign-keys><keyapp="EN"db-id="asvp9xx9kxe0rlex0wp5r5fxaepftrxd90ww"timestamp="1683860193">16</key><keyapp="ENWeb"db-id="">0</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author>Liu,J.</author><author>Yu,Z.</author><author>Sun,M.</author><author>Liu,Q.</author><author>Wei,M.</author><author>Gao,H.</author></authors></contributors><auth-address>DepartmentofPharmacology,SchoolofPharmacy,ChinaMedicalUniversity,Shenyang,Liaoning110122,P.R.China. DepartmentofHepatobiliarySurgery,TheFirstAffiliatedHospitalofChinaMedicalUniversity,Shenyang,Liaoning110001,P.R.China. LiaoningEngineeringTechnologyResearchCentreforTheResearch,DevelopmentandIndustrializationofInnovativePeptideDrugs,Shenyang,Liaoning110122,P.R.China.</auth-address><titles><title>Identificationofcancer/testisantigen2geneasapotentialhepatocellularcarcinomatherapeutictargetbyhubgenescreeningwith
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《古樸的音韻》課件
- 《以變革迎接未來(lái)》課件
- 2024高鐵車站建筑分包商協(xié)議范例
- 《公司KPI提取》課件
- 浙江經(jīng)貿(mào)職業(yè)技術(shù)學(xué)院《計(jì)算機(jī)高級(jí)語(yǔ)言程序設(shè)計(jì)(C++)》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025年度售樓處物業(yè)設(shè)施設(shè)備維護(hù)保養(yǎng)合同2篇
- 科研設(shè)計(jì)行業(yè)安全管理工作總結(jié)
- 2024年魚塘承包養(yǎng)殖產(chǎn)業(yè)鏈并購(gòu)合同3篇
- 漁業(yè)養(yǎng)殖行業(yè)技術(shù)提升策略
- 《直流穩(wěn)壓》課件
- 2024年數(shù)學(xué)三年級(jí)上冊(cè)乘法分配律基礎(chǔ)練習(xí)題(含答案)
- 中煤電力有限公司招聘筆試題庫(kù)2024
- (必練)廣東省生態(tài)環(huán)境監(jiān)測(cè)專業(yè)技術(shù)人員大比武理論試題庫(kù)(含答案)
- 四年級(jí)數(shù)學(xué)脫式計(jì)算練習(xí)題100道
- GB/T 18029.1-2024輪椅車第1部分:靜態(tài)穩(wěn)定性的測(cè)定
- 自適應(yīng)噪聲抵消技術(shù)的研究
- 湖南省建筑工程定額
- DIALux-4.7軟件使用培訓(xùn)
- (2024年)《處方管理辦法》培訓(xùn)課件
- 我國(guó)鄉(xiāng)鎮(zhèn)小學(xué)高年級(jí)學(xué)生課外閱讀現(xiàn)狀調(diào)查與研究
- 道路交通安全隱患排查整治方案
評(píng)論
0/150
提交評(píng)論