項目申請報告書國創(chuàng)_第1頁
項目申請報告書國創(chuàng)_第2頁
項目申請報告書國創(chuàng)_第3頁
項目申請報告書國創(chuàng)_第4頁
項目申請報告書國創(chuàng)_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

..>工程級別工程大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練方案工程申請書〔創(chuàng)新訓(xùn)練工程〕工程名稱:基于隨機(jī)森林的SNP關(guān)聯(lián)性分析系統(tǒng)工程負(fù)責(zé)人:王睿然指導(dǎo)教師:楊利英所在院系:計算機(jī)學(xué)院研究起止時間:2013年11月至2014年11月西安電子科技大學(xué)教務(wù)處二○一三年十一月制填表說明一、填寫申請書前,請先查閱教務(wù)處網(wǎng)站關(guān)于國家級大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練工程管理方法及申請通知。二、申請書的各項內(nèi)容,要實事求是,表達(dá)要明確、嚴(yán)謹(jǐn)。第一次出現(xiàn)的縮寫詞,需注出全稱。三、"工程申請書"要按順序逐項填寫,空缺項要填"無〞。要求一律用A4紙雙面打印,于左側(cè)裝訂成冊??删W(wǎng)上下載、自行復(fù)印或加頁,但格式、內(nèi)容、大小均須與原件一致。電子版填表字體用小四號宋體,單倍行距,申請書一式五份交到各學(xué)院辦公室。四、"工程申請書"中欄目"一至九〞由學(xué)生填寫,欄目"十至十二〞由教師填寫,欄目"十三、十四〞由工程負(fù)責(zé)人所在學(xué)院填寫。工程名稱基于隨機(jī)森林的SNP關(guān)聯(lián)性分析系統(tǒng)工程來源√導(dǎo)師課題□自主選題□競賽工程□其它來源申請經(jīng)費(fèi)〔范圍2000-1000元〕5600工程完成時間申請人(團(tuán)隊)**性別身份證號碼專業(yè)班級手機(jī)E-mail王睿然03121366男4031214班383413378qq.李德江03121365男3031214班946605378qq.楊靜雯03121319女5031214班545373219qq.一、工程組成員情況介紹〔包括自身具備的知識條件,有何特長、興趣,參加哪些科技事件創(chuàng)新活動等〕王睿然:大學(xué)二年級學(xué)生,有較扎實的算法根底,對算法類知識有著濃厚的興趣,尤其愛好數(shù)學(xué)。參加過數(shù)模校賽;有較好的數(shù)學(xué)功底,參加過今年的全國大學(xué)生數(shù)學(xué)競賽,獲得參加決賽資格〔2014年3月份比賽〕;對硬件感興趣,參加過星火杯,與隊友一起研發(fā)了單片機(jī)智能避障小車;能熟練使用matlab、lingo等編程軟件,能夠熟練運(yùn)用C語言。英語水平高,有較高的閱讀英文文檔的能力。學(xué)習(xí)成績突出,屢次獲得校級獎學(xué)金。李德江:大學(xué)二年級學(xué)生,擔(dān)任班長職務(wù),積累了豐富的協(xié)調(diào)管理經(jīng)歷。掌握了線性代數(shù)、離散數(shù)學(xué)、數(shù)據(jù)構(gòu)造、C語言等一系列與程序相關(guān)的知識,擁有良好的學(xué)習(xí)習(xí)慣和研究熱情,積累了一定的計算機(jī)編程能力。參加了星火杯,研發(fā)了單片機(jī)避障小車。楊靜雯:大學(xué)二年級學(xué)生。長期關(guān)注大量數(shù)據(jù)處理與分析,具有較為扎實的數(shù)學(xué)功底,曾參加過ACM校賽,并獲得三等獎。對軟件有濃厚的興趣,參加過星火杯。具有扎實的C語言,數(shù)據(jù)構(gòu)造,線性代數(shù)及離散數(shù)學(xué)功底,屢次獲得校級獎學(xué)金。對算法有一定可以刪除一定深入的研究??梢詣h除一定二、工程研究背景〔可以是已有的根底,與本工程有關(guān)的研究積累和已取得的成績,已具備的條件,尚缺少的條件及方法等〕單核苷酸多態(tài)性〔singlenucleotidepolymorphism,SNP〕,主要是指在基因組水平上由單個核苷酸的變異所引起的DNA序列多態(tài)性,SNP在遺傳性疾病的研究中尤其具有重要意義。隨機(jī)森林是一個包含多個決策樹的機(jī)器學(xué)習(xí)算法,利用隨機(jī)森林對于SNP研究具有明顯優(yōu)勢,適用于處理高維小樣本數(shù)據(jù),并且基于隨機(jī)森林的重要性測度對于SNP的分析很有效?,F(xiàn)有的重要性測度對于預(yù)測變量之間的關(guān)聯(lián)性分析還有缺乏,并且由于SNP的連鎖不平衡,所以有必要研究新的重要性測度來進(jìn)展SNP數(shù)據(jù)的相關(guān)分析。三、國內(nèi)外的研究現(xiàn)狀及研究意義生命信息的解讀和疾病的分子原因發(fā)現(xiàn)是國際研究前沿、國家開展戰(zhàn)略和重大穿插學(xué)科首選的研究領(lǐng)域。隨著人類基因組序列測定的完成和人類單體型圖方案(HapMap方案)的實施,基因組序列變異研究,特別是單核苷酸多態(tài)性研究,正成為新一輪基因組學(xué)的研究重點,其目的是在一定范圍內(nèi)的SNP中找出那些與疾病相關(guān)聯(lián)的SNP子集及其與疾病的關(guān)聯(lián)關(guān)系,為進(jìn)一步的疾病病理分析和生物制藥提供依據(jù)和根底。復(fù)雜疾病的基因關(guān)聯(lián)研究已成為國際上疾病基因組學(xué)、遺傳基因組學(xué)和計算生物信息學(xué)研究的熱點,論文數(shù)目急劇增長,研究成果不斷涌現(xiàn),比方英國劍橋大學(xué)醫(yī)學(xué)研究院Johnson研究組與芬蘭國家公共安康中心J.Tuomilehtoy研究組提出的算法以連鎖不平衡為根底,如果兩SNP間高度連鎖,意味著用一個可預(yù)測另一個,故只需標(biāo)記其中的一個;在SNP的標(biāo)簽上,目前已有的工具和系統(tǒng)包括:由美國南加州大學(xué)生物系與美國阿拉巴馬大學(xué)生物統(tǒng)計系在美國分子與計算生物學(xué)方案支持下開發(fā)的HapBlock,由美國華盛頓大學(xué)基因組科學(xué)系開發(fā)的Idselect和STAMPA。我國國家973、國家863和國家自然科學(xué)基金等多個層面上都對復(fù)雜疾病關(guān)聯(lián)研究給予了支持,其中,北京大學(xué)重點研究重大心臟病、中國漢族人群心臟病以及精神分裂癥和孤獨癥的易感基因發(fā)現(xiàn)。2009年,由安徽醫(yī)科大學(xué)第一附屬醫(yī)院教授張學(xué)軍領(lǐng)銜的研究團(tuán)隊,首次發(fā)現(xiàn)了銀屑病的"第三個兇手〞———LCE基因變異,以及漢族人系統(tǒng)性紅斑狼瘡的5個易感基因,對說明疾病發(fā)病機(jī)制、疾病預(yù)警、臨床診斷及新藥開發(fā)具有重大科學(xué)價值,這些成果分別發(fā)表者國際著名學(xué)術(shù)期刊"自然?遺傳"〔在線和期刊發(fā)表〕上。四、工程研究的目標(biāo)及主要內(nèi)容研究目標(biāo):提出新的隨機(jī)森林變量重要性測度,用于識別和篩選SNP,開發(fā)相關(guān)SNP分析系統(tǒng),實現(xiàn)簡單實用的工具和平臺。主要內(nèi)容:學(xué)習(xí)隨機(jī)森林等理論,了解SNP相關(guān)分析技術(shù)。基于最新研究,創(chuàng)新性地提出一種新的隨機(jī)森林重要性測度方法。小組成員分別在模擬數(shù)據(jù)和真實數(shù)據(jù)上進(jìn)展詳細(xì)測試,并通過測試的結(jié)果對方法進(jìn)展總結(jié)與改進(jìn)。制作成相關(guān)工具,比方Rpackage等。開發(fā)相關(guān)分析系統(tǒng),對系統(tǒng)進(jìn)展測試與評估。五、工程創(chuàng)新特色概述提出新的隨機(jī)森林變量重要性測度方法,使研究既具有重要的研究意義,同時也具有重要的應(yīng)用價值。開發(fā)出高效的SNP數(shù)據(jù)分析系統(tǒng),用于相關(guān)致致病基因病基因的分析與研究。致病基因六、工程實施方案及實施方案實施方案:小組集體學(xué)習(xí)隨機(jī)森林,理解其根本原理;在隨機(jī)森林的根底上,小組分別研究隨機(jī)森林重要性測度和SNP相關(guān)分析技術(shù);小組協(xié)助完成適用于SNP相關(guān)分析的隨機(jī)森林重要性測度;對測度進(jìn)展模擬和真實數(shù)據(jù)的測試;根據(jù)測試結(jié)果對方法進(jìn)展改進(jìn);將方法制作成實用的工具,可以用于進(jìn)一步的理論研究;小組共同完成基于Web的SNP分析系統(tǒng),用于實際的治病基因的分析研究。實施方案:〔2013年11月----2013年12月〕:工程準(zhǔn)備階段,對相關(guān)理論進(jìn)展學(xué)習(xí)和總結(jié),進(jìn)展相關(guān)資料收集與整理,對前人的研究進(jìn)展分析和總結(jié)?!?014年1月----2014年7月〕:工程實現(xiàn)階段,實現(xiàn)重要性測度方法,同時完成Web系統(tǒng)的開發(fā),將方法整合到Web系統(tǒng)中?!?014年8月----2014年11月〕:工程測試階段,對系統(tǒng)進(jìn)展測試,根據(jù)測試結(jié)果進(jìn)展改進(jìn)與修正。七、成員分工情況〔王睿然〕工程負(fù)責(zé)人,工程整體進(jìn)度把握,算法與系統(tǒng)的整合及工具的開發(fā)?!怖畹陆持饕惴▽崿F(xiàn)以及優(yōu)化。〔楊靜雯〕Web系統(tǒng)的開發(fā)與測試。八、預(yù)期成果及成果形式用于重要性測度的高效工具包,以及可以用于SNP分析的Web系統(tǒng)。建立相關(guān)的網(wǎng)絡(luò)平臺。九、資助經(jīng)費(fèi)使用方案〔支出工程、計算根據(jù)及理由〕實驗材料費(fèi)用:3200書籍資料費(fèi)用:150論文發(fā)表費(fèi)用:2000專利申請費(fèi):2000費(fèi)用太低其他:350費(fèi)用太低合計:5600申請人簽名:年月日導(dǎo)師楊利英性別女出生年月職稱/職務(wù)副教授研究領(lǐng)域集成學(xué)習(xí),生物信息學(xué)所屬院系計算機(jī)學(xué)院手機(jī)E-mailyangliying1208163.十、指導(dǎo)教師科研工程情況近三年工程情況:主持工程:陜西省科學(xué)技術(shù)研究開展方案資助工程,基于集成學(xué)習(xí)的模式識別關(guān)鍵技術(shù)研究〔2009K01-56〕,2010~2011中央高校根本科研業(yè)務(wù)費(fèi)工程〔K〕,集成學(xué)習(xí)方法研究及其在高維數(shù)據(jù)分析中的應(yīng)用少了"用〞,2010.9~2012.12.少了"用〞中央高校根本科研業(yè)務(wù)費(fèi)工程〔K5051303017〕參與工程:國家自然科學(xué)基金工程,原因?qū)W習(xí):理論及在全基因組關(guān)聯(lián)分析中的應(yīng)用〔61070137〕,2011-2013國家自然科學(xué)基金工程,構(gòu)造可信、高效軟件系統(tǒng)的根底研究〔60910004〕,2010.01~2012.122009年國家973方案和重大科學(xué)研究方案工程〔2010CB328100-G〕,課題2:信息效勞的需求獲取與建模十一、指導(dǎo)教師能否提供實驗場地,如何解決實驗場地的問題可以提供實驗場地,并且有一臺戴爾工作站〔DellPrecisionT7600/E5-2630(2.3GHz,6核)*2/8G*8/2T(SATA7.2K)*4/DVDRW/K6001G顯卡〕用于處理較大的數(shù)據(jù)。十二、指導(dǎo)教師意見

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論