![數(shù)據(jù)統(tǒng)計分析模型_第1頁](http://file4.renrendoc.com/view/72531d5bde063e01b6bf6671f4ce83d6/72531d5bde063e01b6bf6671f4ce83d61.gif)
![數(shù)據(jù)統(tǒng)計分析模型_第2頁](http://file4.renrendoc.com/view/72531d5bde063e01b6bf6671f4ce83d6/72531d5bde063e01b6bf6671f4ce83d62.gif)
![數(shù)據(jù)統(tǒng)計分析模型_第3頁](http://file4.renrendoc.com/view/72531d5bde063e01b6bf6671f4ce83d6/72531d5bde063e01b6bf6671f4ce83d63.gif)
![數(shù)據(jù)統(tǒng)計分析模型_第4頁](http://file4.renrendoc.com/view/72531d5bde063e01b6bf6671f4ce83d6/72531d5bde063e01b6bf6671f4ce83d64.gif)
![數(shù)據(jù)統(tǒng)計分析模型_第5頁](http://file4.renrendoc.com/view/72531d5bde063e01b6bf6671f4ce83d6/72531d5bde063e01b6bf6671f4ce83d65.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
數(shù)據(jù)統(tǒng)計分析模型第1頁,共16頁,2023年,2月20日,星期五參考書施雨,李耀武編,概率論與數(shù)理統(tǒng)計應(yīng)用,西安交通大學(xué)出版社梅長林,范金成編,數(shù)據(jù)分析方法,高等教育出版社,王學(xué)民編,應(yīng)用多元統(tǒng)計分析,上海財經(jīng)大學(xué)出版社方開泰編,使用多元統(tǒng)計分析,華東師范大學(xué)出版社第2頁,共16頁,2023年,2月20日,星期五統(tǒng)計軟件SAS(StatisticalAnalysisSystem)SPSS(StatisticalPackagefortheSocialScience)R第3頁,共16頁,2023年,2月20日,星期五數(shù)據(jù)統(tǒng)計分析常用模型方差分析回歸分析判別分析聚類分析主成分分析相關(guān)分析(典型相關(guān)分析)因子分析列聯(lián)表分析時間序列分析第4頁,共16頁,2023年,2月20日,星期五例子例1:為了比較同一類型的三種不同食譜的營養(yǎng)效果,將19只幼鼠隨機地分為三組,每只分為8只、4只、7只,各采用這三種食譜喂養(yǎng)。假定其他條件均保持相同,12周后測得其體重增加量如下表所示,是比較這三種食譜的營養(yǎng)效果是否有顯著差異食譜體重增加量甲164190203205206214228257乙185197201231丙187212215220248265281第5頁,共16頁,2023年,2月20日,星期五例子例2:為了研制一種治療枯草熱病的藥物,將兩種成分(A和B)各按三種不同劑量(低、中、高)混合,將36位自愿受試患者隨機分為9組,每組4人服用各種劑量回合下的藥物,記錄其病情緩解的時間(單位:小時)如下表所示,試分析兩種成分及交互作用對病情緩解的時間是否有顯著影響。第6頁,共16頁,2023年,2月20日,星期五例子AB低劑量中劑量高劑量低劑量2.42.72.32.54.64.24.94.7
4.84.54.44.6低劑量5.85.25.55.38.99.18.79.0
9.19.38.79.4低劑量6.15.75.96.29.910.510.610.113.513.013.313.2第7頁,共16頁,2023年,2月20日,星期五例子例3:費希爾(Fisher)于1936年發(fā)表了關(guān)于鳶尾花(Iris)的數(shù)據(jù)。數(shù)據(jù)是對3種鳶尾花:剛毛鳶尾花(第1組)、變色鳶尾花(第2組)和費吉尼亞鳶尾花(第3組)各抽取一個容量為50的樣本,測量其花萼長x1,花萼寬x2,花瓣長x3,花瓣寬x4,單位為mm,數(shù)據(jù)如下表所示。假定有新樣品(x1,x2,x3,x4)=(62.35,58,18),試判別該樣品屬于哪種鳶尾花。第8頁,共16頁,2023年,2月20日,星期五例子編號品種萼長x1萼寬x2瓣長x3瓣寬x4
1503314214634143………………265284615262224515………………364285622………………150363336025第9頁,共16頁,2023年,2月20日,星期五例子例4:2000年全國大學(xué)生數(shù)學(xué)建模競賽A題DNA序列分類
2000年6月,人類基因組計劃中DNA全序列草圖完成,預(yù)計2001年可以完成精確的全序列圖,此后人類將擁有一本記錄著自身生老病死及遺傳進化的全部信息的“天書”。這本大自然寫成的“天書”是由4個字符A,T,C,G按一定順序排成的長約30億的序列,其中沒有“斷句”也沒有標(biāo)點符號,除了這4個字符表示4種堿基以外,人們對它包含的“內(nèi)容”知之甚少,難以讀懂。破譯這部世界上最巨量信息的“天書”是二十一世紀最重要的任務(wù)之一。在這個目標(biāo)中,研究DNA全序列具有什么結(jié)構(gòu),由這4個字符排成的看似隨機的序列中隱藏著什么規(guī)律,又是解讀這部天書的基礎(chǔ),是生物信息學(xué)(Bioinformatics)最重要的課題之一。
雖然人類對這部“天書”知之甚少,但也發(fā)現(xiàn)了DNA序列中的一些規(guī)律性和結(jié)構(gòu)。例如,在全序列中有一些是用于編碼蛋白質(zhì)的序列片段,即由這4個字符組成的64種不同的3字符串,其中大多數(shù)用于編碼構(gòu)成蛋白質(zhì)的20種氨基酸。又例如,在不用于編碼蛋白質(zhì)的序列片段中,A和T的含量特別多些,于是以某些堿基特別豐富作為特征去研究DNA序列的結(jié)構(gòu)也取得了一些結(jié)果。此外,利用統(tǒng)計的方法還發(fā)現(xiàn)序列的某些片段之間具有相關(guān)性,等等。這些發(fā)現(xiàn)讓人們相信,DNA序列中存在著局部的和全局性的結(jié)構(gòu),充分發(fā)掘序列的結(jié)構(gòu)對理解DNA全序列是十分有意義的。目前在這項研究中最普通的思想是省略序列的某些細節(jié),突出特征,然后將其表示成適當(dāng)?shù)臄?shù)學(xué)對象。這種被稱為粗?;湍P突姆椒ㄍ兄谘芯恳?guī)律性和結(jié)構(gòu)。
第10頁,共16頁,2023年,2月20日,星期五作為研究DNA序列的結(jié)構(gòu)的嘗試,提出以下對序列集合進行分類的問題:
1)下面有20個已知類別的人工制造的序列(見下頁),其中序列標(biāo)號1—10
為A類,11-20為B類。請從中提取特征,構(gòu)造分類方法,并用這些已知類別的序列,衡量你的方法是否足夠好。然后用你認為滿意的方法,對另外20個未標(biāo)明類別的人工序列(標(biāo)號21—40)進行分類,把結(jié)果用序號(按從小到大的順序)標(biāo)明它們的類別(無法分類的不寫入):
A類__________
;B類_______________
。
請詳細描述你的方法,給出計算程序。如果你部分地使用了現(xiàn)成的分類方法,也要將方法名稱準確注明。
這40個序列也放在如下地址的網(wǎng)頁上,用數(shù)據(jù)文件Art-model-data
標(biāo)識,供下載:
網(wǎng)易網(wǎng)址:
教育頻道
在線試題;
教育網(wǎng):
New
mcm2000
教育網(wǎng):
/mcm
第11頁,共16頁,2023年,2月20日,星期五例子
2)在同樣網(wǎng)址的數(shù)據(jù)文件Nat-model-data
中給出了182個自然DNA序列,它們都較長。用你的分類方法對它們進行分類,像1)一樣地給出分類結(jié)果。
提示:衡量分類方法優(yōu)劣的標(biāo)準是分類的正確率,構(gòu)造分類方法有許多途徑,例如提取序列的某些特征,給出它們的數(shù)學(xué)表示:幾何空間或向量空間的元素等,然后再選擇或構(gòu)造適合這種數(shù)學(xué)表示的分類方法;又例如構(gòu)造概率統(tǒng)計模型,然后用統(tǒng)計方法分類等。第12頁,共16頁,2023年,2月20日,星期五例子Art-model-data
1.aggcacggaaaaacgggaataacggaggaggacttggcacggcattacacggaggacgaggtaaaggaggcttgtctacggccggaagtgaagggggatatgaccgcttgg
2.cggaggacaaacgggatggcggtattggaggtggcggactgttcggggaattattcggtttaaacgggacaaggaaggcggctggaacaaccggacggtggcagcaaagga
3.gggacggatacggattctggccacggacggaaaggaggacacggcggacatacacggcggcaacggacggaacggaggaaggagggcggcaatcggtacggaggcggcgga
4.atggataacggaaacaaaccagacaaacttcggtagaaatacagaagcttagatgcatatgttttttaaataaaatttgtattattatggtatcataaaaaaaggttgcga
5.cggctggcggacaacggactggcggattccaaaaacggaggaggcggacggaggctacaccaccgtttcggcggaaaggcggagggctggcaggaggctcattacggggag
6.atggaaaattttcggaaaggcggcaggcaggaggcaaaggcggaaaggaaggaaacggcggatatttcggaagtggatattaggagggcggaataaaggaacggcggcaca
7.atgggattattgaatggcggaggaagatccggaataaaatatggcggaaagaacttgttttcggaaatggaaaaaggactaggaatcggcggcaggaaggatatggaggcg
8.atggccgatcggcttaggctggaaggaacaaataggcggaattaaggaaggcgttctcgcttttcgacaaggaggcggaccataggaggcggattaggaacggttatgagg
9.atggcggaaaaaggaaatgtttggcatcggcgggctccggcaactggaggttcggccatggaggcgaaaatcgtgggcggcggcagcgctggccggagtttgaggagcgcg
10.tggccgcggaggggcccgtcgggcgcggatttctacaagggcttcctgttaaggaggtggcatccaggcgtcgcacgctcggcgcggcaggaggcacgcgggaaaaaacg
11.gttagatttaacgttttttatggaatttatggaattataaatttaaaaatttatattttttaggtaagtaatccaacgtttttattactttttaaaattaaatatttatt
12.gtttaattactttatcatttaatttaggttttaattttaaatttaatttaggtaagatgaatttggttttttttaaggtagttatttaattatcgttaaggaaagttaaa
13.gtattacaggcagaccttatttaggttattattattatttggattttttttttttttttttttaagttaaccgaattattttctttaaagacgttacttaatgtcaatgc
14.gttagtcttttttagattaaattattagattatgcagtttttttacataagaaaatttttttttcggagttcatattctaatctgtctttattaaatcttagagatatta
15.gtattatatttttttatttttattattttagaatataatttgaggtatgtgtttaaaaaaaatttttttttttttttttttttttttttttttaaaatttataaatttaa
16.gttatttttaaatttaattttaattttaaaatacaaaatttttactttctaaaattggtctctggatcgataatgtaaacttattgaatctatagaattacattattgat
17.gtatgtctatttcacggaagaatgcaccactatatgatttgaaattatctatggctaaaaaccctcagtaaaatcaatccctaaacccttaaaaaacggcggcctatccc
18.gttaattatttattccttacgggcaattaattatttattacggttttatttacaattttttttttttgtcctatagagaaattacttacaaaacgttattttacatactt
19.gttacattatttattattatccgttatcgataattttttacctcttttttcgctgagtttttattcttactttttttcttctttatataggatctcatttaatatcttaa
20.gtatttaactctctttactttttttttcactctctacattttcatcttctaaaactgtttgatttaaacttttgtttctttaaggattttttttacttatcctctgttat
21.tttagctcagtccagctagctagtttacaatttcgacaccagtttcgcaccatcttaaatttcgatccgtaccgtaatttagcttagatttggatttaaaggatttagattga
22.tttagtacagtagctcagtccaagaacgatgtttaccgtaacgtqacgtaccgtacgctaccgttaccggattccggaaagccgattaaggaccgatcgaaaggg
23.cgggcggatttaggccgacggggacccgggattcgggacccgaggaaattcccggattaaggtttagcttcccgggatttagggcccggatggctgggaccc24.tttagctagctactttagctatttttagtagctagccagcctttaaggctagctttagctagcattgttctttattgggacccaagttcgacttttacgatttagttttgaccgt
25.gaccaaaggtgggctttagggacccgatgctttagtcgcagctggaccagttccccagggtattaggcaaaagctgacgggcaattgcaatttaggcttaggcca
26.gatttactttagcatttttagctgacgttagcaagcattagctttagccaatttcgcatttgccagtttcgcagctcagttttaacgcgggatctttagcttcaagctttttac
27.ggattcggatttacccggggattggcggaacgggacctttaggtcgggacccattaggagtaaatgccaaaggacgctggtttagccagtccgttaaggcttag
28.tccttagatttcagttactatatttgacttacagtctttgagatttcccttacgattttgacttaaaatttagacgttagggcttatcagttatggattaatttagcttattttcga
29.ggccaattccggtaggaaggtgatggcccgggggttcccgggaggatttaggctgacgggccggccatttcggtttagggagggccgggacgcgttagggc30.cgctaagcagctcaagctcagtcagtcacgtttgccaagtcagtaatttgccaaagttaaccgttagctgacgctgaacgctaaacagtattagctgatgactcgta
31.ttaaggacttaggctttagcagttactttagtttagttccaagctacgtttacgggaccagatgctagctagcaatttattatccgtattaggcttaccgtaggtttagcgt32.gctaccgggcagtctttaacgtagctaccgtttagtttgggcccagccttgcggtgtttcggattaaattcgttgtcagtcgctctrtgggtttagtcattcccaaaagg
33.cagttagctgaatcgtttagccatttgacgtaaacatgattttacgtacgtaaattttagccctgacgtttagctaggaatttatgctgacgtagcgatcgactttagcac
34.cggttagggcaaaggttggatttcgacccagggggaaagcccgggacccgaacccagggctttagcgtaggctgacgctaggcttaggttggaacccggaaa
35.gcggaagggcgtaggtttgggatgcttagccgtaggctagctttcgacacgatcgattcgcaccacaggataaaagttaagggaccggtaagtcgcggtagcc
36.ctagctacgaacgctttaggcgcccccgggagtagtcgttaccgttagtatagcagtcgcagtcgcaattcgcaaaagtccccagctttagccccagagtcgacg
37.gggatgctgacgctggttagctttaggcttagcgtagctttagggccccagtctgcaggaaatgcccaaaggaggcccaccgggtagatgccasagtgcaccgt
38.aacttttagggcatttccagttttacgggttattttcccag
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度減肥健身器材銷售與服務(wù)合同
- 2025年度環(huán)境工程資料收集與評估合同范本
- 2025年度新型城鎮(zhèn)化建設(shè)安裝施工總承包合同
- 貴州2025年貴州省自然資源廳事業(yè)單位招聘14人筆試歷年參考題庫附帶答案詳解
- 邯鄲2024年河北邯鄲廣平縣招聘警務(wù)輔助崗位工作人員58人筆試歷年參考題庫附帶答案詳解
- 衡水2025年河北衡水職業(yè)技術(shù)學(xué)院招聘人事代理工作人員25人筆試歷年參考題庫附帶答案詳解
- 綿陽2024年四川省綿陽第一中學(xué)第三批招聘教師3人筆試歷年參考題庫附帶答案詳解
- 滁州安徽滁州天長市水利局機關(guān)綜合服務(wù)中心選調(diào)工作人員筆試歷年參考題庫附帶答案詳解
- 山西省卓越聯(lián)盟2024-2025學(xué)年高三下學(xué)期2月開學(xué)質(zhì)量檢測試題 地理 含答案
- 喹吖啶酮類項目融資計劃書
- 2024年度超詳細!上海新能源汽車充電樁合作協(xié)議3篇
- 年新增1萬噸SQ-06Li鋰吸附材料技改擴能項目環(huán)評資料環(huán)境影響
- 智研咨詢發(fā)布-2025年中國少兒編程行業(yè)市場競爭格局、行業(yè)政策及需求規(guī)模預(yù)測報告
- 分管安全副校長在教師會議上講話:到底如何抓好安全從哪些細節(jié)來抓安全
- 湘教版七年級上冊數(shù)學(xué)期末考試試卷帶答案
- 2024年決戰(zhàn)行測5000題言語理解與表達(培優(yōu)b卷)
- 校園安全視頻監(jiān)控維保方案
- 農(nóng)旅一體化生態(tài)農(nóng)業(yè)示范園區(qū)建設(shè)項目可行性研究報告
- 2025年慢性阻塞性肺疾病全球創(chuàng)議GOLD指南修訂解讀課件
- 政府購買報刊訂閱服務(wù)協(xié)議
- 第三單元名著導(dǎo)讀《駱駝祥子》整本書閱讀教學(xué)設(shè)計+2023-2024學(xué)年統(tǒng)編版語文七年級下冊
評論
0/150
提交評論