版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、任課教師:陳彥云 授課時(shí)數(shù):51課時(shí) 學(xué)分:3分,生物統(tǒng)計(jì)學(xué),內(nèi) 容: 介紹科學(xué)研究中常用的、基本的 生物統(tǒng)計(jì)方法與試驗(yàn)設(shè)計(jì)方法 : 資料的整理; 平均數(shù)、 標(biāo)準(zhǔn)差與變異系數(shù); 常用概率分布;平均數(shù)的統(tǒng)計(jì)推斷;方差分析; 2 檢驗(yàn);直線回歸與相關(guān);可直線化非線性回歸分析;協(xié)方差分析;試驗(yàn)設(shè)計(jì)的基本原理和方法及對(duì)比設(shè)計(jì)、 隨機(jī)區(qū)組設(shè)計(jì),裂區(qū)設(shè)計(jì),正交設(shè)計(jì)等。,方 法: 用CAI課件教學(xué),以課堂講授為主 要 求: 了 解 基本原理; 熟練掌握 所介紹的幾種試驗(yàn)設(shè)計(jì)方法,能 獨(dú)立進(jìn)行試驗(yàn)設(shè)計(jì); 熟練掌握 所介紹的幾種生物統(tǒng)計(jì)方法,能 獨(dú)立進(jìn)行試驗(yàn)結(jié)果的統(tǒng)計(jì)分析; 熟練掌握 電子計(jì)算器的使用。,下一張
2、,主 頁(yè),退 出,上一張,培 養(yǎng) 嚴(yán)謹(jǐn)?shù)闹螌W(xué)態(tài)度 精細(xì)的治學(xué)作風(fēng) 獨(dú)立的自學(xué)能力,下一張,主 頁(yè),退 出,上一張,成績(jī)?cè)u(píng)定: 平時(shí)作業(yè),30% 期末考試,70% 作業(yè)要求: 獨(dú)立思考 演算正確 作圖清楚 書(shū)寫整齊,下一張,主 頁(yè),退 出,上一張,主 要 教 學(xué) 參 考 文 獻(xiàn),1明道緒主編. 生物統(tǒng)計(jì). 中國(guó)農(nóng)業(yè)科技出版社,1998。 2明道緒主編. 獸醫(yī)統(tǒng)計(jì)方法. 成都科技大學(xué)出版社,1991。 3南京農(nóng)業(yè)大學(xué)主編. 田間試驗(yàn)與統(tǒng)計(jì)方法 (第二版). 農(nóng)業(yè)出版社,1988。 4莫惠棟 . 農(nóng)業(yè)試驗(yàn)設(shè)計(jì). 上??茖W(xué)技術(shù)出版社,1984。 5(美)G.W.斯奈迪格著,楊紀(jì)珂等譯. 應(yīng)用與農(nóng)學(xué)和生
3、物學(xué)實(shí)驗(yàn)的數(shù)理統(tǒng)計(jì)方法. 科學(xué)出版社,1964。 6(美)RGD斯蒂爾, JH托里著, 楊紀(jì)珂等譯. 數(shù)理統(tǒng)計(jì)的原理與方法. 科學(xué)出版社,1976。 7 李春喜等編著。生物統(tǒng)計(jì)學(xué)學(xué)習(xí)指導(dǎo)??茖W(xué)出版社,2008,下一張,主 頁(yè),退 出,上一張,每天 都是向既定目標(biāo) 邁進(jìn)的一步,贈(zèng) 言,下一張,主 頁(yè),退 出,上一張,zlcc,E-mail: nxchenyy 陳彥云 寧夏大學(xué)生命科學(xué)學(xué)院第一章 概 論,第一節(jié) 生物統(tǒng)計(jì)學(xué)的概念及主要內(nèi)容,一、概念,生物統(tǒng)計(jì)學(xué)(Biostatistics)是數(shù)理統(tǒng)計(jì)在生物學(xué)研究中的應(yīng)用,它是用數(shù)理統(tǒng)計(jì)的原理和方法來(lái)認(rèn)識(shí)、分析、推斷和解釋生
4、命過(guò)程中的各種現(xiàn)象和試驗(yàn)調(diào)查資料的科學(xué)。屬于生物數(shù)學(xué)的范疇。,二、主要內(nèi)容,生 的 物 基 統(tǒng) 本 計(jì) 內(nèi) 學(xué) 容,試 驗(yàn) 設(shè) 計(jì),統(tǒng) 計(jì) 分 析,基本原則 方案制定 常用試驗(yàn)設(shè)計(jì)方法,資料的搜集和整理 數(shù)據(jù)特征數(shù)的計(jì)算 統(tǒng)計(jì)推斷 方差分析 回歸和相關(guān)分析 協(xié)方差分析 主成分分析 聚類分析,對(duì)比設(shè)計(jì) 隨機(jī)區(qū)組設(shè)計(jì) 裂區(qū)設(shè)計(jì) 拉丁方設(shè)計(jì) 正交設(shè)計(jì),三 生物統(tǒng)計(jì)學(xué)的基本作用:,提供整理和描述數(shù)據(jù)資料的科學(xué)方法,確定某些性狀和特性的數(shù)量特征。,運(yùn)用顯著檢驗(yàn),判斷試驗(yàn)結(jié)果的可靠性或可行性。,提供由樣本推斷總體的方法。,提供試驗(yàn)設(shè)計(jì)的的一些重要原則。,第二節(jié) 生物統(tǒng)計(jì)學(xué)發(fā)展概況,統(tǒng)計(jì)發(fā)展史可以追溯到遠(yuǎn)古
5、的原始社會(huì),但是,能使人類的統(tǒng)計(jì)實(shí)踐上升到理論上予以概括總結(jié)的程度,即開(kāi)始成為一門系統(tǒng)的學(xué)科統(tǒng)計(jì)學(xué),卻是近代的事情,距今只有三百余年的短暫歷史。 現(xiàn)代統(tǒng)計(jì)學(xué)起源于17世紀(jì),主要有兩個(gè)來(lái)源: 1政治科學(xué)需要,2當(dāng)時(shí)貴族階層對(duì)機(jī)率數(shù)學(xué)理論很感興趣而發(fā)展起來(lái)的。另外,研究天文學(xué)的需要也促進(jìn)了統(tǒng)計(jì)學(xué)的發(fā)展。統(tǒng)計(jì)學(xué)發(fā)展的概貌,大致可劃分為古典記錄統(tǒng)計(jì)學(xué)、近代描述統(tǒng)計(jì)學(xué)和現(xiàn)代推斷統(tǒng)計(jì)學(xué)三種形態(tài)。,一、發(fā)展概況,原 始 社 會(huì),奴 隸 社 會(huì),封 建 社 會(huì),資 本 主 義 社 會(huì),迅速發(fā)展 形成分支,生物統(tǒng)計(jì)學(xué),形成不同學(xué)派:,1、政治算術(shù)學(xué)派 起源于17世紀(jì)60年代的英國(guó) 代表人物:威廉.配第(Will
6、iam Petty,16231687) 約翰.格朗托(John Graunt,16201674) 代表作:政治算術(shù) 但未采用“統(tǒng)計(jì)學(xué)”這個(gè)詞,2、國(guó)勢(shì)學(xué)派,又叫記述學(xué)派 創(chuàng)建于17世紀(jì)的德國(guó) 代表人物:海爾曼.康令(Herman Conring,16061681) 阿痕瓦爾(Gottfried Achenwall,17911772) 代表作:近代歐洲各國(guó)國(guó)勢(shì)論首次采用“stastistik” 德國(guó)經(jīng)濟(jì)學(xué)家和統(tǒng)計(jì)學(xué)家克尼斯(K . G . A Knies,18211898)在1850年發(fā)表的論文獨(dú)立科學(xué)的統(tǒng)計(jì)學(xué)中主張把“國(guó)家論”作為“國(guó)勢(shì)學(xué)”的科學(xué)命名,“統(tǒng)計(jì)學(xué)”作為“政治算術(shù)”的科學(xué)命名。,3
7、、數(shù)理統(tǒng)計(jì)學(xué)派 產(chǎn)生于19世紀(jì)中葉 代表人物:阿道夫.凱特勒(L.A.J Quetelet,17961874) 高爾登(F.Galtonl,18221911) 皮爾遜(K.Pearson,18571936 ) 逐漸形成一門獨(dú)立的應(yīng)用數(shù)學(xué)。 1867年韋特斯坦(T.Wittstein)把既是數(shù)學(xué),又是統(tǒng)計(jì)學(xué)的新生科學(xué)命名為數(shù)理統(tǒng)計(jì)學(xué)。,4、社會(huì)統(tǒng)計(jì)學(xué)派 以德國(guó)為中心,創(chuàng)建于19世紀(jì)后期 代表人物:恩格爾(C.I.E. Engel,18211896) 梅爾( C.G.V. Mager ,18411925) 認(rèn)為統(tǒng)計(jì)學(xué)研究的對(duì)象是社會(huì)科學(xué),而數(shù)理統(tǒng)計(jì)學(xué)是一門應(yīng)用數(shù)學(xué)。 19世紀(jì)中葉誕生了馬克思主義的
8、統(tǒng)計(jì)理論,后來(lái),列寧對(duì)其進(jìn)行了豐富和發(fā)展。,二、統(tǒng)計(jì)學(xué)發(fā)展史中的重大事件與重要代表人物,J.Bernoulli(貝努里,瑞士,16541705) 系統(tǒng)論證了“大數(shù)定律”,即樣本容量越大,樣本統(tǒng)計(jì)數(shù)與總體參數(shù)之差越小。,P.S. Laplace(拉普拉斯,法國(guó),17491827) 最早系統(tǒng)的把概率論方法運(yùn)用到統(tǒng)計(jì)學(xué)研究中去,建立了嚴(yán)密的概率數(shù)學(xué)理論,并應(yīng)用到人口統(tǒng)計(jì)、天文學(xué)等方面的研究上。,Gauss(高斯,德國(guó),17771855) 正態(tài)分布理論最早由De Moiver于1733年發(fā)現(xiàn),后來(lái)Gauss在進(jìn)行天文觀察和研究土地測(cè)量誤差理論時(shí)又一次獨(dú)立發(fā)現(xiàn)了正態(tài)分布(又稱常態(tài)分布)的理論方程,提出“
9、誤差分布曲線”,后人為了紀(jì)念他,將正態(tài)分布也稱為Gauss分布。,F. Galton(高爾登,英國(guó),18221911) 19世紀(jì)末統(tǒng)計(jì)學(xué)開(kāi)始用于生物學(xué)的研究。1882年Galton開(kāi)設(shè)“人體測(cè)量實(shí)驗(yàn)室”,測(cè)量9337人的資料,探索能把大量數(shù)據(jù)加以描述與比較的方法和途徑,引入了中位數(shù)、百分位數(shù)、四分位數(shù)、四分位差以及分布、相關(guān)、回歸等重要的統(tǒng)計(jì)學(xué)概念與方法。1889年發(fā)表第一篇生物統(tǒng)計(jì)論文自然界的遺傳。1901年Galton和他的學(xué)生Pearson創(chuàng)辦了“Biometrika(生物統(tǒng)計(jì)學(xué)報(bào))”雜志,首次明確“Biometry(生物統(tǒng)計(jì))”一詞。所以后人推崇Galton為生物統(tǒng)計(jì)學(xué)的創(chuàng)始人。,K.
10、 Pearson(卡.皮爾遜,英國(guó),18571936) Pearson的一生是統(tǒng)計(jì)研究的一生。他首創(chuàng)頻數(shù)分布表與頻數(shù)分布圖,如今已成為最基本的統(tǒng)計(jì)方法之一;觀察到許多生物的度量并不呈現(xiàn)正態(tài)分布,利用相對(duì)斜率得到矩形分布、J型分布、U型分布或鈴型分布等;1900年獨(dú)立發(fā)現(xiàn)了X2分布,提出了有名的卡方檢驗(yàn)法,后經(jīng)Fisher補(bǔ)充,成為小樣本推斷統(tǒng)計(jì)的早期方法之一; Pearson對(duì)“回歸與相關(guān)”進(jìn)一步作了發(fā)展,在18971905年,Pearson還提出復(fù)相關(guān)、總相關(guān)、相關(guān)比等概念,不僅發(fā)展了Galton的相關(guān)理論,還為之建立了數(shù)學(xué)基礎(chǔ)。,W.S.Gosset(歌賽特,英國(guó),17771855) 在生
11、產(chǎn)實(shí)踐中對(duì)樣本標(biāo)準(zhǔn)差進(jìn)行了大量研究。于1908年以“Student(學(xué)生)”為筆名在該年的Biometrika上發(fā)表了論文平均數(shù)的概率誤差,創(chuàng)立了小樣本檢驗(yàn)代替大樣本檢驗(yàn)的理論,即t分布和t檢驗(yàn)法,也稱為學(xué)生式分布。t檢驗(yàn)已成為當(dāng)代生物統(tǒng)計(jì)工作的基本工具之一,為多元分析理論的形成和應(yīng)用奠定了基礎(chǔ),為此,許多統(tǒng)計(jì)學(xué)家把1908年看作是統(tǒng)計(jì)推斷理論發(fā)展史上的里程碑。,R.A.Fisher(費(fèi)歇爾,英國(guó),18901962) Fisher一生論著頗多,共寫了329篇。他跨進(jìn)統(tǒng)計(jì)學(xué)界是從研究概率分布開(kāi)始,1915年在Biometrika上發(fā)表論文無(wú)限總體樣本相關(guān)系數(shù)值的頻率分布,被稱為現(xiàn)代推斷統(tǒng)計(jì)學(xué)的第
12、一篇論文。1923年發(fā)展了顯著性檢驗(yàn)及估計(jì)理論,提出了F分布和F檢驗(yàn),1918年在孟德?tīng)栠z傳試驗(yàn)設(shè)計(jì)間的相對(duì)關(guān)系一文中首創(chuàng)“方差”和“方差分析”兩個(gè)概念,1925年提出隨機(jī)區(qū)組和正交拉丁方試驗(yàn)設(shè)計(jì),并在盧桑姆斯坦德農(nóng)業(yè)試驗(yàn)站得到檢驗(yàn)與應(yīng)用,他還在試驗(yàn)設(shè)計(jì)中提出“隨機(jī)化”原則,1938年和Yates合編了Fisher Yates隨機(jī)數(shù)字表。,另外 Neyman(18941981)和S.Pearson進(jìn)行了統(tǒng)計(jì)理論研究,分別與1936和1938年提出一種統(tǒng)計(jì)假說(shuō)檢驗(yàn)學(xué)說(shuō)。P.C.Mabeilinrobis對(duì)作物抽樣調(diào)查、A.Waecl對(duì)序貫抽樣、Finney對(duì)毒理統(tǒng)計(jì)、K.Mather對(duì)生統(tǒng)遺傳學(xué)
13、、F.Yates對(duì)田間試驗(yàn)設(shè)計(jì)等都作出了杰出貢獻(xiàn)。,三、統(tǒng)計(jì)學(xué)在中國(guó)的傳播,我國(guó)在解放前,社會(huì)經(jīng)濟(jì)發(fā)展緩慢,統(tǒng)計(jì)的應(yīng)用和發(fā)展受到了很大的限制。1913年,顧澄教授(1882?)翻譯了英國(guó)統(tǒng)計(jì)學(xué)家尤爾的著作統(tǒng)計(jì)學(xué)之理論(1911),即為英美數(shù)理統(tǒng)計(jì)學(xué)傳入中國(guó)之始。之后又有一些英美統(tǒng)計(jì)著作被翻譯成中文,F(xiàn)isher的理論和方法也很快傳入中國(guó)。 在20世紀(jì)30年代,生物統(tǒng)計(jì)與田間試驗(yàn)就作為農(nóng)學(xué)系的必修課,1935年王綬(18761972)編著出版的實(shí)用生物統(tǒng)計(jì)法是我國(guó)出版最早的生物統(tǒng)計(jì)專著之一。隨后1942年范福仁出版了田間試驗(yàn)技術(shù)等,這些對(duì)推動(dòng)我國(guó)農(nóng)業(yè)生物統(tǒng)計(jì)和田間試驗(yàn)方法的應(yīng)用都產(chǎn)生了很大影響。
14、,新中國(guó)成立后,許多學(xué)者翻譯、編著了統(tǒng)計(jì)學(xué)論著,有力的推動(dòng)了數(shù)理統(tǒng)計(jì)方法在中國(guó)的普及和應(yīng)用。1978年12月國(guó)家統(tǒng)計(jì)局在四川峨眉召開(kāi)了統(tǒng)計(jì)教學(xué)、科研規(guī)劃座談會(huì),全面引進(jìn)了前蘇聯(lián)的社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)理論和統(tǒng)計(jì)制度,對(duì)我國(guó)社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)學(xué)的發(fā)展起到了一定的積極作用。這以后有關(guān)統(tǒng)計(jì)學(xué)的教材與論著如雨后春筍般涌現(xiàn),統(tǒng)計(jì)工作和統(tǒng)計(jì)科研迅速發(fā)展。1984年1月1日頒布實(shí)施中華人民共和國(guó)統(tǒng)計(jì)法,1987年2月國(guó)家統(tǒng)計(jì)局又發(fā)布中華人民共和國(guó)統(tǒng)計(jì)法實(shí)施細(xì)則,1996年5月八屆人大十九次會(huì)議通過(guò)了關(guān)于修改的決定。 隨著計(jì)算機(jī)的迅速普及,統(tǒng)計(jì)電算程序SAS(Statistical Analysis System)、SPSS
15、(Statistical Package for Social Science) 、 Excel等的引進(jìn),統(tǒng)計(jì)學(xué)在中國(guó)的應(yīng)用與研究出現(xiàn)了嶄新的局面。,第三節(jié) 常用統(tǒng)計(jì)學(xué)術(shù)語(yǔ),一、總體與樣本,具有相同性質(zhì)或?qū)傩缘膫€(gè)體所組成的集合稱為總體 (population),它是指研究對(duì)象的全體; 組成總體的基本單元稱為個(gè)體(individual); 從總體中抽出若干個(gè)體所構(gòu)成的集合稱為樣本(sample); 總體又分為有限總體和無(wú)限總體: 含有有限個(gè)個(gè)體的總體稱為有限總體(finitude popuoation); 包含有極多或無(wú)限多個(gè)體的總體稱為無(wú)限總體(infinitude popuoation).,
16、構(gòu)成樣本的每個(gè)個(gè)體稱為樣本單位;樣本中所包含的個(gè)體數(shù)目叫樣本容量或樣本大小(sample size),樣本容量常記為n。 一般在生物學(xué)研究中,通常把n30的樣本叫小樣本,n 30的樣本叫大樣本。對(duì)于小樣本和大樣本,在一些統(tǒng)計(jì)數(shù)的計(jì)算和分析檢驗(yàn)上是不一樣的。 研究的目的是要了解總體,然而能觀測(cè)到的卻是樣本,通過(guò)樣本來(lái)推斷總體是統(tǒng)計(jì)分析的基本特點(diǎn)。,二、變量與常量,變量,或變數(shù),指相同性質(zhì)的事物間表現(xiàn)差異性或差異特征的數(shù)據(jù)。 常數(shù),表示能代表事物特征和性質(zhì)的數(shù)值,通常由變量計(jì)算而來(lái),在一定過(guò)程中是不變的。,變 量,定性變量,定量變量,連續(xù)變量,非連續(xù)變量,只有整數(shù)出現(xiàn),可以有任何小數(shù)出現(xiàn),為了表示
17、總體和樣本的數(shù)量特征,需要計(jì)算出幾個(gè)特征數(shù),包括平均數(shù)和變異數(shù)(極差、方差、標(biāo)準(zhǔn)差等)。 描述總體特征的數(shù)量稱為參數(shù)(parameter),也稱參量。常用希臘字母表示參數(shù),例如用表示總體平均數(shù),用表示總體標(biāo)準(zhǔn)差; 描述樣本特征的數(shù)量稱為統(tǒng)計(jì)數(shù)(staistic),也稱統(tǒng)計(jì)量。常用拉丁字母表示統(tǒng)計(jì)數(shù),例如用 表 示樣本平均數(shù),用S表示樣本標(biāo)準(zhǔn)差。,三、參數(shù)與統(tǒng)計(jì)數(shù),四、效應(yīng)與互作,通過(guò)施加試驗(yàn)處理,引起試驗(yàn)差異的作用稱為效應(yīng)。效應(yīng)是一個(gè)相對(duì)量,而非絕對(duì)量,表現(xiàn)為施加處理前后的差異。效應(yīng)有正效應(yīng)與負(fù)效應(yīng)之分。,互作,又叫連應(yīng),是指兩個(gè)或兩個(gè)以上處理因素間相互作用產(chǎn)生的效應(yīng)?;プ饕灿姓?yīng)(協(xié)同作用
18、)與負(fù)效應(yīng)(拮抗作用)之分。,五、機(jī)誤與錯(cuò)誤,變異,效應(yīng),誤差,隨機(jī)誤差機(jī)誤(Random error),系統(tǒng)誤差錯(cuò)誤(Systematic error),隨機(jī)誤差,也叫 抽樣誤差(sampling error) 。這是由于試驗(yàn)中無(wú)法控制的內(nèi)在和外在的偶然因素所造成。如試驗(yàn)動(dòng)物的初始條件、飼養(yǎng)條件、管理措施等盡管在試驗(yàn)中力求一致,但也不可能達(dá)到絕對(duì)一致,所以隨機(jī)誤差帶有偶然性質(zhì),在試驗(yàn)中,即使十分小心也是不可避免的。如果通過(guò)良好的試驗(yàn)設(shè)計(jì)、正確的試驗(yàn)操作,增加抽樣或試驗(yàn)次數(shù),隨機(jī)誤差可能減小,但不可能完全消滅。統(tǒng)計(jì)上的試驗(yàn)誤差一般都指隨機(jī)誤差。隨機(jī)誤差越小,試驗(yàn)精確性越高。,系統(tǒng)誤差,也叫片面
19、誤差 (lopsided error)。 這是由于試驗(yàn)條件控制不一致、測(cè)量?jī)x器不準(zhǔn)、試劑配制不當(dāng)、試驗(yàn)人員粗心大意使稱量、觀測(cè)、記載、抄錄、計(jì)算中出現(xiàn)錯(cuò)誤等人為因素而引起的。系統(tǒng)誤差影響試驗(yàn)的準(zhǔn)確性。只要以認(rèn)真負(fù)責(zé)的態(tài)度和細(xì)心的工作作風(fēng)是完全可以避免的。,六、準(zhǔn)確性與精確性,準(zhǔn)確性(accuracy),也叫準(zhǔn)確度,指在調(diào)查或試驗(yàn)中某一試驗(yàn)指標(biāo)或性狀的觀測(cè)值與其真值接近的程度。設(shè)某一試驗(yàn)指標(biāo)或性狀的真值為,觀測(cè)值為 x,若 x與相差的絕對(duì)值|x|越小, 則觀測(cè)值x的準(zhǔn)確性越高; 反之則低。 精確性(precision),也叫精確度,指調(diào)查或試驗(yàn)中同一試驗(yàn)指標(biāo)或性狀的重復(fù)觀測(cè)值彼此接近的程度。若觀
20、測(cè)值彼此接近,即任意二個(gè)觀測(cè)值xi 、xj 相差的絕對(duì)值|xi xj |越小,則觀測(cè)值精確性越高;反之則低。,試驗(yàn)資料的整理,特征數(shù)的計(jì)算,與,第二章,一、試驗(yàn)資料的類型,二、試驗(yàn)資料的搜集,三、試驗(yàn)資料的整理,對(duì)試驗(yàn)資料進(jìn)行分類是統(tǒng)計(jì)歸納的基礎(chǔ)。,試驗(yàn)資料類型,數(shù)量性狀資料,質(zhì)量性狀資料屬性性狀資料,計(jì)數(shù)資料非連續(xù)變量資料,計(jì)量資料連續(xù)變量資料,數(shù)量性狀(quantitative character)是指能夠以計(jì)數(shù)和測(cè)量或度量的方式表示其特征的性狀。觀察測(cè)定數(shù)量性狀而獲得的數(shù)據(jù)就是數(shù)量性狀資料 (data of quantitative characteristics)。數(shù)量性狀資料的獲得有
21、計(jì)數(shù)和測(cè)量?jī)煞N方式,因而數(shù)量性狀資料又分為計(jì)數(shù)資料和計(jì)量資料兩種。,一、數(shù)量性狀資料,1、計(jì)數(shù)資料 指用計(jì)數(shù)方式獲得的數(shù)量性狀資料。在這類資料中,它的各個(gè)觀察值只能以整數(shù)表示,在兩個(gè)相鄰整數(shù)間不得有任何帶小數(shù)的數(shù)值出現(xiàn),因此各觀察值是不連續(xù)的,所以該類資料也稱為非連續(xù)變量資料或間斷變量資料或離散變量資料。,2、計(jì)量資料 指用測(cè)量或度量法獲得的數(shù)量性狀資料,即用度、量、衡等計(jì)量工具直接測(cè)定獲得的數(shù)據(jù)資料。其數(shù)據(jù)是用長(zhǎng)度、重量、容積、溫度、濃度等來(lái)表示,要帶單位。這種資料的各個(gè)觀測(cè)值不一定是整數(shù),兩個(gè)相鄰的整數(shù)間可以有帶小數(shù)的任何數(shù)值出現(xiàn),其小數(shù)位數(shù)的多少由度量工具的精確度而定, 它們之間的變異是
22、連續(xù)性的,因此計(jì)量資料也稱為連續(xù)變量資料。,二、質(zhì)量性狀資料 質(zhì)量性狀(qualitative character)是指能觀察到而不能直接測(cè)量的性狀。觀察質(zhì)量性狀而獲得的數(shù)據(jù)就是質(zhì)量性狀資料(data of qualitative characteristics),也稱為屬性性狀資料。這類性狀本身不能直接用數(shù)值表示,要獲得這類性狀的數(shù)據(jù)資料,須對(duì)其觀察結(jié)果作數(shù)量化處理,其方法有以下兩種:,1、統(tǒng)計(jì)次數(shù)法 在一定的總體或樣本中,根據(jù)某一質(zhì)量性狀的類別統(tǒng)計(jì)其次數(shù),以次數(shù)作為質(zhì)量性狀的數(shù)據(jù)。例如,在研究豌豆的花色遺傳時(shí),紅花與白花雜交,子二代中紅花、紫花和白花的株數(shù)分類統(tǒng)計(jì)如下表。,這種由質(zhì)量性狀數(shù)
23、量化得來(lái)的資料又叫次數(shù)資料。,2、評(píng)分法 對(duì)某一質(zhì)量性狀分成不同級(jí)別,對(duì)不同級(jí)別進(jìn)行評(píng)分來(lái)表示其性狀差異的方法。從而將質(zhì)量性狀進(jìn)行數(shù)量化,以便統(tǒng)計(jì)分析。,一、試驗(yàn)資料的類型,二、試驗(yàn)資料的搜集,三、試驗(yàn)資料的整理,調(diào) 查,試 驗(yàn),資料搜集的方法,一、調(diào)查 調(diào)查是對(duì)已經(jīng)存在的事情的資料按某種方案進(jìn)行收集的方法。資料的調(diào)查又可以分為兩種:普查和抽樣調(diào)查。 1、普查 是對(duì)研究對(duì)象的全部個(gè)體逐一進(jìn)行調(diào)查的方法。普查一般要求在一定的時(shí)間或范圍進(jìn)行,要求準(zhǔn)確和全面。,2、抽樣調(diào)查 是根據(jù)一定的原則從研究對(duì)象中抽取一部分具有代表性的個(gè)體進(jìn)行調(diào)查的方法。通過(guò)抽樣將獲得的樣本資料進(jìn)行統(tǒng)計(jì)處理,然后利用樣本的特征
24、數(shù)對(duì)總體進(jìn)行推斷。生物學(xué)研究中,進(jìn)行普查的情況較少,多數(shù)情況下還是進(jìn)行抽樣調(diào)查。 隨機(jī)抽樣必須滿足2個(gè)條件:一是總體中每個(gè)個(gè)體被抽中的機(jī)會(huì)是均等的;二是總體中任意一個(gè)個(gè)體是相互獨(dú)立的,是否被抽中不受其他個(gè)體的影響。,二、試驗(yàn) 試驗(yàn)是對(duì)已有的或沒(méi)有的事物加以處理的方法。 常見(jiàn)的試驗(yàn)設(shè)計(jì)方法有:對(duì)比設(shè)計(jì)、隨機(jī)區(qū)組設(shè)計(jì)、平衡不完全區(qū)組設(shè)計(jì)、裂區(qū)設(shè)計(jì)、拉丁方設(shè)計(jì)、正交設(shè)計(jì)、正交旋轉(zhuǎn)設(shè)計(jì)等等。 試驗(yàn)設(shè)計(jì)須遵循的三大原則是:隨機(jī)、重復(fù)和局部控制。,一、試驗(yàn)資料的類型,二、試驗(yàn)資料的搜集,三、試驗(yàn)資料的整理,三、試驗(yàn)資料的整理,(一)原始資料的檢查與核對(duì),調(diào)查,試驗(yàn),原始 數(shù)據(jù),核對(duì),檢查,訂正,檢查和核對(duì)
25、原始資料的目的:確保原始資料的完整性和正確性。,三、試驗(yàn)資料的整理,(二)次數(shù)分布表,統(tǒng)計(jì)表的結(jié)構(gòu)和要求: 結(jié)構(gòu)簡(jiǎn)單,層次分明,安排合理,重點(diǎn)突出,數(shù)據(jù)準(zhǔn)確。,表號(hào) 標(biāo)題,1、標(biāo)題 簡(jiǎn)明扼要、準(zhǔn)確地說(shuō)明表的內(nèi)容,有時(shí)須注明時(shí)間、地點(diǎn)。 2、標(biāo)目 標(biāo)目分橫標(biāo)目和縱標(biāo)目?jī)身?xiàng)。橫標(biāo)目列在表的左側(cè) ,縱標(biāo)目列在表的上端,標(biāo)目需 注 明計(jì)算單位,如、kg、cm等等。 3、數(shù)字 一律用阿拉伯?dāng)?shù)字,數(shù)字以小數(shù)點(diǎn)對(duì)齊,小數(shù)位數(shù)一致, 無(wú)數(shù)字的用“”表示,數(shù)字是“0”的,則填寫“0”。 4、線條 多用三線表,上下兩條邊線略粗。,三、試驗(yàn)資料的整理,計(jì)數(shù)資料基本上采用單項(xiàng)式分組法進(jìn)行整理。,特點(diǎn):用樣本變量自然值
26、進(jìn)行分組,每組用一個(gè)或幾個(gè)變量值來(lái)表示。,1117,來(lái)亨雞每月產(chǎn)蛋數(shù)變動(dòng)范圍:,分為7組,統(tǒng)計(jì)各組次數(shù),計(jì)算頻率和累積頻率,制表,1 自然值進(jìn)行分組,最大值17,最小值11。,2 數(shù)據(jù)主要集中在14,向兩側(cè)分布逐漸減少。,表2-3 小麥品種300個(gè)麥穗穗粒數(shù)的次數(shù)分布表,45組?,9 組,三、試驗(yàn)資料的整理,計(jì)量資料一般采用組距式分組法。,全距,組數(shù),組距,組限,歸組,制表,表2-4 150尾鰱魚(yú)體長(zhǎng)(cm),(1) 求全距, 又稱極差 (range):,R=Xmax- Xmin =85-37 =48(cm),(2) 確定組數(shù)和組距(class boundary),組數(shù)是根據(jù)樣本觀測(cè)數(shù)的多少及
27、組距的大小來(lái)確定的,同時(shí)考慮到對(duì)資料要求的精確度以及進(jìn)一步計(jì)算是否方便。,組數(shù),組距,多,小,統(tǒng)計(jì)數(shù)精確,計(jì)算不方便,少,大,統(tǒng)計(jì)數(shù)不精確,計(jì)算方便,組數(shù)的確定,表2-5 樣本容量與分組數(shù)的關(guān)系,組距的確定,即每組內(nèi)的上下限范圍。,組距全距/組數(shù)48104.8,10組,5cm,(3)確定組限(class limit)和組中值(class midvalue),組限 是指每個(gè)組變量值的起止界限。,上限,下限,組中值 是兩個(gè)組限的中間值。,表2-4 150尾鰱魚(yú)體長(zhǎng)(cm),最小一組的下限必須小于資料中的最小值,最大一組的上限必須大于資料中的最大值; 臨界值就高不就低。,35,40,45,85。,(
28、4) 分組,確定好組數(shù)和各組上下限后,可按原始資料中各觀測(cè)值的次序,將各個(gè)數(shù)值歸于各組,計(jì)算各組的觀測(cè)數(shù)次數(shù)、頻率、累積頻率,制成一個(gè)次數(shù)分布表。,計(jì)數(shù)的方法,卡片法,唱票法,畫(huà)“正”字,組限 組中值 次數(shù) 頻率 累積頻率 Frequency Percent Cumulative Percent 35 37.5 3 0.0200 0.0200 40 42.5 4 0.0267 0.0467 45 47.5 17 0.1133 0.1600 50 52.5 28 0.1867 0.3467 55 57.5 40 0.2666 0.6133 60 62.5 25 0.1667 0.7800 65
29、67.5 17 0.1133 0.8973 70 72.5 6 0.0400 0.9333 75 77.5 7 0.0467 0.9800 80 82.5 2 0.0133 0.9933 85 87.5 1 0.0067 1.0000,表2-6 150尾鰱魚(yú)體長(zhǎng)的次數(shù)分布表,三、試驗(yàn)資料的整理,(三)次數(shù)分布圖和頻率分布圖,定義:把次數(shù)(頻率)分布資料畫(huà)成統(tǒng)計(jì)圖形。,特點(diǎn):直觀、形象,包括:條形圖、直方圖、多邊形圖、餅圖和散點(diǎn)圖,三、試驗(yàn)資料的整理,統(tǒng)計(jì)圖繪制的基本要求:,(1)標(biāo)題簡(jiǎn)明扼要,列于圖的下方; (2)縱、橫兩軸應(yīng)有刻度,注明單位; (3)橫軸由左至右,縱軸由下而上,數(shù)值由小到大;
30、圖 形長(zhǎng)寬比例約5:4或6:5; (4)圖中需用不同顏色或線條代表不同事物時(shí),應(yīng)有圖 例說(shuō)明。,圖2.1 月產(chǎn)蛋數(shù)次數(shù)分布柱形圖,圖2.2 月產(chǎn)蛋數(shù)頻率分布柱形圖,條形圖(bar chart), 又稱柱形圖,計(jì)數(shù)資料,特點(diǎn): 柱形之間要間隔一定的距離,屬性資料,2 餅圖(pie chart),圖1 來(lái)亨雞月產(chǎn)蛋次數(shù)分布圖,計(jì)數(shù)資料,質(zhì)量性狀資料,35%,19%,21%,11%,5%,7%,2%,圖2.3 鰱魚(yú)體長(zhǎng)次數(shù)分布圖,3 直方圖 (histogram),又稱矩形圖,計(jì)量資料,特點(diǎn): 各組之間沒(méi)有距離,4 多邊形圖(polygon),又稱折線圖(broken-line chart),計(jì)量資
31、料,圖2.3 鰱魚(yú)體長(zhǎng)次數(shù)分布圖,5 散點(diǎn)圖(scatter),a. 正向直線關(guān)系,b. 負(fù)向直線關(guān)系,c. 曲線關(guān)系,試驗(yàn)資料的整理,特征數(shù)的計(jì)算,與,第二章,集中性 是變量在趨勢(shì)上有著向某一中心聚集,或者說(shuō) 以某一數(shù)值為中心而分布的性質(zhì)。,離散性 是變量有著離中分散變異的性質(zhì)。,變量的分布具有兩種明顯的基本特征:集中性和離散性。,集中性,離散性,平均數(shù),變異數(shù),算術(shù)平均數(shù),中位數(shù),眾數(shù),幾何平均數(shù),極差,方差,標(biāo)準(zhǔn)差,變異系數(shù),調(diào)和平均數(shù),特征數(shù),一、平均數(shù),平均數(shù) 平均數(shù)是統(tǒng)計(jì)學(xué)中最常用的統(tǒng)計(jì)量,是計(jì)量資料的代表值,表示資料中觀測(cè)數(shù)的中心位置,并且可作為資料的代表與另一組相比較,以確定二
32、者的差異情況。,一、平均數(shù),(一)平均數(shù)的種類,算術(shù)平均數(shù),中位數(shù),眾數(shù),幾何平均數(shù),調(diào)和平均數(shù),一、平均數(shù),1. 算術(shù)平均數(shù) (arithmetic mean),定義:總體或樣本資料中所有觀測(cè)數(shù)的總和除以觀測(cè)數(shù) 的個(gè)數(shù)所得的商,簡(jiǎn)稱平均數(shù)、均數(shù)或均值。,總體:,樣本:,一、平均數(shù),2. 中位數(shù)(median),資料中所有觀測(cè)數(shù)依大小順序排列,居于中間位置的觀測(cè)數(shù)稱為中位數(shù)或中數(shù)。,Md,1、當(dāng)觀測(cè)值個(gè)數(shù)n為奇數(shù)時(shí),(n+1)/2位置的觀測(cè)值,即x(n+1)/2為中位數(shù): Md = 2、當(dāng)觀測(cè)值個(gè)數(shù)為偶 數(shù) 時(shí),n/2和(n/2+1)位置的兩個(gè)觀測(cè)值之和的1/2為中位數(shù),即:,一、平均數(shù),3.
33、 眾數(shù)(mode),資料中出現(xiàn)次數(shù)最多的那個(gè)觀測(cè)值或次數(shù)最多一組的組中值或中點(diǎn)值。,M0,注意: (1)對(duì)于某些數(shù)據(jù)而言,如均勻分布,并不存在眾數(shù); (2)對(duì)于某些數(shù)據(jù)存在兩個(gè)或兩個(gè)以上的眾數(shù); (3)主要用來(lái)描述頻率分布。,一、平均數(shù),4. 幾何平均數(shù) (geometric mean),資料中有n個(gè)觀測(cè)數(shù),其乘積開(kāi)n次方所得數(shù)值。,G,適用范圍:幾何均數(shù)適用于變量X為對(duì)數(shù)正態(tài)分布, 經(jīng)對(duì)數(shù)轉(zhuǎn)換后呈正態(tài)分布的資料。,G=,一、平均數(shù),5. 調(diào)和平均數(shù) (harmonic mean),資料中各觀測(cè)值倒數(shù)的算術(shù)平均數(shù)的倒數(shù)。,H,適用范圍:主要用于反映生物不同階段的平均增長(zhǎng) 率或不同規(guī)模的平均規(guī)模
34、。,一、平均數(shù),(二)算術(shù)平均數(shù)的計(jì)算方法,直接計(jì)算法,減去常數(shù)法,加權(quán)平均法,1、直接計(jì)算法 主要用于樣本含量n30以下、未經(jīng)分組資料平均數(shù)的計(jì)算。,例:隨機(jī)抽取20株小麥測(cè)量它們的株高(cm)分別為: 79 85 84 86 84 83 82 83 83 84 81 80 81 82 81 82 82 82 80 求小麥的平均株高。,2、減去(加上)常數(shù)法 若變量 的值都比較大(或都比較?。?,且接近某一常數(shù)a時(shí),可將它們的值都減去(或加上)常數(shù)a,得到一組新的數(shù)據(jù),在計(jì)算其平均數(shù)。,例:設(shè)a為80(cm)則有: 79 85 84 86 84 83 82 83 83 2 1 5 4 6 4
35、3 2 3 3 81 80 81 82 81 82 82 82 80 4 1 0 1 2 1 2 2 2 0,“80”,3、加權(quán)平均法 對(duì)于樣本含量 n30 以上且已分組的資料,可以在次數(shù)分布表的基礎(chǔ)上采用加權(quán)法計(jì)算平均數(shù),計(jì)算公式為:,第i組的次數(shù)fi是權(quán)衡第i個(gè)自然值xi在資料中所占比重大小的數(shù)量,因此將fi 稱為是xi的“權(quán)數(shù)”,加權(quán)法也由此而得名。,例:,式中: 第i組的組中值; 第i組的次數(shù); 分組數(shù),若為分組資料,則用每組組中值乘以該組次數(shù)之和再除以總次數(shù)來(lái)計(jì)算:,例: 將100頭長(zhǎng)白母豬的仔豬一月窩重(單位:kg)資料整理成次數(shù)分布表如下,求其加權(quán)數(shù)平均數(shù)。,表 100頭長(zhǎng)白母豬
36、仔豬一月窩重次數(shù)分布表,即這100頭長(zhǎng)白母豬仔豬一月齡平均窩重為45.2kg,計(jì)算若干個(gè)來(lái)自同一總體的樣本平均數(shù)的平均數(shù)時(shí),如果樣本含量不等,也應(yīng)采用加權(quán)法計(jì)算。,例:某牛群有黑白花奶牛 1500頭,其平均體重為750 kg ,而另一牛群有黑白花奶牛1200頭,平均體重為725 kg,如果將這兩個(gè)牛群混合在一起,其混合后平均體重為多少? 此例兩個(gè)牛群所包含的牛的頭數(shù)不等,要計(jì)算兩個(gè)牛群混合后的平均體重,應(yīng)以兩個(gè)牛群牛的頭數(shù)為權(quán),求兩個(gè)牛群平均體重的加權(quán)平均數(shù),即:,離均差之和等于零。,離均差平方和最小。,(三)算術(shù)平均數(shù)的重要性質(zhì),(x-x-) = x1+ x2 +.+ xn n. x- =x
37、-nx/n =x-x=0,(x-a) 2= (x-x-)+ (x-a)2 = (x-x-)2+2 (x-x-) (x-a)+ (x-a)2 = (x-x-)2+ (x-a)2 = (x-x-)2+n(x-a)2,一、平均數(shù),(四)算術(shù)平均數(shù)的作用,(1)指出一組數(shù)據(jù)資料內(nèi)變量的中心位置,標(biāo)志著資 料所代表性狀的數(shù)量水平和質(zhì)量水平。,(2)作為樣本或資料的代表數(shù)與其他資料進(jìn)行比較。,(3)通過(guò)平均數(shù)提供計(jì)算樣本變異數(shù)的基本數(shù)據(jù)。,(4)用樣本的平均數(shù)估計(jì)總體平均數(shù)。,二、變異數(shù),變異數(shù)的種類,極差,方差,標(biāo)準(zhǔn)差,變異系數(shù),二、變異數(shù),(一)極差(全距,range),極差是數(shù)據(jù)分布的兩端變異的最大
38、范圍,即樣本變量值最大值和最小值之差,用R表示。它是資料中各觀測(cè)值變異程度大小的最簡(jiǎn)便的統(tǒng)計(jì)量。,例:150尾鰱魚(yú)體長(zhǎng) R=85-37=48(cm),R = maxx1,x2, xn - minx1,x2, xn =x1,x2, xnmax - x1,x2, xnmin,二、變異數(shù),簡(jiǎn)單明了,當(dāng)資料很多而又要迅速對(duì)資料的變異程度作出判斷時(shí),可以利用極差。,(1) 除了最大、最小值,不能反映組內(nèi)其他數(shù)據(jù)的變異。,優(yōu)點(diǎn),缺點(diǎn),用途,(2)樣本較大時(shí)抽到較大值與較小值的可能性也較大,因而樣本極差也較大,故樣本含量相差較大時(shí),不宜用極差來(lái)比較分布的離散度。,極差,二、變異數(shù),如何準(zhǔn)確地表示樣本內(nèi)各個(gè)觀
39、測(cè)值的變異程度,平均數(shù),可以求出各個(gè)觀測(cè)值與平均數(shù)的離差,即離均差。,離均差可以反映出一個(gè)觀測(cè)值偏離平均數(shù)的性質(zhì)和程度。,離均差之和為零。,?,方差,二、變異數(shù),平方和(SS),平方和的平均數(shù),二、變異數(shù),自由度(degree of freedom),二、變異數(shù),均方(mean square,MS),方差(variance),二、變異數(shù),(二)方差(Variance),樣本,總體,二、變異數(shù),樣本方差帶有原觀測(cè)單位的平方單位,在僅表示一個(gè)資料中各觀測(cè)值的變異程度而不作其它分析時(shí),常需要與平均數(shù)配合使用,這時(shí)應(yīng)將平方單位還原,即求出樣本方差的平方根。,標(biāo)準(zhǔn)差,二、變異數(shù),(三)標(biāo)準(zhǔn)差(stand
40、ard deviation, Sd),樣本,總體,二、變異數(shù),(三)標(biāo)準(zhǔn)差(standard deviation, Sd),二、變異數(shù),x=411,x2=18841,X=6,X2=76,二、變異數(shù),二、變異數(shù),(三)標(biāo)準(zhǔn)差(standard deviation, Sd),例:,二、變異數(shù),(三)標(biāo)準(zhǔn)差(standard deviation, Sd),特性,標(biāo)準(zhǔn)差的大小,受多個(gè)觀測(cè)數(shù)影響,如果觀測(cè)數(shù)與觀測(cè)數(shù)間差異較大,則離均差也大,因而標(biāo)準(zhǔn)差也大,反之則小。,1,各觀測(cè)數(shù)加上或減去一個(gè)常數(shù),其標(biāo)準(zhǔn)差不變;,2,各觀測(cè)數(shù)乘以或除以一個(gè)常數(shù)a,其標(biāo)準(zhǔn)差擴(kuò)大或縮小a倍。,二、變異數(shù),(三)標(biāo)準(zhǔn)差(st
41、andard deviation, Sd),3,2s,3s,68.27%,95.46%,99.73%,二、變異數(shù),(三)標(biāo)準(zhǔn)差(standard deviation, Sd),作用,1,表示變量分布的離散程度。,4,估計(jì)平均數(shù)的標(biāo)準(zhǔn)誤。,3,進(jìn)行平均數(shù)的區(qū)間估計(jì)和變異系數(shù)計(jì)算。,2,可以概括估計(jì)出變量的次數(shù)分布及各類觀測(cè)數(shù)在總體中所占的比例。,二、變異數(shù),(四)變異系數(shù)(coefficient of variability, CV ),定義:樣本的標(biāo)準(zhǔn)差除以樣本平均數(shù),所得到的比值就是變異系數(shù)。,特點(diǎn):是樣本變量的相對(duì)變異量,不帶單位。 可以比較不同樣本相對(duì)變異程度的大小。,二、變異數(shù),(四)
42、變異系數(shù)(coefficient of variability, CV ),大田,穗粒數(shù)44.6,標(biāo)準(zhǔn)差18.9 豐產(chǎn)田,穗粒數(shù)65.0,標(biāo)準(zhǔn)差18.3,大田,CV=42.38% 豐產(chǎn)田,CV=28.15%,二、變異數(shù),(四)變異系數(shù)(coefficient of variability, CV ),用途,1,比較度量衡單位不同的多組資料的變異度。,例:某地20歲男子100人,其身高均數(shù)為166.06cm,標(biāo)準(zhǔn)差為4.95cm;其體重均數(shù)為53.72kg,標(biāo)準(zhǔn)差為4.96kg。比較身高與體重的變異情況。,身高:CV2.98% 體重:CV9.23%,該地20歲男子體重的變異大于身高的變異。,二、
43、變異數(shù),(四)變異系數(shù)(coefficient of variability, CV ),用途,2,比較均數(shù)相差懸殊的多組資料的變異度,概 率,概率分布,與,第三章,一、概率的概念,二、概率的計(jì)算,三、概率的分布,四、大數(shù)定律,一、概率基本概念,(一)事件,定義:在一定條件下,某種事物出現(xiàn)與否就稱為是事件。 自然界和社會(huì)生活上發(fā)生的現(xiàn)象是各種各樣的,常見(jiàn)的有兩類。,1、在一定條件下必然出現(xiàn)某種結(jié)果或必然不出現(xiàn)某種結(jié)果。,確定性事件,必然事件(U) (certain event),不可能事件(V) (impossible event),一、概率基本概念,2、在一定條件下可能發(fā)生也可能不發(fā)生。,隨
44、機(jī)事件(random event) 不確定事件(indefinite event),一、概率基本概念,為了研究隨機(jī)現(xiàn)象,需要進(jìn)行大量重復(fù)的調(diào)查、實(shí)驗(yàn)、測(cè)試等,這些統(tǒng)稱為試驗(yàn)。,一、概率基本概念,(二)頻率(frequency),若在相同的條件下,進(jìn)行了n次試驗(yàn),在這n次試驗(yàn)中,事件A出現(xiàn)的次數(shù)m稱為事件A出現(xiàn)的頻數(shù),比值m/n稱為事件A出現(xiàn)的頻率(frequency),記為W(A)=m/n。,0W(A) 1,一、概率基本概念,種子發(fā)芽與否是不能事先確定的,但從表中可以看出,試驗(yàn)隨著n值的不同,種子發(fā)芽率也不相同,當(dāng)n充分大時(shí),發(fā)芽率在0.92附近擺動(dòng)。,例:,一、概率基本概念,頻率表明了事件頻
45、繁出現(xiàn)的程度,因而其穩(wěn)定性說(shuō)明了隨機(jī)事件發(fā)生的可能性大小,是其本身固有的客觀屬性,提示了隱藏在隨機(jī)現(xiàn)象中的規(guī)律性。,概 率,一、概率基本概念,(三)概率(probability,P),概率的統(tǒng)計(jì)定義:設(shè)在相同的條件下,進(jìn)行大量重復(fù)試驗(yàn),若事件A的頻率穩(wěn)定地在某一確定值p的附近擺動(dòng),則稱p為事件A出現(xiàn)的概率。,P(A) = p,統(tǒng)計(jì)概率(statistics probability) 后驗(yàn)概率(posterior probability),統(tǒng)計(jì)概率,一、概率基本概念,拋擲一枚硬幣發(fā)生正面朝上的試驗(yàn)記錄 實(shí)驗(yàn)者 投擲次數(shù) 發(fā)生正面朝上的次數(shù) 頻率(m/n) 蒲豐 4040 2048 0.5069
46、K 皮爾遜 12000 6019 0.5016 K 皮爾遜 24000 12012 0.5005,隨著實(shí)驗(yàn)次數(shù)的增多,正面朝上這個(gè)事件發(fā)生的頻率穩(wěn)定接近0.5,我們稱0.5作為這個(gè)事件的概率。,一、概率基本概念,(三)概率(probability,P),P(A) = p=lim ,在一般情況下,隨機(jī)事件的概率P是不可能準(zhǔn)確得到的。通常以試驗(yàn)次數(shù)n充分大時(shí),隨機(jī)事件A的頻率作為該隨機(jī)事件概率的近似值。,m n,m n,概率的古典定義,一、概率基本概念,對(duì)于某些隨機(jī)事件,不用進(jìn)行多次重復(fù)試驗(yàn)來(lái)確定其概率,而是根據(jù)隨機(jī)事件本身的特性直接計(jì)算其概率。,隨 機(jī) 事 件,(1)試驗(yàn)的所有可能結(jié)果只有有限個(gè)
47、,即樣本空間中的基本事件只有有限個(gè);,(2)各個(gè)試驗(yàn)的可能結(jié)果出現(xiàn)的可能性相等,即所有基本事件的發(fā)生是等可能的;,(3)試驗(yàn)的所有可能結(jié)果兩兩互不相容。,概率的古典定義,一、概率基本概念,具有上述特征的隨機(jī)試驗(yàn),稱為古典概型(classical model).,設(shè)樣本空間有n個(gè)等可能的基本事件所構(gòu)成,其中事件A包含有m個(gè)基本事件,則事件A的概率為m/n,即P(A)=m/n。,古典概率(classical probability) 先驗(yàn)概率(prior probability),一、概率基本概念,1,2,3,4,5,6,7,8,9,10,隨機(jī)抽取一個(gè)球,求下列事件的概率; (1)事件A抽得一個(gè)編
48、號(hào) 4 (2)事件B =抽得一個(gè)編號(hào)是2的倍數(shù),該試驗(yàn)樣本空間由10個(gè)等可能的基本事件構(gòu)成,即n=10,而事件A所包含的基本事件有3個(gè),即抽得編號(hào)為1、2、3中的任何一個(gè),事件A便發(fā)生。,P(A)=3/10=0.3,P(B)=5/10=0.5,一、概率基本概念,1,2,3,4,5,6,7,8,9,10,A“一次取一個(gè)球,取得紅球的概率”,10個(gè)球中取一個(gè)球,其可能結(jié)果有10個(gè)基本事件(即每個(gè)球被取到的可能性是相等的),即n=10,事件A:取得紅球,則A事件包含3個(gè)基本事件,即m=3,P(A)=3/10=0.3,一、概率基本概念,1,2,3,4,5,6,7,8,9,10,B “一次取5個(gè)球,其中
49、有2個(gè)紅球的概率”,10個(gè)球中任意取5個(gè),其可能結(jié)果有C105個(gè)基本事件, 即n= C105,事件B =5個(gè)球中有2個(gè)紅球,則B包含的基本事件數(shù)m= C32 C73,P(B) = C32 C73 / C105 = 0.417,一、概率基本概念,0P(A)1,任何事件,P(U)=1,必然事件,P(V)0,不可能事件,0P(A)1,隨機(jī)事件,概率的基本性質(zhì),概率的計(jì)算,第二部分,二、概率的計(jì)算,(一)事件的相互關(guān)系,和事件,積事件,互斥事件,對(duì)立事件,獨(dú)立事件,完全事件系,二、概率的計(jì)算,1,和事件,事件A和事件B中至少有一個(gè)發(fā)生而構(gòu)成的新事件稱為事件A和事件B的和事件,記作A+B。,n個(gè)事件的和
50、,可表示為A1+A2+An,二、概率的計(jì)算,2,積事件,事件A和事件B中同時(shí)發(fā)生而構(gòu)成的新事件稱為事件A和事件B的積事件,記作AB。,n個(gè)事件的積,可表示為A1 A2 An,二、概率的計(jì)算,3,互斥事件(互不相容事件),事件A和事件B不能同時(shí)發(fā)生,則稱這兩個(gè)事件A和B互不相容或互斥。 AB=V,n個(gè)事件兩兩互不相容,則稱這n個(gè)事件互斥。,如血型:ABOAB,二、概率的計(jì)算,4,對(duì)立事件,事件A和事件B必有一個(gè)發(fā)生,但二者不能同時(shí)發(fā)生,且A和B的和事件組成整個(gè)樣本空間。即A+B=U,AB=V。我們稱事件B為事件A的對(duì)立事件。如:新生兒男或女。,二、概率的計(jì)算,5,獨(dú)立事件,事件A和事件B的發(fā)生無(wú)
51、關(guān),事件B的發(fā)生與事件A的發(fā)生無(wú)關(guān),則事件A和事件B為獨(dú)立事件。如:種子發(fā)芽。,如果多個(gè)事件A1、A2、A3、An 彼此獨(dú)立,則稱之為獨(dú)立事件群。,二、概率的計(jì)算,6,完全事件系,如果多個(gè)事件A1、A2、A3、An兩兩互斥,且每次試驗(yàn)結(jié)果必然發(fā)生其一,則稱事件A1、A2、A3、An為完全事件系。,完全事件系的和事件概率為,任何一個(gè)事件發(fā)生的概率為1/n。即: P(A1A2An),二、概率的計(jì)算,(二)概率的計(jì)算法則,定理: 若事件A與B互斥,則 P(A+B)=P(A)+P(B),試驗(yàn)的全部結(jié)果包含n個(gè)基本事件,事件A包含其中m1個(gè)基本事件,事件B包含其中m2個(gè)基本事件。由于A和B互斥,因而它們
52、各包含的基本事件應(yīng)該完全不同。所以事件AB所包含的基本事件數(shù)為m1+m2。,P(A+B)=m1+m2/n=m1/n+m2/n=P(A)+P(B),二、概率的計(jì)算,推理1 P(A1+A2+An)=P(A1)+P(A2)+P(An),推理3 完全事件系的和事件的概率為1。,二、概率的計(jì)算,例:玉米田中,一穗株(A)占67.2%,雙穗株(B)占30.7%,空 穗株(C)占2.1%,試計(jì)算一穗株和雙穗株的概率。,P(A+B)=P(A)+P(B)=0.672+0.307=0.979,因?yàn)镻(A)+P(B)+P (C) =1 P(A+B)=1-P(C)=1-0.021=0.979,或,二、概率的計(jì)算,定理
53、: 事件A和事件B為獨(dú)立事件,則事件A與事件B同時(shí)發(fā)生的概率為各自概率的乘積。 P(AB)=P(A)P(B),推理:A1、A2、An彼此獨(dú)立,則 P(A1A2A3An)=P(A1)P(A2)P(A3)P(An),二、概率的計(jì)算,例:播種玉米,種子的發(fā)芽率為90%,每穴兩粒,則:,C:兩粒種子均發(fā)芽,C = AB,P(C) = P(A) P(B) = 0.81,求:,概 率 分 布,第三部分,三、概率分布,(一)離散型變量的概率分布,要了解離散型隨機(jī)變量x的統(tǒng)計(jì)規(guī)律,必須知道它的一切可能值xi及其每種可能值的概率pi。,對(duì)離散型變量x的一切可能值xi(i=1,2,3),及其對(duì)應(yīng)的概率pi,P (
54、x=xi) = pi, i=1,2,3,三、概率分布,例:,此表給出了該魚(yú)群年齡構(gòu)成的全部,我們稱之為該魚(yú)群年齡的概率分布。,三、概率分布,此表列出了性別變量的取值及相應(yīng)值的概率,揭示了觀察嬰兒性別試驗(yàn)的統(tǒng)計(jì)規(guī)律。,用隨機(jī)變量的可能取值及取相應(yīng)值的概率來(lái)表示隨機(jī)試驗(yàn)的規(guī)律稱為隨機(jī)變量的分布律或概率函數(shù)。,例:,三、概率分布,P (x=xi) = pi, i=1,2,3,設(shè)離散型變量x的所有一切可能值xi(i=1,2,3),取相應(yīng)值的概率為pi,則P (x=xi)稱為離散型隨機(jī)變量x的概率函數(shù)。,三、概率分布,離散型變量的概率分布的特點(diǎn),特點(diǎn),Pi 0 (i=1,2,),= 1,三、概率分布,(
55、二)連續(xù)型變量的概率分布,當(dāng)試驗(yàn)資料為連續(xù)型變量,一般通過(guò)分組整理成頻率分布表。如果從總體中抽取樣本的容量n相當(dāng)大,則頻率分布就趨于穩(wěn)定,我們將它近似地看成總體概率分布。,直方圖中同一組內(nèi)的頻率是相等的。,三、概率分布,直方圖中每一矩形的面積就表示該組的頻率。,三、概率分布,當(dāng)n無(wú)限大時(shí),頻率轉(zhuǎn)化為概率,頻率密度也轉(zhuǎn)化為概率密度,階梯形曲線也就轉(zhuǎn)化為一條光滑的連續(xù)曲線,這時(shí)頻率分布也就轉(zhuǎn)化為概率分布了,此曲線為總體的概率密度曲線,曲線函數(shù)f(x)稱為概率密度函數(shù)。,三、概率分布,三、概率分布,對(duì)于一個(gè)連續(xù)型隨機(jī)變量x,取值于區(qū)間a,b內(nèi)的概率為函數(shù)f(x)從a到b的積分,即:,連續(xù)型隨機(jī)變量的
56、概率由概率分布密度函數(shù)所確定。,概率密度函數(shù)f(x)曲線與x軸所圍成的面積為1。,大 數(shù) 定 律,第四部分,四、大數(shù)定律,大數(shù)定律:是概率論中用來(lái)闡述大量隨機(jī)現(xiàn)象平均結(jié)果穩(wěn)定性的一系列定律的總稱。,主要內(nèi)容:樣本容量越大,樣本統(tǒng)計(jì)數(shù)與總體參數(shù)之差越小。,四、大數(shù)定律,貝努里大數(shù)定律,辛欽大數(shù)定律,四、大數(shù)定律,(1)貝努里大數(shù)定律,設(shè)m是n次獨(dú)立試驗(yàn)中事件A出現(xiàn)的次數(shù),而p是事件A在每次試驗(yàn)中出現(xiàn)的概率,則對(duì)于任意小的正數(shù),有如下關(guān)系:,四、大數(shù)定律,(2)辛欽大數(shù)定律,設(shè)x1,x2,x3,xn是來(lái)自同一總體的變量,對(duì)于任意小的正數(shù),有如下關(guān)系:,幾種常見(jiàn)的理論分布,第二節(jié),隨機(jī)變量的概率分布
57、 (probability distribution),離散型變量 (discrete random variable),連續(xù)型變量 (continuous random variable),二項(xiàng)分布 泊松分布,正態(tài)分布,變 量,一、二 項(xiàng) 分 布,二 項(xiàng) 分 布是一種離散型隨機(jī)變量 的分布,對(duì)于某個(gè)性狀,常??梢园哑滟Y料分為兩個(gè)類型。試驗(yàn)結(jié)果只能是“非此即彼”構(gòu)成對(duì)立事件,將這種事件構(gòu)成的總體稱為二項(xiàng)總體,其概率分布稱為二項(xiàng)分布。,離散型隨機(jī)變量的分布,哺乳動(dòng)物,種子,穗子,生物個(gè)體,雄性,雌性,發(fā)芽,不發(fā)芽,有芒,無(wú)芒,成活,死亡,對(duì)立事件,一、二項(xiàng)分布的概率函數(shù),非此即彼,一、二項(xiàng)分布,在種子發(fā)芽試
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 第六單元 騁懷悟文本繪思慧想象-2024-2025學(xué)年七年級(jí)語(yǔ)文上冊(cè)閱讀綜合實(shí)踐說(shuō)課稿(統(tǒng)編版2024)
- 2025年牛津上海版選修5歷史下冊(cè)月考試卷
- 2025年滬科版選修4地理上冊(cè)階段測(cè)試試卷含答案
- 《S管理素養(yǎng)的推進(jìn)》課件
- 智能在線珠寶咨詢顧問(wèn)服務(wù)合同
- 智能城市智能數(shù)據(jù)存儲(chǔ)服務(wù)合同
- 一年級(jí)少先隊(duì)培訓(xùn)課件
- 2024幼兒園人事管理與幼兒戶外活動(dòng)安全保障合同3篇
- 2025年外研版九年級(jí)歷史上冊(cè)月考試卷
- 教育機(jī)構(gòu)與媒體合作協(xié)議
- 11054-國(guó)家開(kāi)放大學(xué)2023年春期末統(tǒng)一考試《流通概論》答案
- 晉江物流行業(yè)分析
- 編譯原理考試題及答案匯總
- 【蘇州市軌道交通安全管理現(xiàn)狀、問(wèn)題及優(yōu)化建議分析4300字(論文)】
- 國(guó)家開(kāi)放大學(xué)2023年7月期末統(tǒng)一試《11132衛(wèi)生管理》試題及答案-開(kāi)放本科
- 咽喉癌病歷書(shū)寫
- 2023年自然資源部所屬事業(yè)單位招聘(208人)筆試參考題庫(kù)(共500題)答案詳解版
- 自身免疫性肝炎診斷和治療指南(2021版)解讀
- 淺析小班幼兒角色游戲的年齡特點(diǎn)及游戲指導(dǎo)
- 全州疫苗接種與免疫規(guī)劃培訓(xùn)班講話稿
- 詩(shī)化小說(shuō)示范課
評(píng)論
0/150
提交評(píng)論