




已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
統計發(fā)展概覽由于人類的統計實踐是通過計算活動實現的,統計發(fā)展史可以追溯到古代的原始社會,即從現在開始足有5000多年的漫長歲月。但是可以將人類的統計實踐提高到理論上可以概括的水平。也就是說,開始成為系統的學問統計是近代的事情,離現在只有300多年前的短暫歷史了。統計發(fā)展的概述可以分為經典記錄統計、現代技術統計、現代推理統計三種形式。一、經典記錄統計古典記錄統計形成時間大約從17世紀中葉到19世紀中葉。統計在這個崛起階段仍然是意義和范圍不太明確的學科,在用文字或數字真實地記錄和分析國家社會經濟狀況的過程中,初步建立了統計研究的方法和規(guī)則。概率理論引進后,才成為越來越成熟的方法。第一次有效地將古典概率論引入統計學的是法國天文學家、數學家和統計學家拉普拉斯(P.S. Laplace,1749-1827)。因此,比利時統計學家凱特勒指出,統計應該從拉普拉斯開始。(a)拉普拉斯的主要貢獻1,開發(fā)概率論的研究拉氏概率論的最初表達發(fā)表于1774年。這是他的代表作,從1812年開始發(fā)行4版概率分析理論。在本書中,拉氏首次將數學分析方法系統地應用于概率論研究,建立了嚴密的概率數學理論。這本書不僅總結了自己過去的研究,還總結了老一輩學者研究概率論的成果,成為古典概率論的集大成者。2、推進概率論在統計中的應用,由于拉普拉斯將天文學和物理學的研究結合起來從事概率研究,他可以指出,概率理論可以相當自覺、相當明確地應用,并能解決一系列實際問題。他在實際振興中的成績多方面,主要表現在人口統計、觀測誤差理論及概率論在天文問題上的應用。結合概率分布模型和中心極限思想,研究了最小二乘法的1809年至1812年,首次為統計中此后最廣泛使用的手段提供了理論依據。3,統計學的大量法則拉普拉斯認為?!白鳛楝F象的原因,我們知道或知道的也是原因復雜,無法計算;發(fā)生原因被偶然因素或沒有一定規(guī)律的因素擾亂,直到事物發(fā)展的變化,要長期廣泛觀察,才能求得發(fā)展的真法。概率理論可以研究造成這種發(fā)展變化的成分,并指明其成分的數量。”這是他通過天文學上的研究獲得的經驗。他發(fā)現,如果有足夠的時間觀察天體的運動,就會出現使物體特征消失的傾向等現象。他指出,這不是偶然,而是其中一定有什么原因。4、在統計發(fā)展史上,試圖推斷大樣本,人口計算問題,可以成為統計學家多年的問題。拉普拉斯直到19世紀初才利用概率論的原理邁出了重要的一步。理論上,1781年拉普拉斯在“理論上概率論”一文中建立了概率積分,提供了計算區(qū)間誤差的強有力的手段。從1781年到1786年,提出了“拉普拉斯定理”(中心極限定理的一部分),初步確立了大樣本推理的理論基礎。實際上,拉普拉斯在1786年寫了一篇關于巴黎人口出生、結婚和死亡的文章,文章提出了根據法國特定地區(qū)的出生率估計全國人口的問題。他抽調了30個市縣,進行了深入調查,估算了全國總人口數。其方法和結果仍然相當粗糙,但在統計發(fā)展史上,他利用樣本推斷出整體的思想方式,為后人開辟了抽樣調查的新途徑。對概率論與統計的結合研究做出貢獻的另一個人是德國偉大的數學家高斯(c.f .高斯,1777-1855)。(b)高斯的主要貢獻1、成立最小平方的學生時代,課程開始了最小平方研究。1794年,他讀了數學家蘭伯特(j . h . Lambert,1728 1777)的作品,討論了如何使用平均法確定觀察值(yi,Xi)中線性關系y= x的兩個系數。1795年,以殘差平方和西格瑪(I-a-bxi)2為最小值得到的a和b估計了和。1798年完成最小二乘法的整體思維結構于1809年正式發(fā)表。2、發(fā)現高斯分布調查、觀察或測量的誤差是不可避免的,而且一般無法掌握??扑雇ㄟ^他豐富的天文觀測和從1821年到1825年測量土地的經驗,發(fā)現了觀察值x和實際值的誤差變異,極大地服從了現代人最熟悉的正規(guī)分布。他利用最大似然法和其他數學知識推導了測量誤差的概率分布公式?!罢`差分布曲線”一詞是科斯莫斯提出的,后代為了紀念他,將此分布曲線稱為高斯分布曲線,即今天的正態(tài)分布曲線。高斯發(fā)現的一般誤差概率分布曲線及其所產生的天文觀測誤差的測量方法在理論上和應用上都具有十分重要的意義。二、現代技術統計近代技術統計形成時期大約是19世紀中葉到20世紀上半葉。這種“描述”的特征最初是由研究生物進化的學者組成的群體確定的,因此歷史上稱他們?yōu)樯锝y計學。生物統計學派的創(chuàng)始人是英國的戈登(F. Galton,1822-1911),隊長是戈登的學生比爾森(K.Pearson,1857-1936)。(a)戈登的主要貢獻1、為了研究早期生物統計學人類智能的遺傳問題,高利登仔細閱讀了300多人的傳記,初步確定了其中有多少人的親屬關系及關系大致緊密。然后在知名人士組個別調查,從整體上查明了智力遺傳學的規(guī)律性。為了獲得更多有關人的特性和能力的統計資料,高爾頓從1882年開始成立了“人體測量實驗室”。連續(xù)6年測量了9337名“身高、體重、寬度、呼吸力、牽引力和壓力、掌摑速度、聽覺、視力、色覺和其他個人信息”,深入研究了這些數據中隱藏的內在關系,得出了“祖先遺傳規(guī)律”。他努力探索描述和比較大量數據的方法和方法,引入了重要的統計概念和方法,如中數、百分位數、四分位數、四分位數、分布、相關性、回歸等。1901年,戈登和他的學生比爾森為生物計量學 (Biometrika)雜志撰寫的創(chuàng)刊中,首次為他們使用的統計方法提出了“生物統計”(biology)一詞。戈登解釋說:“所謂的生物統計學是適用于生物界的現代統計方法。”看戈登和隨后的研究室,他們把生物統計看作應用統計。其研究范圍是對生物科學的問題進行統計研究,更重要的是開發(fā)生物科學應用中的統計方法本身。2、對統計的貢獻(1)戈登首次統計接近變異是進化論中的重要概念,并領導了英國生物統計學派的創(chuàng)立。1889年,戈登將整體定量測定法引入遺傳研究。戈登發(fā)現,通過整體測量,可以確定對象或植物的每種類型的平均類型。在一個恒星中,所有的物體圍繞這個平均類型,以它為軸,向多方面變異。這就是他在遺傳的天賦這本書里提出的平均偏差法則。(2)“相關”統計相關法律是戈登制定的。首先,他測量了甜豌豆的大小,發(fā)現后代有遺傳后“回雙親”的現象。1877年收集了很多身體長度的數據,計算了高個子和矮個子,高個子的父母的后代各有多少個高個子和矮個子的孩子,在一定程度上知道父母高個子,父母矮個子的后代矮個子的事實,在父母和子女之間的長度上將其具體化為數量關系。1888年,戈登在相關與人體主要測量一文中充分論述了“相關”的統計重要性,并提出了戈爾登相關函數(即目前常用的相關系數)的計算公式。戈爾登在1870年研究人類身體長度的遺傳時發(fā)現,高個子父母的子女傾向于低于父母的身體長度。相反,短父母的子女們的身體長度傾向于高于父母的長度。從整體來看,高個子的人“回歸”了一般身高的期待,矮個子的人則相反的“回歸”。這是統計上“回歸”的初始含義。1886年,戈登在論文中正式提出了“從遺傳的身體長度到中間身體長度的回歸”的概念。(b)比爾森的主要貢獻比爾森在生物統計學上傾注了心血,上升到了通用方法學的高度。比爾森的生活是統計學的一生,他對統計做出了巨大貢獻:1、從可變數據處理生物統計中獲取的數據往往是無序的,很難知道原因。為此,比爾森首次探索了處理數據的方法,他開創(chuàng)的頻率分布圖和頻率分布圖現在成為統計方法最基本的手段之一。據悉,分布曲線的匹配在19世紀以前用頻率分布解釋了變異值,最終以正態(tài)分布曲線出現。但是比爾森注意到在生物統計學的經驗分布中,對很多生物的測量不是正態(tài)分布,而是經常以偏法分布,甚至是坡度很多。都不是單峰,也不是單峰。說明“現狀”信念不可靠。1894年,他在一篇名為“不對稱頻率曲線的分解”的文章中,首先將不對稱觀測曲線分解成幾條規(guī)則曲線。他利用稱為“相對梯度”的方法獲得了12種分布函數類型:正態(tài)分布、矩形分布、j型分布、u型分布或貝爾分布。經過r . fisher的進一步研究,biersheng分布曲線、型出現在小樣本理論中。推導比爾森曲線系統的方法缺乏理論基礎,但給了很多啟示。3.卡方檢察官于1900年獨立重新發(fā)現了比爾森的分布,并提出了著名的卡方檢驗法(Test of)。比爾森得到了統計:=(實際次數-理論數)2/證明了當理論數和觀測值足夠多時總是近似服從自由度為(k-1)的分布。其中k表示要拆分的組數。在自然現象的范圍內,檢驗法被廣泛使用。由r .費雪補充,小樣本成為推斷統計的早期方法之一。4、回歸及相關開發(fā)回歸及相關,經過birson的進一步開發(fā),在這兩個概念生物統計學領域,它被推進為一般統計方法的重要概念。1896年,他在進化論的數學研究:回歸、遺傳、隨機配對一文中寫道,仍然廣泛使用的線性相關計算公式:比爾幸存的回歸計算公式:=a bx(其中a和b根據最小二乘法計算得出),回歸系數的計算公式:y隨著x的變化而變化,(如果x與y一起變更,則輸入(x-)/-(y-)2。比爾的生存從1897年到1905年,不僅發(fā)展了阿爾高登的理論,還在數學上發(fā)展了相關的相關、總相關、相關比例等概念。三、現代推理統計現代推斷統計形成時間大約是20世紀初葉到20世紀中葉。人類歷史進入20世紀后,社會領域和自然領域對統計的要求都更大。各種事物和現象之間復雜的數量關系和一系列未知的數量變化僅僅靠記錄或技術很難看到效果。因此,把握事物的整體真實關系,預測未來發(fā)展的“推論”方法層出不窮。從技術統計中學習推理是統計發(fā)展過程中的一大飛躍。統計發(fā)展的這一重大變化是在農業(yè)現場試驗領域進行的。因此,歷史上被稱為農業(yè)試驗學。對確立現代推理統計的最大貢獻是英國統計學家戈塞特(W.S. Gosset,1876-1937年)和費舍爾(r . a . fisher,1890-1962年)。(a)戈塞特的t檢驗和小樣本思想1908年,戈塞特首次以學生的筆名在生物計量學雜志上發(fā)表了平均概率誤差。這篇文章提供了學生t檢驗的依據,因此很多統計學家認為1908年是統計推理理論發(fā)展史上的里程碑。之后,高爾塞連續(xù)發(fā)表了相關系數的概率誤差(1909)、隨機樣本平均分布(1909)、來自無限總體隨機樣本平均的概率估計表(1917)等。他比較了這些論文中的第一、平均誤差和標準誤差兩種計算方法;其次,研究了泊松分布的樣本誤差問題。第三,建立了相關系數的抽樣分布。第四,帶來了“學生”分布,即t分布。這些論文的完成為“小樣本理論”奠定了基礎。之后為樣品數據的統計分析和解釋開辟了新的道路。由于戈塞特的理論,統計學開始從大標本發(fā)展到小標本,從描寫發(fā)展到推理,有些人把戈塞特譽為推理的先驅。(b) R .費舍統計理論和方法費雪一生寫了329篇論文。世界各國最普及的統計著作有:1925年出版的供研究人員用的統計方法,1930年出版的自然選擇的遺傳原理,1935年出版的試驗設計,1938年和耶特聯合出版的供生物學、農學與醫(yī)學研究用的統計表,1938年出版的統計估計理論,1950年出版的對數理統計的貢獻當時他在統計學上處于世界領先地位,他的貢獻是多方面的。1、通用方法r .費雪強調,統計學是對所有自然現象或社會生活現象的研究、統計方法及其計算方法“和其他數學科目一樣,對所有問題的研究應用相同的公式”的一般方法。他指出:“統計學是應用數學最重要的部分,可以看作是加工觀察到的材料的數學?!?、“無限假設”r .費雪認為,研究包括社會經濟現象在內的各種事物的現象時,必須拋棄有關具體物質內容的信息,讓統計只涉及“統計總綱”。例如,“如果已經有1萬名新兵的信息,統計調查的對象不是全體新兵,而是各種身體長度大小的總和。”.顯然,r .費雪只對構成整個統計元素的特定符號感興趣,而對每個元素本身沒有興趣。其目的是簡化問題,使其易于統計處理。他在1922年寫的理論統計學的數學基礎一書中提出了“無限總體假設”的重要概念?!凹僭O的無限總體,即現有數據就是那個隨機樣本?!?3,采樣分布r . fisher(r)從研究概率分布開始。1915年,他在統計方法和科學推斷雜志上發(fā)表了無限總體樣本相關系數值的頻率分布。這篇論文對相關系數的一般公式進行了論證,對以后整體推理統計的發(fā)展將有所貢獻。這篇論文被稱為現代抽象統計的第一篇論文。1922年,r .皮雪導出了相關系數r的z分布,隨后還準備了生物計量學。1924年,r .皮雪綜合研究了t .分布、分布、z .分布,使皮氏生的檢查也適用于小樣本。1938
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 摩托車銷售合同協議書
- 物資采購合同安全協議書
- 合同洽談協議書模板圖片
- 街邊店面物業(yè)合同協議書
- 2025年中國紅景天苷項目商業(yè)計劃書
- 天氣美術課件圖片
- 重慶鋁鑄汽車零部件項目申請報告
- 中國有機硅DMC項目商業(yè)計劃書
- 汽修廠門衛(wèi)合同協議書
- 安全方針課件
- 道路危險貨物運輸安全標準化手冊
- 名校版初中物理“公式+考點+方法技巧”大匯編
- 醫(yī)院消毒供應中心CSSD??浦R《CSSD器械消毒與干燥方式的正確選擇》精美培訓課件
- Photoshop圖像處理模擬試題2023
- 杠桿(CA1340自動車床)加工工藝及夾具設計
- NB-T 10316-2019 風電場動態(tài)無功補償裝置并網性能測試規(guī)范
- GB/T 9444-2019鑄鋼鑄鐵件磁粉檢測
- GB/T 94.1-1987彈性墊圈技術條件彈簧墊圈
- GB/T 32512-2016光伏發(fā)電站防雷技術要求
- GB/T 24425.1-2009普通型鋼絲螺套
- 2023年注冊會計師之注會公司戰(zhàn)略與風險管理真題練習試卷A卷附答案
評論
0/150
提交評論