誤差理論與數據處理基礎知識_第1頁
誤差理論與數據處理基礎知識_第2頁
誤差理論與數據處理基礎知識_第3頁
誤差理論與數據處理基礎知識_第4頁
誤差理論與數據處理基礎知識_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、誤差理論與數據處理基礎知識0-1 物理實驗中的測量誤差與不確定度誤差和不確定度的概念物理實驗離不開對各種物理量進行測量,由測量所得的一切數據,都毫無例外地包含有一定數量的測量誤差,沒有誤差的測量結果是不存在的。測量誤差存在于一切測量之中,貫穿于測量的全過程。隨著科學技術水平的不斷提高,測量誤差可以被控制得越來越小,但卻永遠不會降低到零。測量誤差測量值真值。何謂真值?真值是在特定條件下被測量量的客觀實際值,當被測量的測量過程完全確定,且所有測量的不完善性完全排除時,則測量值就等于真值。這就是說,真值是通過完善的測量才能獲得。然而,嚴格、完善的測量難以做到,故真值就不能確定。在實踐中,有一些物理量

2、的真值或從相對意義上來說的真值是可以知道的,這有如下幾種:(1)理論真值。如平面三角形三內角之和恒為180;某一物理量與本身之差恒為零,與本身之比值恒為1;理論公式表達值或理論設計值等。(2)計量單位制中的約定真值。國際單位制所定義的七個基本單位,根據國際計量大會的共同約定,凡是滿足上述定義條件而復現出的有關量值都是真值。(3)標(基)器相對真值。凡高一級標準器的誤差是低一級或變通測量儀器誤差的時,則可認為前者是后者的相對真值。如經國家級鑒定合格的標準器稱為國家標準器,它在同一計量單位中精確度最高,從而作為全國該計量單位的最高依據。國際鉑銥合金千克原器的質量將作為國際千克質量的真值。在科學實驗

3、中,真值就是指在無系統(tǒng)誤差的情況下,觀測次數無限多時所求得的平均值。但是,實際測量總是有限的,故用有限次測量所求得的平均值作為近似真值(或稱最可信賴值)。1誤差(error)誤差即觀測值與真值之間的差異。如前所述,測量誤差就是測量值減去真值。(1)絕對誤差(absolute error)。某物理量值與其真值之差稱絕對誤差,它是測量值偏離真值大小的反映,有時又稱真誤差。即 絕對誤差量值-真值 修正值-絕對誤差真值-量值 真值量值+修正值這說明量值加上修正值后,就可以消除誤差的影響。在精密計量中,常常用加一個修正值的方法來保證量值的準確性。(2)相對誤差(relative error)。絕對誤差與

4、真值的比值所表示的誤差大小稱為相對誤差或誤差率。有時,兩組測量的絕對誤差相同,但真值不同,而此時實際反映了兩種不同的準確度。所以采用相對誤差就能夠清楚地表示出測量的準確程度。按定義,當絕對誤差很小時,此時相對誤差還有一種表達形式,即分貝誤差。同種物理量之比取對數,再乘以20,這稱為分貝A(單位用dB表示)。設兩個同種物理量之比為 (0-1-1)則按分貝的定義有 (0-1-2)如果比值a產生了一個誤差,那末將引起A產生一個誤差(此為分貝誤差),則 (0-1-3)式(0-1-3)減去式(0-1-2),得 (0-1-4)該式即為相對誤差與分貝誤差之間的關系式。從數學上可知則式(0-1-4)可寫成或

5、分貝誤差主要用在聲學及無線電計量之中,如計算聲壓級,按規(guī)定空氣中的基準聲壓(大約相當于蚊子飛行發(fā)出聲音的聲壓),如有一聲的聲壓,則其聲壓級按式(0-1-4)計算為。相對誤差還有一種簡便實用的形式引用誤差。它在多擋或連續(xù)刻度的儀表中得到廣泛應用。為了減少誤差計算中的麻煩和劃分儀表正確度等級的方便,一律取儀表的量程或測量范圍上限值作為誤差計算的分母(即基準值),而分子一律取用儀表量程范圍內可能出現的最大絕對誤差值。于是,定義引用誤差為在熱工、電工儀表中,正確度等級一般都是用引用誤差來表示的,通常分成0.1、0.2、0.5、1.0、1.5、2.5和5.0七級。上述數值表示該儀表最大引用誤差的大小,但

6、不能認為儀表在各個刻度上的測量都具有如此大的誤差。例如某儀表正確度等級為R級(即引用誤差為R%),滿量程的刻度值為X,實際使用時的測量值為(一般X),則 (0-1-5)通過上面的分析,可知為了減少儀表測量的誤差,提高正確度,應該使儀表盡可能在靠近滿量程刻度的區(qū)域內使用。這正是人們利用或選用儀表時,盡可能在滿刻度量程的以上區(qū)域內使用的原因。(3)誤差的分類根據誤差產生的原因和性質將誤差分為系統(tǒng)誤差和隨機誤差兩大類。系統(tǒng)誤差在相同條件下,多次測量同一物理量時,測量值對真值的偏離(包括大小和方向)總是相同的,這類誤差稱為系統(tǒng)誤差。系統(tǒng)誤差的特點是恒定性,不能用增加測量次數的方法使它減小,在實驗中發(fā)現

7、和消除系統(tǒng)誤差是很重要的,因為它常常是影響實驗結果準確程度的主要因素,能否用恰當的方法發(fā)現和消除系統(tǒng)誤差,是測量者實驗水平高低的反映,但是又沒有一種普遍適用的方法去消除系統(tǒng)誤差,主要是靠對具體問題作具體的分析與處理,要靠實驗經驗的積累。如果我們能夠確定系統(tǒng)誤差的數值,就應該把它從實驗結果中扣除,消除它的影響,或者說,把系統(tǒng)誤差的影響減小到偶然誤差的范圍以內,這種數值已知的系統(tǒng)誤差稱為“已定系統(tǒng)誤差”。還有一類系統(tǒng)誤差,只知道它存在于某個大致范圍,而不知道它的具體數值,我們稱之為“未定系統(tǒng)誤差”。例如儀器的允差就屬于這一類。關于系統(tǒng)誤差的限制和消除將在后面介紹隨機誤差(偶然誤差)由于偶然的不確定

8、因素造成每一次測量值的無規(guī)律的漲落,測量值對真值的偏離時大時小、時正時負,不能由上次測量值預計下一次測量值的大小,這類誤差稱為隨機誤差,也稱偶然誤差。造成偶然誤差的因素是多方面的,如儀器性能和測量者感官分辯力的統(tǒng)計漲落,環(huán)境條件(如溫度、濕度、氣壓、氣流、微震)的微小波動,測量對象本身的不確定性(如氣壓、放射性物質單位時間內衰變的粒子數,小球直徑或金屬絲直徑)等等。偶然誤差的特點是它的隨機性,如果在相同的宏觀條件下,對某一物理量進行多次測量,當測量次數足夠大時,便可以發(fā)現這些測量值呈現出一定的規(guī)律性統(tǒng)計規(guī)律性,即它們服從某種概率分布。下面我們對一個實際測量的結果進行統(tǒng)計分析(表0-1-1),就

9、可以發(fā)現隨機誤差的特點和規(guī)律。表0-1-1中觀測總次數n150次,某測量值的算術平均值為3.01,共分14個分區(qū)間,每個區(qū)間的間隔為0.01。為直觀起見,把表中的數據畫成頻率分布的直方圖如(圖0-1-1),從圖中便可分析歸納出隨機誤差的以下四個特點。表0-1-1 測值分布值區(qū)間1234567測值xi2.952.962.972.982.993.003.01誤差-0.06-0.05-0.04-0.03-0.02-0.010出現次數nI46611142024頻率0.0270.040.040.0730.0930.1330.16區(qū)間891011121314測值xI3.023.033.043.053.06

10、3.073.08誤差xi0.010.020.030.040.050.060.07出現次數n率0.1130.080.080.0660.0580.0270.018圖0-1-1 頻率分布直方圖a)隨機誤差的有界性。在某確定的條件下,誤差的絕對值不會超過一定的限度。表0-1-1中的xi均不大于0.07,可見絕對值很大的誤差出現的概率近于零,即誤差有一定限度。b)隨機誤差的單峰性。絕對值小的誤差出現的概率比絕對值大的誤差出現的概率大,最小誤差出現的概率最大。表0-1-1中的次數為110次,其中的占61次,而的僅40次??梢婋S機誤差的分布成單峰形c)隨機誤差的對稱性。絕對值相等的

11、正負誤差出現的概率相等。表0-1-1正誤差出現的次數為65次,而負誤差為61次,兩者出現的頻率分別為0.427和0.407,大致相等。d)隨機誤差的抵償性。在多次、重復測量中,由于絕對值相等的正負誤差出現的次數相等,所以全部誤差的算術平均值隨著測量次數的增加趨于零,即隨機誤差具有抵償性。抵償性是隨機誤差最本質的統(tǒng)計特性,凡是具有相互抵償特性的誤差,原則上都可以按隨機誤差來處理。雖然隨機誤差產生的原因尚不清楚,但由于它總體上遵守統(tǒng)計規(guī)律,因此理論上可以計算出它對測量結果的影響。(4)誤差的表示方法算術平均誤差在一組測量中,用全部測值的隨機誤差絕對值的算術平均值來表示。按定義 (0-1-6) 式中

12、:xi一組測量中的各個測量,i1,2,n(測量的次數);一組測值的算術平均值,第i個測值xi與平均值之偏差(即誤差)的絕對值這種表示方法已經考慮到了觀測次數n對隨機誤差的影響,但是各次觀測中相互間符合的程度不能予以反映。因為一組測量中,偏差彼此接近的情況與另一組測量中偏差有大、中、小的情況,兩者的算術平均誤差很可能相等。標準誤差(又稱均方根誤差)它是觀測值與真值偏差的平方和觀測次數n比值的平方根,按定義 (0-1-7)式中,A被測物理量的真值; 第i個測值xi與真值A之偏差。在實際測量中,觀測次數n總是有限的,真值只能用最可信賴(最佳)值來代替,此時的標準誤差按下式計算: (0-1-8)標準誤

13、差對一組測量中的特大或特小誤差反映非常敏感,所以,標準誤差能夠很好地反映出測量的精密度。這正是標準誤差在工程測量中廣泛被采用的原因。例1 有兩組觀測數據:第一組 2.9、3.1、3.0、2.9、3.1第二組 3.0、2.8、3.0、3.0、3.2求平均值、算術平均誤差、標準誤差,并分析其準確度及精密度。解 列表計算如下:第 一 組 測 量算術平均值3.0算術平均誤差標準誤差n-1第 二 組 測 量算術平均值3.0算術平均誤差標準誤差n-1從計算結果可知:兩組數據的平均值一樣,即測量的準確度一樣;兩組數據的測量精密度實際上不一樣。因為第一組數據的重現性較好,但此時的算術平均誤差是一樣的,顯然未能

14、反映出精密度來。標準誤差n-1的計算結果說明第一組測量數據比第二組精密度高。標準誤差不僅僅是一組觀測值的函數,而且更重要的是它對一組測量中的大誤差及小誤差反映比較敏感。因此,在試驗中廣泛用標準誤差來表示測量的精密度。極限誤差通常定義極限誤差的范圍為標準誤差的3倍,即3n-1。從統(tǒng)計的角度計算得,所測物理量的真值落在3n-1范圍內的概率為99.7%,而超出此范圍的可能性實際上已經非常小,故把它定義為極限誤差。(5)幾個重要概念精密度(簡稱精度precision)它表示測量結果中隨機誤差大小的程度,即在一定條件下,進行多次、重復測量時,所得測量結果彼此之間符合的程度,通常用隨機不確定度來表示。正確

15、度(correctness)它表示測量結果中系統(tǒng)誤差大小的程度。即在規(guī)定的條件下,測量中所有系統(tǒng)誤差的綜合。準確度(又稱精確度accuracy)準確度是測量結果中系統(tǒng)誤差與隨機誤差的綜合,它表示測量結果與真值的一致程度。從誤差的觀點來看,準確度反映了測量的各類誤差的綜合。如果所有已定系統(tǒng)誤差已經修正,那末準確度可用不確定度來表示。2不確定度(uncertainty)不確定度是由于測量誤差的存在而對被測量值不能肯定的程度。表達方式有系統(tǒng)不確定度、隨機不確定度、總不確定度??砂垂乐档牟煌椒ò巡淮_定度歸并為A、B兩類分量。前者是多次重復測量后,用統(tǒng)計方法計算出的標準誤差;后者是用其他方法估計出的近

16、似的“標準誤差”。系統(tǒng)不確定度實質上就是系統(tǒng)誤差限,常用未定系統(tǒng)誤差可能不超過的界限或半區(qū)間寬度e來表示。隨機不確定度實質上就是隨機誤差對應于置信概率1-a時的置信區(qū)限k(a為顯著性水平)。當置信因子k1時,標準誤差就是隨機不確定度,此時的置信概率(按正態(tài)分布)為68.27%。總不確定度是由系統(tǒng)不確定度與隨機不確定度按合成方差的方法合成而得的。它反映了測量結果中未能確定的量值的范圍。不確定度是測量結果的測度,沒有不確定度說明,測量結果將無從比較。1993年,國際計量局(BIPM)等7個國際組織發(fā)表了測量不確定度表示指南。這一國際的權威性文獻,對計量和科學實驗工作極其重要。綜上所述,不確定度與誤

17、差有區(qū)別,誤差是一個理想的概念,一般不能準確知道;但不確定度反映誤差存在分布范圍,即隨機誤差分量和未定系統(tǒng)誤差分量綜合的分布范圍,可由誤差理論求得??傊?,不確定度是未定誤差的特征描述,而不是指具體的誤差大小和符號,故不確定度不能用來修正測量結果。圖0-1-2 給出了精密度、正確度和準確度的示意圖。圖0-1-2 精密度(a)、正確度(b)、準確度(c)的示意圖0-2 概率統(tǒng)計理論基礎如前所述測量誤差的存在是一切測量中的普遍現象,那么,研究測量誤差的性質和產生的原因,研究如何有效地減小測量誤差對實驗結果的影響,科學地表達含有誤差的測量結果,以及對實驗結果如何評價等,這一系列的問題就顯得十分重要。正

18、是在這樣的背景下,產生并發(fā)展了一門專門的學科,這就是測量誤差理論。它是人們把概率論與數理統(tǒng)計理論應用于測量誤差的研究中而形成并發(fā)展起來的一種科學理論。要想深入地討論測量誤差,需要有豐富的實驗經驗和概率統(tǒng)計知識,下面我們將介紹常用的誤差理論知識,闡述誤差分析的概率統(tǒng)計理論基礎。希望有助于讀者提高實驗的誤差分析和數據處理能力。一、幾個基本概念1隨機事件及概率如拋擲一枚硬幣,出現正面向上和背面向上的事均有可能,我們把正面向上出現的事件記作A,把背于出現的事件記為B。在拋擲之前,A事件出現和B事件出現,事先是無法知道的。也就是說,在一定條件下,事件A可能發(fā)生也可能不發(fā)生,把這類事件稱隨機事件。在物理實

19、驗中,有許多被測對象本身具有隨機性。例如宏觀熱力學量(溫度、密度、壓強等)的數值都是統(tǒng)計平均值,原子和原子核等微觀領域的統(tǒng)計漲落現象也非常明顯,這就使得實驗觀測值不可避免地帶有隨機性,如果在一定的條件下,共進行N次試驗,其中事件A發(fā)生了NA次,比值NA/N稱為事件A發(fā)生的頻率。如果隨著試驗的次數N增加,頻率NA/N愈來愈趨近某個確定值,那么,當N時,頻率的極限值稱為事件A的概率,記為Pr(A),即 (0-2-1)2隨機變量和隨機子樣如果所研究的各個隨機事件可以分別用一個數來表示,這個數就是隨機事件的函數,稱為隨機變量。在物理量的測量中,測量結果為某一個特定的數值,是一個隨機事件,這個數值就是隨

20、機變量的取值。隨機變量全部可能取值的集合稱為母體或總體。一次測量得到的是隨機變量的一個具體數值,稱為隨機變量的一個隨機數。如果總共進行了N次獨立的試驗,得到隨機變量的N個隨機數(x1,x2,xN),稱為隨機變量的一個隨機子樣(或稱為樣本),簡稱子樣。一個子樣中隨機數的數目N稱為子樣的容量。物理量的測量結果總是獲得某些隨機變量的子樣,子樣的容量由重復觀測的次數決定。隨機變量按其取值的情況分為離散型與連續(xù)型:只能取有限個可數的一串數值的隨機變量稱為離散型隨機變量;可能值布滿某個區(qū)間的隨機變量稱為連續(xù)型的隨機變量。在核物理實驗和單光子計數實驗中,粒子或光子的計數率是離散型的隨機變量,然而在物理量的測

21、量中,更多見的是連續(xù)型的隨機變量。3、分布函數、概率函數和概率密度函數對于隨機變量,我們關心的不只是隨機變量的全部可能取值,還必須了解各種可能取值的概率,即隨機變量的概率分布。無論是離散型還是連續(xù)型的隨機變量,其可能的全部取值可以排列在實數軸上,亦即是實數軸上的一個子集合,設X是一個隨機變量,是任意實數。函數 (0-2-2)稱為X的分布函數。因此,若已知X的分布函數,我們就知道X在任一區(qū)間上的概率,在這個意義上說,分布函數完整地描述了隨機變量的統(tǒng)計規(guī)律性。如果將X看成是數軸上的隨機點的坐標,那么,分布函數在處的函數值就表示X落在區(qū)間()上的概率。分布函數具有以下的基本性質。是一個不減函數01,

22、且 (0-2-3)對于離散型變量X,它只能取可數個的數值,除了用布函數描述外,還可以用概率函數來描述它的分布。概率函數在某一點的取值等于隨機變量X取值為的概率,即 (0-2-4)根據分布函數和概率函數的定義,有。對于連續(xù)型隨機變量可以引入概率密度函數。因此有根據式(0-2-3)應有 (0-2-5)這就是應滿足的歸一化條件。隨機變量在區(qū)間內取值的概率稱為區(qū)間的概率含量。顯然,區(qū)間的概率含量為上述關于分布函數、概率函數和概率密度函數的概念都可以推廣到多個隨機變量的情形。特別是,如果X和Y是兩個互相獨立的隨機變量,那么根據概率論,它們的聯合概率密度函數等于各自的概率密度函數的乘積,即 (0-2-6)

23、二、概率分布的數字特征量隨機變量有不同形式的分布,為研究方便,常用一些共同定義的數字特征量來表征它們。最重要的特征量是隨機變量的期望值和方差。1隨機變量的期望值隨機變量的期望值定義為 (0-2-7)期望值的物理意義是作無究多次重復測量時,測量結果的平均值。根據期望值的定義可得 (0-2-8)上式表明分布在期望值的周圍。但期望值和概率密度函數取極大值的位置未必重合。以后我們仍用尖括號表示括號內隨機變量的函數的期望值,例如隨機變量的函數的期望值定義為 (0-2-9)2隨機變量的方差隨機變量的方差定義為 (0-2-10)方差描述隨機變量圍繞期望值分布的離散程度,亦即隨機變量取值偏離期望值起伏的大小。

24、通常把隨機變量的方差記為方差的平方根稱為隨機變量的均方根差或標準差。3兩個隨機變量的協(xié)方差兩個隨機變量的協(xié)方差定義為 (0-2-11)協(xié)方差描述兩個隨機變量的相關程度。當x和y相互獨立時,由式(0-2-6)和(0-2-11)可得Cov(x,y)0。若Cov(x,y)0,x和y一定不相互獨立;但是如果Cov(x,y)0,x和y可能相互獨立,也可能不相互獨立。通常還用相關系數(x,y)描述x和y的相關程度。 (0-2-12)根據協(xié)方差定義,不難證明,三、幾種常用的概率分布由于隨機變量受到不同因素的影響,或者物理現象本身的統(tǒng)計性差異,使得隨機變量的概率分布形式多種多樣,這里討論幾種常用的分布,要注意

25、掌握其概率函數(或概率密度函數)的數字特征量。1二項式分布若隨機事件A發(fā)生的概率為P,不發(fā)生的概率為(1-P),現在討論在N次獨立試驗中事件A發(fā)生k次的概率,顯然k是一個離散型隨機變量,可能取值為0,1,N。對于這樣一個隨機事件,可導出其概率分布為 (0-2-13)式中因子N!/k!(N-k)!代表N次試驗中事件A發(fā)生k次,而不發(fā)生為(N-k)次的各種可能組合數。若令q1-P,則這個概率表示式剛好是二項式展開 (0-2-14)中的項,因此式(0-2-13)所表示的概率分布稱為二項式分布。二項式分布中有兩個獨立的參數N和P,故往往又把式(0-2-13)中左邊概率函數的記號寫作p(k;N,P)。遵

26、從二項式分布的隨機變量k的期望值和方差分別為 (0-2-15) (0-2-16) 二次式分布有許多實際應用。例如,穿過儀器的N個粒子被儀器探測到k個的概率,或N個放射性核經過一段時間后衰變k個的概率等,這些問題的隨機變量k都服從二項式分布,又例如,在產品質量檢驗或民意測驗中,抽樣試驗以確定合乎其條件的結果的概率,也是二項式分布問題。2泊松分布對于二項式分布,若,且每次試驗中A發(fā)生的概率,但期望值趨于有限值m,在這種極限情況下其分布如何?由二項式分布的概率函數式并考慮到的情況,即便可得到 (0-2-17)上式表示的概率分布稱泊松分布,可見泊松分布是二項式分布的極限情況。注意到時,便可得到遵從泊松

27、分布的隨機變量k的期望值和方差: (0-2-18) (0-2-19)因此,泊松分布只有一個參數m,它等于隨機變量的期望值或方差。例如,一塊放射性物質在一定時間間隔內的衰變數,一定時間間隔內計數器記錄到的粒子數,高能荷電粒子在某固定長度的路徑上的碰撞次數等,都遵從泊松分布。3均勻分布若連續(xù)隨機變量x在區(qū)間a,b上取值恒定不變,則這種分布為均勻分布,均勻分布的概率密度函數 (0-2-20)其幾何表示見圖0-2-1。圖0-2-1 區(qū)間a,b上的均勻分布 圖0-2-2 區(qū)間0,1上的均勻分布均勻分布的期望值和方差為 (0-2-21) (0-2-22)實驗工作中常用0,1區(qū)間的均勻分布,若用r表示該區(qū)間

28、的隨機變量,其概率密度函數為這個分布如圖0-2-2所示,隨機變量r在該區(qū)間的期望值和方差,讀者不難求得。均勻分布是一種最簡單的連續(xù)型隨機變量分布,如數字式儀表末位1量化誤差,機械傳動齒輪的回差,數值計算中湊整的舍入誤差等都遵從均勻分布。4正態(tài)分布實用中最重要的概率分布是正態(tài)分布(又稱高斯分布)。正態(tài)分布的概率密度函數為 (0-2-23)式中x是連續(xù)型隨機變量,和是分布參數,且0。為了標志其特征,通常又用表示正態(tài)分布的概率密度函數,用表示正態(tài)分布的分布函數,即不難求得,遵從正態(tài)分布的隨機變量x的期望值和方差分別為, (0-2-24) . (0-2-25) 由此可見,正態(tài)分布中的參數是期望值,參數

29、是標準誤差,正態(tài)分布的特征由這兩個參數的數值完全確定;若消除了測量的系統(tǒng)誤差,則就是待測物理量的真值,它決定分布的位置;而的大小與概率密度函數曲線的“胖”、“瘦”有關,即決定分布偏離期望值的離散程度,不同參數值的正態(tài)分布概率密度函數曲線如圖0-2-3所示,曲線是單峰對稱的,對稱軸處于期望值和概率密度極大值所在處。圖0-2-3 不同參數值的正態(tài)分布曲線期望值和方差的正態(tài)分布叫做標準正態(tài)分布,其概率密度函數和分布函數為 (0-2-26) (0-2-27)若,只要把隨機變量作線性變換 (0-2-28)則隨機變量u便遵從標準正態(tài)分布,且有 (0-2-29) (0-2-30)這樣便可利用標準正態(tài)分布求概

30、率分布。例 某隨機變量x遵從正態(tài)分布,試利用標準正態(tài)分布表分別求出x落在期望值附近,2和3的概率含量。解:由式(0-2-27)可知,當x偏離期望值,2和3時,標準正態(tài)分布隨機變量取值分別為1,2和3,故查標準正態(tài)分布表求隨機變量落在區(qū)間-1,1、-2,2和-3,3內的概率即可。當隨機變量等于1時,標準正態(tài)分布表給出,這是圖0-2-4曲線下的陰影部分(區(qū)間為),而我們求的是圖0-2-5曲線下的陰影部分(區(qū)間為-1,1),即圖0-2-4 標準正態(tài)分布的分布函數 圖0-2-5 同理,標準正態(tài)分布的隨機變量等于2和3時,分別有故x落在區(qū)間內的概率含量為68.3%;落在區(qū)間內的概率含量為95.4%;落在

31、區(qū)間內的概率含量為99.7%。理論上可以證明,若一個隨機變量是由大量的、相互獨立的、微小的因素所合成的總效果,則這個隨機變量就近似地服從正態(tài)分布。這就是說,由不能控制的大量的偶然因素造成的隨機誤差會遵從或近似遵從正態(tài)分布。另外,許多非正態(tài)分布也常以正態(tài)分布為極限或很快趨于正態(tài)分布。例如,對于泊松分布,若期望值m足夠大時,它趨近于形式而泊松分布的故上式與正態(tài)分布的形式相同。雖然泊松分布中的k是離散型變量,但當時泊松分布已很接近于正態(tài)分布。又例如,對于二項式分布,當N足夠大時,也趨于形式為的正態(tài)分布,只不過而已。0-3 實驗數據的分析與處理一、系統(tǒng)誤差的分析與處理系統(tǒng)誤差是一種固定的或服從一定規(guī)律

32、變化的誤差。對某物理量作多次重復測量時,系統(tǒng)誤差不具有抵償性,故通常不能用處理隨機誤差的方法來處理。前面討論隨機誤差是以測量數據中不包含系統(tǒng)誤差為前提的??墒窍到y(tǒng)誤差與隨機誤差往往是同時存在于測量數據中,有時系統(tǒng)誤差對實驗結果的影響比隨機誤差還要嚴重。如果不消除或不減少系統(tǒng)誤差的影響,就會使得對隨機誤差的估計變得毫無意義。對于一個具體實驗來說,要能找出造成系統(tǒng)誤差的主要原因。然后,從實驗中設法限制和消除這些因素的影響。下面我們就系統(tǒng)誤差的主要來源如何判斷系統(tǒng)誤差的存在以及限制和消除系統(tǒng)誤差進行討論。1.系統(tǒng)誤差的來源分析(1)裝置誤差儀器、儀表誤差儀器、儀表誤差是由于使用的儀器或量具在結構上不

33、完善、或沒有按照操作規(guī)程使用而引起的誤差。例如電工儀表、電橋、電位差計等的誤差。標準器誤差標準器是提供標準量值的器具,如標準電池、標準電阻等,它們本身的標稱值含有的誤差。安置誤差安置誤差是由于儀器或被測工件的安置不當所引的誤差。例如,有些電工儀表按規(guī)定應水平放置,而在使用時,垂直放置儀表引起的誤差。裝備、附件誤差裝備、附件誤差主要指的是電源的波形、三相電源的不對稱度,各種測量附件如轉換開關、觸點、接線引起的誤差以及測試設備和電路的安裝、布置或調整不完善等產生的誤差。(2)方法誤差(理論誤差)測量方法本身的理論根據不完善或采用了近似公式引起的誤差稱為方法誤差。例如,電阻與溫度的關系為RR20+(

34、t-20)+(t-20)2式中:R溫度t的電阻; R20溫度20時的電阻;電阻的一次溫度系數; 電阻的二次溫度系數;在實驗中不考慮溫度因素的影響而引起的系統(tǒng)誤差R-(t-20)-(t-20)2,消除它的方法就是進行溫度修正。(3)觀測者誤差觀測者誤差是由于觀測者的生理或心理上的特點和固有習慣所造成的。例如,觀測者對刻度尺進行估讀時,習慣地偏向某一方向(始終偏大或偏?。┯涗浶畔⒒蛴嫊r的滯后等所造成的誤差。(4)環(huán)境誤差環(huán)境誤差是在測量時的環(huán)境影響量(如溫度、濕度、氣壓、電磁場等)偏離規(guī)定值時而產生的誤差。除上述系統(tǒng)誤差的來源外,還有很多系統(tǒng)誤差是很復雜的。例如,刻度盤刻度線不準確而引起的測量示數

35、的誤差,就是一種比較復雜的系統(tǒng)誤差。因此,我們在設計和制造測量儀器以及設計選擇測量方法時,都要預先考慮系統(tǒng)誤差的來源,盡可能將系統(tǒng)誤差減小到所允許的范圍內。2.系統(tǒng)誤差存在的判斷對比檢驗是判斷系統(tǒng)誤差存在的常用方法。這里所說的對比,可以是把要判斷的實驗結果跟標準值、理論值比較;或者是跟準確度較高的儀器設備的測量值相比較;還可以是跟采用不同的實驗方法測得的結果相比較。由于隨機誤差不可避免,在系統(tǒng)誤差與隨機誤差同時存在的情況下,應進行多次測量以減少隨機誤差的影響,才能有效地判斷系統(tǒng)誤差的存在。在多次測量中,分析測量數據隨時間變化的規(guī)律(特別是偏差的變化),往往會有助于發(fā)現隨時間線性變化或周期變化的

36、系統(tǒng)誤差。分布檢驗也是判斷系統(tǒng)誤差的一種重要方法。這是一種假設檢驗,先由理論分析和過去同類測量的經驗,認為測量值應該遵從某種分布,然后用統(tǒng)計量作檢驗,判斷實驗結果是否與假設分布相符,如果不符可懷疑測量中存在著系統(tǒng)誤差。直接分析實驗原理、方法以及實驗條件的變化,也是判斷系統(tǒng)誤差的一種有效方法。如果實驗方案本身就存在著不完備性。比如說計算公式是近似的,測量方法受到某種副效應或某種干擾的影響,則這個實驗必然存在著系統(tǒng)誤差。另外,有些實驗所研究的物理現象存在著統(tǒng)計漲落,測量儀器產生零點漂移,控制的實驗條件隨時間而明顯變化等,這些因素也就帶來了系統(tǒng)誤差??傊瑢嶒灡旧淼姆治鲅芯?,往往會使我們能直接找出

37、系統(tǒng)誤差并可估計其大小。3.系統(tǒng)誤差的限制和消除方法(1)消除產生系統(tǒng)誤差的根源。在測量之前,要求測量者對可能產系統(tǒng)誤差的環(huán)節(jié)作仔細的分析,從產生根源上加以消除。例如,若系統(tǒng)誤差來自儀器不準確或使用不當,則應該把儀器校準并按規(guī)定的使用條件去使用;若理論公式只是近似的,則應在計算時加以修正;若測量方法上存在著某種因素會帶來系統(tǒng)誤差,則應估計其影響的大小或改變測量方法以消除其影響;若外界環(huán)境條件急劇變化,或存在著某種干擾,則應設法穩(wěn)定實驗條件,排除有關干擾;若測量人員操作不善,或者讀數有不良偏向,則應該加強訓練以改進操作技術,以及克服不良偏向等??傊?,從產生系統(tǒng)誤差的根源上加以消除,無疑是一種最根

38、本的方法。(2)在測量中限制和消除系統(tǒng)誤差。對于固定不變的系統(tǒng)誤差的限制和消除,在測量過程中常常采用下列方法:抵消法。有些定值的系統(tǒng)誤差無法從根源上消除,也難以確定其大小而修正,但可以進行兩次不同的測量,使兩次讀數時出現的系統(tǒng)誤差大小相等而符號相反,然后取兩次測量的平均值便可消除系統(tǒng)誤差。例如螺旋測微計空行程(螺旋旋轉但量桿不動)引起的固定系統(tǒng)誤差,可以從兩個方向對標線來消除。先順時針方向旋轉,對準標志讀數,a為不含系統(tǒng)誤差的讀數,為空行程引起的誤差。再逆時針方向旋轉,對準標志讀數。兩次讀數取平均,即得,可見空行程所引起的誤差已經消除。代替法。在某裝置上對未知量測量后,馬上用一標準量代替未知量

39、再進行測量,若儀器示值不變,便可肯定被測的未知量即等于標準量的值,從而消除了測量結果中的儀器誤差。例如用天平秤物體質量m,若天平兩臂和不等,先使m與砝碼G平衡,則有。再以標準砝碼P取代質量為m的物體,若調節(jié)P與G達到平衡,則有。從而,消除了天平不等臂引起的系統(tǒng)誤差。交換法。根據誤差產生的原因,對某些條件進行交換,以消除固定的誤差。例如用電橋測電阻,得。若兩臂有誤差,可將被測電阻互換再測得。從而可得,消除了帶來的誤差。下面再討論一定規(guī)律變化的系統(tǒng)誤差的消除方法。對稱觀測法。這是消除隨時間線性變的系統(tǒng)誤差的有效方法。隨著時間的變化,被測量的量值作線性變化,如圖0-3-1所示。若定某時刻為中點,則對

40、稱于點的系統(tǒng)誤差的算術平均值彼此相等,即有。利用此規(guī)律,可把測量點對稱安排,取每組對稱點讀數的算術平均值作為測量值,便可消除這類系統(tǒng)誤差。 圖0-3-1 線性變化的系統(tǒng)誤差 圖0-3-2 周期變化的系統(tǒng)誤差有些按復雜規(guī)律變化的系統(tǒng)誤差,若在短時間內可認為是線性變化的,也可近似地作為線性誤差處理,從而也可用對稱測量法減少誤差。半周期偶次測量法。這是消除周期性系統(tǒng)誤差的基本方法。周期性誤差一般出現在有圓周運動的情況(如度盤等),以2為周期呈正弦變化。因此,在相距半周期(180)的位置上作一次測量,取兩次讀數的平均值,便可有效地消除周期性系統(tǒng)誤差。這種誤差一般表示為式中a為周期性系統(tǒng)誤差的幅值。當位

41、相時誤差,當位相時誤差。故相隔半周期兩次觀測誤差的平均值,即周期性系統(tǒng)誤差得到消除。實時反饋修正法。這是消除各種變值系統(tǒng)誤差的自動控制方法。當查明某種誤差因素(例如位移、氣壓、溫度、光強等)的變化時,由傳感器將這些因素引起的誤差反饋回控制系統(tǒng),通過計算機根據其影響測量結果的函數關系進行處理,對測量結果作出自動補償修正。這種方法在微機控制的自動測量技術中得到了廣泛的應用。二、隨機誤差的統(tǒng)計分析數據處理的任務是要從測量結果找出隨機變量的分布規(guī)律或它的數字特征量,從而得出結論。從理論上講,只要測量的次數足夠多,隨機變量的規(guī)律性一定能呈現出來,但實際上進行的或允許的觀測次數總是有限的,有時甚至是少量的

42、,因此我們關心的是怎樣有效地利用有限的數據,才能去掉那些由于測量次數不夠多引起的隨機干擾,盡可能作出精確可靠的結論。由于測量時不是對全部可能的取值進行研究,只是得到一個容量有限的隨機子樣,因此,基于這個隨機子樣得出的結論一定包含一定的不確定性,概率就是這種不確定性的量度。這時必須用概率的語言來表述我們的結論。例如:對于某個正態(tài)變量測量結果表述為,通常意味在到范圍內取值的概率為68.3%,表述這一結論所用的概率稱為置信水平。由于子樣平均值本身也是一個隨機變量,故區(qū)間也應是隨機的,則或該兩式說明在區(qū)間內包含真值的可靠程度為68.3%,或者說子樣均值有68.3%的可能性落在以真值a為中心、的區(qū)間范圍

43、內。通常,稱為置信區(qū)間(或置信限),為置信區(qū)間的半長。68.3%為置信概率(或置信度),常表示為,稱顯著性水平。概括起來,可以對測量結果作以下結論:測量結果子樣平均值置信區(qū)間半長該結論說明,一切測量結果應該理解為在一定置信概率下,以子樣平均值為中心,以置信區(qū)間半長為界限的量,這正是誤差統(tǒng)計意義的所在。當隨機變量規(guī)律的函數形式已知,未知的只是其中某些參數的數值時,數據處理的任務就是要估計這些參數的數值。在實驗測量中,這些參數往往就是我們要求的物理量的數值,如正態(tài)變量的期望值常常就是所要測量的物理量的真值。假設是分布的參數,測量得到的子樣為,當未知時,我們可尋找子樣的一個合適的函數作為的估計量,并

44、給出這種估計的誤差大小,這種估計方法稱為分布參數的點估計,子樣的函數稱為統(tǒng)計量。我們也可以尋找兩個統(tǒng)計量和,而且有,使參數落在區(qū)間之間有足夠大的(給定的)概率,這種估計方法稱為分布參數的區(qū)間估計。此外還可以根據經驗或其他方面的知識給參數以某假設值,然后建立統(tǒng)計推斷方法,利用子樣提供的信息在一定的概率水平下對接受或拒絕這個假設作出決斷,這一類的假設檢驗稱為參數檢驗;當隨機變量分布規(guī)律的函數形式未知時,我們也可以根據理論的預測或經驗對它所遵從的分布規(guī)律作出假設,用統(tǒng)計推斷的方法對是否接受這一假設作出決斷,這一類的假設檢驗稱為擬合性檢驗。當然還可以利用測量結果對其他假設進行檢驗。根據近代物理實驗數據

45、分析處理的需要,我們著重介紹參數估計(點估計)的最大似然法與分布規(guī)律的檢驗方法。三、分布參數的點估計分布參數點估計的方法是用統(tǒng)計量作出參數的估計量,而統(tǒng)計量是隨機子樣的函數。隨機子樣可以看作是一個N維的隨機變量,一次測量得到子樣的N個隨機數值,另一次測量得到另N個隨機數值,因此它們的函數必然也是隨機變量。統(tǒng)計量既然是隨機變量,它必然遵從一定的分布規(guī)律,有它的期待值、方差及其他數字特征量。由于統(tǒng)計量是我們對母體分布參數和分布規(guī)律進行推斷的基礎,因此統(tǒng)計量本身的分布和數字特征量是我們必須加以研究的。根據母體的分布規(guī)律及統(tǒng)計量的函數形式,原則上可以導出統(tǒng)計量遵從的分布規(guī)律。一般說來,要確定統(tǒng)計量的精

46、確分布是很復雜的,對于一些特殊情形,如母體是正態(tài)分布時,這個問題有較簡單的解法。必須指出的是:統(tǒng)計量遵從的分布規(guī)律和母體的分布不一定相同。例如,當母體為正態(tài)分布時,某些統(tǒng)計量卻遵從分布、t分布或者其他分布規(guī)律。如果參數的估計量的期待值滿足則稱為的無偏估計量。有些估計量不滿足式(0-3-1)但是當子樣容量N時滿足這種估計量稱為漸近的無偏估計量。對于同一個參數,可以用不同方法設計不同形式的統(tǒng)計量作為的估計量,常用的方法之一是最大似然法。1.參數估計的最大似然法子樣可看作N維的隨機變量,它們的聯合概率密度稱為子樣的似然函數。由于是隨機變量x的隨機子樣,因此其中各個隨機變量x的概率密度函數(對于離散型

47、變量,則是概率函數)的形式和x的概率密度函數相同,只需把x換為xi。由于各xi是互相獨立的,根據式(0-3-6)似然函數等于各個觀測值xi ,概率密度的乘積,即似然函數為對于已知的,L的大小說明哪些子樣有較大的可能性;當未知而已知時,采用的不同估算計值L將有不同的數值,L的大小說明哪一些值有較大的可能性,亦即實測子樣對的估計提供了一定的信息。選擇使實測數值有較大概率密度的參數值作為的估計值是一種很自然的估計辦法,這就是最大似然法。如果估計值使似然函數最大,即則稱為參數的最大似然估計。求最大似然估計量的具體辦法是解似然方程 (0-3-2)數理統(tǒng)計的理論證明,用最大似然法求出估算計量具有一系列的優(yōu)

48、良性質,但最大似然估計量通常是漸近的無偏估計量。小子樣的最大似然估計量不一定是無偏估計量,然而可以通過適當的調整使其成為無偏估計量。2.檢驗若N個不等精度的觀測值分別服從正態(tài)分布,這時量定義為 (0-3-3)式中的為的加權平均值。如果某些觀測值存在系統(tǒng)誤差使得它們的期待值偏離被測的真值,或者某些觀測值對誤差的估計過小都會使量的數值遠小于N-1。因此,當量的數值遠遠大于N-1時,表明這組觀測值之間存在著不協(xié)調。由于的概率小于1/400,若,通常不能認為有系統(tǒng)誤差存在;若則表明有系統(tǒng)誤差存在或者在某些測量中誤差的估計過小;當介于1與2之間則不能確定是否有系統(tǒng)誤差的存在。當檢驗表明有系統(tǒng)誤差存在時,

49、應對各個觀測結果進行審核,把可疑值剔去,重新計算并再作檢驗。檢驗可以幫助我們發(fā)現是否有明顯的系統(tǒng)誤差,但并不能通過檢驗把系統(tǒng)誤差都找出來,例如當的數值介于1與2之間時,量偏大有可能是由于存在系統(tǒng)誤差,也可能是統(tǒng)計漲落的結果。3應用舉例 表0-3-2列出H2電離電勢的一組不等精度的測量值,現在進行綜合分析如下:表0-3-2 H2電離電勢的測量值i12345616.517.115.615.415.615.370.6745Si0.50.20.10.10.10.03用Si作為的估計值分別代入式(3-15)和(3-18)求出加權平均值和量分別為同樣用Si作為的估計值,由式(3-17)和(3-19)求出平

50、均值方差的兩種估計值分別為0.00153和0.01098,二者相差太大,疑有系統(tǒng)誤差存在,這時作檢驗得到數值顯然太大,因此肯定有系統(tǒng)誤差存在。現在去掉17.10.2這一組數據再處理一次,得到再用兩種方法計算平均值方差的估計量,分別為:0.00155和0.00243二者已無重大差別,這時作檢驗得,可以認為剩下的五組數據已不存在明顯的不協(xié)調,最后結果可表示為。0-4 最小二乘擬合在物理實驗中經常要觀測兩個有函數關系的物理量。根據兩個量的許多組觀測數據來確定它們的函數曲線,這就是實驗數據處理中的曲線擬合問題。這類問題通常有兩種情況:一種是兩個觀測量x與y之間的函數形式已知,但一些參數未知,需要確定未

51、知參數的最佳估計值;另一種是x與y之間的函數形式還不知道,需要找出它們之間的經驗公式。后一種情況常假設x與y之間的關系是一個待定的多項式,多項式系數就是待定的未知參數,從而可采用類似于前一種情況的處理方法。一、最小二乘法原理在兩個觀測量中,往往總有一個量精度比另一個高得多,為簡單起見把精度較高的觀測量看作沒有誤差,并把這個觀測量選作x,而把所有的誤差只認為是y的誤差。設x和y的函數關系由理論公式y(tǒng)f(x;c1,c2,cm) (0-4-1)給出,其中c1,c2,cm是m個要通過實驗確定的參數。對于每組觀測數據(xi,yi)i1,2,N。都對應于xy平面上一個點。若不存在測量誤差,則這些數據點都準

52、確落在理論曲線上。只要選取m組測量值代入式(0-4-1),便得到方程組 yif(x;c1,c2,cm) (0-4-2) 式中i1,2,m.求m個方程的聯立解即得m個參數的數值。顯然Nm的情況下,式(0-4-2)成為矛盾方程組,不能直接用解方程的方法求得m個參數值,只能用曲線擬合的方法來處理。設測量中不存在著系統(tǒng)誤差,或者說已經修正,則y的觀測值yi圍繞著期望值 擺動,其分布為正態(tài)分布,則yi的概率密度為,式中是分布的標準誤差。為簡便起見,下面用C代表(c1,c2,cm)??紤]各次測量是相互獨立的,故觀測值(y1,y2,cN)的似然函數.取似然函數L最大來估計參數C,應使 (0-4-3)對于y的分布不限于正態(tài)分布來說,式(0-4-3)稱為最小二乘法準則。若為正態(tài)分布的情況,則最大似然法與最小二乘法是一致的。因權重因子,故式(0-4-3)表明,用最小二乘法來估計參數,要求各測量值yi的偏差的加權平方和為最小。根據式(0-4-3)的要求,應有從而得到方程組

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論