版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、關(guān)鍵術(shù)語統(tǒng)計(jì)學(xué)(Statistics)收收集、分析、表述和解釋數(shù)據(jù)的藝術(shù)和科學(xué)。數(shù)據(jù)( Data)收被收集、分析和解釋的事實(shí)與數(shù)字。數(shù)據(jù)集(Data set)收一特定研究中所有收集的數(shù)據(jù)。個(gè)體( Elements )收從中收集數(shù)據(jù)的實(shí)體。變量( Variable)收個(gè)體的某種令人感興趣的屬性。觀測值( Observation )收為單個(gè)個(gè)體獲取的度量集。品質(zhì)數(shù)據(jù)(Qualitative data)收為一個(gè)體的性質(zhì)提供標(biāo)記或名稱的數(shù)據(jù)。品質(zhì)數(shù)據(jù)可能是非數(shù)值或數(shù)值型的。品質(zhì)變量(Qualitative variable)收有關(guān)品質(zhì)數(shù)據(jù)的變量。數(shù)量數(shù)據(jù)(Quantitative data)收表明某事
2、多少的數(shù)據(jù)。數(shù)量數(shù)據(jù)總是數(shù)值型的。數(shù)量變量(Quantitative variable)收有關(guān)數(shù)量數(shù)據(jù)的變量。截面數(shù)據(jù)(Cross-sectional data)收在同時(shí)或近似相同時(shí)點(diǎn)收集的數(shù)據(jù)。時(shí)間序列數(shù)據(jù)( Time series data)收在幾個(gè)連續(xù)期間收集的數(shù)據(jù)。描述統(tǒng)計(jì)學(xué)(Descriptive statistics)收用于匯總數(shù)據(jù)的表、圖和數(shù)值方法。總體(Population )收一特定研究中所有感興趣個(gè)體的集合。樣本( Sample )收總體的一個(gè)子集。統(tǒng)計(jì)推斷(Statistical inference)收利用從一個(gè)樣本獲得的數(shù)據(jù)對總體性質(zhì)進(jìn)行估計(jì)或假設(shè)檢驗(yàn)的過程。頻數(shù)分布(
3、Frequency distribution) 對一數(shù)據(jù)集的表格匯總法,顯示若干無重疊組別中每一組的項(xiàng)目頻數(shù)(或個(gè)數(shù))。相對頻數(shù)分布(Relative frequency distribution) 一數(shù)據(jù)集的表格匯總法,顯示在若干無重疊組別中每一組的項(xiàng)目總數(shù)的相對頻數(shù),即分?jǐn)?shù)或比例。百分?jǐn)?shù)頻數(shù)分布(Percent frequency distribution) 一數(shù)據(jù)集的表格匯總法,顯示幾個(gè)無重疊組別中每一組的項(xiàng)目總數(shù)的百分率。條形圖(Bar graph) 一種圖形方法,描述在品質(zhì)數(shù)據(jù)的頻數(shù)分布、相對頻數(shù)據(jù)分布或百分?jǐn)?shù)頻數(shù)分布中表示的信息。餅形圖(Pie chart) 一種描述品質(zhì)數(shù)據(jù)匯總的
4、圖形方法,建立于把一個(gè)圓細(xì)分成與每一組的相對頻數(shù)相對應(yīng)的扇型的基礎(chǔ)上。直方圖(Histogram) 一種通過在橫軸上放置組間隔,在縱軸上放置頻數(shù)來描述數(shù)量數(shù)據(jù)的頻數(shù)分布、相對頻數(shù)分布或百分?jǐn)?shù)頻數(shù)分布。累積頻數(shù)分布(Cumulative frequency distribution) 對數(shù)量數(shù)據(jù)集的表格法匯總,顯示數(shù)值小于或等于每一組組上限的項(xiàng)目數(shù)。累積相對頻數(shù)分布(Cumulative relative frequency distribution) 對數(shù)量數(shù)據(jù)的表格法匯總,顯示數(shù)值小于或等于每一組組上限的項(xiàng)目分?jǐn)?shù)或比例。累積百分?jǐn)?shù)頻數(shù)分布(Cumulative percent frequen
5、cy distribution) 對數(shù)量數(shù)據(jù)的表格法匯總,顯示數(shù)值小于或等于每一組組上限的項(xiàng)目的百分率。組中值(Class midpoint) 每一組中在組下限和組上限正中間的值。莖葉顯示(Stem-and-leaf display) 一種同時(shí)排列數(shù)量數(shù)據(jù)順序并提供分布形態(tài)的深入信息的探索性數(shù)據(jù)分析技術(shù)。交叉分組列表(Crosstabulation) 對兩個(gè)變量數(shù)據(jù)的表格匯總。一個(gè)變量的組用行來描述,另一變量的組用列來描述。散點(diǎn)圖(Scatter diagram) 表示兩個(gè)數(shù)量變量之間關(guān)系的圖形方法。一個(gè)變量列在橫軸上,另一個(gè)變量列在縱軸上。總體參數(shù)(Population parameter)
6、 用來概括總體數(shù)據(jù)的量度的數(shù)值(如總體平均數(shù),總體方差2,總體標(biāo)準(zhǔn)差)。樣本統(tǒng)計(jì)量(Sample statistic) 用來概括樣本數(shù)據(jù)的量度的數(shù)值(如樣本平均數(shù),樣本方差s2,樣本標(biāo)準(zhǔn)差s)。平均數(shù)( Mean ) 衡量數(shù)據(jù)集中心位置的量度。用所有數(shù)據(jù)值相加的和除以項(xiàng)數(shù)計(jì)算。中位數(shù)( Median ) 衡量數(shù)據(jù)集中心位置的量度。中位數(shù)的值將所有的數(shù)據(jù)分為兩個(gè)相等部分,一部分的值都大于或等于它,而另一部分的值都小于或等于它。眾數(shù)( Mode ) 用以衡量數(shù)據(jù)的位置的量度,定義為發(fā)生頻數(shù)最高的數(shù)據(jù)值。百分位數(shù)(Percentile) 至少有p的數(shù)據(jù)項(xiàng)小于等于這個(gè)值,且至少有( 1 0 0-p)的
7、數(shù)據(jù)項(xiàng)大于等于這個(gè)值。第5 0百分位數(shù)即為中位數(shù)。四分位數(shù)( Quartiles ) 第2 5、第5 0和第7 5百分位數(shù)分別即為第1、第2、第3四分位數(shù)。四分位數(shù)將數(shù)據(jù)集分為4個(gè)部分,每一部分含有2 5的數(shù)據(jù)。臨界點(diǎn)( Hinges) 下端臨界點(diǎn)約等于第1四分位數(shù)或第2 5百分位數(shù)。上端臨界點(diǎn)約等于第3四分位數(shù)或第75百分位數(shù)。由于計(jì)算約定的不同,臨界點(diǎn)的值與四分位數(shù)的值會稍有不同。全距( Range ) 用以衡量變異程度的量度,定義為最大值減最小值的差。四分位點(diǎn)內(nèi)距(Interquartile range, IQR) 用以衡量變異程度的量度,定義為第3四分位數(shù)與第1個(gè)四分位數(shù)之差。方差(
8、Variance ) 用以衡量數(shù)據(jù)集變異程度的量度,是建立在距平均數(shù)離差的平方值的基礎(chǔ)上的。標(biāo)準(zhǔn)差(Standard deviation) 用以衡量數(shù)據(jù)集變異程度的量度,取方差的正的平方根。標(biāo)準(zhǔn)差系數(shù)( Coefficient of variation) 衡量數(shù)據(jù)集相對變異程度的量度,以標(biāo)準(zhǔn)差除以平均數(shù)再乘以100得到。Z分?jǐn)?shù)(Z-score) 以距平均數(shù)的離差除以標(biāo)準(zhǔn)差s所得的值。Z分?jǐn)?shù)是標(biāo)準(zhǔn)化的數(shù)值,指數(shù)據(jù)值xi距離平均數(shù)的標(biāo)準(zhǔn)差的個(gè)數(shù)。切貝謝夫定理( Chebyshers theorem) 這一定理可以用于任何數(shù)據(jù)集,用來描述與平均數(shù)的距離在特定數(shù)目個(gè)標(biāo)準(zhǔn)差范圍之內(nèi)的數(shù)據(jù)項(xiàng)的百分比。經(jīng)驗(yàn)
9、法則(Empirical rule) 這一法則適用于山峰形或鐘形分布的數(shù)據(jù),用以描述與平均數(shù)的距離在1個(gè)、2個(gè)、3個(gè)標(biāo)準(zhǔn)差范圍之內(nèi)的數(shù)據(jù)項(xiàng)的百分比。異常值( outlier) 異常大或異常小的數(shù)據(jù)值。五數(shù)概括法(Five-number summary) 是一種探索性數(shù)據(jù)分析的技術(shù)。用五個(gè)數(shù)據(jù)值:最小值、第1四分位數(shù)、平均數(shù)、第3四分位數(shù)和最大值來概括數(shù)據(jù)集。盒形圖(Box plot) 一種用圖形概括數(shù)據(jù)的方法。用一個(gè)以第1和第3四分位數(shù)為邊界的方盒來表明在中心位置的5 0的數(shù)據(jù)。以一條橫線(稱為須線)從方盒兩側(cè)延伸以表明大于第3四分位數(shù)和小于第1四分位數(shù)的數(shù)據(jù)值的位置。所有異常值的位置也予以標(biāo)
10、明。協(xié)方差( Covariance) 用以衡量兩變量間線性相關(guān)關(guān)系的數(shù)值量度。正值表示正相關(guān),負(fù)值表示負(fù)相關(guān)。相關(guān)系數(shù)(Correlation cofficient ) 用以衡量兩變量間線性相關(guān)關(guān)系的數(shù)值量度。其取值從- 1到+ 1。接近+ 1的值表示強(qiáng)的正線性相關(guān),接近- 1的值表示強(qiáng)的負(fù)線性相關(guān),接近零的值表示幾乎無線性相關(guān)關(guān)系。加權(quán)平均數(shù)( Weighted mean) 將每一個(gè)數(shù)據(jù)值予以一個(gè)權(quán)重以反映其在數(shù)據(jù)集中的重要程度。由此獲得的平均數(shù)即為加權(quán)平均數(shù)。分組數(shù)據(jù)(Grouped data) 將數(shù)據(jù)分為若干個(gè)組并配以頻數(shù)分布,而不記錄原始數(shù)據(jù)的個(gè)體值。概率( probability)衡
11、衡量某一事件發(fā)生可能性的數(shù)值量度。試驗(yàn)( Experient)衡任何可以產(chǎn)生明確定義的結(jié)果的過程。試驗(yàn)結(jié)果用符號Ei表示。樣本點(diǎn)(Sample point)衡單一的試驗(yàn)結(jié)果。樣本空間(Sample space)衡所有可能的樣本點(diǎn)(試驗(yàn)結(jié)果)的集合。樹形圖( Tree diagram)衡一種用于多步驟試驗(yàn)樣本點(diǎn)的定義的輔助圖形工具。概率的基本條件(Basic requirements of probability)衡概率分配方式必須滿足兩個(gè)基本條件:a. 對于任意一個(gè)試驗(yàn)結(jié)果Ei,必須有0P(Ei)1。b. 所有的k個(gè)試驗(yàn)結(jié)果滿足P(Ei)= 1。古典法(Classical method)衡一種
12、概率分配的方法,它假設(shè)試驗(yàn)結(jié)果都是等可能發(fā)生的。相對頻數(shù)法(Relative frequency method)衡一種以試驗(yàn)或歷史數(shù)據(jù)為基礎(chǔ)的概率分配方法。主觀法(Subjective method)衡一種以主觀判斷為基礎(chǔ)的概率分配方法。事件( Event)衡一個(gè)樣本點(diǎn)的集合。事件A的補(bǔ)(Complement of event A)衡由所有不包含在A的樣本點(diǎn)構(gòu)成的事件。文氏圖( Venn diagram)衡一種抽象表明樣本空間和事件運(yùn)算的輔助圖形工具。事件A和事件B的并(Union of A and B)衡所有的屬于A或B或同時(shí)屬于二者的樣本點(diǎn)構(gòu)成的事件。A和B的并記作AB。事件A和事件B的交
13、(Intersection of A and B)衡同時(shí)屬于A和B的樣本點(diǎn)構(gòu)成的事件。A和B的交記作AB。加法公式(Addition law)衡加法公式用于計(jì)算事件的并的概率,即P(AB)。公式為P(AB)=P(A)+P(B)-P(AB)。對于互斥事件,由于P(AB)= 0,該公式簡化為P(AB)=P (A)+P(B)?;コ馐录?Mutually exclusive events)衡兩個(gè)事件沒有公共的樣本點(diǎn);即AB為空且P(AB)= 0。條件概率(Conditional probability)衡給定其他事件發(fā)生的條件下某個(gè)事件發(fā)生的概率。給定事件B下A的概率為P(A | B)=P(AB)/P
14、(B)。獨(dú)立事件(Independent events)衡兩個(gè)事件A和B有P(A|B)=P(A)或P(B|A)=P(B);也就是說,事件間相互沒有影響。乘法公式(Multiplication law)衡用于計(jì)算兩事件交的概率P(AB)的概率公式??梢詫懗蒔 (AB)= P(A)P(B|A)或者P(AB)=P(B)P(A|B)。對于獨(dú)立事件,簡化為P(AB)= P(A)P(B)。先驗(yàn)概率(Prior probabilities)衡事件的初始估計(jì)概率。后驗(yàn)概率(Posterior probabilities)衡根據(jù)另外的信息而得到的事件的修正概率。貝葉斯定理( B a y e s theorem)
15、衡一種用來計(jì)算后驗(yàn)概率的方法。隨機(jī)變量(Random variable)試試驗(yàn)結(jié)果的數(shù)值性描述。離散型隨機(jī)變量(Discrete random variable)試可取一個(gè)有窮或無窮數(shù)列的值的隨機(jī)變量。連續(xù)型隨機(jī)變量(Continuous random variable)試可取一個(gè)區(qū)間或一系列區(qū)間的任何值的隨機(jī)變量。概率分布(Probability distribution)試一個(gè)表示概率怎樣在隨機(jī)變量可能值間分布的描述。概率函數(shù)(Probability function)試一個(gè)函數(shù),用f(x)標(biāo)記,提供了離散型隨機(jī)變量x取特定值的概率。離散均勻概率函數(shù)(Discrete uniform pr
16、obability function)試用來定義具有相等概率的離散型概率分布的函數(shù)。數(shù)學(xué)期望(Expected value)試度量隨機(jī)變量平均值或中心位置的量度。方差( Variance )試度量隨機(jī)變量的差異性,或離散性的量度。標(biāo)準(zhǔn)差(Standard deviation)試方差的正平方根。二項(xiàng)試驗(yàn)(Binomial experment)試具有5 . 4節(jié)中4個(gè)屬性的概率試驗(yàn)。二項(xiàng)概率分布(Binomial probability distribution)試表示二項(xiàng)試驗(yàn)中n次試驗(yàn)有x次成功的概率分布。二項(xiàng)概率函數(shù)(Binomial probability function)試用來計(jì)算二項(xiàng)試
17、驗(yàn)的概率的函數(shù)。泊松概率分布(Poisson probability distribution)試表示在一段特定時(shí)間或空間中一個(gè)事件發(fā)生x次的概率的概率分布。泊松概率函數(shù)(Poisson probability function)試用來計(jì)算泊松概率的函數(shù)。超幾何概率函數(shù)( Hypergeometric probability function)試用來計(jì)算在各次試驗(yàn)非獨(dú)立時(shí), n次試驗(yàn)有x次成功的概率的函數(shù)。均勻概率分布(Uniform probability distribution)一一種連續(xù)型概率分布,其隨機(jī)變量在等長度的每一區(qū)間上取值的概率都相同。概率密度函數(shù)(Probability d
18、ensity function)一定義連續(xù)型隨機(jī)變量的概率分布的函數(shù)。正態(tài)概率分布(Normal Probability distribution)一一種連續(xù)型概率分布,其概率密度函數(shù)呈鐘型,由均值和標(biāo)準(zhǔn)差確定。標(biāo)準(zhǔn)正態(tài)概率分布(Standard normal probability distribution)均值為0、標(biāo)準(zhǔn)差為1的正態(tài)分布。連續(xù)修正因子(Continuity correction factor)一當(dāng)用連續(xù)正態(tài)概率分布來近似離散二項(xiàng)概率分布時(shí),從x值加減的0.5值。指數(shù)概率分布(Exponential probability distribution)一一種連續(xù)型概率分布,在計(jì)
19、算一個(gè)事件兩次發(fā)生之間的時(shí)間或空間的概率時(shí)有用參數(shù)(Parameter) 總體的一個(gè)數(shù)值特征,如總體均值、總體標(biāo)準(zhǔn)差、總體比率p 等等。簡單隨機(jī)抽樣(Simple random sampling) 有限總體:選擇一個(gè)樣本, n個(gè)樣本點(diǎn)中每一個(gè)等概率被選到。無限總體:選取的樣本,其中每一個(gè)元素來自同一總體并且是獨(dú)立的。無放回抽樣(Sampling without replacement) 一個(gè)元素一旦選入樣本,就從總體中剔除,不能再次被選入。放回抽樣(Sampling with replacement) 一個(gè)元素一旦選入樣本,仍被放回總體中。先前被選入的元素可能再次被選,并且在樣本中可出現(xiàn)多次(
20、多于一次)。樣本統(tǒng)計(jì)量(Sample Statistic) 一種樣本特征,如:樣本均值,樣本標(biāo)準(zhǔn)差s,樣本比率等等。樣本統(tǒng)計(jì)量用于估計(jì)總體的參數(shù)值。抽樣分布(Sampling distribution) 樣本統(tǒng)計(jì)量所有可能值構(gòu)成的概率分布。點(diǎn)估計(jì)(Point estimate) 用做總體參數(shù)估計(jì)量的值。點(diǎn)估計(jì)量(Pointestimator) 提供總體參數(shù)點(diǎn)估計(jì)的樣本統(tǒng)計(jì)量,如: 、s 或。有限總體修正系數(shù)(Finite population correction factor) 對自有限總體而非無限總體抽樣時(shí),系數(shù)用于和的公式中。經(jīng)驗(yàn)法則是當(dāng)n /N0 . 0 5時(shí),一般可忽略有限總體修正系
21、數(shù)。標(biāo)準(zhǔn)誤差(Standard error) 點(diǎn)估計(jì)量的標(biāo)準(zhǔn)差。中心極限定理(Central Limit theorem) 當(dāng)樣本容量大的時(shí)候,用正態(tài)概率分布近似和的抽樣分布。無偏性(Unbiasedness) 點(diǎn)估計(jì)量的一個(gè)性質(zhì),點(diǎn)估計(jì)量的數(shù)學(xué)期望等于所估總體參數(shù)的值。相對有效性(Relative efficiency) 對同一總體參數(shù)的兩個(gè)無偏點(diǎn)估計(jì)量,有更小標(biāo)準(zhǔn)差的點(diǎn)估計(jì)量更有效。一致性(Consistency) 點(diǎn)估計(jì)量的一個(gè)性質(zhì),樣本容量越大,所得的點(diǎn)估計(jì)值與總體參數(shù)越接近。分層簡單隨機(jī)抽樣(Stratified simple random sampling) 一種概率抽樣方式,總體
22、先分成層,然后從每層中抽取簡單隨機(jī)樣本。整群抽樣(Cluster sampling) 一種概率抽樣方式,總體先分成群,然后從中抽取一個(gè)或更多個(gè)群。系統(tǒng)抽樣(Systematic sampling) 一種概率抽樣方式,從頭k 個(gè)元素中隨機(jī)選一個(gè),然后依次往后選第k個(gè)元素。方便抽樣(Covenience sampling) 一種非概率抽樣方式,其中基于簡便選擇樣本中的元素。判斷抽樣(Judgement sampling) 一種非概率抽樣方式,其中基于研究人員的判斷選擇元素為樣本。區(qū)間估計(jì)(Interval estimate) 總體參數(shù)估計(jì)值的一個(gè)范圍,確信該范圍包括參數(shù)的值在內(nèi)。抽樣誤差(Samp
23、ling error) 無偏估計(jì)值(如樣本均值)與所估計(jì)的總體參數(shù)值(如樣本比率p)之差的絕對值??傮w均值的抽樣誤差為| - |,總體比率的抽樣誤差為| -p|。精度( Precision ) 抽樣誤差的概率解釋。置信水平(Confidence Level) 與區(qū)間估計(jì)相聯(lián)系的置信度。例如,如果某一區(qū)間估計(jì)程序所得出的全部區(qū)間中有95%包括總體參數(shù)在內(nèi),則我們稱該區(qū)間估計(jì)的構(gòu)造是基于95%的置信水平。其中,0.95稱作置信系數(shù)。邊際誤差(Margin error) 置信區(qū)間中從點(diǎn)估計(jì)值中所加上或減去的值。t分布(t Distribution) 概率分布的一族,當(dāng)總體是正態(tài)或者近似正態(tài)概率分布,并且總體標(biāo)準(zhǔn)差未知的情況下,對總體均值進(jìn)行區(qū)間估計(jì)時(shí)常用到該分布。自由度(Degrees of freedom) t分布的參數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年木材雕刻藝術(shù)品制作木工合同范本3篇
- 機(jī)織物課程設(shè)計(jì)報(bào)告
- 插值算法課課程設(shè)計(jì)
- 2022-2023年浙江省杭州市余杭區(qū)六年級下冊期中語文試卷及答案
- 燃?xì)庹n程設(shè)計(jì)紙
- 2024年岳麓版必修3英語下冊階段測試試卷971
- 2024年滬教版第一冊生物上冊階段測試試卷619
- 2025年小升初復(fù)習(xí)之小題狂練300題(選擇題):介詞(10題)
- 機(jī)械原理課程設(shè)計(jì)刨削
- 電子cad課程設(shè)計(jì)簡單點(diǎn)的
- 七年級上冊數(shù)學(xué)壓軸題幾何試卷(帶答案)
- 網(wǎng)絡(luò)安全保密教育知識普及培訓(xùn)課件
- 家長會課件:初二上期家長會課件
- 接待上級領(lǐng)導(dǎo)工作總結(jié)
- 著色滲透探傷檢測報(bào)告
- 古建工程監(jiān)理規(guī)劃范本
- 醫(yī)療質(zhì)量管理工具課件
- 2023年上海市閔行區(qū)中心醫(yī)院住院醫(yī)師規(guī)范化培訓(xùn)招生(口腔科)考試參考題庫+答案
- 單肺通氣中的麻醉管理
- 建筑施工安全檢查標(biāo)準(zhǔn)jgj59-2023
- 2023-2024學(xué)年江蘇省高郵市小學(xué)數(shù)學(xué)六年級上冊期末通關(guān)考試題
評論
0/150
提交評論