版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
商務(wù)統(tǒng)計(jì)學(xué)與SPSS應(yīng)用主講:黃英姿
博士第一講抽樣及樣本什么是統(tǒng)計(jì)學(xué)?統(tǒng)計(jì)學(xué)是關(guān)于數(shù)據(jù)的科學(xué),其內(nèi)容包括數(shù)據(jù)的收集、分類、匯總、組織、分析和解釋。統(tǒng)計(jì)學(xué)在商務(wù)及經(jīng)濟(jì)中的應(yīng)用:會(huì)計(jì)金融營(yíng)銷生產(chǎn)經(jīng)濟(jì)什么是數(shù)據(jù)?數(shù)據(jù)是經(jīng)過(guò)收集、分析、概括后用以表達(dá)和說(shuō)明的事實(shí)和數(shù)字;個(gè)體、變量及觀測(cè)值質(zhì)量數(shù)據(jù)及數(shù)量數(shù)據(jù)截面數(shù)據(jù)和時(shí)間序列數(shù)據(jù)數(shù)據(jù)的獲得現(xiàn)有數(shù)據(jù)調(diào)研數(shù)據(jù)數(shù)據(jù)收集中的陷井基本概念總體、個(gè)體與樣本描述性統(tǒng)計(jì)學(xué):研究一組數(shù)據(jù)的組織、整理及描述的統(tǒng)計(jì)學(xué)分支推斷統(tǒng)計(jì)學(xué):利用樣本數(shù)據(jù)對(duì)總體進(jìn)行推斷的統(tǒng)計(jì)學(xué)分支總體參數(shù):用來(lái)描述總體特征的概括性數(shù)字統(tǒng)計(jì)量:用來(lái)描述樣本特征的概括性數(shù)字變量抽樣及抽樣方法抽樣從總體中抽取樣本的過(guò)程抽樣方法概率抽樣簡(jiǎn)單隨機(jī)抽樣、等距抽樣、分層抽樣、分群抽樣非概率抽樣便利抽樣、判斷抽樣、配額抽樣、滾雪球抽樣質(zhì)量數(shù)據(jù)匯總
頻數(shù)分布FrequencyDistributions相對(duì)頻數(shù)分布RelativeFrequencyDistributions百分?jǐn)?shù)頻數(shù)分布PercentFrequencyDistributions條形圖BarGraph餅形圖PieChart頻數(shù)分布
頻數(shù)分布是用數(shù)據(jù)概括表的形式不列示若干個(gè)互不重疊分組中每組數(shù)據(jù)值出現(xiàn)的次數(shù);編制頻數(shù)分布表的目的是揭示表面數(shù)據(jù)的內(nèi)涵,而這種數(shù)據(jù)內(nèi)涵很難迅速?gòu)脑紨?shù)據(jù)中獲取。相對(duì)頻數(shù)分布和百分?jǐn)?shù)頻數(shù)分布
相對(duì)頻數(shù)是各組數(shù)據(jù)出現(xiàn)的頻數(shù)占數(shù)據(jù)總數(shù)的比例;相對(duì)頻數(shù)分布是表明每一組的相對(duì)頻數(shù)的數(shù)據(jù)集的表格總匯;百分?jǐn)?shù)頻數(shù)分布是相對(duì)頻數(shù)乘以100;百分?jǐn)?shù)頻數(shù)分布是表明每一組的百分?jǐn)?shù)頻數(shù)的數(shù)據(jù)集的表格總匯。條形圖條形圖是用圖的方式描述已概括成頻數(shù)、相對(duì)頻數(shù)或百分?jǐn)?shù)頻數(shù)分布的質(zhì)量數(shù)據(jù)的方法;在圖形的橫軸為每一組別的標(biāo)記;縱軸為頻數(shù)、相對(duì)頻數(shù)、百分?jǐn)?shù)頻數(shù);用固定寬度的條繪制每一標(biāo)記,擴(kuò)展條的高度達(dá)到縱軸上表示的各組別的頻數(shù)、相對(duì)頻數(shù)或百分?jǐn)?shù)頻數(shù);條形相對(duì)獨(dú)立以強(qiáng)調(diào)每一類是一獨(dú)立的事實(shí)。餅形圖餅形圖也是常用的描繪質(zhì)量數(shù)據(jù)相對(duì)頻數(shù)分布的圖形方法;先畫(huà)圓,然后用相對(duì)頻數(shù)把圓劃分為扇形。其角度大小與相對(duì)頻數(shù)對(duì)應(yīng)數(shù)量(定量)數(shù)據(jù)匯總頻數(shù)分布FrequencyDistributions相對(duì)頻數(shù)分布RelativeFrequencyDistributions百分?jǐn)?shù)頻數(shù)分布PercentFrequencyDistributions點(diǎn)圖Dotplot直方圖Histogram累積分布CumulativeDistribution穹形圖Ogive頻數(shù)分布確定無(wú)重復(fù)的組別數(shù)一般為為5-20個(gè)組大樣本數(shù)據(jù)分較多的組小樣本數(shù)據(jù)分較少的組確定各組間的組距各組間的組距相同近似組距為
近似組距=-----------------------------
最大數(shù)據(jù)值-最小數(shù)據(jù)值組數(shù)頻數(shù)分布確定組上線與組下線下線確定分配給該組可能的最小數(shù)據(jù)值;上線確定分配給該組可能的最大數(shù)據(jù)值;上、下線不一定是所給數(shù)據(jù)值;上、下線的確定不唯一,可依據(jù)數(shù)據(jù)中小數(shù)點(diǎn)的位置選取適當(dāng)?shù)纳?、下線;上、下線的確定應(yīng)使得每個(gè)數(shù)據(jù)屬且只屬于其中一個(gè)組。相對(duì)頻數(shù)和百分?jǐn)?shù)頻數(shù)相對(duì)頻數(shù)分布和百分?jǐn)?shù)頻數(shù)分布相對(duì)頻數(shù)是各組數(shù)據(jù)出現(xiàn)的頻數(shù)占數(shù)據(jù)總數(shù)的比例;相對(duì)頻數(shù)分布是表明每一組的相對(duì)頻數(shù)的數(shù)據(jù)集的表格總匯;百分?jǐn)?shù)頻數(shù)分布是相對(duì)頻數(shù)乘以100;百分?jǐn)?shù)頻數(shù)分布是表明每一組的百分?jǐn)?shù)頻數(shù)的數(shù)據(jù)集的表格總匯。點(diǎn)圖點(diǎn)圖是用圖形概括數(shù)據(jù)最簡(jiǎn)單的方法之一;點(diǎn)圖用橫坐標(biāo)軸顯示數(shù)據(jù)的值域,然后用小圓點(diǎn)半每個(gè)數(shù)據(jù)值標(biāo)在坐標(biāo)軸的上方直方圖直方圖是將數(shù)據(jù)所反映的分布直觀地顯示出來(lái)的一種常用方法;橫軸為所感興趣的變量,縱軸為頻數(shù)、相對(duì)頻數(shù)或百分頻數(shù);每一組的頻數(shù)、相對(duì)頻數(shù)或百分?jǐn)?shù)頻數(shù)用長(zhǎng)方形表示,長(zhǎng)方形的底在橫軸上,寬是組距,高是相應(yīng)的頻數(shù)、相對(duì)頻數(shù)或百分?jǐn)?shù)頻數(shù);不像條形圖,直方圖在鄰近的組間沒(méi)有分隔。累積分布累積頻數(shù)分布表示小于或等于每一組上限的數(shù)據(jù)值的個(gè)數(shù)的取值情況;累積相對(duì)頻數(shù)分布表示小于或等于每一組上限的數(shù)據(jù)值所點(diǎn)比例的取值情況;累積百分?jǐn)?shù)頻數(shù)分布就是累積相對(duì)頻數(shù)與100乘積穹形圖穹形圖即是累積頻數(shù)分布或累積相對(duì)頻數(shù)分布的圖形;橫軸為所感興趣的變量,縱軸為累積頻數(shù)或累積相對(duì)頻數(shù);探索性數(shù)據(jù)分析放在后面與數(shù)值方法一起講交叉分組列表交叉分組列表是一種同時(shí)匯總兩個(gè)變量數(shù)據(jù)的表格方法一般在表格的左邊和頂端的標(biāo)記定義兩個(gè)變量的組數(shù)交叉分組列表揭示了所列兩個(gè)變量之間的內(nèi)在關(guān)系散點(diǎn)圖散點(diǎn)圖是將兩個(gè)變量之間的關(guān)系直觀地顯示出來(lái)的一種方法數(shù)值方法位置的度量MeasuresofLocation離散程度的度量Measuresofdispersion形狀的度量MeasuresofShape位置的度量平均數(shù)Mean中位數(shù)Median眾數(shù)Mode百分位數(shù)Percentiles四分位數(shù)Quartiles平均數(shù)所有數(shù)據(jù)之和與數(shù)據(jù)個(gè)數(shù)的商如果數(shù)據(jù)集是總體,總體平均值(populationmean)為如果數(shù)據(jù)集為樣本,樣本平均值(Simplemean)為中位數(shù)若數(shù)據(jù)的個(gè)數(shù)是奇數(shù),當(dāng)把所有數(shù)據(jù)按升序排列時(shí),中位數(shù)就是處在中心位置的數(shù)若數(shù)據(jù)的個(gè)數(shù)是偶數(shù),當(dāng)把所有數(shù)據(jù)按升序排列時(shí),中位數(shù)就是處在中心兩個(gè)數(shù)的平均數(shù)
眾數(shù)出現(xiàn)頻數(shù)最高的數(shù)
如果有多于一個(gè)眾數(shù)存在,則稱數(shù)據(jù)是多峰的百分位數(shù)第p個(gè)百分位數(shù)是這樣的數(shù)據(jù)值:至少有p%個(gè)數(shù)據(jù)值跟它一樣或比它?。恢辽儆?100-p)%個(gè)數(shù)據(jù)值跟它一樣大或比它大。百分位數(shù)的計(jì)算:增序排列數(shù)據(jù);計(jì)算指數(shù)I=(p/100)n若i不是整數(shù),將其向上取整,則p分位數(shù)是第i項(xiàng);若i是整數(shù),則p分位數(shù)是第i項(xiàng)與第i+1項(xiàng)的數(shù)據(jù)的平均值。百分位數(shù)例有數(shù)據(jù)集6,3,8,10,6,20,5,4為求其第20個(gè)百分?jǐn)?shù),先將原數(shù)據(jù)集排序
3
4
5
6
68
10
20計(jì)算指數(shù)i=(20/100)*8≈2則原數(shù)據(jù)集的第20個(gè)百分位數(shù)就是位于第二項(xiàng)的4。四分位數(shù)四分位數(shù)是特定的百分?jǐn)?shù)。第一個(gè)四分位數(shù)為25%百分位數(shù);分二個(gè)四分位數(shù)為50%百分位數(shù)即中位數(shù);第三個(gè)四分位數(shù)為75%百分位數(shù)。離散程度的度量
全距Range四分位點(diǎn)內(nèi)距inter-quartileRange方差Variance標(biāo)準(zhǔn)差StandardDeviation標(biāo)準(zhǔn)差系數(shù)CoefficientofVariation全距全距是數(shù)據(jù)中最大值與最小值間的差距全距是數(shù)據(jù)離散程度最簡(jiǎn)單的描述全距對(duì)最大數(shù)據(jù)及最小數(shù)據(jù)敏感四分位點(diǎn)內(nèi)距
四分位點(diǎn)內(nèi)距是第一與第一四分位數(shù)間的差距是中間50%的數(shù)據(jù)的全距它能夠克服極端數(shù)據(jù)的影響方差方差是各數(shù)據(jù)值與其平均值之間的平均差異如果數(shù)據(jù)集是總體,總體方差為如果數(shù)據(jù)集為樣本,樣本方差為標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差為方差的正平方根標(biāo)準(zhǔn)差具有與原始數(shù)據(jù)相同的計(jì)量單位,較方差更便于比較如果數(shù)據(jù)集是總體,則總體標(biāo)準(zhǔn)差為如果數(shù)據(jù)集是樣本,則樣本標(biāo)準(zhǔn)差為變異系數(shù)變異系數(shù)是標(biāo)準(zhǔn)差相對(duì)于平均數(shù)的大小的度量如果數(shù)據(jù)集為總體,變異系數(shù)為如果數(shù)據(jù)集為樣本,變異系數(shù)為平均數(shù)和方差的應(yīng)用Z分?jǐn)?shù)z-Scores切比曉夫定理Chebyshev’sTheorem經(jīng)驗(yàn)法則TheEmpiricalRule異常值的檢驗(yàn)DetectingOutliersZ分?jǐn)?shù)Z-分?jǐn)?shù)通常稱為標(biāo)準(zhǔn)化數(shù)值Z-分?jǐn)?shù)的意義是數(shù)據(jù)值偏離平均數(shù)標(biāo)準(zhǔn)差的個(gè)數(shù)Z-分?jǐn)?shù)大于0的數(shù)據(jù)是那些比平均數(shù)大的數(shù)據(jù)值Z-分?jǐn)?shù)小于0的數(shù)據(jù)是那些比平均數(shù)小的數(shù)據(jù)值Z-分?jǐn)?shù)等于0的數(shù)據(jù)是那些與平均數(shù)相等的數(shù)據(jù)值一個(gè)數(shù)據(jù)集經(jīng)過(guò)標(biāo)準(zhǔn)化之后,其平均值變?yōu)?,標(biāo)準(zhǔn)差變成1切比曉夫定理至少(1-1/k2)個(gè)數(shù)據(jù)落在平均數(shù)k倍標(biāo)準(zhǔn)差范圍內(nèi),其中k是大于1的任何數(shù)值至少75%的數(shù)據(jù)落在平均數(shù)的k=2標(biāo)準(zhǔn)差范圍內(nèi)至少89%的數(shù)據(jù)落在平均數(shù)的k=3標(biāo)準(zhǔn)差范圍內(nèi)至少94%的數(shù)據(jù)落在平均數(shù)的k=4標(biāo)準(zhǔn)差范圍內(nèi)經(jīng)驗(yàn)法則對(duì)于具有鐘形分布的數(shù)據(jù)集而言大約68%的數(shù)據(jù)落在平均數(shù)的1倍標(biāo)準(zhǔn)差范圍內(nèi)大約95%的數(shù)據(jù)落在平均數(shù)的2倍標(biāo)準(zhǔn)差范圍內(nèi)幾乎所有的數(shù)據(jù)落在平均數(shù)的3倍標(biāo)準(zhǔn)差范圍內(nèi)異常值的檢驗(yàn)數(shù)據(jù)集中出現(xiàn)的非正常大或非正常小的數(shù)據(jù)值稱為異常值Z-分?jǐn)?shù)值低于-3或高于3的數(shù)據(jù)可能是異常值異常值的出現(xiàn)可能是由于記錄錯(cuò)誤,也可能是記錄正確的非正常數(shù)據(jù)值異常值也可能來(lái)自于不同的總體探索性數(shù)據(jù)分析
探索性數(shù)據(jù)分析技術(shù)是由簡(jiǎn)單運(yùn)算及容易繪制的圖形組成,可用快速匯總數(shù)據(jù)。莖葉圖Stem-andLeafdisplay五數(shù)概括Five-NumberSummary箱圖Boxplot莖葉圖莖葉圖是一種簡(jiǎn)單的對(duì)數(shù)據(jù)進(jìn)行快束描繪的數(shù)據(jù)匯總方法莖葉圖不僅提供了數(shù)據(jù)排序,同時(shí)還顯示了數(shù)據(jù)的分布信息與直方圖有相似之處,但莖葉圖還顯示了實(shí)際的數(shù)據(jù)值數(shù)據(jù)的首位或首幾位放置在直線的左邊—稱為莖數(shù)據(jù)的末位(只是最后一位)放置在直線的右邊--稱為葉五數(shù)概括最小數(shù)據(jù)值SmallestValue第一個(gè)四分位數(shù)FirstQuartile中位數(shù)Median第三個(gè)四分位數(shù)ThirdQuartile最大值LargestValue箱圖以第1和第3四分位數(shù)(Q1和Q3)作為箱子兩端,其間的間距稱為四分位間距,記為IQR=Q3-Q1箱圖的下限制線位于比Q1低1.5倍IQR的位置上,上限制線位于比Q3高1.5倍IQR的位置上限制線以外的是異常值雙變量相關(guān)關(guān)系度量
協(xié)方差
Covariance相關(guān)系數(shù)CorrelationCoefficient協(xié)方差如果數(shù)據(jù)集是總體,協(xié)方差為如果數(shù)據(jù)集是樣本,協(xié)方差為正值表示正相關(guān),負(fù)值表示負(fù)相關(guān)相關(guān)系數(shù)CorrelationCoefficient如果數(shù)據(jù)集是總體,相關(guān)系數(shù)為如果數(shù)據(jù)集是樣本,相關(guān)系數(shù)為相關(guān)系數(shù)的值在-1與1之間相關(guān)系數(shù)的值接近-1表示較顯著地負(fù)線性相關(guān)相關(guān)系數(shù)的值接近1表示較顯著地正線性相關(guān)加權(quán)平均數(shù)和分組數(shù)據(jù)
的加權(quán)平均數(shù)
加權(quán)平均數(shù)TheWeightedMean分組數(shù)據(jù)GroupedData
加權(quán)平均數(shù)當(dāng)數(shù)據(jù)來(lái)處總體時(shí)代替平均值是一個(gè)特殊的加權(quán)平均數(shù)分組數(shù)據(jù)分組數(shù)據(jù)的樣本均值為是第i組中值是第i組的頻數(shù)
n為樣本容量分組數(shù)據(jù)的樣本方差為分組數(shù)據(jù)分組數(shù)據(jù)的總體均值為是第i組中值是第i組的頻數(shù)
n為樣本容量分組數(shù)據(jù)的樣本方差為審計(jì)時(shí)間頻數(shù)分布表審計(jì)時(shí)間(天)
頻數(shù)10-1415-1920-2425-2930-34合計(jì)4852120審計(jì)時(shí)間頻數(shù)分布表樣本均值為樣本方差為形狀的度量描述數(shù)據(jù)是如果分布的形狀的度量對(duì)稱性(Symmetric)或歪曲性(Skewe
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 鋼天橋施工方案
- 二零二五年度農(nóng)產(chǎn)品加工出口合作合同模板3篇
- 基于癌癥相關(guān)多類型數(shù)據(jù)的生存預(yù)測(cè)深度學(xué)習(xí)方法研究
- 2025合法股份贈(zèng)與合同
- 2025年辦公家具訂貨合同樣本
- 大連金牌名校數(shù)學(xué)試卷
- 2025年度房屋拆除工程進(jìn)度款支付及結(jié)算合同4篇
- 9心中的“110”(說(shuō)課稿)-2024-2025學(xué)年道德與法治三年級(jí)上冊(cè)統(tǒng)編版001
- 外墻落水管施工方案
- 一年級(jí)數(shù)學(xué)計(jì)算題專項(xiàng)練習(xí)匯編
- 2024虛擬現(xiàn)實(shí)產(chǎn)業(yè)布局白皮書(shū)
- 車站值班員(中級(jí))鐵路職業(yè)技能鑒定考試題及答案
- JTG∕T E61-2014 公路路面技術(shù)狀況自動(dòng)化檢測(cè)規(guī)程
- 高中英語(yǔ)短語(yǔ)大全(打印版)
- 2024年資格考試-對(duì)外漢語(yǔ)教師資格證筆試參考題庫(kù)含答案
- 軟件研發(fā)安全管理制度
- 三位數(shù)除以兩位數(shù)-豎式運(yùn)算300題
- 寺院消防安全培訓(xùn)課件
- 比摩阻-管徑-流量計(jì)算公式
- GB/T 42430-2023血液、尿液中乙醇、甲醇、正丙醇、丙酮、異丙醇和正丁醇檢驗(yàn)
- 五年級(jí)數(shù)學(xué)應(yīng)用題100道
評(píng)論
0/150
提交評(píng)論