衛(wèi)生統(tǒng)計學-衛(wèi)統(tǒng)4定量資料的統(tǒng)計描述課件_第1頁
衛(wèi)生統(tǒng)計學-衛(wèi)統(tǒng)4定量資料的統(tǒng)計描述課件_第2頁
衛(wèi)生統(tǒng)計學-衛(wèi)統(tǒng)4定量資料的統(tǒng)計描述課件_第3頁
衛(wèi)生統(tǒng)計學-衛(wèi)統(tǒng)4定量資料的統(tǒng)計描述課件_第4頁
衛(wèi)生統(tǒng)計學-衛(wèi)統(tǒng)4定量資料的統(tǒng)計描述課件_第5頁
已閱讀5頁,還剩22頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

衛(wèi)生統(tǒng)計學-衛(wèi)統(tǒng)4定量資料的統(tǒng)計描述課件定量資料基本概念與特點集中趨勢描述指標離散程度描述指標偏態(tài)與峰態(tài)分布特征描述正態(tài)性檢驗方法及應用場景異常值識別與處理策略contents目錄01定量資料基本概念與特點定量資料是指用數(shù)值大小表示的觀察值,通常包括計量資料和等級資料。定義計量資料等級資料用測量或計數(shù)手段得到的數(shù)值變量,如身高、體重、血壓等。將觀察對象按照某種屬性或特征的程度或等級進行分組,如病情輕重、療效等級等。030201定量資料定義及分類數(shù)值性連續(xù)性離散性可變性定量資料特點分析01020304定量資料以數(shù)值形式表示,可以進行數(shù)學運算和統(tǒng)計分析。許多定量資料是連續(xù)的,可以取任何數(shù)值,如身高、體重等。部分定量資料是離散的,只能取整數(shù)或特定數(shù)值,如人口數(shù)、病例數(shù)等。定量資料在不同個體或不同時間可能存在差異,具有可變性。常見數(shù)據(jù)類型舉例如身高、體重、血壓等生理指標,在一般人群中呈正態(tài)分布。如醫(yī)學研究中某些生化指標,可能呈偏態(tài)分布。如某疾病的發(fā)病率、死亡率等,屬于二項分布范疇。如單位時間內某事件的發(fā)生次數(shù),符合泊松分布特點。正態(tài)分布資料偏態(tài)分布資料二項分布資料泊松分布資料02集中趨勢描述指標定義計算公式適用范圍特性算術均數(shù)所有觀察值相加后除以觀察值個數(shù)所得的商。適用于對稱分布,特別是正態(tài)分布的資料。算術均數(shù)=總和/觀察值個數(shù)算術均數(shù)易受極端值影響,對于偏態(tài)分布資料,算術均數(shù)的代表性較差。0102幾何均數(shù)定義n個觀察值連乘積的n次方根。幾何均數(shù)計算公式幾何均數(shù)=(x1*x2*...*xn)^(1/n)中位數(shù)定義將一組觀察值按大小順序排列,位于中間位置的數(shù)。中位數(shù)計算若觀察值個數(shù)為奇數(shù),則中位數(shù)是位于中間的數(shù);若為偶數(shù),則中位數(shù)是中間兩個數(shù)的平均數(shù)。適用范圍幾何均數(shù)適用于反映一組經(jīng)對數(shù)轉換后呈對稱分布的變量在數(shù)量上的平均水平;中位數(shù)適用于各種分布類型的資料,尤其適用于偏態(tài)分布資料和分布不確定的資料。030405幾何均數(shù)與中位數(shù)0102眾數(shù)定義一組觀察值中出現(xiàn)次數(shù)最多的數(shù)。眾數(shù)計算直接觀察或計算頻數(shù)分布表。百分位數(shù)定義將一組觀察值按大小順序排列,某一百分位置的數(shù)。百分位數(shù)計算確定百分位位置,查找對應數(shù)值。適用范圍眾數(shù)適用于各種分布類型的資料,常用于描述分類資料的集中趨勢;百分位數(shù)常用于描述定量資料的觀察值在某一百分位置的水平,如百分位數(shù)間距可用于描述離散程度。030405眾數(shù)與百分位數(shù)03離散程度描述指標一組數(shù)據(jù)的最大值與最小值之差,反映數(shù)據(jù)的波動范圍。極差上四分位數(shù)與下四分位數(shù)之差,反映中間50%數(shù)據(jù)的離散程度。四分位數(shù)間距極差與四分位數(shù)間距各數(shù)據(jù)與均數(shù)之差的平方和的平均數(shù),反映數(shù)據(jù)的離散程度。方差的算術平方根,與原始數(shù)據(jù)單位相同,更直觀地反映數(shù)據(jù)的離散程度。方差與標準差標準差方差變異系數(shù)標準差與均數(shù)之比,用于比較不同單位或均數(shù)相差較大的幾組數(shù)據(jù)的離散程度。意義消除單位或均數(shù)對離散程度比較的影響,使得不同組數(shù)據(jù)間的離散程度比較更為客觀。變異系數(shù)及其意義04偏態(tài)與峰態(tài)分布特征描述偏態(tài)分布概念偏態(tài)分布是指頻數(shù)分布不對稱,集中位置偏向一側的分布。根據(jù)集中位置偏向的不同,可分為左偏態(tài)分布和右偏態(tài)分布。判斷方法通過計算偏態(tài)系數(shù)(skewness)來判斷分布是否偏態(tài)。偏態(tài)系數(shù)大于0為右偏態(tài),小于0為左偏態(tài),等于0為對稱分布。偏態(tài)分布概念及判斷方法峰態(tài)分布是指頻數(shù)分布峰的尖銳程度或扁平程度。根據(jù)峰的形狀不同,可分為尖峰分布、平峰分布和標準峰分布。峰態(tài)分布概念通過計算峰態(tài)系數(shù)(kurtosis)來判斷分布是否峰態(tài)。峰態(tài)系數(shù)大于3為尖峰分布,小于3為平峰分布,等于3為標準峰分布。判斷方法峰態(tài)分布概念及判斷方法對集中趨勢的影響偏態(tài)分布時,算術均數(shù)受極端值影響較大,中位數(shù)和幾何均數(shù)相對穩(wěn)定。峰態(tài)分布時,算術均數(shù)相對穩(wěn)定,但中位數(shù)和幾何均數(shù)可能受極端值影響。對離散程度的影響偏態(tài)分布時,標準差受極端值影響較大,四分位數(shù)間距相對穩(wěn)定。峰態(tài)分布時,標準差相對穩(wěn)定,但四分位數(shù)間距可能受極端值影響。對統(tǒng)計推斷的影響在進行參數(shù)檢驗或非參數(shù)檢驗時,需要考慮樣本數(shù)據(jù)是否服從正態(tài)分布或近似正態(tài)分布。如果數(shù)據(jù)呈現(xiàn)明顯的偏態(tài)或峰態(tài)分布,可能會影響檢驗結果的準確性和可靠性。因此,在進行統(tǒng)計推斷前,需要對數(shù)據(jù)的分布形態(tài)進行檢驗和評估。偏態(tài)和峰態(tài)對數(shù)據(jù)分析影響05正態(tài)性檢驗方法及應用場景

圖形法直觀判斷正態(tài)性直方圖通過繪制數(shù)據(jù)的直方圖,觀察數(shù)據(jù)分布形態(tài),若呈現(xiàn)鐘型或近似鐘型,可初步判斷為正態(tài)分布。P-P圖與Q-Q圖將數(shù)據(jù)與理論的正態(tài)分布進行比較,若點基本在一條直線上,則數(shù)據(jù)近似服從正態(tài)分布。箱線圖通過箱線圖判斷數(shù)據(jù)分布的偏態(tài)和異常值情況,輔助判斷正態(tài)性。數(shù)值法精確檢驗正態(tài)性適用于大樣本數(shù)據(jù),通過比較經(jīng)驗分布函數(shù)與理論正態(tài)分布函數(shù)的差異來檢驗正態(tài)性。Kolmogorov-Smirnov檢驗計算數(shù)據(jù)的偏度和峰度,若偏度接近0且峰度接近3,則數(shù)據(jù)近似服從正態(tài)分布。偏度與峰度檢驗適用于小樣本數(shù)據(jù),通過比較樣本數(shù)據(jù)與理論正態(tài)分布的差異來檢驗正態(tài)性。Shapiro-Wilk檢驗作出推斷結論根據(jù)P值與顯著性水平的比較結果,作出是否拒絕原假設的推斷結論。確定P值根據(jù)檢驗統(tǒng)計量的值和設定的顯著性水平,確定P值。計算檢驗統(tǒng)計量根據(jù)所選的檢驗方法計算相應的檢驗統(tǒng)計量。提出假設設定原假設H0(數(shù)據(jù)服從正態(tài)分布)和備擇假設H1(數(shù)據(jù)不服從正態(tài)分布)。選擇檢驗方法根據(jù)樣本量大小和數(shù)據(jù)特征選擇合適的檢驗方法。正態(tài)性假設檢驗流程06異常值識別與處理策略異常值是指在數(shù)據(jù)集中明顯偏離其他數(shù)據(jù)點的觀測值,可能是由于測量錯誤、數(shù)據(jù)錄入錯誤或自然變異等原因產(chǎn)生的。異常值定義如儀器故障、操作不當?shù)?。測量誤差如數(shù)據(jù)輸入時的手誤、數(shù)據(jù)格式錯誤等。數(shù)據(jù)錄入錯誤某些觀測值本身就屬于極端情況,如生物學上的異常個體。自然變異異常值定義及產(chǎn)生原因通過繪制箱線圖,觀察數(shù)據(jù)分布,異常值通常位于箱體的外部。箱線圖法Z-score法IQR法其他方法計算每個觀測值的Z-score,將Z-score超過一定閾值(如±3)的觀測值視為異常值。計算四分位距(IQR),將小于Q1-1.5*IQR或大于Q3+1.5*IQR的觀測值視為異常值。如MAD法、Tukey'sFences等。異常值識別方法介紹處理異常值策略探討保留異常值若異常值為真實觀測結果且符合研究目的,可將其保留在數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論