描述性統(tǒng)計(jì)分析課件_第1頁
描述性統(tǒng)計(jì)分析課件_第2頁
描述性統(tǒng)計(jì)分析課件_第3頁
描述性統(tǒng)計(jì)分析課件_第4頁
描述性統(tǒng)計(jì)分析課件_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

描述性統(tǒng)計(jì)分析課件引言描述性統(tǒng)計(jì)基本概念數(shù)據(jù)收集與整理數(shù)據(jù)分布的描述集中趨勢的度量離散程度的度量偏態(tài)與峰態(tài)的度量描述性統(tǒng)計(jì)分析在實(shí)際應(yīng)用中的注意事項(xiàng)contents目錄01引言目的本課件旨在幫助學(xué)習(xí)者掌握描述性統(tǒng)計(jì)分析的基本概念、方法及應(yīng)用,培養(yǎng)數(shù)據(jù)處理和分析能力。背景在當(dāng)今數(shù)據(jù)驅(qū)動(dòng)的時(shí)代,描述性統(tǒng)計(jì)分析作為數(shù)據(jù)處理的基礎(chǔ)手段,對于各個(gè)領(lǐng)域的研究和實(shí)踐具有重要意義。通過本課程的學(xué)習(xí),學(xué)習(xí)者將能夠更有效地理解和應(yīng)用描述性統(tǒng)計(jì)分析方法,從而更好地應(yīng)對現(xiàn)實(shí)生活中的數(shù)據(jù)問題。目的和背景數(shù)據(jù)整理和展示講解數(shù)據(jù)的分類、整理方法,以及如何使用圖表等方式進(jìn)行數(shù)據(jù)可視化。離散程度度量探討方差、標(biāo)準(zhǔn)差和四分位距等離散程度度量指標(biāo)的計(jì)算方法和意義。案例分析和實(shí)踐通過具體案例,演示描述性統(tǒng)計(jì)分析方法的應(yīng)用,并提供實(shí)踐機(jī)會(huì),讓學(xué)習(xí)者親自動(dòng)手進(jìn)行數(shù)據(jù)分析和解讀?;靖拍罱榻B描述性統(tǒng)計(jì)分析的定義、作用及常用術(shù)語。集中趨勢度量闡述平均數(shù)、中位數(shù)和眾數(shù)等集中趨勢度量指標(biāo)的計(jì)算方法和應(yīng)用場景。分布形態(tài)描述介紹偏態(tài)和峰態(tài)等分布形態(tài)描述指標(biāo),以及如何通過直方圖和箱線圖等方式進(jìn)行分布形態(tài)的可視化。010203040506課件內(nèi)容概述02描述性統(tǒng)計(jì)基本概念

統(tǒng)計(jì)量與總體參數(shù)統(tǒng)計(jì)量描述樣本特征的數(shù),如樣本均值、樣本方差等??傮w參數(shù)描述總體特征的數(shù),如總體均值、總體方差等。統(tǒng)計(jì)量與總體參數(shù)的關(guān)系統(tǒng)計(jì)量是總體參數(shù)的估計(jì)值,通過樣本數(shù)據(jù)計(jì)算得出。定量數(shù)據(jù)和定性數(shù)據(jù)。定量數(shù)據(jù)可進(jìn)一步分為離散型和連續(xù)型數(shù)據(jù)。數(shù)據(jù)類型主要來源于觀察、實(shí)驗(yàn)和調(diào)查。其中,觀察和實(shí)驗(yàn)是獲取第一手?jǐn)?shù)據(jù)的主要方法,調(diào)查則是獲取第二手?jǐn)?shù)據(jù)的主要手段。數(shù)據(jù)來源數(shù)據(jù)的類型與來源根據(jù)變量的性質(zhì)可分為數(shù)值型變量和分類變量。數(shù)值型變量可進(jìn)一步分為離散型和連續(xù)型變量,分類變量可分為有序分類變量和無序分類變量。變量的測量尺度可分為定類尺度、定序尺度、定距尺度和定比尺度。不同的測量尺度對應(yīng)著不同的統(tǒng)計(jì)方法和分析手段。變量的分類與測量尺度測量尺度變量分類03數(shù)據(jù)收集與整理數(shù)據(jù)收集方法通過直接觀察研究對象來收集數(shù)據(jù),如實(shí)驗(yàn)、調(diào)查等。通過設(shè)計(jì)問卷,向被調(diào)查者提出問題,收集其回答的數(shù)據(jù)。通過與被調(diào)查者進(jìn)行面對面交流,了解其觀點(diǎn)、態(tài)度等,收集相關(guān)數(shù)據(jù)。通過查閱相關(guān)文獻(xiàn)資料,獲取歷史數(shù)據(jù)、前人研究成果等。觀察法問卷法訪談法文獻(xiàn)法數(shù)據(jù)清洗數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)分組數(shù)據(jù)匯總數(shù)據(jù)整理過程01020304去除重復(fù)、無效、異常等數(shù)據(jù),保證數(shù)據(jù)質(zhì)量。將數(shù)據(jù)轉(zhuǎn)換為適合分析的形式,如數(shù)值型、分類型等。根據(jù)研究目的,將數(shù)據(jù)按照一定的標(biāo)準(zhǔn)進(jìn)行分組。對分組后的數(shù)據(jù)進(jìn)行匯總統(tǒng)計(jì),計(jì)算各組數(shù)據(jù)的頻數(shù)、頻率等。準(zhǔn)確性評估完整性評估一致性評估及時(shí)性評估數(shù)據(jù)質(zhì)量評估檢查數(shù)據(jù)是否真實(shí)反映了實(shí)際情況,是否存在誤差。檢查數(shù)據(jù)之間是否存在矛盾、不一致的情況。檢查數(shù)據(jù)是否完整,是否存在缺失值、異常值等。檢查數(shù)據(jù)是否及時(shí)反映了最新情況,是否存在滯后現(xiàn)象。04數(shù)據(jù)分布的描述用于展示數(shù)據(jù)分布的表格,列出各個(gè)數(shù)值范圍及其對應(yīng)的頻數(shù)(出現(xiàn)次數(shù))。頻數(shù)分布表直方圖用途用矩形面積表示頻數(shù)的圖形,矩形的高度代表頻數(shù),寬度代表數(shù)值范圍。直觀展示數(shù)據(jù)的分布情況,便于發(fā)現(xiàn)數(shù)據(jù)的集中趨勢、離散程度以及異常值。030201頻數(shù)分布表與直方圖將頻數(shù)逐一累加得到的數(shù)值,表示小于或等于某一數(shù)值的數(shù)據(jù)個(gè)數(shù)。累計(jì)頻數(shù)累計(jì)頻數(shù)與總頻數(shù)的比值,表示小于或等于某一數(shù)值的數(shù)據(jù)所占的百分比。累計(jì)頻率了解數(shù)據(jù)的整體分布情況,便于對數(shù)據(jù)進(jìn)行排序和分組。用途累計(jì)頻數(shù)與累計(jì)頻率對稱分布數(shù)據(jù)以均值為中心對稱分布,如正態(tài)分布。偏態(tài)分布數(shù)據(jù)分布不對稱,分為左偏態(tài)(負(fù)偏態(tài))和右偏態(tài)(正偏態(tài))。峰態(tài)分布數(shù)據(jù)分布的尖峭程度,分為尖峰、平峰和肥尾等。用途描述數(shù)據(jù)分布的形態(tài)和特征,為進(jìn)一步的統(tǒng)計(jì)分析提供依據(jù)。例如,正態(tài)分布是許多統(tǒng)計(jì)方法的基礎(chǔ)假設(shè)之一,了解數(shù)據(jù)是否服從正態(tài)分布對于選擇合適的統(tǒng)計(jì)方法具有重要意義。01020304數(shù)據(jù)分布的形態(tài)與特征05集中趨勢的度量算術(shù)平均數(shù)是一組數(shù)據(jù)的總和除以數(shù)據(jù)的個(gè)數(shù),用于反映數(shù)據(jù)集中趨勢的一個(gè)統(tǒng)計(jì)量。定義算術(shù)平均數(shù)=數(shù)據(jù)總和/數(shù)據(jù)個(gè)數(shù)計(jì)算公式算術(shù)平均數(shù)易受極端值影響,對于偏態(tài)分布的數(shù)據(jù)可能不太適用。特點(diǎn)算術(shù)平均數(shù)中位數(shù)定義01將一組數(shù)據(jù)按大小順序排列,位于中間位置的數(shù)即為中位數(shù)。若數(shù)據(jù)量為奇數(shù),則中位數(shù)是中間那個(gè)數(shù);若數(shù)據(jù)量為偶數(shù),則中位數(shù)是中間兩個(gè)數(shù)的平均值。眾數(shù)定義02眾數(shù)是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)。特點(diǎn)03中位數(shù)和眾數(shù)不易受極端值影響,對于偏態(tài)分布的數(shù)據(jù)較為適用。中位數(shù)與眾數(shù)算術(shù)平均數(shù)適用于對稱分布或近似對稱分布的數(shù)據(jù);中位數(shù)和眾數(shù)適用于各種類型的數(shù)據(jù)分布,尤其是偏態(tài)分布。適用范圍算術(shù)平均數(shù)受極端值影響較大,穩(wěn)定性較差;中位數(shù)和眾數(shù)受極端值影響較小,穩(wěn)定性較好。穩(wěn)定性對于對稱分布的數(shù)據(jù),算術(shù)平均數(shù)、中位數(shù)和眾數(shù)通常接近,具有較好的代表性;對于偏態(tài)分布的數(shù)據(jù),中位數(shù)和眾數(shù)的代表性通常優(yōu)于算術(shù)平均數(shù)。代表性不同集中趨勢度量的比較06離散程度的度量一組數(shù)據(jù)中最大值與最小值之差,用于反映數(shù)據(jù)的波動(dòng)范圍。極差上四分位數(shù)與下四分位數(shù)之差,用于衡量中間50%數(shù)據(jù)的離散程度。四分位差極差與四分位差方差各數(shù)據(jù)與其均值之差的平方的平均數(shù),用于衡量數(shù)據(jù)的離散程度。標(biāo)準(zhǔn)差方差的算術(shù)平方根,用于反映數(shù)據(jù)分布的離散程度。方差與標(biāo)準(zhǔn)差離散系數(shù)及其應(yīng)用離散系數(shù)標(biāo)準(zhǔn)差與均值的比值,用于比較不同均值數(shù)據(jù)的離散程度。應(yīng)用在財(cái)務(wù)分析、質(zhì)量控制等領(lǐng)域中,離散系數(shù)可用于評估數(shù)據(jù)的穩(wěn)定性和波動(dòng)性。例如,在股票投資中,離散系數(shù)可用于衡量股票價(jià)格的波動(dòng)程度,幫助投資者做出決策。07偏態(tài)與峰態(tài)的度量偏態(tài)定義偏態(tài)是指數(shù)據(jù)分布的不對稱性。在統(tǒng)計(jì)學(xué)中,偏態(tài)通常通過計(jì)算偏態(tài)系數(shù)來衡量。偏態(tài)系數(shù)偏態(tài)系數(shù)是描述數(shù)據(jù)分布偏態(tài)程度的統(tǒng)計(jì)量,計(jì)算公式為偏態(tài)系數(shù)=(n∑(Xi-X?)^3)/(n-1)(n-2)S^3。其中,Xi為數(shù)據(jù),X?為均值,S為標(biāo)準(zhǔn)差,n為樣本量。偏態(tài)類型根據(jù)偏態(tài)系數(shù)的正負(fù)和大小,可以將偏態(tài)分為左偏態(tài)(負(fù)偏態(tài))、右偏態(tài)(正偏態(tài))和無偏態(tài)。偏態(tài)及其度量方法峰態(tài)定義峰態(tài)是指數(shù)據(jù)分布峰部的尖銳程度。在統(tǒng)計(jì)學(xué)中,峰態(tài)通常通過計(jì)算峰態(tài)系數(shù)來衡量。峰態(tài)系數(shù)峰態(tài)系數(shù)是描述數(shù)據(jù)分布峰部尖銳程度的統(tǒng)計(jì)量,計(jì)算公式為峰態(tài)系數(shù)=(n(n+1)∑(Xi-X?)^4)/(n-1)(n-2)(n-3)S^4-3(n-1)^2/(n-2)(n-3)。其中,Xi為數(shù)據(jù),X?為均值,S為標(biāo)準(zhǔn)差,n為樣本量。峰態(tài)類型根據(jù)峰態(tài)系數(shù)的正負(fù)和大小,可以將峰態(tài)分為尖峰態(tài)(正峰態(tài))、平峰態(tài)(負(fù)峰態(tài))和標(biāo)準(zhǔn)峰態(tài)。峰態(tài)及其度量方法010203偏態(tài)應(yīng)用舉例在金融領(lǐng)域,偏態(tài)分布常被用來描述股票收益率的分布情況。如果股票收益率呈現(xiàn)右偏態(tài)分布,說明極端收益出現(xiàn)的概率較大,投資者需要關(guān)注風(fēng)險(xiǎn)。峰態(tài)應(yīng)用舉例在質(zhì)量控制領(lǐng)域,峰態(tài)分布可以用來描述產(chǎn)品質(zhì)量的分布情況。如果產(chǎn)品質(zhì)量呈現(xiàn)尖峰態(tài)分布,說明大部分產(chǎn)品的質(zhì)量集中在均值附近,而極端質(zhì)量出現(xiàn)的概率較小,有利于質(zhì)量控制。偏態(tài)和峰態(tài)的綜合應(yīng)用在實(shí)際問題中,偏態(tài)和峰態(tài)往往同時(shí)出現(xiàn)。例如,在醫(yī)學(xué)研究中,某種疾病的發(fā)病率可能呈現(xiàn)右偏且尖峰的分布。這意味著發(fā)病率高的地區(qū)較為集中,且存在極端高發(fā)病率的地區(qū),需要引起醫(yī)學(xué)界的關(guān)注。偏態(tài)和峰態(tài)的應(yīng)用舉例08描述性統(tǒng)計(jì)分析在實(shí)際應(yīng)用中的注意事項(xiàng)03考慮數(shù)據(jù)的質(zhì)量和完整性檢查數(shù)據(jù)是否存在缺失值、異常值或重復(fù)值等問題,以確保數(shù)據(jù)的準(zhǔn)確性和完整性。01確認(rèn)數(shù)據(jù)收集的方法和過程了解數(shù)據(jù)的收集方式、樣本選擇、數(shù)據(jù)采集時(shí)間等,以評估數(shù)據(jù)的可靠性和代表性。02驗(yàn)證數(shù)據(jù)來源的權(quán)威性確保數(shù)據(jù)來自可靠的機(jī)構(gòu)、組織或數(shù)據(jù)庫,避免使用來源不明的數(shù)據(jù)。數(shù)據(jù)來源的可靠性問題統(tǒng)計(jì)方法應(yīng)用諸如IQR(四分位距)法則、Z-score等方法,定量地識(shí)別異常值??梢暬椒ㄍㄟ^繪制箱線圖、散點(diǎn)圖等圖表,直觀地發(fā)現(xiàn)異常值。處理策略根據(jù)異常值的性質(zhì)和實(shí)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論