




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第一章:統(tǒng)計資料的描述
概率論和數(shù)理統(tǒng)計是用來研究隨機現(xiàn)象的數(shù)量規(guī)律性的.由于隨機現(xiàn)象的普遍性,使得概率論和數(shù)理統(tǒng)計在工農(nóng)業(yè)生產(chǎn)、社會經(jīng)濟和現(xiàn)代科技各領(lǐng)域中具有極其廣泛的應(yīng)用.作為今后要為人類醫(yī)藥事業(yè)作出貢獻(xiàn)的大學(xué)生,應(yīng)該學(xué)好這門學(xué)科.
第一講統(tǒng)計資料的整理
一、統(tǒng)計資料的類型
1.計量資料(又稱定量數(shù)據(jù))
在實際工作中對每個觀察單位用定量的方法測定某項指標(biāo)量,所得數(shù)據(jù)稱為計量資料。整理資料時一般用單項分組或組距分組的方法。
2.計數(shù)資料(又稱定性數(shù)據(jù))
在實際工作中將每個觀察單位按某種屬性或類別分組,所得各組的觀察單位個數(shù),稱為計數(shù)資料。整理資料時一般用組距分組、單項分組或不分組的方法。在實際問題中絕大多數(shù)數(shù)據(jù)資料是計量資料,本書所介紹的統(tǒng)計方法也主要用于計量資料的分析處理,只有非參數(shù)方法等用于計數(shù)資料的分析(不排除通過數(shù)量轉(zhuǎn)化而用計量資料的分析方法處理)。二、統(tǒng)計數(shù)據(jù)的整理和顯示
統(tǒng)計數(shù)據(jù)的整理是根據(jù)統(tǒng)計研究的目的和任務(wù),將收集的零亂的數(shù)據(jù)資料進行科學(xué)的加工和匯總,
使數(shù)據(jù)資料條理化、系統(tǒng)化,以反映研究總體的數(shù)量特征、規(guī)律性和趨勢。統(tǒng)計數(shù)據(jù)的整理的一般步驟為:(1)對數(shù)據(jù)進行審核;(2)對數(shù)據(jù)按某種屬性特征或數(shù)量特征進行分組;(3)列出統(tǒng)計表、繪制統(tǒng)計圖。(一)定性數(shù)據(jù)的整理
定性數(shù)據(jù)是描述總體個體的屬性特征的。例:下表是根據(jù)2000年我國人口普查數(shù)據(jù)得到的,對我國6周歲以上人口按受教育程度(屬性特征)分組形成的頻數(shù)、頻率分布表。
2000年我國6周歲以上人口教育程度頻數(shù)、頻率分布表受教育程度文盲、半文盲小學(xué)初中高中及中專大專以上人數(shù)(億)1.10934.51914.29891.41090.4573比例(﹪)9.438.336.412.03.9我國6周歲以上人口受教育程度餅形圖(二)定量數(shù)據(jù)的整理和顯示
定量數(shù)據(jù)是描述總體的數(shù)量特征的。例:某高校某專業(yè)110名學(xué)生某門考試成績(分)如下表:764294977288559662839980817768906785696176738165518787938810089996561749762729149728298100735171996894828579745587498572789786537173908877808671968546736698559881798486748662747959969769898681788499459582916773898984743272試編制考試成績頻數(shù)、頻率分布表。學(xué)生考試成績統(tǒng)計圖表
解:(1)
計算極差R=最大值-最小值
=100-32=68
(2)確定組數(shù)k
▲經(jīng)驗分組n<50k取5~6組
50<n<100k取7~10組n>100k取10~15組
▲公式分組k=1+
=7.781≈8
(3)確定組距(等距情形):d==8.5
為便于計算,組距一般取5或10的倍數(shù);第一組的下限要小于最小值,最后一組上限要大于最大值,本例取d=10,第一組的下限取30,最后一組的上限取100。本例實取7組。
▲
確定組中值組中值=(4)分組計算頻數(shù)、頻率和累計頻率,列表10.7820.4910.2450.1090.0550.009累計頻率0.2180.2910.2450.1360.05450.0450.009頻率(f/n)24322715651頻數(shù)(f)90-10080-9070-8060-7050-6040-5030-40成績分組表
學(xué)生考試成績分布表(5)繪制頻數(shù)、頻率、累計頻率圖學(xué)生考試成績統(tǒng)計圖表三、數(shù)據(jù)分布特征的統(tǒng)計指標(biāo)描述(一)集中趨勢的測度
1.平均值(只介紹平均值,中位數(shù)、眾數(shù)自學(xué))(1)簡單算術(shù)平均值(用于未分組數(shù)據(jù))
設(shè)觀測數(shù)據(jù)值為
則上例110名學(xué)生的平均成績?yōu)?
(2)加權(quán)算術(shù)平均數(shù)(用于分組數(shù)據(jù))
設(shè)原始數(shù)據(jù)共分為k組,各組的組中值為:
則
上例,由學(xué)生考試成績分布表的數(shù)據(jù):
成績分組
30-4040-5050-6060-7070-8080-9090-100
組中值(M)35455565758595
頻數(shù)(f)1 5 6 15 27 32 24
計算得:
由于組中值是該組的代表值,故用加權(quán)算術(shù)平均值公式計算的值為準(zhǔn)確值的近似值。
(3)平均值的數(shù)學(xué)性質(zhì):◆各觀測值與它們的均值的離差之和為零;
即◆各觀測值與它們的均值的離差的平方和最小。
即
上述性質(zhì)今后在計算或論證過程中將會用到。
(二)數(shù)據(jù)分布離散程度的測度平均值代表觀測值的整體水平,其代表性的好壞需要另外的指標(biāo)加以側(cè)度。即要考察各觀測數(shù)據(jù)偏離其平均值的程度或是數(shù)據(jù)的分散程度。一般地說該測度值越小,平均值代表性越好,數(shù)據(jù)相對集中;相反,代表性差,數(shù)據(jù)相對分散。常用的測度值有極差、平均差、方差、標(biāo)準(zhǔn)差和變異系數(shù)等,其中最重要的是方差和標(biāo)準(zhǔn)差。
1.極差
R=最大值-最小值(不分組)
或R=最后一組上限-第一組下限(分組)
極差簡單易算,但只用了數(shù)據(jù)的兩個極端值,丟失的信息太多,不能反映中間數(shù)據(jù)的離散性,故不常用。
2.方差和標(biāo)準(zhǔn)差方差和標(biāo)準(zhǔn)差是觀測數(shù)據(jù)離散程度最重要的測度。
(1)總體方差和標(biāo)準(zhǔn)差
設(shè)
則總體方差總體標(biāo)準(zhǔn)差為總體的全部觀測值,
(2)樣本方差和標(biāo)準(zhǔn)差
設(shè)從總體抽取的樣本數(shù)據(jù)為
,
則樣本方差
(不分組)
或
(分組)
樣本標(biāo)準(zhǔn)差
例:根據(jù)上例學(xué)生考試成績原始數(shù)據(jù),已知n=110,
故樣本方差和樣本標(biāo)準(zhǔn)差分別為計算結(jié)果說明每個學(xué)生的考試成績與平均成績78.10分相比,
平均相差別14.70分,成績分布不是很均勻。注:本例如果用分組的計算公式結(jié)果分別為本199.53和14.20
與準(zhǔn)確值215.98和14.70相差不多,但是計算量減少了。在實際計算時用下列簡化公式(用計算器上的統(tǒng)計功能)=78.103.標(biāo)準(zhǔn)化變量
在對不同量綱的多個變量進行統(tǒng)計分析時,往往要對變量(或觀測值)進行標(biāo)準(zhǔn)化處理。其公式為:
標(biāo)準(zhǔn)化值的絕對值一般不會超過3個標(biāo)準(zhǔn)差,僅只有0.3%的值超過,這些數(shù)值稱為離群點。在第三章中將會詳細(xì)討論標(biāo)準(zhǔn)化變量有關(guān)性質(zhì)。
4.變異系數(shù)和樣本標(biāo)準(zhǔn)誤◆變異系數(shù)
×100%
它是一個無量綱的相對數(shù),主要用于比較總體水平差異較大或具有不同量綱的數(shù)據(jù)組的數(shù)據(jù)離散程度大小。
◆樣本標(biāo)準(zhǔn)誤
它是描述了各樣本平均值偏離總體平均值的平均程度(又稱為抽樣平均誤差)。例:(略)
第二講用excel進行數(shù)據(jù)整理和作圖
一、excel數(shù)據(jù)分析程序的安裝在安裝excel時選擇完全安裝,進入excel后:◆點擊“工具”菜單中的“加載宏”
◆在彈出的“加載宏”對話框中選擇“分析工具庫”◆點擊確定,完成安裝。(在excel“工具”的菜單就會出現(xiàn)“數(shù)據(jù)分析”的命令選項。二、統(tǒng)計作圖
例;根據(jù)下表的數(shù)據(jù);
2000年我國6周歲以上人口教育程度頻數(shù)、頻率分布表建立excel數(shù)據(jù)庫,并制作統(tǒng)計條形圖。受教育程度文盲、半文盲小學(xué)初中高中及中專大專以上人數(shù)(億)1.10934.51914.29891.41090.4573比例(﹪)9.438.336.412.03.9
◆在excel中建立數(shù)據(jù)庫
◆在“插入”下拉菜單中選擇“圖表”子菜單,進入圖表向?qū)?/p>
◆選擇圖表類型中的“柱形圖”,再單擊“下一步”◆進入圖表數(shù)源數(shù)據(jù)窗口,確定用于制作圖表的數(shù)據(jù)區(qū)域,在“數(shù)據(jù)區(qū)域”欄中輸入“A2:F2”,在“系列產(chǎn)生在”欄選“行”.◆單擊上步的圖表中頂部“系列”標(biāo)簽,再點擊“分類(X)軸標(biāo)志”的空白區(qū)域的右邊的,會彈一個小條形框,再用鼠標(biāo)選定數(shù)據(jù)源的數(shù)據(jù)分類區(qū)域(B1:F1),再點擊小條形框右邊的按鈕。
單擊◆單擊“下一步”得下圖,并可選擇相關(guān)功能菜單◆單擊“完成”,得下圖◆對所得條形圖進行編輯:將光標(biāo)移到要調(diào)整的區(qū)域,單擊右鍵進入編輯窗口,對相關(guān)項目進行重新選擇,得到如下圖形三、定量數(shù)據(jù)的頻數(shù)分布與直方圖的生成
例:以前面的110名學(xué)生的考試成績?yōu)槔幹祁l數(shù)分布表并生成直方圖.1.將考試數(shù)據(jù)輸入excel中,建立數(shù)據(jù)庫;2.將數(shù)據(jù)按組距d=10分組,在空白列輸入各組的上限值(實為本組上限值-1);3.選擇“工具”下垃菜單的“數(shù)據(jù)分析”子菜單,用鼠標(biāo)雙擊對話框中的“直方圖”選項,4.入進“直方圖”對話框,其主要選項有:(1)在輸入?yún)^(qū)域里輸入(A1:A110);(2)在接收區(qū)域里輸入(C3:C9);(3)選擇“標(biāo)志”選項;(4)選擇“累計百分率”選項(如果要作累計頻率折線圖的話);(5)選擇“圖表輸出”選項。按“確定
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 1.1孟德爾的豌豆雜交實驗(一)課件高一下學(xué)期生物人教版(2019)必修2
- 公司產(chǎn)品購買合同范例
- 買賣車轉(zhuǎn)讓合同范例
- 中建居間合同范例
- 以工代賑設(shè)備采購合同范例
- 企業(yè)玉米收購合同樣本
- 供需方 采購合同范例
- 交安設(shè)施合同范例
- 養(yǎng)殖用工合同范例
- 買賣杉木合同范例
- 第14課《第一次世界大戰(zhàn)》中職高一下學(xué)期高教版(2023)世界歷史全一冊
- 【MOOC】行政法與行政訴訟法學(xué)-西南政法大學(xué) 中國大學(xué)慕課MOOC答案
- ARVR在電商設(shè)計中的應(yīng)用與前景
- 宣傳工作實務(wù)-形考任務(wù)三-國開(FJ)-參考資料
- 貴州省遵義市(2024年-2025年小學(xué)五年級語文)人教版小升初真題((上下)學(xué)期)試卷及答案
- 物流行業(yè)綜合工時優(yōu)化方案
- 宮頸癌護理查房-5
- 2023年上海鐵路局集團有限公司招聘考試真題
- 中國高血壓防治指南(2024年修訂版)要點解讀
- 軸類零件加工工藝設(shè)計-畢業(yè)設(shè)計論文
- 2024年山東濟寧初中學(xué)業(yè)水平考試地理試卷真題(含答案詳解)
評論
0/150
提交評論