公司培訓(xùn)用基礎(chǔ)統(tǒng)計(jì)學(xué)new_第1頁
公司培訓(xùn)用基礎(chǔ)統(tǒng)計(jì)學(xué)new_第2頁
公司培訓(xùn)用基礎(chǔ)統(tǒng)計(jì)學(xué)new_第3頁
公司培訓(xùn)用基礎(chǔ)統(tǒng)計(jì)學(xué)new_第4頁
公司培訓(xùn)用基礎(chǔ)統(tǒng)計(jì)學(xué)new_第5頁
已閱讀5頁,還剩53頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

基礎(chǔ)統(tǒng)計(jì)學(xué)(初級)講義Paladinma

2011-6-22輕松學(xué)統(tǒng)計(jì)下列哪一種敘述方式最完整呢?背板螺孔扭力強(qiáng)度很好;背板螺孔扭力強(qiáng)度平均為10kg/cm^2;大多說產(chǎn)品的螺孔扭力強(qiáng)度在(10±0.8)kg/cm^2以內(nèi);99.73%的產(chǎn)品的螺孔扭力強(qiáng)度在(10±0.8)kg/cm^2以內(nèi)統(tǒng)計(jì)學(xué)的定義研究如何搜集資料、整理資料和進(jìn)行數(shù)量分析、推斷的一門方法論科學(xué)。研究數(shù)量方面的研究客觀現(xiàn)象總體的數(shù)量特征研究不確定現(xiàn)象一門方法論的科學(xué)單個(gè)單個(gè)單個(gè)單個(gè)單個(gè)單個(gè)單個(gè)單個(gè)樣本不確定性:受到偶然的,隨機(jī)因素的作用統(tǒng)計(jì)學(xué)的分類理論統(tǒng)計(jì)學(xué)應(yīng)用統(tǒng)計(jì)學(xué)基本統(tǒng)計(jì)量統(tǒng)計(jì)分布描述統(tǒng)計(jì)推斷統(tǒng)計(jì)參數(shù)估計(jì)非參數(shù)估計(jì)假設(shè)檢驗(yàn)SPC相關(guān)/回歸分析方差分析(變異數(shù))實(shí)驗(yàn)設(shè)計(jì)DOE多變量分析統(tǒng)計(jì)方法基礎(chǔ)篇應(yīng)用篇統(tǒng)計(jì)能幫你、我做什么?問題之現(xiàn)狀分析真因驗(yàn)證對策擬定效果確認(rèn)解決問題思路1、敘述統(tǒng)計(jì)量2、估計(jì)1、假設(shè)檢驗(yàn)2、ANOVA3、DOE1、假設(shè)檢驗(yàn)2、回歸分析3、DOE1、假設(shè)檢驗(yàn)2、估計(jì)Syllabus描述統(tǒng)計(jì)總體與樣本描述統(tǒng)計(jì)量統(tǒng)計(jì)分布描述及概率分布抽樣分布推斷統(tǒng)計(jì)估計(jì)假設(shè)檢驗(yàn)計(jì)量型資料檢驗(yàn)計(jì)數(shù)型資料檢驗(yàn)統(tǒng)計(jì)測定的層次掌握統(tǒng)計(jì)測定的不同層次,對于正確地分析數(shù)據(jù)和選擇檢驗(yàn)方法(參數(shù)檢驗(yàn)、非參數(shù)檢驗(yàn))是十分重要的!統(tǒng)計(jì)要素一、總體(母體)客觀存在的,具有某種共同性質(zhì)的許多個(gè)體構(gòu)成的整體,由數(shù)據(jù)特性可分為:計(jì)量型總體:如長度、重量、時(shí)間等計(jì)數(shù)型總體:如男女、ok與ng等二、樣本:從總體中隨機(jī)抽取若干單位構(gòu)成的集合體一般n在30以下者稱為小樣本,n在30以上時(shí)稱為大樣本三、推斷以樣本所包含信息為基礎(chǔ)對總體的某些特征作出判斷,預(yù)測和估計(jì)。四、推斷的可靠性總體與樣本的關(guān)系明確調(diào)查的總體,從總體中抽取樣本并對樣本的信息加以分析,根據(jù)樣本信息對總體作出判斷,對推斷的可靠性加以測定。樣本總體抽樣/實(shí)驗(yàn)推論隨機(jī)試驗(yàn)、隨機(jī)事件、隨機(jī)變量在同一組條件下,對某事物或現(xiàn)象所進(jìn)行的觀察或?qū)嶒?yàn)叫隨機(jī)試驗(yàn)(Experiment)把觀察或?qū)嶒?yàn)的結(jié)果叫隨機(jī)事件。如果隨機(jī)試驗(yàn)的每一種結(jié)果可以用一個(gè)數(shù)字作為其代表,則稱為隨機(jī)變量一、連續(xù)型continuous(計(jì)量型):可以用單位來度量二、離散型discrete(計(jì)數(shù)型):表現(xiàn)為屬性和類別基本統(tǒng)計(jì)量眾數(shù)中位數(shù)平均數(shù)四分位數(shù)極差-全距方差和標(biāo)準(zhǔn)差離散系數(shù)四分位差集中趨勢一組資料向其中心靠攏的傾向與程度集中趨勢及時(shí)尋找一般水平的代表值選用哪一個(gè)測量值來反映資料的集中趨勢,要根據(jù)資料的類型來決定。集中趨勢

眾數(shù):出現(xiàn)次數(shù)最多的資料點(diǎn),可能沒有或有多個(gè)中位數(shù)QM:排序后,位于中間位置的值平均值:一組資料的均衡點(diǎn)所在各資料點(diǎn)與平均值間的距離和為0

各資料點(diǎn)與平均值間的距離平方和為最小最常用的量測值

四分位數(shù):用三個(gè)數(shù)值Q1、Q2、Q3把變量數(shù)列中全部單位分為四個(gè)部分,這三個(gè)數(shù)值稱為四分位數(shù)四分位數(shù)---箱線圖111212122231323414245152561626717278182891929102030四分位數(shù)---箱線圖(事例)眾數(shù)、中位數(shù)與平均值的關(guān)系眾數(shù)<中位數(shù)<平均數(shù)右偏分布平均數(shù)<中位數(shù)<眾數(shù)左偏分布分散趨勢反映各資料點(diǎn)遠(yuǎn)離其中心的程度從另一個(gè)方式來說明集中趨勢的代表程度兩組數(shù)據(jù)的平均值相同,但上面的數(shù)據(jù)散布程度比較大分散趨勢全距R:數(shù)據(jù)資料中最大與最小之差Max-Min方差與標(biāo)準(zhǔn)差:離散系數(shù):指消除平均數(shù)影響后的標(biāo)志變異指標(biāo),其形式為相對數(shù)。標(biāo)準(zhǔn)差系數(shù):標(biāo)準(zhǔn)差與其對應(yīng)的平均值之比

---用于對不同資料組別的離散程度比較

---消除資料的不同水準(zhǔn)和不同單位的影響分散程度---方差與標(biāo)準(zhǔn)差方差標(biāo)準(zhǔn)差總體樣本注意:樣本的方差分母用n-1去除分散程度---自由度指一個(gè)樣本中各隨機(jī)變量的數(shù)值可以自由變動(dòng)的項(xiàng)數(shù)。如樣本中有n個(gè)隨機(jī)變量,每一項(xiàng)數(shù)值都可以自由變動(dòng),則其自由度為n;如n個(gè)隨機(jī)變量的平均數(shù)已確認(rèn),則只有n-1個(gè)隨機(jī)變量的數(shù)值可以自由變動(dòng),而剩余的另一個(gè)隨機(jī)變量必然由該平均數(shù)與n-1個(gè)隨機(jī)變量的數(shù)值所決定,不能自由變動(dòng),則這時(shí)n個(gè)隨機(jī)變量的自由度為 n-1。例如:樣本數(shù)為3,X1=2,X2=4,X3=9,則X=5。當(dāng)X=5確定時(shí),在X1,X2,X3中只能由兩個(gè)資料點(diǎn)可以自由取值,例如X1=6,X2=7,那X3必然為21、眾數(shù):40、46、592、中位數(shù)為Qm:第個(gè)數(shù),即為3、平均數(shù)為:Casestudy---各統(tǒng)計(jì)量的計(jì)算3434353536404040424245464646474849515255555859595960636465637865686870717373787981828485899496102102108Casestudy---各統(tǒng)計(jì)量的計(jì)算34343535364040404242454646464748495152555558595959606364656378656868707173737879818284858994961021021084、全距:5、方差:6、標(biāo)準(zhǔn)差:7、標(biāo)準(zhǔn)差系數(shù):利用excel的分析工具箱Note:excel之“工具”--〉”數(shù)據(jù)分析”--〉描述統(tǒng)計(jì)Syllabus描述統(tǒng)計(jì)總體與樣本描述統(tǒng)計(jì)量統(tǒng)計(jì)分布描述及概率分布抽樣分布推斷統(tǒng)計(jì)估計(jì)假設(shè)檢驗(yàn)計(jì)量型資料檢驗(yàn)計(jì)數(shù)型資料檢驗(yàn)統(tǒng)計(jì)分布描述分布---分布的呈現(xiàn)分布圖---直方圖隨機(jī)變量的分布隨機(jī)變量的取值是隨機(jī)的,但內(nèi)在還是有規(guī)律性的,這個(gè)規(guī)律性可以用分布來描述。1、可能取什么值,或在哪個(gè)區(qū)間上取值。2、取這些值的概率各是多少,或在任一區(qū)間上取值的概率是多少?例如:擲一個(gè)骰子常用之分布(一)常用離散型分布---計(jì)數(shù)型數(shù)據(jù)1、二項(xiàng)分布2、泊松分布3、超幾何分布(二)正態(tài)分布---計(jì)量型數(shù)據(jù)(三)其他連續(xù)分布1、均勻分布2、對數(shù)正態(tài)分布3、指數(shù)分布二項(xiàng)分布由n次隨機(jī)試驗(yàn)組成的隨機(jī)現(xiàn)象,它滿足如下條件1、重復(fù)進(jìn)行n次隨機(jī)試驗(yàn);2、n次隨機(jī)試驗(yàn)間相互獨(dú)立;3、每次試驗(yàn)僅有兩個(gè)可能結(jié)果;4、每次試驗(yàn)成功的概率均為p,失敗的概率均為1-p二項(xiàng)分布例:從不合格品率為0.1的成品中隨機(jī)抽取6個(gè),計(jì)X為6個(gè)成品中的不合格數(shù),則X服從二項(xiàng)分布b(6,0.1),簡記X~b(6,0.1)P=0.3n=10,30,50,80n=30p=0.1,0.3,0.5,0.8二項(xiàng)分布特性1、當(dāng)n愈大時(shí),對稱性愈明顯2、當(dāng)p愈接近0.5時(shí),愈接近左右對稱實(shí)際應(yīng)用np>=5&n(1-p)>=5時(shí)二項(xiàng)分布可用正態(tài)分布來描述泊松分布用來描述如下的隨機(jī)變量的概率分布1、在一定時(shí)間內(nèi),電話總站接錯(cuò)電話的次數(shù)2、在一定時(shí)間內(nèi),某操作系統(tǒng)發(fā)生的故障3、一個(gè)鑄件上的缺陷數(shù)4、一平方米玻璃上氣泡的個(gè)數(shù)5、一件產(chǎn)品因擦傷留下的痕跡個(gè)數(shù)泊松分布總與計(jì)點(diǎn)過程相關(guān)聯(lián),并且計(jì)點(diǎn)是在一定時(shí)間內(nèi)、或一定區(qū)域內(nèi)、或一特定單位內(nèi)的前提下進(jìn)行的,若λ表示某特定單位內(nèi)的平均點(diǎn)數(shù)(λ>0),令X表示出現(xiàn)的點(diǎn)數(shù),則X取x值的概率例:某公司一個(gè)月發(fā)生重大事故數(shù)X服從泊松分布,根據(jù)以往的記錄,該公司一個(gè)月平均發(fā)生1.2起重大事故,這表明:X服從λ=1.2的泊松分布。泊松分布超幾何分布從一個(gè)有限總體中進(jìn)行不放回抽樣常遇到超幾何分布。設(shè)有N個(gè)產(chǎn)品組成的總體,其中含有M個(gè)不合格品。若從中隨機(jī)不放回地抽取n個(gè)產(chǎn)品,則其中不合品的個(gè)數(shù)X是一個(gè)離散隨機(jī)變量,假如n<=M,則X可能取0,1,2…n若n>M,則X可能取0,1,2…M其中r=min(n,M)例:20個(gè)樣品中,其中5個(gè)有缺陷,若從中隨機(jī)抽取8個(gè),抽中缺陷的數(shù)量X的分布:在實(shí)際應(yīng)用中,當(dāng)n/N<=0.1,可以用二項(xiàng)概率去近似超幾何概率超幾何分布正態(tài)分布正態(tài)分布函數(shù)左右兩尾與橫軸漸漸接近但不相交正態(tài)分布有兩個(gè)變相點(diǎn),分別在μ±σ對應(yīng)的地方正態(tài)分布為左右對稱的概率分布正態(tài)分布隨機(jī)變量的線性函數(shù)仍為正態(tài)分布正態(tài)分布中心到各標(biāo)準(zhǔn)差(σ)之間的概率分布如下0.02150.13590.34130.68260.95440.9973標(biāo)準(zhǔn)正態(tài)分布假如X服從正態(tài)分布則Z=(X-μ)/σ會(huì)服從μ=0,σ=1的正態(tài)分布此時(shí)的正態(tài)分布稱為標(biāo)準(zhǔn)正態(tài)分布Z=(X-μ)/σ的轉(zhuǎn)換過程為標(biāo)準(zhǔn)化設(shè)X~N(μ,σ2

)則Z=~N(0,1)若X~N(10,4),通過標(biāo)準(zhǔn)化變換Z=~N(0,1)μσx0,1z正態(tài)分布在6σ界限內(nèi)居中的正態(tài)分布圖正態(tài)分布在偏移1.5σ情況下的正態(tài)分布圖μ標(biāo)準(zhǔn)正態(tài)分布---應(yīng)用產(chǎn)品質(zhì)量特性X的不合格品率:例:某廠生產(chǎn)電阻的規(guī)格限為80±4,從現(xiàn)場得知電阻值X服從正態(tài)分布,均值μ=80.8,σ=1.3,則低于規(guī)格下限和規(guī)格上限的概率為:標(biāo)準(zhǔn)正態(tài)分布表Syllabus描述統(tǒng)計(jì)總體與樣本描述統(tǒng)計(jì)量統(tǒng)計(jì)分布描述及概率分布抽樣分布推斷統(tǒng)計(jì)估計(jì)假設(shè)檢驗(yàn)計(jì)量型資料檢驗(yàn)計(jì)數(shù)型資料檢驗(yàn)抽樣分布所有的樣本統(tǒng)計(jì)量(平均值、比例、方差等)所形成的分布稱為抽樣分布結(jié)果來自樣本數(shù)目相同的所有可能樣本樣本平均值的抽樣分布樣本比例的抽樣分布樣本方差的抽樣分布樣本平均值的抽樣分布例:假設(shè)一總體含有四個(gè)元素,即總體之總個(gè)數(shù)N=4,四個(gè)元素分別為則總體的平均值、方差及分布如下:樣本平均值的抽樣分布若從總體中抽取n=2的隨機(jī)樣本,共有4*4=16個(gè)可能樣本,計(jì)算出各樣本之平均,并給出其平均值的分布。樣本平均值的抽樣分布樣本平均值的抽樣分布M為所有可能樣本數(shù)目比較與總結(jié):樣本平均的平均(數(shù)學(xué)期望)等于總體平均樣本平均的方差等于總體方差的1/n中央極限定理設(shè)從平均值為u,方差為σ2的一個(gè)任意分布總體(離散分布或連續(xù)分布、正態(tài)分布或非正態(tài)分布)中抽取個(gè)數(shù)為n的樣本,當(dāng)n夠大時(shí),樣本平均值的抽樣分布近似于平均值為u,方差數(shù)為σ2/n的正態(tài)分布一個(gè)任意分布的總體當(dāng)樣本數(shù)足夠大時(shí)(n>30)樣本平均值得抽樣分布趨近于正態(tài)分布中央極限定理減少測量誤差的方法:對同一個(gè)零件的質(zhì)量特性作兩次或更多次重復(fù)測量,并用其均值去估計(jì)過程輸出的質(zhì)量特性,這可以減少標(biāo)準(zhǔn)差,從而測量系統(tǒng)的精度就自動(dòng)增加了。這種簡易的方法可以使多次測量的平均值比單次測量值更具穩(wěn)定性!總體Ⅰ:均勻分布總體Ⅱ:雙峰分布總體Ⅲ:指數(shù)分布中央極限定理必須符合下列二條件:1、σ需已知2、樣本足夠大(n>30)思考:但大部分的情況σ是未知的,還可以用中央極限定理嗎?中央極限定理的限制T分布當(dāng)σ未知,且樣本不夠大時(shí),可以用樣本標(biāo)準(zhǔn)差s來替代σ,仍可得到跟正態(tài)分布接近的性質(zhì)此分布的自由度為n-1之t分布T分布可用于總體方差未知時(shí)正態(tài)總體均值的估計(jì)與檢驗(yàn),以及線性回歸模型中回歸系數(shù)的顯著性檢驗(yàn)等n=∞n=20n=1T分布的性質(zhì)

T分布是均值為0的對稱的鐘形曲線,取值范圍在-∞與+∞之間;

T分布的方差大于1,與標(biāo)準(zhǔn)正態(tài)相比,t分布的中心部分較低,兩個(gè)尾部較高;隨著自由度n的不斷增大,t分布越來越趨近于標(biāo)準(zhǔn)正態(tài)分布,并以其為極限;

T(∞)≈N(0,1)不同自由度的t分布大樣本

(n≧30)中央極限定理正態(tài)總體σ已知正態(tài)分布性質(zhì)小樣本

(n﹤30)總體σ未知t分布性質(zhì)大樣本

(n≧30)中央極限定理非正態(tài)小樣本

(n﹤30)抽樣

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論