6sigma第二章基礎統計1_第1頁
6sigma第二章基礎統計1_第2頁
6sigma第二章基礎統計1_第3頁
6sigma第二章基礎統計1_第4頁
6sigma第二章基礎統計1_第5頁
已閱讀5頁,還剩50頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

作者:項目支持部日期:2012/02/20第二章基礎統計2第一節(jié)統計的基本概念3統計學的概念在日常生活中經常接觸,且每天都在使用-為預測棒球比賽的勝負,調查各個Team的過去勝率-用收集的氣象資料預測天氣統計學為了對不確實的未來的預測提供必要的情報收集,分類,分析資料及以此為基礎提示結論的學問統計學4觀察的偏差當重復測量時,經常產生不同的結果,這就是偏差通常原因的偏差測量中的差異是被期望的并可以預測的特殊原因的偏差(隨機)測量中的差異是不可預測的偏差:觀察值與實際值之間的差異5偏差所有的茄子產于一塊地并同一天采摘問題:你期望存在偏差嗎?什么類型的偏差?6觀察的偏差(續(xù))我們期望觀察出偏差,當沒有時將引起注意如果所有的區(qū)域的產品的銷售量完全相同,我們將懷疑數據的真實性.偏差使我們的工作更有挑戰(zhàn)性,我們通常不相信來源于單個數據的結果,通常收集多個數據并注意收集的方法以減少偏差,偏差是自然存在的,被期望的并是統計的基礎7數據類型連續(xù)變量用長度或時間等作為測量尺度。離散變量是分類的信息如“合格”或“不合格”。例如: 零件編號. 邏輯 連續(xù) 1 合格 2.031 2 合格 2.034 3 不合格 2.076 4 合格 2.022 5 不合格 2.001連續(xù)變量離散變量問題解決方案8連續(xù)變量參數如:尺寸,重量或時間來描述產品或過程特性,這個測量尺度可以被細細分成有意義的小數你能舉出三個設備嗎?可用來收集連續(xù)變量的.相比僅僅知道零件的好或壞連續(xù)變量能告訴更多的信息連續(xù)變量9離散變量不可能再細分成有意義的小數

離散變量是事情發(fā)生或不發(fā)生的次數或測量發(fā)生的頻率.離散變量也是可分類的數據,如;銷售區(qū)域,生產線,操作班組和工廠,單板有缺陷的焊點無辜或有罪離散變量合格/不合格區(qū)域10離散變量通常如果能獲得更多的信息優(yōu)先考慮連續(xù)變量.如果不能獲得連續(xù)變量可以分析邏輯變量,找出結果并做結論.連續(xù)和離散變量的注釋:

離散變量的例子:單板的合格

合格/不合格發(fā)票的正確性正確/不正確按時付款按時/遲交為了有效的分析,離散變量要求更多的數據點11在下列的例子邊,畫圈選擇A=“離散”或V=“連續(xù)變量”1.銷售的準確性2.數據輸入的準確性3.銷售區(qū)域4.用“通過”/“不通過”量具測直徑5.焊膏厚度6.直供協議7.網板厚度8.供應商產品的缺陷數9.計劃部下達合同的變更次數

AVAVAVAVAVAVAVAVAV練習12總體(母集團)和樣本成為關心對象的所有個體的集合稱為總體,在總體中作為調查對象采納的一部分稱為樣本??傮w樣本總體的特性:個數(N)平均

μ

分散

2

標準偏差

樣本的特性:統計量(n)

平均x

分散S2

標準偏差S如果能夠準確計算總體的個數時沒有問題,但如果難以計算時以樣本計算的統計量為基礎進行推定.13

平均值

-總體或樣本的平均值。-總體的平均值用

表示-樣本的平均值用X均方差-與平均值間距的平方的平均值.(表示數據的離散程度.)-總體的方差用表示-樣本的方差用s2

表示標準的方差是方差的平方根。(表示數據的離散程度.)-總體標準偏差由表示-樣本標準偏差由s

表示14極差--在一個子組中最高值與最低值的差值

極差=X高

-X低.極差用

R表示中位數--反應中間50%的數值,一系列數據由低到高排列后所得到的中間數。眾數--在一個數據集中最頻繁出現的值。15平均值下列是茄子的重量1.0 1.2 1.5 2.5 3.0 4.2 6.11.1 1.5 2.0 3.0 4.0 4.2 6.20.9 1.4 2.1 3.1 4.5 4.4 6.01.2 1.6 2.5 3.2 4.4 4.51.0 1.5 2.4 3.3 4.5 6.0茄子的平均重量是多少?16平均值所有重量累計

=平均值茄子個數=平均值

-總體或樣本的平均值。樣本用

x,總體用

表示。平均值公式^175 7 21 255 5 1 05 3 1 05 2 1 05 8 1 0除了平均值,我們還要知道其它信息嗎?

數據的離散程度怎樣?例如:五位數的中心值是5X 5 5 5 5R 0 6 20 25R=極差=X高

-X低平均值相同!這是子組極差18除了中心值和極差,我們還要知道其它更多信息嗎?

極差是足夠具體嗎?

59616363645962666565646065626468706563646866656667646658656571636963667064676466626464646164636564686667697168666563646468676564656470656865666966666563686662676566676660676360647390個女工的平均身高把數據標在下面57 60 65 70 75xx直方圖19直方圖20離散程度的測量用來判定一個數據集合離散程度或寬度的恒量尺度極差=最大值-最小值均方差=與平均值差的平方的平均值標準偏差=方差的平方根,提供與平均值的標準的距離的測量。均方差為什么有用?21標準偏差--恒量數據的離散程度總體的標準偏差用“”表示,樣本的標準偏差用S表示=(Xi-)2i=1NN總體的標準偏差方差--與中心值間距的平均值

S=(Xi-X)2i=1nn-1樣本的標準偏差統計術語和定義^讓我們練習...22例子課堂例子:計算均方差和標準偏差(2,6,4)計算平均值,均方差和標準偏差x

=

xnii=1ns2=n(Xi-X)2i=1n-1

s=(Xi-X)2i=1nn-1平均值 均方差 標準偏差均方差(s2)=8/(3-1)=4標準偏差(s)=平方根(4)=2

i

xi

(xi-4)

(xi-4)2

1 2 -2 4 2 6 2 4

3

4

0

0

總和 12 0 823課堂練習:計算均方差 標準偏差(1,3,5,4,7)用下列表格做指導首先計算平均值計算中心值均方差 標準偏差x

=

xni1ns2=n(Xi-X)2i=1n-1

s=(Xi-X)2i=1nn-1平均值 均方差 標準偏差

均方差(s2)=標準偏差(s)=練習24還有其它的統計概念嗎?當然有!!中位數&眾數:59616363645962666565646065626468706563646866656667646658656571636963667064676466626464646164636564686667697168666563646468676564656470656865666966666563686662676566676660676360647390位女士的身高:中位數

-反應中間(50%)處的數值,一系列數據由低到高排列所得的中間數。 什么是中位數?眾數

-在一個數集中最頻繁出現的數。

什么是眾數?25平均值,中位數和眾數是所有居中趨勢的測量居中趨勢值聚集在某個中心值附近26何時應用807060504030201003002001000Neg

Skew中位數平均值130120110100908070603002001000Pos

Skew中位數平均值1101009080706050403020100500Normal平均值=中位數27到目前為止我們知道:偏差.數據的類型中心值中位數眾數極差標準偏差均方差28第二節(jié)概率分布概率分布是將分布的形狀演變成數據模型成為品質管理及6Sigma開展的基本。291)正態(tài)分布UnitsofMeasure直方塊的中點中心光滑連接形成曲線大多數(但不是所有)數據是正態(tài)分布或鐘形曲線正態(tài)分布告訴我們數據的離散情況30正態(tài)分布(Normaldistribution)正態(tài)分布在統計應用領域最重要的分布并成為6Sigma開展的基本.正態(tài)分布也可如下表示

X~N()2,變量正態(tài)分布平均標準偏差即正態(tài)分布由平均和標準偏差來定義31正態(tài)分布的形態(tài)是?95.5%43210-1-2-3-468.3%99.73%以平均為軸對稱(Symmetric)

原點在一個位置(Unimodal)鐘形

(Bell-shaped)32正態(tài)分布的標準偏差()規(guī)范上限(USL)規(guī)范下限(LSL)分布的中心值(U)分布的標準偏差()1XorUCLp(d)3中心值LCLX+2sX+1sX+3sX-1sX-2sX-3s33Sigma是?95.5%43210-1-2-3-468.3%99.73%第一個彎曲點(傾斜從減少到增加的位置,DeflectionPoint)與平均間的距離以平均為中心占據68%的面積34正態(tài)分布的函數式

正態(tài)分布的密度函數

-<X<+:3.142e:2.7183

:分布的平均

:分布的標準偏差1

√22e-(x-)2/22f(X)=X~N()2,35正態(tài)曲線(Normalcurve)形態(tài)95.5%43210-1-2-3-468.3%99.73%121=112121221[因和而異的正態(tài)分布形狀]12,1=2

1=2,1

2

12,1

2

應熟悉教材后部分的正態(tài)分布表的讀法36標準正態(tài)分布平均(中心)為0,標準偏差為1的正態(tài)分布

X-

利用

Z=————

將正態(tài)分布式進行座標轉換95.5%43210-1-2-3-468.3%99.73%N(0,12)37回到先前的例子:身高直方圖和和正態(tài)曲線65.1X+1(2.8)X+2(2.8)X+3(2.8)67.970.773.562.359.556.7X=65.1s=2.8R=1538正態(tài)分布例1<問題>對某一制品的拉長長度進行品質管理,平均為40,標準偏差為2.

N(40,22).購買此制品時顧客要求拉長長度在35以上.

此工程生產的制品滿足顧客要求的概率為多少?39解40235已知這個時面積是多少?N(40,22).Minitab中求面積的部分40正態(tài)分布例2<例2>假設某一工藝的品質特性遵守標準正態(tài)分布(平均=0,標準偏差=1)不良率為1%時,z值(Sigmalevel)

是多少?<解>已知累計概率時求Z值,在

minitab的

normal分布中使用

inversecumulativeprobability.41關于正態(tài)分布的附加說明影響制造工程的平均值或分散的要因區(qū)分為1)偶然要因和2)異常要因.偶然要因指的是如現場的溫度變化等不可管理的要因,異常要因指設備的異常,作業(yè)者的失誤等要因.沒有異常要因介入,只有偶然要因作用時取出的數據必然遵守正態(tài)分布.在教育中大家也能感覺到利用連續(xù)概率分布函數的統計分析中最先觀察的是是否正態(tài).就是說正態(tài)分布是非常重要的.今后要學習的

t-分布,F-分豐,2-分布等是人為制造的概率密度函數.但正態(tài)分布是說明自然現象的自然的分布.42(2)二項分布(Binomialdistribution)Data形態(tài)為不良品(Defective)Data時使用擲硬幣時出現正面與反面的概率是相互獨立的概率分布二項分布需要滿足下列條件貝魯諾實驗:實驗的結果只存在兩種可能性

例)良品,不良品.2)在同一條件下進行實驗3)各個實驗是相互獨立的,即,前結果不影響后結果4)對每個實驗結果的概率是相同的.43二項分布的例<問題>某一制造工程一天生產1000個

Diode平均不良率為1%。檢查者在每個小時隨機地抽取50個樣品選出不良品。此時發(fā)現一個以下不良品的概率是多少?<解>發(fā)現一個以下不良品的概率是發(fā)現一個不良品的概率加上一個也發(fā)現不了的概率首先求一個不良也發(fā)現不了的概率44對二項分布的理解二項分布的概率密度函數

P(X=x)=nCxpx(1-p)n-x

nCx=()=

n!x!(n-x)!nx二項分布在品質管理經常使用,適用于在相當大的母集團中抽取標本,在這里p意味著母集團的不良率(Defectiverate)這里x是抽取任意

n個標本時不良個數.下一頁說明的二項分布的平均,分散,標準偏差是C階段管理圖的基礎。45二項分布的形態(tài)01234P(X)x1/162/163/164/165/166/1601234P(X)x0.10.20.3n=4,p=1/2時二項分布n=9,p=1/3時

二項分布56789二項分布的形狀1)n即使少

p=0.5時概率分布總是對稱的2)p不是0.5,但

n變大時接近對稱二項分布的期望值,標準偏差,分散期望值:=E(X)=np分散:2=Var(X)=np(1-p)=npq標準偏差:

=√np(1-p)=√npq46(3)帕松分布(Poissondistribution)定義單位時間或單位空間發(fā)生特定事件的發(fā)生次數時使用-鋼板,織物等連續(xù)體平均有

m個缺陷時,隨機抽取一定單位檢查缺陷時,出現

x個缺陷時出現的概率遵守帕松分布-單位時間到銀行的顧客數,某一地區(qū)一天的交通事故數帕松分布的密度函數

P(X=x)=e-mmx

x!m:平均發(fā)生次數x:事件發(fā)生次數

帕松分布的特性-二項分布中

p<0.1時,轉換為帕松分布-帕松分布中

m>5時,轉換為正態(tài)分布47帕松分布的例題<問題>半導體裝置

unit當wire-bonding缺陷可表示為帕松分布。此時缺陷率為4時,隨機抽取一個單位檢查時缺陷(defect)為2個以下的概率是?<解>如二項分布求累計概率,minitab中選擇帕松分布后求解。即,缺陷為2個,1個,0個的概率相加即可。48帕松分布的理解1.帕松分布在品質管理表示單位面積,單位個數,單位時間當的缺陷數.間接部門的例:一天發(fā)生的交通事故件數等也可表示為此分布2.特別是在6Sigma追求的是:比不良(defective)更注重缺陷(defect),所以必須記住此分布3.此分布的平均和標準偏差在今后C階段的管理圖成為對

defect的

controlchart理論根據

49帕松分布和

RTY間的關系

帕松分布

觀察帕松分布的概念,可發(fā)現與Unit內分布缺陷(

Defect)是同一概念.即可如下展開

事件的平均發(fā)生次數

m成為

dpu.RTY是最終工程沒有缺陷的概率,即帕松分布中

x=0的概率

即代入帕松分布式時成立下列式.RTY=e-dpudpu=-ln(RTY)P(X=x)=e-mmx

x!m:平均發(fā)生次數x:事件發(fā)生次數50中心極限

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論