版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、體育統(tǒng)計(jì)學(xué)第一章 緒論第一節(jié) 體育統(tǒng)計(jì)及其研究對(duì)象統(tǒng)計(jì)的作用客觀事物的特征質(zhì)的特征量的特征統(tǒng)計(jì)活動(dòng)研究 統(tǒng)計(jì)的分類(從性質(zhì)上)(一) 描述性統(tǒng)計(jì) 對(duì)事物的特征與狀態(tài)進(jìn)行數(shù)量描述 身高=226 cm 體重=141 kg百米速度=15 s 投籃命中率=52% (二) 推斷性統(tǒng)計(jì) 通過(guò)樣本數(shù)量特征估計(jì)推斷總體特征總體抽取隨機(jī)樣本均值 X = 14.6秒抽樣總體平均成績(jī)是14.6秒嗎 體育統(tǒng)計(jì)的概念體育統(tǒng)計(jì)是運(yùn)用數(shù)理統(tǒng)計(jì)的原理和方法對(duì)體育領(lǐng)域里各種隨機(jī)現(xiàn)象規(guī)律性進(jìn)行研究的一門基礎(chǔ)應(yīng)用學(xué)科。屬于方法論學(xué)科范疇。理解:1:用普遍的方法研究特殊領(lǐng)域的問(wèn)題。2:無(wú)論描述統(tǒng)計(jì)還是推斷統(tǒng)計(jì),都服務(wù)于對(duì)隨機(jī)現(xiàn)象規(guī)律
2、性的研究。 統(tǒng)計(jì)工作的基本過(guò)程統(tǒng)計(jì)資料的搜集統(tǒng)計(jì)資料的整理統(tǒng)計(jì)資料的分析統(tǒng)計(jì)資料的搜集:(基礎(chǔ)環(huán)節(jié))根據(jù)研究設(shè)計(jì)的要求獲取有關(guān)數(shù)據(jù)資料。統(tǒng)計(jì)資料的整理:(中間環(huán)節(jié))按照分析的要求對(duì)數(shù)據(jù)資料進(jìn)行審核和分類。統(tǒng)計(jì)資料的分析:(決定性階段)按照研究目的對(duì)整理后的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)學(xué)處理。 統(tǒng)計(jì)工作的基本過(guò)程 體育統(tǒng)計(jì)的研究對(duì)象及其特征研究對(duì)象:(1)體育領(lǐng)域里的各種可量化的隨機(jī)現(xiàn)象。(2)非體育領(lǐng)域里對(duì)體育發(fā)展有關(guān)的各種隨機(jī)現(xiàn)象。研究范圍逐漸擴(kuò)大了! 體育統(tǒng)計(jì)研究對(duì)象的特征運(yùn)動(dòng)性特征:反映運(yùn)動(dòng)能力心理能力等方面的數(shù)量指標(biāo)是具有 運(yùn)動(dòng)性特征的。(1,與運(yùn)動(dòng)有關(guān);2,是動(dòng)態(tài)的)綜合性特征:兼有自然科學(xué)和社會(huì)科
3、學(xué)的綜合屬性??陀^性特征:數(shù)據(jù)來(lái)源于客觀事物本身,是對(duì)客觀事物的反映。第二節(jié) 體育統(tǒng)計(jì)在體育活動(dòng)中的作用是體育教育科研活動(dòng)的基礎(chǔ)有助于訓(xùn)練工作的科學(xué)化能幫助研究者制定研究設(shè)計(jì)能幫助研究者有效地獲取文獻(xiàn)資料總體與個(gè)體1,總體的概念:根據(jù)統(tǒng)計(jì)研究的具體研究目的而確定的同質(zhì)對(duì)象的全體。2,個(gè)體的概念:組成總體的每個(gè)基本單位。3,總體的分類:第三節(jié) 體育統(tǒng)計(jì)中的若干基本概念總體現(xiàn)存總體假想總體有限總體無(wú)限總體有限總體:基本研究單位的邊界是明晰的,并且基本研究單位的數(shù)量是有限的總體。無(wú)限總體:基本研究單位的數(shù)量是無(wú)限多個(gè)的總體。樣本1,樣本的概念:根據(jù)研究需要與可能,從總體中抽取的部 分研究對(duì)象所形成的
4、子集為樣本。2,樣本的分類:隨機(jī)樣本和非隨機(jī)樣本樣本隨機(jī)樣本非隨機(jī)樣本采用隨機(jī)抽樣方法獲得的樣本研究者根據(jù)研究需要,制定某些條件獲得的帶非隨機(jī)性質(zhì)的樣本必然事件和隨機(jī)事件1,必然事件:在確定的條件范圍內(nèi),必然發(fā)生 (或不發(fā)生)的事件。 (具備可預(yù)言性)2,隨機(jī)事件:在一定的實(shí)驗(yàn)條件下,有可能發(fā)生,也有可能不發(fā)生的事件。(具備不可預(yù)言性,只能猜)隨機(jī)變量1,隨機(jī)變量:隨機(jī)事件的數(shù)量表現(xiàn)。隨機(jī)變量連續(xù)型隨機(jī)變量離散型隨機(jī)變量至少理論上可以窮舉不能窮舉總體參數(shù)和樣本統(tǒng)計(jì)量1,總體參數(shù):反映總體數(shù)量特征的指標(biāo)。2,樣本統(tǒng)計(jì)量:反映樣本數(shù)量特征的指標(biāo)。概率1,古典概率:適用于總體明晰的情況下。2:統(tǒng)計(jì)概
5、率:適用于總體狀況不明的情況下。 補(bǔ)充內(nèi)容:連加和的縮寫式 在高等數(shù)學(xué)中,采用連加求和縮寫式形式來(lái)表示連加求和數(shù),它的一般形式為: 其中:連加求和號(hào) 變量(一組觀測(cè)數(shù)據(jù))在 中, i 是下標(biāo),n 是上標(biāo) , i 、n 表示連加求和的界限,即從通項(xiàng)公式具體分解的第一項(xiàng)開(kāi)始相加一直到第n項(xiàng)為止。各具體項(xiàng)根據(jù) i 的取值不同而有所不同,i 取1為第一項(xiàng),取“n”為第n項(xiàng)。體育中常用的連加求和運(yùn)算: 為了避免符號(hào)過(guò)于復(fù)雜,今后凡在求和范圍可以看清的條件下,通常將號(hào)上下標(biāo)省略不寫,簡(jiǎn)記為 補(bǔ)充內(nèi)容:連加和的縮寫式課堂練習(xí):展開(kāi)連加和縮寫式體育統(tǒng)計(jì)學(xué)第二章 統(tǒng)計(jì)資料的收集與整理 收集資料的基本要求 1:資
6、料的準(zhǔn)確性 2:資料的齊同性 3:資料的隨機(jī)性 收集資料的基本方法 1:日常積累 2:全面普查 3:專題研究 第一節(jié) 統(tǒng)計(jì)資料的收集 幾種常用的抽樣方法簡(jiǎn)單隨機(jī)抽樣(完全隨機(jī)抽樣)抽取特點(diǎn):1:不分組,不分類,不排隊(duì)地抽取; 2:總體中每個(gè)個(gè)體都有被抽中的機(jī)會(huì); 3:總體中每個(gè)個(gè)體被抽中的機(jī)會(huì)是均等的。抽取方法:1:抽簽法 2:隨機(jī)數(shù)表法(見(jiàn)隨機(jī)數(shù)表)該方法的優(yōu)點(diǎn):樣本代表性好該方法的缺點(diǎn):總體含量大時(shí),編號(hào)困難。工作量大。 幾種常用的抽樣方法分層抽樣抽取步驟方法:1:按屬性特征分成若干類型、部分或?qū)樱?:在類型、部分或?qū)又邪凑毡壤M(jìn)行簡(jiǎn)單隨機(jī)抽樣。分層的需注意的問(wèn)題:1:層間必須有清晰的界面
7、;(類間差異大,類內(nèi)差異小)2:必須知道各類型中的個(gè)體數(shù)目和比例;3:層的數(shù)目不宜太多,但也不要極少。分層抽樣的優(yōu)點(diǎn):1:能夠提高樣本代表性,又不至于給調(diào)查工作帶來(lái)麻煩,在代表性和工作量之間做出了平衡;2:適用于總體情況復(fù)雜、個(gè)體數(shù)目較多的情況。分層抽樣范例某大學(xué)體育系大一新生總體人數(shù)合計(jì)900人田徑350人籃球200人足球150人網(wǎng)球100人體操80人游泳20人分層田徑35人籃球20人足球15人網(wǎng)球10人體操8人游泳2人按照10%比例簡(jiǎn)單隨機(jī)抽樣研究樣本含量為90人按照學(xué)生專項(xiàng)屬性分層繼續(xù)下一步的研究過(guò)程 幾種常用的抽樣方法整群抽樣整群抽樣的特點(diǎn):區(qū)別于簡(jiǎn)單隨機(jī)抽樣和分層抽樣,抽樣的單位不再
8、是總體中的個(gè)體,是總體中的劃分出來(lái)的群。劃分群應(yīng)注意的問(wèn)題: 群間差異要小,群內(nèi)差異要大。討論: 調(diào)查廣東省初中畢業(yè)生體質(zhì)達(dá)標(biāo)的情況。如何抽樣?第二節(jié) 統(tǒng)計(jì)資料的整理 資料的審核1:初審簡(jiǎn)單排誤2:邏輯檢查專業(yè)知識(shí)、常識(shí),指標(biāo)關(guān)系間排誤3:復(fù)核按比例抽樣復(fù)核 頻數(shù)整理頻數(shù)分布表的制作頻數(shù)分布表的編制(實(shí)例)【例】某小學(xué)五年級(jí)學(xué)生跳繩成績(jī)?nèi)缦拢▎挝唬簜€(gè)/分鐘)。對(duì)數(shù)據(jù)進(jìn)行分組。 117 122 124 129 139 107 117 130 122 125108 131 125 117 122 133 126 122 118 108110 118 123 126 133 134 127 123
9、118 112112 134 127 123 119 113 120 123 127 135137 114 120 128 124 115 139 128 124 121分組方法單變量值分組1. 將一個(gè)變量值作為一組2. 適合于離散變量3. 適合于變量值較少的情況單變量值分組表表 某小學(xué)五年級(jí)學(xué)生跳繩成績(jī)表成績(jī)(個(gè))頻數(shù)(人)成績(jī)(個(gè))頻數(shù)(人)成績(jī)(個(gè))頻數(shù)(人)107108110112113114115117118121211133119120121122123124125126127121443223128129130131133134135137139211122112組距分組將變量值
10、的一個(gè)區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的情況必須遵循“不重不漏”的原則可采用等距分組,也可采用不等距分組組距分組的步驟(等距分組)求全距(極差)R:R最大值最小值確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。在實(shí)際分組時(shí),可以按 Sturges 提出的經(jīng)驗(yàn)公式來(lái)確定組數(shù)K確定組距I:組距(Class Width)是一個(gè)組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來(lái)確定,即:組距( 最大值最小值) 組數(shù) (k)確定組限 (組限:是指每組的起點(diǎn)值與終點(diǎn)值)5. 根據(jù)分組整理成頻數(shù)分布表 填寫組限 按照從上到下、從小到大的順序填寫,只寫下限,不寫上限 劃記
11、將數(shù)據(jù)逐個(gè)劃記到相應(yīng)的組中,五個(gè)為一組 計(jì)算:頻數(shù)(f);頻率;組中值( 組中值該組下限 組距2 )組距分組涉及的幾個(gè)概念1. 下 限:一個(gè)組的最小值2. 上 限:一個(gè)組的最大值3. 組 距:上限與下限之差4. 組中值:下限與上限之間的中點(diǎn)值課堂練習(xí)117 122 124 129 139 107 117 130 122 125108 131 125 117 122 133 126 122 118 108110 118 123 126 133 134 127 123 118 112112 134 127 123 119 113 120 123 127 135137 114 120 128 124
12、 115 139 128 124 121【例】某小學(xué)五年級(jí)學(xué)生跳繩成績(jī)?nèi)缦拢▎挝唬簜€(gè)/分鐘)。對(duì)數(shù)據(jù)進(jìn)行分組。 1.求全距(極差)R: R最大值(Xmax) 139最小值(Xmin) 107 322.確定組數(shù):3.確定組距: 組距( 最大值139 - 最小值107) 組數(shù)7 51 + 1.70/0.306.66774.確定組限: 第一組下限(L1)最小值(Xmin) 組距(I)/2 107 5 /2 104.5105 其他組組限的確定:從第一組開(kāi)始,每一組的下限加上組距,就得到該組的上限,此上限又是下一組的下限,于是就形成了一列左閉右開(kāi)的半開(kāi)區(qū)間5.根據(jù)分組整理成頻數(shù)分布表:(略,參照書P17
13、-P18)需要說(shuō)明的幾個(gè)問(wèn)題 關(guān)于組數(shù)的確定: 1:可以依據(jù)已有的成熟的專業(yè)經(jīng)驗(yàn)來(lái)確定; 2:可參考前蘇聯(lián)專家制定的參考表(如右表)確定: 關(guān)于圖形的繪制:可以繪制直觀的圖形來(lái)方便了解數(shù)據(jù)的信息。較常使用的圖形形式有多邊形圖和直方圖等。圖形中,一般橫坐標(biāo)代表組限,縱坐標(biāo)代表頻數(shù)。樣本含量(n)分組數(shù)(k)30-605-860-1007-10100-2009-12200-50011-15作業(yè)1.每人準(zhǔn)備一本固定的作業(yè)本。2.教材P19第二章習(xí)題第4題,按照步驟與格式制作頻數(shù)分布表及其直方圖。體育統(tǒng)計(jì)學(xué)第三章 樣本特征數(shù)第一節(jié) 集中位置量數(shù)集中趨勢(shì) (位置)離中趨勢(shì) (分散程度)偏態(tài)和峰度(形狀)
14、數(shù)據(jù)的分布特征及其測(cè)量指標(biāo)數(shù)據(jù)特征及其測(cè)量指標(biāo)分布狀況集中趨勢(shì)離散程度方差和標(biāo)準(zhǔn)差平均差峰 度絕對(duì)差全距偏 態(tài)幾何平均數(shù)眾數(shù)中位數(shù)算術(shù)平均數(shù)集中趨勢(shì)(Central tendency)一組數(shù)據(jù)向其中心值靠攏的傾向和程度測(cè)度集中趨勢(shì)就是尋找數(shù)據(jù)一般水平的代表值或中心值不同類型的數(shù)據(jù)用不同的集中趨勢(shì)測(cè)度值低層次數(shù)據(jù)的集中趨勢(shì)指標(biāo)值適用于高層次的測(cè)量數(shù)據(jù),反過(guò)來(lái),高層次數(shù)據(jù)的集中趨勢(shì)指標(biāo)值并不適用于低層次的測(cè)量數(shù)據(jù)選用哪一個(gè)測(cè)度值來(lái)反映數(shù)據(jù)的集中趨勢(shì),要根據(jù)所掌握的數(shù)據(jù)的類型來(lái)確定中位數(shù) (Median)中位數(shù),又稱中數(shù),中點(diǎn)數(shù)。 符號(hào)Md (Median),定義:是指位于一組數(shù)據(jù)中較大一半與較小一
15、半中間位置的那個(gè)數(shù)。Md50%50%中位數(shù) (Median)特征:此數(shù)可能是數(shù)據(jù)中的某一個(gè),也可能根本不是原有的數(shù)據(jù)。不受極端值的影響計(jì)算方法:將數(shù)據(jù)依大小次序排列,若數(shù)據(jù)個(gè)數(shù)為奇數(shù),則取數(shù)列中間的那個(gè)數(shù)為中數(shù);若數(shù)據(jù)個(gè)數(shù)為偶數(shù),則取中間兩個(gè)數(shù)的平均數(shù)為中數(shù)。概念:樣本觀測(cè)值在頻數(shù)分布表中頻數(shù)最多的那一組的組中值。(分組數(shù)據(jù)的眾數(shù),屬于引申概念)原始概念:眾數(shù),符號(hào)Mo,它指在一組數(shù)中出現(xiàn)次數(shù)最多的那個(gè)數(shù)。計(jì)算方法是直接找到出現(xiàn)次數(shù)最多的那個(gè)數(shù)。眾數(shù)具有不唯一性。例如: 眾數(shù) (Mode)無(wú)眾數(shù)原始數(shù)據(jù): 10 5 9 12 6 8一個(gè)眾數(shù)原始數(shù)據(jù): 6 5 9 8 5 5多于一個(gè)眾數(shù)原始數(shù)據(jù)
16、: 25 28 28 36 42 42分組數(shù)據(jù)中眾數(shù)的計(jì)算頻數(shù)最多的那一組的組中值。如書P21-P22:練習(xí):找找眾數(shù),利用上次所做的作業(yè)。幾何平均數(shù)概念:樣本觀測(cè)值的連乘積,并以樣本觀測(cè)值的總數(shù)作為次數(shù),開(kāi)方所得的數(shù)據(jù)。主要適用于一組數(shù)據(jù)中有少量數(shù)據(jù)偏大或偏小,數(shù)據(jù)分布呈偏態(tài)。計(jì)算公式:舉例說(shuō)明:1,2,3,4,8,16,42,108見(jiàn)教材P22,例題3.4算術(shù)平均數(shù)算術(shù)平均數(shù)簡(jiǎn)稱為平均數(shù)或均值,符號(hào)為M(Mean)總體算術(shù)平均數(shù):希臘字母 (音:miu)樣本算術(shù)平均數(shù):英文字母 (音:X bar)。算術(shù)平均數(shù)是由所有數(shù)據(jù)之和除以數(shù)據(jù)個(gè)數(shù)所得的商數(shù),用公式表示為:算術(shù)平均數(shù)在應(yīng)用上有如下特點(diǎn)
17、:算術(shù)平均數(shù)是一個(gè)良好的集中量數(shù),具有反應(yīng)靈敏、確定嚴(yán)密、簡(jiǎn)明易解、計(jì)算簡(jiǎn)單、適合進(jìn)一步演算和較小受抽樣變化的影響等優(yōu)點(diǎn)。算術(shù)平均數(shù)易受極端數(shù)據(jù)的影響,這是因?yàn)槠骄鶖?shù)反應(yīng)靈敏,每個(gè)數(shù)據(jù)的或大或小的變化都會(huì)影響到最終結(jié)果。第二節(jié):離中趨勢(shì)量數(shù)數(shù)據(jù)分布的另一個(gè)重要特征離中趨勢(shì)的各指標(biāo)值是對(duì)數(shù)據(jù)離散程度所作的描述反映各變量值遠(yuǎn)離其中心值的程度,因此也稱為離中趨勢(shì)從另一個(gè)側(cè)面說(shuō)明了集中趨勢(shì)測(cè)度值的代表程度不同類型的數(shù)據(jù)有不同的離散程度測(cè)度值 全距(極差,兩極差)概念:一組數(shù)據(jù)最大值與最小值之差。公式: R最大值(Xmax) 最小值(Xmin)特征與缺陷:1:能夠了解數(shù)據(jù)的范圍(區(qū)域,區(qū)間)。2:只考慮
18、極值,容易受到異常數(shù)據(jù)的影響,屬于粗略的指標(biāo)值,精細(xì)程度不夠。絕對(duì)差與平均差絕對(duì)差:平均差;方差和標(biāo)準(zhǔn)差1:是離散程度的測(cè)量指標(biāo)值之一,最常用。2:能反映數(shù)據(jù)的分布。3:能反映各變量值與均值的平均差異。4:根據(jù)總體數(shù)據(jù)計(jì)算的,稱為總體方差或標(biāo)準(zhǔn)差;根據(jù)樣本數(shù)據(jù)計(jì)算的,稱為樣本方差或標(biāo)準(zhǔn)差。4 6 8 10 12X = 8.3總體方差和標(biāo)準(zhǔn)差的計(jì)算公式總體方差的計(jì)算公式總體標(biāo)準(zhǔn)差的計(jì)算公式樣本方差和標(biāo)準(zhǔn)差樣本方差的計(jì)算公式樣本標(biāo)準(zhǔn)差的計(jì)算公式自由度(degree of freedom)一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個(gè)數(shù)當(dāng)樣本數(shù)據(jù)的個(gè)數(shù)為 n 時(shí),若樣本均值x 確定后,只有n-1個(gè)數(shù)據(jù)可以自由取值
19、,其中必有一個(gè)數(shù)據(jù)則不能自由取值例如,樣本有3個(gè)數(shù)值,即x1=2,x2=4,x3=9,則 x = 5。當(dāng) x = 5 確定后,x1,x2和x3有兩個(gè)數(shù)據(jù)可以自由取值,另一個(gè)則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值樣本方差用自由度去除,其原因可從多方面來(lái)解釋,從實(shí)際應(yīng)用角度看,在抽樣估計(jì)中,當(dāng)用樣本方差去估計(jì)總體方差2時(shí),它是2的無(wú)偏估計(jì)量 平均數(shù)與標(biāo)準(zhǔn)差在體育中的應(yīng)用平均數(shù)與標(biāo)準(zhǔn)差在決策中的直接應(yīng)用。變異系數(shù)在穩(wěn)定性研究中的應(yīng)用。 法在原始數(shù)據(jù)邏輯審核中的應(yīng)用。 平均數(shù)與標(biāo)準(zhǔn)差在決策中的直接應(yīng)用例題:教練員要從兩名標(biāo)槍運(yùn)動(dòng)員中決定一人參加 比賽,如何作出決策?
20、 隊(duì)員甲:40.50;41.26;40.44;39.62;40.12 42.10;39.84;40.18;38.70;39.54 隊(duì)員乙:40.48;42.88;40.50;39.50;38.00; 43.32;38.72;41.82;36.84;40.24簡(jiǎn)單應(yīng)用平局?jǐn)?shù)與標(biāo)準(zhǔn)差進(jìn)行數(shù)據(jù)決策的步驟:1:確定樣本數(shù)據(jù)的全域。2:確定樣本數(shù)據(jù)的平均水平。3:確定樣本數(shù)據(jù)的離散程度。4:根據(jù)專業(yè)專項(xiàng)應(yīng)用要求采取相應(yīng)不同決策。注意:決策前提是認(rèn)同所取得的數(shù)據(jù)是真實(shí)客觀有效的。 變異系數(shù)在穩(wěn)定性研究中的應(yīng)用例題:某運(yùn)動(dòng)員主項(xiàng)為100m跑,兼項(xiàng)為跳遠(yuǎn),在競(jìng)技期內(nèi),其主、兼項(xiàng)目測(cè)試結(jié)果如下: 100m: s
21、 s 跳遠(yuǎn): m m 試比較該運(yùn)動(dòng)員主項(xiàng)、兼項(xiàng)成績(jī)的穩(wěn)定性。 (試比較該運(yùn)動(dòng)員100m跑、跳遠(yuǎn)兩成績(jī)的離散程度。)解答:二者的指標(biāo)單位不同且性質(zhì)不同,不能夠直接進(jìn)行比較。 依據(jù)變異系數(shù)的概念特征,可以計(jì)算CV進(jìn)行比較:由于該運(yùn)動(dòng)員100m跑的CV跳遠(yuǎn)的CV,故該運(yùn)動(dòng)員的100m跑的成績(jī)比跳遠(yuǎn)成績(jī)穩(wěn)定。(或說(shuō)100m跑成績(jī)的離散程度小于跳遠(yuǎn)成績(jī))例題:隨機(jī)抽取某市300名初中男生的身高,經(jīng)檢驗(yàn)基本服從正態(tài)分布,并得出 cm, cm,在這300名學(xué)生中,有三人的身高原始數(shù)據(jù)為 cm, cm, cm。試用 法檢查這三個(gè)數(shù)據(jù)是否為可疑數(shù)據(jù)。 法進(jìn)行原始數(shù)據(jù)邏輯審核的步驟:1:求 的下限和上限。2:數(shù)據(jù)
22、檢驗(yàn),看數(shù)據(jù)是否存在 下限,上限 區(qū)間之內(nèi)。3:作出初步判定 a:在區(qū)間之內(nèi),可以初步認(rèn)定數(shù)據(jù)正常; b:在區(qū)間之外,需要進(jìn)一步審核數(shù)據(jù)的準(zhǔn)確性。法在原始數(shù)據(jù)邏輯審核中的應(yīng)用作業(yè)1.計(jì)算教材P19第二章習(xí)題第4題中樣本數(shù)據(jù)的所有集中量數(shù)指標(biāo)和離散量數(shù)指標(biāo)。2.教材P39第三章習(xí)題第2題。3.自習(xí)教材第三章與第四章未講到的內(nèi)容。體育統(tǒng)計(jì)學(xué)第五章 正態(tài)分布 正態(tài)分布的概念與性質(zhì)100個(gè)樣本數(shù)據(jù)的頻率分布直方圖200個(gè)樣本數(shù)據(jù)的頻率分布直方圖總體密度曲線無(wú)窮多個(gè)樣本數(shù)據(jù)的頻率分布直方圖正態(tài)分布的重要性1.描述連續(xù)型隨機(jī)變量的最重要的分布2.可用于近似連續(xù)型的離散變量的分布3.經(jīng)典統(tǒng)計(jì)推斷的基礎(chǔ)xf
23、(x)概率密度函數(shù)f(x) :隨機(jī)變量 X 的頻數(shù) :總體方差 =3.14159; e = 2.71828x = 隨機(jī)變量的取值 (- x 0正態(tài)曲線的最高點(diǎn)在均值,它也是分布的中位數(shù)和眾數(shù)正態(tài)分布是一簇分布,每一特定正態(tài)分布通過(guò)均值和標(biāo)準(zhǔn)差來(lái)區(qū)分。 決定曲線的位置,稱為位置參數(shù);決定曲線的形狀,稱為形狀參數(shù)。曲線f(x)相對(duì)于均值對(duì)稱,尾端向兩個(gè)方向無(wú)限延伸,且理論上永遠(yuǎn)不會(huì)與橫軸相交正態(tài)曲線下的總面積等于1,即概率值等于1隨機(jī)變量的概率由曲線下的面積給出 和 對(duì)正態(tài)曲線的影響xf(x)CAB正態(tài)分布的概率概率是曲線下的面積 !abxf(x)標(biāo)準(zhǔn)正態(tài)分布 任何一個(gè)一般的正態(tài)分布,可通過(guò)下面的
24、線性變換 轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布 標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)xms一般正態(tài)分布 =1u標(biāo)準(zhǔn)正態(tài)分布 標(biāo)準(zhǔn)正態(tài)分布 標(biāo)準(zhǔn)正態(tài)分布的重要性一般正態(tài)分布的不同取決于均值和標(biāo)準(zhǔn)差 計(jì)算概率時(shí) ,每一個(gè)一般正態(tài)分布都需要有自己的正態(tài)概率分布表,這種表格是無(wú)窮多的。若能將一般正態(tài)分布轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布,計(jì)算概率時(shí)就只需查一張表(標(biāo)準(zhǔn)正態(tài)分布表)就可以了。先將一個(gè)一般正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布計(jì)算概率時(shí),查標(biāo)準(zhǔn)正態(tài)概率分布表對(duì)于負(fù)的 x ,可由 (-x)- x得到對(duì)于標(biāo)準(zhǔn)正態(tài)分布,即X N(0,12),有P (a X b) b aP (|X| a) 2 a 1對(duì)于一般正態(tài)分布,即X N( , 2),有標(biāo)準(zhǔn)正態(tài)分
25、布表的使用 標(biāo)準(zhǔn)化的例子A(5,102)x =5=10一般正態(tài)分布6.2 =1u標(biāo)準(zhǔn)正態(tài)分布 00.12.0478P(5 X 6.2) 標(biāo)準(zhǔn)化的例子B(5,102)一般正態(tài)分布.1664.0832.0832標(biāo)準(zhǔn)正態(tài)分布P(2.9 X 7.1)正態(tài)分布(實(shí)例) 【例】設(shè)UN(0,12),求以下概率值: (1) P(U2); (3) P(-1U3) ; (4) P(| U| 2) 解:(1) P(U 2)=1- P(U 2)=1-0.9973=0.0227 (3) P(-1U 3)= P(U 3)- P(U-1) = (3)- (-1)= (3) 1-(1) = 0.9987-(1-0.8413)
26、=0.8354 (4) P(| U | 2) = P(-2 U 2)= (2)- (-2) = (2)- 1-(2)=2 (2)- 1=0.9545 正態(tài)分布(實(shí)例) 【例】設(shè)XN(5,32),求以下概率值 (1) P(X 10) ; (2) P(2X 10) 解: (1) (2)正態(tài)分布(實(shí)例)【例】設(shè)XN(1,4),求P (0X1.6)解: XN(1,4) XN(1,22) 故, = 1, = 2 P (0X1.6) 正態(tài)分布理論在體育中的應(yīng)用主要應(yīng)用方面:制定考核標(biāo)準(zhǔn)制定離差評(píng)價(jià)表進(jìn)行人數(shù)估算在綜合評(píng)價(jià)中統(tǒng)一 變量單位應(yīng)用正態(tài)分布理論制定考核標(biāo)準(zhǔn)制定考核標(biāo)準(zhǔn)的步驟:1:制作正態(tài)曲線的分布
27、草圖。2:計(jì)算出從 到 ui值所圍成的面積概率。3:查表求得各等級(jí)的ui值。4:求得各等級(jí)標(biāo)準(zhǔn)的原始成績(jī)xi值。舉例說(shuō)明(如書本例5.1)應(yīng)用正態(tài)分布理論制定離差評(píng)價(jià)表制定離差評(píng)價(jià)表的步驟:1:根據(jù)指標(biāo)總數(shù)畫好框表。2:將各個(gè)指標(biāo)的平均數(shù)填入0標(biāo)準(zhǔn)差等級(jí)線與各個(gè)指標(biāo)縱線的交叉處。3:計(jì)算1標(biāo)準(zhǔn)差,2標(biāo)準(zhǔn)差,3標(biāo)準(zhǔn)差的對(duì)應(yīng)指標(biāo)數(shù)值,并填入各級(jí)標(biāo)準(zhǔn)差等級(jí)線與各個(gè)指標(biāo)縱線的交叉處。特別要注意計(jì)量的方向性(如:田徑中田賽與徑賽的計(jì)分區(qū)別)。4:依據(jù)指標(biāo)成績(jī)基礎(chǔ)值和指標(biāo)變化值畫出不同時(shí)期的變化圖線。5:注意離差等級(jí)的劃分標(biāo)準(zhǔn)合理制定。(參考標(biāo)準(zhǔn)有兩種)舉例說(shuō)明(如書本例5.2)應(yīng)用正態(tài)分布理論進(jìn)行人數(shù)估
28、算應(yīng)用正態(tài)分布理論進(jìn)行人數(shù)估算的步驟:1:作正態(tài)分布曲線的草圖,以確定估計(jì)范圍。2:求各個(gè)區(qū)間的ui 值。3:查表找到所估計(jì)范圍的面積概率。4:計(jì)算估計(jì)范圍的人數(shù)。舉例說(shuō)明(如書本例5.3)在綜合評(píng)價(jià)中統(tǒng)一 變量單位U分法:就是依據(jù)距離平均數(shù)有多少個(gè)標(biāo)準(zhǔn)差的距離來(lái)確定分?jǐn)?shù)的方法。如果距離平均數(shù)在正方向有2個(gè)標(biāo)準(zhǔn)差的距離,則記為U分為2分。在負(fù)方向有2個(gè)標(biāo)準(zhǔn)差距離,則記為U分為-2分。直接用u值來(lái)評(píng)分。Z分法:是通過(guò)U分轉(zhuǎn)換成更加符合實(shí)際運(yùn)用情況的分?jǐn)?shù)計(jì)量方法??梢赞D(zhuǎn)換為百分計(jì)分法,公式為:累計(jì)計(jì)分法:用于符合正態(tài)分布的前提下不等距升分的方法之一。其公式為:百分位數(shù)法:用于不符合正態(tài)分布的條件下
29、使用變換分?jǐn)?shù)的變量標(biāo)準(zhǔn)化法。其公式見(jiàn)教材P99(5.15)。作業(yè)1. P49 第三章課后習(xí)題第7題。2. P99 第五章課后習(xí)題第2題。3. P100 第五章課后習(xí)題第3題。4. P100 第五章課后習(xí)題第5題。體育統(tǒng)計(jì)學(xué)第六章 統(tǒng)計(jì)推斷 (假設(shè)檢驗(yàn)) 關(guān)于誤差的說(shuō)明1:隨機(jī)誤差偶然因素造成,不可避免,無(wú)法消除2:系統(tǒng)誤差實(shí)驗(yàn)條件和研究方法造成的,可以改善3:抽樣誤差抽出的樣本統(tǒng)計(jì)量之間或樣本統(tǒng)計(jì)量與總體參數(shù)之間的偏差,主要由于個(gè)體間差異造成的,樣本含量增大時(shí),抽樣誤差會(huì)有減少的趨勢(shì)4:人為誤差(過(guò)失錯(cuò)誤)人為過(guò)失錯(cuò)誤造成的統(tǒng)計(jì)數(shù)據(jù)的失真性。統(tǒng)計(jì)處理中最關(guān)心的是系統(tǒng)誤差和抽樣誤差。第一節(jié) 參數(shù)
30、估計(jì)第一節(jié) 參數(shù)估計(jì) 關(guān)于“標(biāo)準(zhǔn)誤”的概念表示樣本均數(shù)(或樣本率)與總體均數(shù) (或總體率)之間偏差程度的標(biāo)準(zhǔn)差。 均數(shù)標(biāo)準(zhǔn)誤的計(jì)算公式:第一節(jié) 參數(shù)估計(jì) 均數(shù)標(biāo)準(zhǔn)誤的計(jì)算公式:第一節(jié) 參數(shù)估計(jì) 點(diǎn)估計(jì)與區(qū)間估計(jì)點(diǎn) 估 計(jì)選定適當(dāng)?shù)臉颖窘y(tǒng)計(jì)量作為參數(shù)的估計(jì)量。區(qū)間估計(jì)以變量的概率分布規(guī)律來(lái)確定未知參數(shù) 值的可能范圍。置信概率在區(qū)間估計(jì)中,預(yù)選規(guī)定的概率。置信區(qū)間在區(qū)間估計(jì)中,按照預(yù)選規(guī)定的概率確 定下來(lái)的區(qū)間范圍。 置信區(qū)間的計(jì)算一:總體均數(shù)的置信區(qū)間1:大樣本含量(n45),可以認(rèn)定符合正態(tài)分布,根據(jù)正態(tài)分布原理,用u分計(jì)算。2:小樣本含量(n45),不符合正態(tài)分布,只能根據(jù)t分布原理,用t分
31、計(jì)算。二:總體率的置信區(qū)間 樣本含量必須足夠大(如:n100) p的抽樣分布逼近正態(tài)分布,用u分計(jì)算。計(jì)算公式:教材P108-109.假設(shè)檢驗(yàn)的基本思想及步驟 主要學(xué)習(xí)目標(biāo) : 假設(shè)檢驗(yàn)的基本知識(shí) u 檢驗(yàn) t 檢驗(yàn) 卡方檢驗(yàn)(不講)什么是假設(shè)?假設(shè)是對(duì)總體參數(shù)的一種看法總體參數(shù)包括總體均值、比例、方差等分析之前必需要有合理的陳述我認(rèn)為:蛙跳訓(xùn)練能夠促進(jìn)100m跑成績(jī)的提高!什么是假設(shè)檢驗(yàn)?根據(jù)研究目的,對(duì)樣本所屬總體的特征提出一個(gè)假設(shè),然后根據(jù)樣本資料所提供的信息,對(duì)這個(gè)假設(shè)作出拒絕或者不拒絕的判斷,這一過(guò)程成為假設(shè)檢驗(yàn)。概念核心:事先對(duì)總體參數(shù)或分布形式作出某種假設(shè)然后利用樣本信息來(lái)判斷原
32、假設(shè)是否成立假設(shè)檢驗(yàn)的基本思想. 因此我們拒絕假設(shè) = 173 cm. 我們假設(shè)這個(gè)是總體的真實(shí)均值樣本均值m = 173 cm抽樣分布H0這個(gè)是我們抽樣得出的某個(gè)樣本均值 .150總體假設(shè)檢驗(yàn)的過(guò)程(提出假設(shè)抽取樣本作出決策)抽取隨機(jī)樣本均值 X = 15.6秒初三男生100M平均成績(jī)是13.6秒提出假設(shè) 拒絕假設(shè)! 別無(wú)選擇.作出決策假設(shè)檢驗(yàn)中的小概率原理 什么是小概率?1.在一次試驗(yàn)中,一個(gè)幾乎不可能發(fā)生的事件發(fā)生的概率2.在一次試驗(yàn)中小概率事件一旦發(fā)生,我們就有理由拒絕原假設(shè)3.小概率由研究者事先確定(與置信區(qū)間相關(guān))抽樣分布H0值臨界值臨界值a/2 a/2 樣本統(tǒng)計(jì)量拒絕域拒絕域接受
33、域1 - 置信水平假設(shè)檢驗(yàn)的基本步驟(1)根據(jù)實(shí)際情況建立原假設(shè)H0 ,備擇假設(shè)H1(2)選擇并計(jì)算檢驗(yàn)統(tǒng)計(jì)量的取值(3)確定顯著性水平,查表得出相應(yīng)的臨界值(4)把實(shí)值與臨界值進(jìn)行比較,作出統(tǒng)計(jì)判斷 什么檢驗(yàn)統(tǒng)計(jì)量?1. 用于假設(shè)檢驗(yàn)問(wèn)題的統(tǒng)計(jì)量2. 選擇統(tǒng)計(jì)量的方法與參數(shù)估計(jì)相同,需考慮是大樣本還是小樣本總體方差已知還是未知3.檢驗(yàn)統(tǒng)計(jì)量的基本形式為確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量提出原假設(shè)H0 和備擇假設(shè)H1 什么是原假設(shè)?(Null Hypothesis)1.待檢驗(yàn)的假設(shè),又稱“0假設(shè)、虛無(wú)假設(shè)”。2.如果錯(cuò)誤地作出決策會(huì)導(dǎo)致一系列后果。3.總是有等號(hào) , 或4.表示為 H0 H0 : 某一數(shù)值0
34、 例如, H0 : 1.73(米)提出原假設(shè)H0和備擇假設(shè)H1 什么是備擇假設(shè)?(Alternative Hypothesis)1.與原假設(shè)對(duì)立的假設(shè)2.總是有不等號(hào): , 或 3.表示為 H1 H1: 某一數(shù)值,或 某一數(shù)值 例如, H1: F ,則拒絕原假設(shè)H0 ,表明均值之間的差異是顯著的,所檢驗(yàn)的因素(A)對(duì)觀察值有顯著影響若FF ,則不能拒絕原假設(shè)H0 ,表明所檢驗(yàn)的因素(A)對(duì)觀察值沒(méi)有顯著影響 單因素方差分析表(基本結(jié)構(gòu))方差來(lái)源平方和SS自由度df均方MSF 值組間(因素影響)組內(nèi)(誤差)總和SSASSESSTk-1n-kn-1MSAMSEMSAMSE單因素方差分析(一個(gè)例子)
35、【例】為了對(duì)幾個(gè)行業(yè)的服務(wù)質(zhì)量進(jìn)行評(píng)價(jià),消費(fèi)者協(xié)會(huì)在零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)分別抽取了不同的樣本,其中零售業(yè)抽取7家,旅游業(yè)抽取了6家,航空公司抽取5家、家電制造業(yè)抽取了5家,然后記錄了一年中消費(fèi)者對(duì)總共23家服務(wù)企業(yè)投訴的次數(shù),結(jié)果如表9.7。試分析這四個(gè)行業(yè)的服務(wù)質(zhì)量是否有顯著差異?(0.05)單因素方差分析(一個(gè)例子)消費(fèi)者對(duì)四個(gè)行業(yè)的投訴次數(shù) 觀察值( j )行業(yè)( A )零售業(yè)旅游業(yè)航空公司家電制造業(yè)123456757554645545347 624960545655 5149485547 7068636960 單因素方差分析(計(jì)算結(jié)果)解:設(shè)四個(gè)行業(yè)被投訴次數(shù)的均值分別
36、為,m1、m2 、m3、m4 ,則需要檢驗(yàn)如下假設(shè) H0: m1 = m2 = m3 = m4 (四個(gè)行業(yè)的服務(wù)質(zhì)量無(wú)顯著差異) H1: m1 ,m2 ,m3, m4不全相等 (有顯著差異)Excel輸出的結(jié)果如下 結(jié)論:拒絕H0。四個(gè)行業(yè)的服務(wù)質(zhì)量有顯著差異 方差分析中的多重比較 (作用)多重比較是通過(guò)對(duì)總體均值之間的配對(duì)比較來(lái)進(jìn)一步檢驗(yàn)到底哪些均值之間存在差異多重比較方法有多種,這里介紹Fisher提出的最小顯著差異方法,簡(jiǎn)寫為L(zhǎng)SD,該方法可用于判斷到底哪些均值之間有差異 LSD方法是對(duì)檢驗(yàn)兩個(gè)總體均值是否相等的t檢驗(yàn)方法的總體方差估計(jì)加以修正(用MSE來(lái)代替)而得到的 方差分析中的多重
37、比較(步驟)提出假設(shè)H0: mi = mj (第i個(gè)總體的均值等于第j個(gè)總體的均值)H1: mi mj (第i個(gè)總體的均值不等于第j個(gè)總體的均值)檢驗(yàn)的統(tǒng)計(jì)量為 若|t|t,拒絕H0;若|t|t,不能拒絕H0方差分析中的多重比較(基于統(tǒng)計(jì)量xi-xj的LSD方法)通過(guò)判斷樣本均值之差的大小來(lái)檢驗(yàn) H0檢驗(yàn)的統(tǒng)計(jì)量為 :xi xj檢驗(yàn)的步驟為 提出假設(shè)H0: mi = mj (第i個(gè)總體的均值等于第j個(gè)總體的均值)H1: mi mj (第i個(gè)總體的均值不等于第j個(gè)總體的均值)計(jì)算LSD若|xi-xj| LSD,拒絕H0,若|xi-xj| 2.096 顏色1與顏色2的銷售量有顯著差異|x1-x3|
38、= |27.3-26.4| =0.92.096 顏色1與顏色4的銷售量有顯著差異|x2-x3|= |29.5-26.4| =3.12.096 顏色2與顏色3的銷售量有顯著差異|x2-x4|= |29.5-31.4| =1.92.096 顏色3與顏色4的銷售量有顯著差異體育統(tǒng)計(jì)學(xué)第八章 相關(guān)分析變量間的關(guān)系(函數(shù)關(guān)系)是一一對(duì)應(yīng)的確定關(guān)系設(shè)有兩個(gè)變量 x 和 y ,變量 y 隨變量 x 一起變化,并完全依賴于 x ,當(dāng)變量 x 取某個(gè)數(shù)值時(shí), y 依確定的關(guān)系取相應(yīng)的值,則稱 y 是 x 的函數(shù),記為 y = f (x),其中 x 稱為自變量,y 稱為因變量各觀測(cè)點(diǎn)落在一條線上 xy 函數(shù)關(guān)系的
39、例子圓的面積(S)與半徑之間的關(guān)系可表示為: S = R2 某種商品的銷售額(y)與銷售量(x)之間的關(guān)系可表示為: y = p x (p 為單價(jià))變量間的關(guān)系(函數(shù)關(guān)系)變量間的關(guān)系(相關(guān)關(guān)系)變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá)一個(gè)變量的取值不能由另一個(gè)變量唯一確定當(dāng)變量 x 取某個(gè)值時(shí),變量 y 的取值可能有幾個(gè)各觀測(cè)點(diǎn)分布在直線周圍 xy 相關(guān)關(guān)系的例子父親身高(y)與子女身高(x)之間的關(guān)系家庭收入狀況(y)與體育消費(fèi)(x)之間的關(guān)系體育用品銷售額(y)與廣告費(fèi)支出(x)之間的關(guān)系收入水平(y)與受教育程度(x)之間的關(guān)系變量間的關(guān)系(相關(guān)關(guān)系)相關(guān)關(guān)系的類型相關(guān)關(guān)系非線性相關(guān)線性相關(guān)正
40、相關(guān)正相關(guān)負(fù)相關(guān)負(fù)相關(guān)完全相關(guān)不相關(guān)相關(guān)關(guān)系的圖示不相關(guān)負(fù)線性相關(guān)正線性相關(guān)非線性相關(guān)完全負(fù)線性相關(guān)完全正線性相關(guān)相關(guān)系數(shù)對(duì)變量之間關(guān)系密切程度的度量對(duì)兩個(gè)變量之間線性相關(guān)程度的度量稱為簡(jiǎn)單相關(guān)系數(shù)或積差相關(guān)系數(shù)。若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計(jì)算的,稱為總體相關(guān)系數(shù),記為若是根據(jù)樣本數(shù)據(jù)計(jì)算的,則稱為樣本相關(guān)系數(shù),記為 r簡(jiǎn)單相關(guān)系數(shù)(積差相關(guān)系數(shù)) 樣本相關(guān)系數(shù)的計(jì)算公式或化簡(jiǎn)為相關(guān)系數(shù)取值及其意義 r 的取值范圍是 -1,1|r|=1,為完全相關(guān)r =1,為完全正相關(guān)r = -1,為完全負(fù)正相關(guān) r = 0,不存在線性相關(guān)-1 r 0,為負(fù)相關(guān) 0 t,拒絕H0 若tt,接受H0若IrI大
41、于表上的=5%相應(yīng)的值,且小于表上1%相應(yīng)的值,稱變量x與y之間有顯著的線性關(guān)系若IrI大于表上=1%相應(yīng)的值,稱變量x與y之間有十分(非常)顯著的線性關(guān)系若IrI小于表上=5%相應(yīng)的值,稱變量x與y之間沒(méi)有明顯的線性關(guān)系相關(guān)系數(shù)的顯著性檢驗(yàn) 相關(guān)系數(shù)的顯著性檢驗(yàn)(實(shí)例)以例8.1為例:對(duì)其相關(guān)系數(shù)進(jìn)行檢驗(yàn)解:第一步:提出假設(shè): H0: ;H1: 0第二步:計(jì)算檢驗(yàn)統(tǒng)計(jì)量: 相關(guān)系數(shù)的顯著性檢驗(yàn)(實(shí)例)第三步:確定顯著性水平,并作出決策體育統(tǒng)計(jì)學(xué)第九章 回歸分析(一元線性回歸)什么是回歸分析?(內(nèi)容)從一組樣本數(shù)據(jù)出發(fā),確定變量之間的數(shù)學(xué)關(guān)系式對(duì)這些關(guān)系式的可信程度進(jìn)行各種統(tǒng)計(jì)檢驗(yàn),并從影響某
42、一特定變量的諸多變量中找出哪些變量的影響顯著,哪些不顯著利用所求的關(guān)系式,根據(jù)一個(gè)或幾個(gè)變量的取值來(lái)預(yù)測(cè)或控制另一個(gè)特定變量的取值,并給出這種預(yù)測(cè)或控制的精確程度回歸分析與相關(guān)分析的區(qū)別相關(guān)分析中,變量 x 變量 y 處于平等的地位;回歸分析中,變量 y 稱為因變量,處在被解釋的地位,x 稱為自變量,用于預(yù)測(cè)因變量的變化相關(guān)分析中所涉及的變量 x 和 y 都是隨機(jī)變量;回歸分析中,因變量 y 是隨機(jī)變量,自變量 x 可以是隨機(jī)變量,也可以是非隨機(jī)的確定變量相關(guān)分析主要是描述兩個(gè)變量之間線性關(guān)系的密切程度;回歸分析不僅可以揭示變量 x 對(duì)變量 y 的影響大小,還可以由回歸方程進(jìn)行預(yù)測(cè)和控制 回歸
43、模型的類型一個(gè)自變量?jī)蓚€(gè)及兩個(gè)以上自變量回歸模型多元回歸一元回歸線性回歸非線性回歸線性回歸非線性回歸回歸模型與回歸方程回歸模型回答“變量之間是什么樣的關(guān)系?”方程中運(yùn)用1 個(gè)數(shù)字的因變量(響應(yīng)變量)被預(yù)測(cè)的變量1 個(gè)或多個(gè)數(shù)字的或分類的自變量 (解釋變量)用于預(yù)測(cè)的變量3.主要用于預(yù)測(cè)和估計(jì)一元線性回歸模型 (概念要點(diǎn))當(dāng)只涉及一個(gè)自變量時(shí)稱為一元回歸,若因變量 y 與自變量 x 之間為線性關(guān)系時(shí)稱為一元線性回歸對(duì)于具有線性關(guān)系的兩個(gè)變量,可以用一條線性方程來(lái)表示它們之間的關(guān)系描述因變量 y 如何依賴于自變量 x 和誤差項(xiàng) 的方程稱為回歸模型一元線性回歸模型 (概念要點(diǎn)) 對(duì)于只涉及一個(gè)自變量
44、的簡(jiǎn)單線性回歸模型可表示為 y = b0 + b1 x + e模型中,y 是 x 的線性函數(shù)(部分)加上誤差項(xiàng)線性部分反映了由于 x 的變化而引起的 y 的變化誤差項(xiàng) 是隨機(jī)變量反映了除 x 和 y 之間的線性關(guān)系之外的隨機(jī)因素對(duì) y 的影響是不能由 x 和 y 之間的線性關(guān)系所解釋的變異性0 和 1 稱為模型的參數(shù)一元線性回歸模型(基本假定)誤差項(xiàng)是一個(gè)期望值為0的隨機(jī)變量,即E()=0。對(duì)于一個(gè)給定的 x 值,y 的期望值為E ( y ) = 0+ 1 x對(duì)于所有的 x 值,的方差2 都相同誤差項(xiàng)是一個(gè)服從正態(tài)分布的隨機(jī)變量,且相互獨(dú)立。即N( 0 ,2 )獨(dú)立性意味著對(duì)于一個(gè)特定的 x
45、值,它所對(duì)應(yīng)的與其他 x 值所對(duì)應(yīng)的不相關(guān)對(duì)于一個(gè)特定的 x 值,它所對(duì)應(yīng)的 y 值與其他 x 所對(duì)應(yīng)的 y 值也不相關(guān)回歸方程 (概念要點(diǎn))描述 y 的平均值或期望值如何依賴于 x 的方程稱為回歸方程簡(jiǎn)單線性回歸方程的形式如下 E( y ) = 0+ 1 x方程的圖示是一條直線,因此也稱為直線回歸方程0是回歸直線在 y 軸上的截距,是當(dāng) x=0 時(shí) y 的期望值1是直線的斜率,稱為回歸系數(shù),表示當(dāng) x 每變動(dòng)一個(gè)單位時(shí),y 的平均變動(dòng)值估計(jì)(經(jīng)驗(yàn))的回歸方程簡(jiǎn)單線性回歸中估計(jì)的回歸方程為其中: 是估計(jì)的回歸直線在 y 軸上的截距, 是直線的斜率,它表示對(duì)于一個(gè)給定的 x 的值,是 y 的估計(jì)
46、值,也表示 x 每變動(dòng)一個(gè)單位時(shí), y 的平均變動(dòng)值 用樣本統(tǒng)計(jì)量 和 代替回歸方程中的未知參數(shù) 和 ,就得到了估計(jì)的回歸方程總體回歸參數(shù) 和 是未知的,必需利用樣本數(shù)據(jù)去估計(jì)參數(shù) 0 和 1 的最小二乘估計(jì)最小二乘法 (概念要點(diǎn))使因變量的觀察值與估計(jì)值之間的離差平方和達(dá)到最小來(lái)求得 和 的方法。即用最小二乘法擬合的直線來(lái)代表x與y之間的關(guān)系與實(shí)際數(shù)據(jù)的誤差比其他任何直線都小最小二乘法(圖示)xy(xn , yn)(x1 , y1)(x2 , y2)(xi , yi)ei = yi-yi最小二乘法 ( 和 的計(jì)算公式) 根據(jù)最小二乘法的要求,可得求解 和 的標(biāo)準(zhǔn)方程如下估計(jì)方程的求法(實(shí)例)
47、 【例】根據(jù)例10.1中的數(shù)據(jù),配合人均消費(fèi)金額對(duì)人均國(guó)民收入的回歸方程 根據(jù) 和 的求解公式得估計(jì)(經(jīng)驗(yàn))方程 人均消費(fèi)金額對(duì)人均國(guó)民收入的回歸方程為y = 54.22286 + 0.52638 x估計(jì)方程的求法(Excel的輸出結(jié)果)回歸方程的顯著性檢驗(yàn)離差平方和的分解因變量 y 的取值是不同的,y 取值的這種波動(dòng)稱為變差。變差來(lái)源于兩個(gè)方面由于自變量 x 的取值不同造成的除 x 以外的其他因素(如x對(duì)y的非線性影響、測(cè)量誤差等)的影響對(duì)一個(gè)具體的觀測(cè)值來(lái)說(shuō),變差的大小可以通過(guò)該實(shí)際觀測(cè)值與其均值之差 來(lái)表示離差平方和的分解(圖示)xyy離差分解圖離差平方和的分解 (三個(gè)平方和的關(guān)系)2.
48、 兩端平方后求和有從圖上看有SST = SSR + SSE總變差平方和(SST)回歸平方和(SSR)殘差平方和(SSE)離差平方和的分解 (三個(gè)平方和的意義)總平方和(SST)反映因變量的 n 個(gè)觀察值與其均值的總離差回歸平方和(SSR)反映自變量 x 的變化對(duì)因變量 y 取值變化的影響,或者說(shuō),是由于 x 與 y 之間的線性關(guān)系引起的 y 的取值變化,也稱為可解釋的平方和殘差平方和(SSE)反映除 x 以外的其他因素對(duì) y 取值的影響,也稱為不可解釋的平方和或剩余平方和樣本決定系數(shù) (判定系數(shù) r2 )回歸平方和占總離差平方和的比例反映回歸直線的擬合程度取值范圍在 0 , 1 之間 r2 1
49、,說(shuō)明回歸方程擬合的越好;r20,說(shuō)明回歸方程擬合的越差判定系數(shù)等于相關(guān)系數(shù)的平方,即r2(r)2回歸方程的顯著性檢驗(yàn) (線性關(guān)系的檢驗(yàn) )檢驗(yàn)自變量和因變量之間的線性關(guān)系是否顯著具體方法是將回歸離差平方和(SSR)同剩余離差平方和(SSE)加以比較,應(yīng)用F檢驗(yàn)來(lái)分析二者之間的差別是否顯著如果是顯著的,兩個(gè)變量之間存在線性關(guān)系如果不顯著,兩個(gè)變量之間不存在線性關(guān)系回歸方程的顯著性檢驗(yàn) (檢驗(yàn)的步驟)提出假設(shè)H0:線性關(guān)系不顯著2. 計(jì)算檢驗(yàn)統(tǒng)計(jì)量F確定顯著性水平,并根據(jù)分子自由度1和分母自由度n-2找出臨界值F 作出決策:若FF ,拒絕H0;若Ft,拒絕H0; tt=2.201,拒絕H0,表明
50、人均收入與人均消費(fèi)之間有線性關(guān)系對(duì)前例的回歸系數(shù)進(jìn)行顯著性檢驗(yàn)(0.05)回歸系數(shù)的顯著性檢驗(yàn)(Excel輸出的結(jié)果)預(yù)測(cè)及應(yīng)用利用回歸方程進(jìn)行估計(jì)和預(yù)測(cè)根據(jù)自變量 x 的取值估計(jì)或預(yù)測(cè)因變量 y的取值估計(jì)或預(yù)測(cè)的類型點(diǎn)估計(jì)y 的平均值的點(diǎn)估計(jì)y 的個(gè)別值的點(diǎn)估計(jì)區(qū)間估計(jì)y 的平均值的置信區(qū)間估計(jì)y 的個(gè)別值的預(yù)測(cè)區(qū)間估計(jì)利用回歸方程進(jìn)行估計(jì)和預(yù)測(cè)(點(diǎn)估計(jì))2. 點(diǎn)估計(jì)值有y 的平均值的點(diǎn)估計(jì)y 的個(gè)別值的點(diǎn)估計(jì)3. 在點(diǎn)估計(jì)條件下,平均值的點(diǎn)估計(jì)和個(gè)別值的的點(diǎn)估計(jì)是一樣的,但在區(qū)間估計(jì)中則不同對(duì)于自變量 x 的一個(gè)給定值x0 ,根據(jù)回歸方程得到因變量 y 的一個(gè)估計(jì)值利用回歸方程進(jìn)行估計(jì)和預(yù)
51、測(cè)(點(diǎn)估計(jì)) y 的平均值的點(diǎn)估計(jì)利用估計(jì)的回歸方程,對(duì)于自變量 x 的一個(gè)給定值 x0 ,求出因變量 y 的平均值的一個(gè)估計(jì)值E(y0) ,就是平均值的點(diǎn)估計(jì)在前面的例子中,假如我們要估計(jì)人均國(guó)民收入為2000元時(shí),所有年份人均消費(fèi)金額的的平均值,就是平均值的點(diǎn)估計(jì)。根據(jù)估計(jì)的回歸方程得利用回歸方程進(jìn)行估計(jì)和預(yù)測(cè)(點(diǎn)估計(jì)) y 的個(gè)別值的點(diǎn)估計(jì)利用估計(jì)的回歸方程,對(duì)于自變量 x 的一個(gè)給定值 x0 ,求出因變量 y 的一個(gè)個(gè)別值的估計(jì)值 ,就是個(gè)別值的點(diǎn)估計(jì)2. 比如,如果我們只是想知道1990年人均國(guó)民收入為1250.7元時(shí)的人均消費(fèi)金額是多少,則屬于個(gè)別值的點(diǎn)估計(jì)。根據(jù)估計(jì)的回歸方程得利
52、用回歸方程進(jìn)行估計(jì)和預(yù)測(cè) (區(qū)間估計(jì))點(diǎn)估計(jì)不能給出估計(jì)的精度,點(diǎn)估計(jì)值與實(shí)際值之間是有誤差的,因此需要進(jìn)行區(qū)間估計(jì)對(duì)于自變量 x 的一個(gè)給定值 x0,根據(jù)回歸方程得到因變量 y 的一個(gè)估計(jì)區(qū)間區(qū)間估計(jì)有兩種類型置信區(qū)間估計(jì)預(yù)測(cè)區(qū)間估計(jì)利用回歸方程進(jìn)行估計(jì)和預(yù)測(cè)(置信區(qū)間估計(jì)) y 的平均值的置信區(qū)間估計(jì) 利用估計(jì)的回歸方程,對(duì)于自變量 x 的一個(gè)給定值 x0 ,求出因變量 y 的平均值E(y0)的估計(jì)區(qū)間 ,這一估計(jì)區(qū)間稱為置信區(qū)間 E(y0) 在1-置信水平下的置信區(qū)間為式中:Sy為估計(jì)標(biāo)準(zhǔn)誤差利用回歸方程進(jìn)行估計(jì)和預(yù)測(cè)(置信區(qū)間估計(jì):算例) 【例】根據(jù)前例,求出人均國(guó)民收入為1250.7
53、元時(shí),人均消費(fèi)金額95%的置信區(qū)間 解:根據(jù)前面的計(jì)算結(jié)果 712.57,Sy=14.95,t(13-2)2.201,n=13 置信區(qū)間為712.5710.265人均消費(fèi)金額95%的置信區(qū)間為702.305元722.835元之間利用回歸方程進(jìn)行估計(jì)和預(yù)測(cè)(預(yù)測(cè)區(qū)間估計(jì)) y 的個(gè)別值的預(yù)測(cè)區(qū)間估計(jì) 利用估計(jì)的回歸方程,對(duì)于自變量 x 的一個(gè)給定值 x0 ,求出因變量 y 的一個(gè)個(gè)別值的估計(jì)區(qū)間,這一區(qū)間稱為預(yù)測(cè)區(qū)間 y0在1-置信水平下的預(yù)測(cè)區(qū)間為注意!利用回歸方程進(jìn)行估計(jì)和預(yù)測(cè)(置預(yù)測(cè)區(qū)間估計(jì):算例) 【例】根據(jù)前例,求出1990年人均國(guó)民收入為1250.7元時(shí),人均消費(fèi)金額的95%的預(yù)測(cè)區(qū)
54、間 解:根據(jù)前面的計(jì)算結(jié)果有 712.57,Sy=14.95,t(13-2)2.201,n=13 置信區(qū)間為712.5734.469人均消費(fèi)金額95%的預(yù)測(cè)區(qū)間為678.101元747.039元之間影響區(qū)間寬度的因素1.置信水平 (1 - )區(qū)間寬度隨置信水平的增大而增大2.數(shù)據(jù)的離散程度 (s)區(qū)間寬度隨離散程度的增大而增大3.樣本容量區(qū)間寬度隨樣本容量的增大而減小4.用于預(yù)測(cè)的 xp與x的差異程度區(qū)間寬度隨 xp與x 的差異程度的增大而增大置信區(qū)間、預(yù)測(cè)區(qū)間、回歸方程xpyxx預(yù)測(cè)上限置信上限預(yù)測(cè)下限置信下限第三節(jié) 多元線性回歸一. 多元線性回歸模型回歸參數(shù)的估計(jì)回歸方程的顯著性檢驗(yàn)回歸系
55、數(shù)的顯著性檢驗(yàn)多元線性回歸的預(yù)測(cè)多元線性回歸模型多元線性回歸模型 (概念要點(diǎn))一個(gè)因變量與兩個(gè)及兩個(gè)以上自變量之間的回歸描述因變量 y 如何依賴于自變量 x1 , x2 , xp 和誤差項(xiàng) 的方程稱為多元線性回歸模型涉及 p 個(gè)自變量的多元線性回歸模型可表示為 b0 ,b1,b2 ,bp是參數(shù) 是被稱為誤差項(xiàng)的隨機(jī)變量 y 是x1,,x2 , ,xp 的線性函數(shù)加上誤差項(xiàng) 說(shuō)明了包含在y里面但不能被p個(gè)自變量的線性關(guān)系所解釋的變異性多元線性回歸模型 (概念要點(diǎn)) 對(duì)于 n 組實(shí)際觀察數(shù)據(jù)(yi ; xi1,,xi2 , ,xip ),(i=1,2,n),多元線性回歸模型可表示為y1 = b0
56、+ b1 x11+ b2 x12 + bpx1p + e1y2= b0 + b1 x21 + b2 x22 + bpx2p + e2 yn= b0 + b1 xn1 + b2 xn2 + bpxnp + en多元線性回歸模型(基本假定)自變量 x1,x2,xp是確定性變量,不是隨機(jī)變量隨機(jī)誤差項(xiàng)的期望值為0,且方差2 都相同誤差項(xiàng)是一個(gè)服從正態(tài)分布的隨機(jī)變量,即N(0,2),且相互獨(dú)立多元線性回歸方程 (概念要點(diǎn))描述 y 的平均值或期望值如何依賴于 x1, x1 ,xp的方程稱為多元線性回歸方程多元線性回歸方程的形式為 E( y ) = 0+ 1 x1 + 2 x2 + p xp b1,b2,bp稱為偏回歸系數(shù) bi 表示假定其他變量不變,當(dāng) xi 每變動(dòng)一個(gè)單位時(shí),y 的平均平均變動(dòng)值多元線性回歸方方程的直觀解釋二元線
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 風(fēng)管采購(gòu)安裝合同范例
- 建筑總包合同范例范例
- 催收尾款合同范例
- 2024年鋁合金扁絲項(xiàng)目可行性研究報(bào)告
- 支架施工方案
- 門面中介合同范例
- 2024年照片盒項(xiàng)目可行性研究報(bào)告
- 2024年木帽架項(xiàng)目可行性研究報(bào)告
- 2024年某科技公司與高校之間的科研合作開(kāi)發(fā)合同
- 二年級(jí)數(shù)學(xué)(上)計(jì)算題專項(xiàng)練習(xí)
- 部編版三年級(jí)上冊(cè)語(yǔ)文《第四單元測(cè)試》(帶答案)
- 《推拿治療小兒腹瀉》精品PPT
- 大學(xué)英語(yǔ)四級(jí)必背詞匯表21853
- 結(jié)構(gòu)設(shè)計(jì)面試題(答案)
- 升壓站、變電站架構(gòu)安裝方案
- 赤峰高鐵廣場(chǎng)商鋪?zhàn)赓U合同(樣本)
- 郭頂—水星記—歌詞
- 英文版?zhèn)€人簡(jiǎn)歷自薦信
- 其他專技、管理服務(wù)崗位聘期考核表
- 四年級(jí)上學(xué)期勞動(dòng)技術(shù)測(cè)試卷帶答案
- 關(guān)于學(xué)習(xí)考察應(yīng)急管理工作情況報(bào)告.doc
評(píng)論
0/150
提交評(píng)論