行為科學統(tǒng)計第七版考研復習_第1頁
行為科學統(tǒng)計第七版考研復習_第2頁
行為科學統(tǒng)計第七版考研復習_第3頁
行為科學統(tǒng)計第七版考研復習_第4頁
行為科學統(tǒng)計第七版考研復習_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、符號說明: 重點 引導語 派生概念或() 派生分析語句第 部分 簡介與描述性統(tǒng)計首先提出了1 平均數(shù)(集中趨勢)2 對變異性的測量(描述了數(shù)據(jù)是怎樣分布在平均數(shù)附近的)第一章 統(tǒng)計學入門 統(tǒng)計 總體與樣本 統(tǒng)計的作用: 1 整理和總結信息,使研究者看出在研究中發(fā)生了什么,并和其他研究者交流結果。 2 統(tǒng)計幫助研究者回答了引出研究的普遍問題,它根據(jù)獲得的結果來確定結論是什么。研究開始于一個 關于總體的 普遍問題。 為回答這個問題,研究者研究了一個樣本 將結果從樣本推廣到整個總體。統(tǒng)計 是指,整理、總結并解釋信息的一系列數(shù)學過程??傮w 在一個特定研究中所有感興趣個體的集合。 (是研究者希望研究的整

2、個組。 ) 參數(shù) 用來描述總體的特性。通常是一個數(shù)字值。參數(shù)可以從單個測量中得到,或從對總體的一組測量中推導。 樣本 從一個總體中選擇出來的個體的集合,通常在研究中被期望代表總體。統(tǒng)計量 用來描述樣本的特性。 通常是一個數(shù)字值。統(tǒng)計量可以從單個測量中得到,或從對樣本的一組測量中推 導出來。(通常,每個總體參數(shù)都與一個樣本統(tǒng)計量相對應。 ) 數(shù)據(jù) 從個體中得到的測量或觀察(其中測量、觀察均為名詞。 ) 它通常被稱為一個分數(shù)或原始分數(shù)。統(tǒng)計分為兩類:1 描述性統(tǒng)計 是用于總結、組織并簡化數(shù)據(jù)的統(tǒng)計過程。 它是一種技術,把原始數(shù)據(jù)組織總結成更易處理的形式。 (通常被組織成表或圖,或用計算平均數(shù)的方法

3、總結一組數(shù)據(jù)。 ) 2 推論性統(tǒng)計 是先研究樣本,然后將結果推廣到 樣本來自的總體 的技術。 (通常使用樣本統(tǒng)計量 作為推論總體參數(shù)的基礎。 ) (它通?;卮疬@個問題: 到底是 1 還是 2 其中 1 是樣本中的結果差異只是取樣誤差。 2 是 樣板間的教學差異是由于樣本性質(zhì)(如書中例子中:教學方法)造成的。樣本只提供了關于總體的有限信息。 即使樣本可以代表它們來自的總體, 但我們不期望一 個樣本可以給出關于整個總體的精確描述。通常,在樣本統(tǒng)計量 和 總體參數(shù)間 存在一些差異,叫取樣誤差。 取樣誤差 存在于樣本統(tǒng)計量 和總體參數(shù) 間的差異或誤差的數(shù)量。 每個樣本都包含具有不同性質(zhì)的不同個體。 由

4、于樣本由不同人組成, 樣本統(tǒng)計量也從一 個樣本變化到另一個。并且沒有一個樣本統(tǒng)計量 和 總體參數(shù) 完全一致。取樣誤差的基本理念: 樣本統(tǒng)計量通常與其相應的總體參數(shù)不同,并且根據(jù)樣本的不同而變化。數(shù)據(jù)結構、研究方法與統(tǒng)計變量 是一種 針對不同個體具有不同值的 特性或條件。常量 是一種 不會變化,且對每個個體都相同的 特性或條件。 相關法 觀察兩個變量并確定它們之間是否存在關系。(2X2 表格數(shù)據(jù)中,對于每個個體,研究者都有兩個測量,且所有的測量都是個數(shù)。這種表 示個數(shù)的數(shù)據(jù)的變量之間的關系,可以用卡方檢驗。 )對兩組或多組測量來說,會存在其中一個變量被用來定義組別。(例如早餐成績問題, 變量 1

5、吃不吃早餐被用來定義組, 變量 2 學習成績被用來得到每個組 的數(shù)據(jù))并且,如果測量過程產(chǎn)生數(shù)字值,那么統(tǒng)計評估會包括計算每組的平均數(shù),并比較它們。 如果測量過程僅僅將個體歸入非數(shù)字的類別中,那么統(tǒng)計評估常包括計算每個組的比例。(例如, 產(chǎn)生數(shù)字值的兒童早餐與成績問題, 學習成績被用來計算平均值。 而城鄉(xiāng)居民的政 策接受研究中,數(shù)字值被用來計算比例。 ) 實驗法 操縱一個變量并觀察或測量另一個變量。并且為了建立兩個變量間的因果關系,實 驗需要控制所有其他變量,使它們不會影響結論。實驗法的兩個特性:1 操縱: 研究者操縱一個變量, 將它的值從一個水平變化到另一水平。 然后觀察或測量第二 個變量,

6、來確定這種操縱是否導致了變化的產(chǎn)生。2 控制:研究者必須控制研究情況,使其他無用的變量不能影響需要研究的變量關系。 通常研究者需要考慮的兩種變量:1 被試變量一些特性會 隨個體的不同 而變化,如年齡性別和智力。只要實驗是比較兩組個體的差異, 就必須保證兩組的被試變量完全相同。2 環(huán)境變量通常使用三種技術控制其他變量:1 隨機分派 目的是,使每個被試有相同的機會被分派到每個處理條件中, 以使被試的特性在兩組中均勻分布。2 匹配通過匹配來保證參與組或環(huán)境的同質(zhì)性。 (如測量所有被試 IQ 后,將被試匹配地分派到兩組 中,使兩組有基本相等的 IQ)3 將變量控制成常量 例如,只使用 10 歲兒童做被

7、試。實驗法的術語自變量 被研究者操縱的變量。 (在行為研究中, 自變量通常由被試參與的兩個或多個處理條 件組成。) 自變量由 在觀察因變量之前就操縱好的前條件組成。因變量 即被觀察的變量,用于評估處理 效應。(或:被觀察并用來評估可能存在操縱效應 的變量)在心理學研究中,因變量通常是經(jīng)過測量后從每個被試中得到的數(shù)據(jù)。注意,在實驗法,事實上只測量了一個變量。 (因為是操縱一個觀察另一個) 它和相關法有本質(zhì)區(qū)別 后者兩個變量均被測量,數(shù)據(jù)由每個個體的兩個不同分數(shù)組成??刂茥l件與實驗條件通常,實驗將 沒有接受任何處理的被試的分數(shù),與接受處理的被試分數(shù)進行比較。 這是通過 證明處理條件造成的分數(shù)與不處

8、理造成的分數(shù)的不同,而說明存在處理效應。 這種研究中,出現(xiàn)了:1 控制條件 指個體不接受實驗處理。 或者不接受處理,或者接受中性或安慰劑性處理。 控制條件的目的是提供與實驗條件相比較的基準。2 實驗條件 指個體接受實驗處理。注意:自變量通常由至少兩個值組成。 (因為至少應有兩個值才能稱為變量) 有的實驗,自變量是簡單的數(shù)值。由實驗組和控制組組成的實驗,自變量應該是處理與非處理。非實驗和準實驗法準自變量 是指在非實驗中那些決定了組別的變量。在非實驗中僅僅對兩個組進行比較,但這兩組卻不是通過操縱自變量所得到 通常是 由被試變量或時間變量(如處理前與處理后)決定。p17 的兩個例子,均是無法操縱變量

9、 1(可視為準自變量,準在它為改變因變量而生,卻無 法被操縱),這種變量 1 叫做準自變量。分割線開始 對于例子 2 的 “研究者無法操縱時間 ”,這里有兩個問題:1 為什么它這樣說, “無法操縱時間,但是用它來劃分兩組數(shù)據(jù) ” 這里面其實強調(diào)了兩個因果關系,即:a)如果這是一個實驗,那么自變量一定為研究者所操縱。 b)如果一個變量是一個實驗里的自變量, 那么 “分組 ”這個過程一定是由操縱自變量造成的。 (因為自變量通常由被試參與的處理條件組成,而處理條件決定了分組。 ) 所以才有這種暗含因果關系的用詞 “但是用它 ”。2 為什么這是個非實驗 因為這個實驗的分組是源于時間變量 治療前治療后是

10、兩個時間點, 而它并沒有得到研究 者的操縱。如果是對時間操縱后才導致這種分組, 才能說時間是實驗的自變量, 而這個實驗才能是實驗。 注:切莫糾結于, 為什么說它沒有操縱時間這種思維是在假定了時間是此實驗的自變 量導致的,而時間僅僅是導致分組的原因,只能稱為準自變量。分割線結束 變量與測量有些變量僅僅是假設出來的概念(即構念)從而無法直接觀察,對它們的研究需要測量。 構念 是內(nèi)部屬性或特性,它不能被直接觀察到,但可以描述并解釋行為。操作定義 是一個測量過程。它測量了外部行為,并 使用測量結果作為定義 和對假設的構 念的測量。操作定義有兩個部分 1 描述了一系列測量構念的操作; 2 用測量結果定義

11、了構念。根據(jù)變量值的類型,分為兩種變量:1 離散變量 由不同的、不可分割的類別組成。在兩個相鄰類別之間不存在其他值。 它們通常限于整數(shù)。2 連續(xù)變量在任意兩個觀察到的值之間都存在無限多個可能的值。 一個連續(xù)變量可以被分割成無限個小 數(shù)部分。連續(xù)變量的兩個因素1)兩個不同個體很少會得到完全一樣的測量。若有,可以合理懷疑測量過程過于粗糙,或 變量可能不是真的連續(xù)的。2)測量連續(xù)變量時,每個測量類別實際上都是一個區(qū)間,需要用邊界來定義。 一個數(shù)值其實是一個區(qū)間,而非量表上一個點。在量表上對其設定邊界,有以下概念:實限 指一條連續(xù)數(shù)據(jù)線上數(shù)值組成的區(qū)間的界限。將兩個相鄰數(shù)值分開的實限恰好位于兩 個數(shù)值

12、的中點。每個數(shù)值都有兩個實限:上實限和下實限。收集數(shù)據(jù)需要測量觀察。 而測量包括將事物分類(定性測量)和使用數(shù)字描述事物大?。ǘ繙y量) 。 介紹四種測量量表:1 稱名量表 由一系列具有不同名稱的類別組成。 稱名量表的測量將觀察的對象分類并貼標簽,但不對觀察做任何定量的區(qū)分。 (稱名量表的類別不是量化值, 但它可以用數(shù)字代表, 并依然不能代表任何量化差異。 如房 間 100 和房間 109 這條信息無法得出任何量化結論。 )2 順序量表由一組 按順序排列的類別 組成。順序量表的測量將觀察對象按大小排序。 例如,類別可以是大中小,但不能是1cm2cm3cm 。類別組成了序列這個事實意味著在類別間

13、存在方向性。 可以用順序量表的測量, 來確定 兩個個體是否不同并確定差異的方向,但無法確定兩個個體間的差異大小。等距量表和等比量表它們都由一系列排序的類別組成,并且這些類別組成了一系列相同大小的區(qū)間。大小相同的區(qū)間,代表可以利用此量表來確定兩個測量間的差異的大小和方向。 它們的區(qū)別在于零點的性質(zhì)。3 等距量表 由排序的類別組成,這些類別都是完全相同大小的區(qū)間。等距量表具有隨意的零點,并且零值不代表被測量的變量不存在。 在等距量表中,量表數(shù)字間的差異等價于量的差異,但大小的比例沒有意義。4 等比量表 是一種等距量表。它有一個絕對零值,代表沒有測量的變量。 等比量表絕對的、非任意的零點,使我們可以

14、測量變量的絕對值。 等比量表中數(shù)字的比例可以反映量上的比例。關于判斷是等距還是等比(自推) :1 等距量表的零點沒有意義, 等比量表的零點則代表了一個 “沒有測量 ”的變量 (我把測量視 為名詞,大約代表 “值 ”)。所以等距的零點才能隨便換,且只為衡量測量值的差值。 SAT就是一個等距量表,因為零值是為衡量測量值之差而存在。 每個人的感冒次數(shù)則是等比量表,因為零值有意義且不能變動。因此: 2 等距量表的重點在于測量之間的差值,等比量表則是比例。 例如 SAT測試就是等距量表,重點在于測量間的差值而非比例。(并不排除等比量表中測量間差值的意義,但由于等比本也是等距,因此舍棄比例并無意 義。)統(tǒng)

15、計符號分數(shù) 指研究中對因變量的觀察后得到的每個被試的值。原始分數(shù) 指研究中最初得到的、沒有改變過的一組數(shù)據(jù)。 特定變量的值用 X 表示。(注意: X又叫一個量表,可視為是一類數(shù)據(jù)之意。在 p48 圖上三行有明確的表達)第二章 頻數(shù)分布概述原始數(shù)據(jù)通常不會顯示任何明顯的模式。研究者依靠描述性統(tǒng)計來總結和組織他們的結 果,使得當真的存在某些模式時,它們更易被發(fā)現(xiàn)。描述性統(tǒng)計的任務:簡化結構并整理組織數(shù)據(jù)。 最常用過程是將數(shù)據(jù)放入一個頻數(shù)分布。頻數(shù)分布 是一種組織好的關于位于測量量表每個類別上的個體數(shù)目的數(shù)據(jù)表。 頻數(shù)分布顯示了個體得分在測量量表上的分布情況頻數(shù)分布可以是表或圖,但均有如下兩個相同因

16、素:1 組成最初測量量表的類別2 頻數(shù)的記錄(每個類別中的個體數(shù)目)頻數(shù)分布表頻數(shù)分布表的特點:1 表中的第一列,列出了所有可能的值,即使此類別的頻數(shù)為0。對于順序、等距、等比量表,類別被按從高到低的順序排列。對于稱名量表,類別可以按任意順序排列。2 第二列記錄每個數(shù)值的頻數(shù)。3 第一列的值 (如 X)指的是測量量表, 并非真實數(shù)據(jù)。 比如 X=5 但此類別的個體并不存在。4 頻數(shù)可以用于求出分布中的數(shù)據(jù)個數(shù)。將頻數(shù)相加可以得到個體個數(shù)的總和。除了頻數(shù)分布的兩個基本列之外,還有其他描述數(shù)據(jù)分布的測量。 最常用的是比例和百分率。比例 用 p 表示。 p=f/N 。 百分率 %=p( 100) =

17、f/N (100) 由于比例 p 描述了頻數(shù)( f)和數(shù)據(jù)數(shù)目( N )的關系,故比例又可稱為相對頻數(shù)。 比例通常表示為小數(shù)。當一個數(shù)據(jù)組涵蓋范圍過大時,為了不必列出所有數(shù)據(jù),可以使用如下辦法: 分組頻數(shù)分布表 將數(shù)據(jù)分成區(qū)間組,然后將區(qū)間列在表中,用區(qū)間代替每個數(shù)據(jù)。這里的組(即區(qū)間) ,叫組距。 它有四個規(guī)則:1)應該具有大約 10 個組距。只是大約。2)每個區(qū)間的寬度應為相對簡單的數(shù)字。特別的,5 和 10 可以簡化計算。3)每個組距的最小數(shù)值應為寬度的倍數(shù)。如以10 為區(qū)間寬度,則這些區(qū)間應從 20, 30 等開始。4)所有區(qū)間應有相同寬度。 它們應當無間斷無重復涵蓋 所有數(shù)值, 使任

18、意特定數(shù)值恰好只 屬于一個區(qū)間。在分組頻率分布表中,頻數(shù)是對組距的描述,即這個組距的頻數(shù)為f=xxx。并且, 當分數(shù)被放入一個分組表后, 會失去關于特定分數(shù)值的信息。 通常組距越寬失去的信 息越多。當測量一個連續(xù)變量時,得到的測量對應的是線上的區(qū)間,而不是單個的點。 例如一個連續(xù)變量的 X=8的頻數(shù) f=3,其實是代表有 3個數(shù)在 之間。 同樣的,頻數(shù)分布表中也存在實限概念。表面界限 比如 4049 的組距中, 40 和 49 為區(qū)間的表面界限。 但是這個區(qū)間的實限則是 40 的下實限和 49 的上實限, 即:這個組距的實限是和。并且組距的兩實限間的距離,就是區(qū)間的寬度。 每兩個組距會在實限處

19、交匯,因此量表中沒有中斷。注意,回答 “該組距的值域 ”時,需要回答出表面界限和實限。 分布表中最后一個區(qū)間是最小的區(qū)間。因為“在順序、等距、等比量表中,類別被按順序排列通常是由高到低 ”。頻數(shù)分布圖對于用 稱名量表或順序量表 測量的數(shù)據(jù),用柱形圖。 對于用 等距或等比量表 測量的數(shù)據(jù),有兩種圖。1 直方圖首先將數(shù)字(測量類別)沿 X 軸列出,然后畫出位于每個 X值上的一個矩形,使得:a. 矩形的高度對應每個類別的頻數(shù)b. 矩形的寬度為每個類別的實限。 另外,修正的直方圖中,頻數(shù)用方塊代替,故不再需要顯示頻數(shù)的 Y 軸。總結(自推) : 注意 p39 圖的組距畫法。第一個矩形寬架設在至之間,

20、把刻度標在中點上。即恰好代表了組距1。對于圖, 7578組和 8184 組之間沒有空隙,是為了看齊分組頻數(shù)分布表的 “無縫 ”。 它說明 7881 組之間沒有數(shù)據(jù) 這是組距的寬度決定的現(xiàn)象。2 折線圖 首先將數(shù)字(測量類別)沿著 X 軸列出,然后1)每個坐標的中心上方有一個點,它的垂直位置對應這一類別的頻數(shù)。2)點和點之間的連續(xù)線段將這一系列點連在一起3)最后,在分數(shù)全距(看坐標系內(nèi),別看軸)的兩端各畫一條直線與X 軸相交(其實是零點和 X 最大值那點,看圖) 對于一個分組分布,可以將每個點直接畫在組距的中點處(中點為區(qū)間兩實限的平均值) 。對于總體分布的頻數(shù)分布圖 由于其個體數(shù)過大,這種圖有

21、兩個特點:1 相對頻數(shù) 在圖中(可視為柱形圖)只有分組( X 軸)和相對頻數(shù)( Y 軸),沒有顯示絕對數(shù)目。2 平滑曲線 當一個總體由 等比量表 的數(shù)字分數(shù)構成時, 常用平滑曲線代替直方圖或折線圖的階梯或鋸 齒狀。平滑曲線并非是將一系列點 (真實頻數(shù)) 連在一起, 而是展示從一個分數(shù)到另一個分數(shù)的相 對變化。頻數(shù)分布的形狀完整描述任意分布, 有三種特性:形狀、集中趨勢和變異性 集中趨勢 指分布中心的位置變異性 指數(shù)據(jù)是分散在廣大區(qū)域還是集中在一起 形狀 理論上分布的形狀被定義為一個方程。 而大部分分布的形狀是:1 對稱分布 可以通過中心畫一條垂直線使分布的一側為另一側的鏡像2 偏態(tài)分布 分數(shù)傾

22、向于堆積在量表的一端并向另一端逐漸變細 另:尾 指分數(shù)逐漸向分布一段變細的部位 a)正偏態(tài)分布:尾在右側的偏態(tài)分布(即尾指向X 軸正方向)b)負偏態(tài)分布:尾在左側的偏態(tài)分布(即尾指向X 軸負方向)百分位數(shù)、百分等級和內(nèi)插法 頻數(shù)分布除了描述整組數(shù)據(jù),也可以用來描述整組數(shù)據(jù)中的個體位置。 原始分數(shù) 個體分數(shù)或 X 值。原始分數(shù)本身不能提供個體位置。 其中一個變化是 將原始分數(shù)轉(zhuǎn)化為百分位數(shù)。注意:可見,百分位數(shù)就是原始分數(shù)的一個變化。1 一個特定分數(shù)的等級(百分等級) 指在分布中低于或等于該特定分數(shù)的個體的百分率。 等級一定是一個百分率。 例如,全班有 60%的人分數(shù)在 43 以下,那么分數(shù) X

23、=43 具有百分等級 60%。2 百分位數(shù)當一個分數(shù)被它的百分等級確定后,這個分數(shù)就叫百分位數(shù)。 它依然是一個原始分數(shù)。 如上例, X=43 可以被稱為第 60 個百分位數(shù)。在頻數(shù)分布表中,為了確定百分位數(shù)或百分等級: 累積頻數(shù)( cf) 計算量表中位于或低于每個類別的個體數(shù)目。因為它們表示了沿著量表向上時積累的個體個數(shù)。 (累積頻數(shù)顯示了處于或低于每個分數(shù)的個體個數(shù)。 ) 累積百分率( c%) 將累積頻數(shù)轉(zhuǎn)化成百分率 因為它們顯示了沿著量表向上時的累積的個體百分率。注意,頻數(shù)分布表中的 X 值仍是區(qū)間,并非一個個點。 所以,當 X=2的 cf=2,c%=10%時,指的是: 在達到區(qū)間 X=2

24、的上限前積累了 2 個,且占 10%。內(nèi)插法 具體步驟略 注意:內(nèi)插法的基本假定是,一個區(qū)間從一端到另一端的變化是正常的線性變化。莖葉圖略第三章 集中趨勢集中趨勢 是一個統(tǒng)計測量,它確定了 能夠代表分布中心的 一個數(shù)值。集中趨勢的目的 找到最典型或最能代表整個組 的單個數(shù)值即 確認每一個分布的 “中心 ”或 “最具代表性的數(shù)值 ”。) 集中趨勢描述了一個大型總體的典型特征,使得大量數(shù)據(jù)更容易被理解。 )三種測量集中趨勢的方法:1 平均數(shù) 也叫算數(shù)平均數(shù),是將分布中的所有數(shù)據(jù)相加并除以數(shù)據(jù)的個數(shù)得到的。一個總體的平均數(shù)用 表示,一個樣本的平均數(shù)用 M 表示。(通常,使用希臘字母代表總體的特性,用

25、英文字母代表一個樣本的特性。 )我們經(jīng)常需要將兩組數(shù)據(jù)組合,并找出合并組的整體平均數(shù)。 整體平均數(shù)并非原先兩個樣本的平均數(shù)中心。 由于兩個樣本大小不同, 其中一個對整體組做 出了更大貢獻。因此,決定整體平均數(shù)時占了更大權數(shù)。因此,整體平均數(shù)也叫加權平均數(shù)。 加權平均數(shù) 等于 數(shù)據(jù)總和 / 數(shù)據(jù)個數(shù)。2 中數(shù) 中數(shù) 是恰好將一個分布一分為二的數(shù)值。這個值也相當于第 50 個百分位數(shù) (中數(shù)不存在特殊符號和記號,對于樣本和總體來說,中數(shù)的定義和計算相同。 ) (在圖形中,中數(shù)恰好將圖形的面積分成兩部分。 )3 眾數(shù)眾數(shù) 是具有最大頻率的 分數(shù)或類別 眾數(shù)可以用于確認任何測量量表的典型值或平均值,包

26、括稱名量表。 眾數(shù)是一個分數(shù)或一個類別。但絕不是頻數(shù)。一個分布只有一個平均數(shù),一個中數(shù)。但它可能有一個眾數(shù)、多個眾數(shù),或沒有眾數(shù)。 具有兩個眾數(shù)的分布被稱為雙峰分布,具有多于兩個眾數(shù)的分布為多峰分布。 有時,具有數(shù)個等高點的分布叫無眾數(shù)。(通常雙峰分布說明在同一個總體或樣本里,存在兩個不同的、有區(qū)別的個體組。 ) 通常,眾數(shù)是具有絕對最高頻數(shù)的數(shù)值。但有時也表示具有相對高頻數(shù)的值。此時這個分布有兩個不同的峰值,每一個值都是這個分布的眾數(shù)。 較高的叫主要眾數(shù),較矮的叫次要眾數(shù)。選擇一種最適合的集中趨勢測量1 平均數(shù) 優(yōu)點:用到了分布中的每個數(shù)值,通常具有很好的代表性。與最常見的變異性測量有緊密聯(lián)

27、系(如平均數(shù)和方差等) 缺點:極易受極端值影響而位移,而不能較好代表整個分布。2 中數(shù)1)極端數(shù)值和偏態(tài)分布 中樞不易受極端值影響。 即使極端值再變大,中數(shù)也不會因此改變。2)未確定數(shù)值 比如有一個被試從未完成實驗,只好1 小時后停止實驗,其時間則無法確定。注意:對于未確定數(shù)值第一, 不能不要這個數(shù)值。 因為使用樣本的目的是把握總體, 這個數(shù)據(jù)告訴我們有一部分總 體不能解決問題。第二,不能記錄為 60 分鐘。要記錄的是完成所需時間,個體從未完成任務,則無法記錄。 綜上所述,存在未確定數(shù)值則無法計算平均值。我們選擇中數(shù)。3)尾端開放式分布指 一個分布的類別 沒有上限和下限。例如孩子的個數(shù)量表中,

28、存在類別 “5或更多 ”。 這樣就無法計算 X,更無法計算平均數(shù)。4)順序量表注意: 由于平均數(shù)是 根據(jù)距離 來定義集中趨勢, 而中數(shù)是用方向定義的 一半分數(shù)大 于中數(shù),一半小于中數(shù) 因此不能用平均數(shù),而用中數(shù)來報告順序量表的平均數(shù)。3 眾數(shù)1)稱名量表 因為稱名量表不能測量數(shù)量,因此不能計算平均值和中數(shù)。2)離散變量3)描述形狀 在一個頻數(shù)分布圖中,眾數(shù)表示了高峰的位置。集中趨勢和分布形狀1 對稱分布 一個對稱的單峰分布:平均數(shù)、中數(shù)、眾數(shù)重合于中點。 一個對稱的雙峰分布:平均數(shù)和中數(shù)處于中點,眾數(shù)位于兩側。2 偏態(tài)分布正偏態(tài)分布:從左到右為 眾數(shù),中數(shù),平均數(shù) 負偏態(tài)分布:從左到右為 平均

29、數(shù),中數(shù),眾數(shù)第四章 變異性 變異性: 提供了 對一個分布中的數(shù)據(jù) 分散程度或聚集程度 的數(shù)量測量。 測量變異性的目的:獲得分數(shù)在分布中的離散型的客觀測量一個好的變異性的目的:1 描述了分布。 (表示了數(shù)據(jù)是否聚集在一起 或分布在較大區(qū)域內(nèi)。 ) 通常變異性是根據(jù)距離定義的。2 測量了單個或一組數(shù)據(jù)能否很好地代表整個分布。3 提供了在使用一個樣本代表總體時 預期誤差值的信息全距和四分位距全距 Xmax 的上實限( URL)和 Xmin 的下實限( LRL)的差值。四分位距 被分布的中間 50%所覆蓋的距離。等于 Q3-Q1。其中 Q1Q3 為第一四分位數(shù)和第三四分位數(shù),指分布最低的25%和分布

30、最高的 25%與其余值分隔開的界限(是一個界限) 。一般會把它轉(zhuǎn)換為半四分位距,它測量了從分布中心到50%的分布邊界的距離。由于它始于分布中央的 50%,因此不易受極端值影響。但它不能考慮單個數(shù)據(jù)間的真實距離,不能給出數(shù)據(jù)如何分散或聚集的全景??傮w的標準差和方差標準差 離差的平方和除以總體大?。ɑ驑颖镜淖杂啥龋┑乃銛?shù)平方根。 標準差的目的:對分數(shù)到平均數(shù)的標準距離的測量。標準差推導過程里的中間量1)離差)離差 是每個數(shù)與平均數(shù)之間的距離。并且有正負。數(shù)據(jù)的離差總和為零。 這也是標準差計算需要將離差平方的原因 引入離差的平方,使得對變異性的測量基于距離的平方之上。結果:給每個數(shù)據(jù)增減一個常量,標準差不變。 給每個數(shù)據(jù)增減一個倍數(shù),標準差依同樣倍數(shù)增減。2)方差 是離差平方和除以總體大?。ɑ驑颖咀杂啥龋┑纳獭藴什畹慕馕?)估計 對于一個分布,標準差的范圍在( a, b)區(qū)間。其中 a,b 分別為距平均數(shù)最近和最遠的數(shù) 據(jù)與平均數(shù)的距離。大約在( a+b)/2 處。2)圖示 標準差線大約為從平均數(shù)到最極端值的一半3)計算公式 標準差和方差在概念上,對于總體和樣本完全相同。對于總體:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論