(完整版)多元統(tǒng)計分析思考題答案_第1頁
(完整版)多元統(tǒng)計分析思考題答案_第2頁
(完整版)多元統(tǒng)計分析思考題答案_第3頁
(完整版)多元統(tǒng)計分析思考題答案_第4頁
(完整版)多元統(tǒng)計分析思考題答案_第5頁
已閱讀5頁,還剩3頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、多元統(tǒng)計分析思考題答案多元統(tǒng)計分析思考題答案如下九道題題目中有錯誤的或不清楚記得老師課堂上說過考試內(nèi)容不會超出這九道思考題, 的地方,歡迎大家指出、更改、補充。1、簡述信度分析答題提示:要答可靠度概念,可靠度度量,克朗巴哈系數(shù)、拆半系數(shù)、單項與總體相關系數(shù)、稀釋相關系數(shù)等(至少要答四個系數(shù),至少要給出兩個指標的公式) 答:信度(Reliability )即可靠性,它是指采用同樣的方法對同一對象重復測量時所得結果 的一致性程度。信度指標多以相關系數(shù)表示,大致可分為三類:穩(wěn)定系數(shù)(跨時間的一致性),等值系數(shù)(跨形式的一致性)和內(nèi)在一致性系數(shù)(跨項目的一致性)。信度分析的方法主要有以下四種:1)、重

2、測信度法這一方法是用同樣的問卷對同一組被調(diào)查者間隔一定時間重復施測,計算兩次施測結果的相關系數(shù)。重測信度屬于穩(wěn)定系數(shù)。重測信度法特別適用于事實式問卷,如果沒有突發(fā)事件導致被調(diào)查者的態(tài)度、意見突變,這種方法也適用于態(tài)度、意見式問卷。由于重測信度法 需要對同一樣本試測兩次, 被調(diào)查者容易受到各種事件、 活動和他人的影響, 而且間隔時間 長短也有一定限制,因此在實施中有一定困難。2)、復本信度法復本信度法是讓同一組被調(diào)查者一次填答兩份問卷復本,計算兩個復本的相關系數(shù)。復 本信度屬于等值系數(shù)。復本信度法要求兩個復本除表述方式不同外,在內(nèi)容、格式、難度和 對應題項的提問方向等方面要完全一致,而在實際調(diào)查

3、中,很難使調(diào)查問卷達到這種要求, 因此采用這種方法者較少。3)、折半信度法折半信度法是將調(diào)查項目分為兩半,計算兩半得分的相關系數(shù),進而估計整個量表的信 度。折半信度屬于內(nèi)在一致性系數(shù),測量的是兩半題項得分間的一致性。這種方法一般不適用于事實式問卷(如年齡與性別無法相比),常用于態(tài)度、意見式問卷的信度分析。在問卷調(diào)查中,態(tài)度測量最常見的形式是5級李克特(Likert)量表。進行折半信度分析時,如果量表中含有反意題項,應先將反意題項的得分作逆向處理,以保證各題項得分方向的一致性,然后將全部題項按奇偶或前后分為盡可能相等的兩半,計算二者的相關系數(shù)。為了校正差異,兩半測驗的方差相等時,常運用斯皮爾曼-

4、布朗公式(Spearman-BrownFormula): rxx=2rhh/(1+rhh),其中,rhh:兩半測驗的相關系數(shù);rxx :估計或修正后的信度。 該公式可以估計增長或縮短一個測驗對其信度系數(shù)的影響。當兩半測驗的方差不同時,應采用盧倫公式(Rulon Formula )或弗拉納根公式(Flanagan Formula)進行修正。4)、“信度系數(shù)法Cronbach ”信度系數(shù)是目前最常用的信度系數(shù),其公式為: nSi2 n 1 i 1 n 1 Sx2,S,2 _,、, q 2其中,Si為每一項目的方差;SX為測驗總分方差。從公式中可以看出,”系數(shù)評價的是量表中各題項得分間的一致性,屬于

5、內(nèi)在一致性系數(shù)。 這種方法適用于態(tài)度、意見式問卷(量表)的信度分析。2、簡述多元尺度分析在你工作中的應用答:多元尺度分析(Multi-dimension Analysis)是市場研究的一種有力手段,是市場調(diào)查、分析數(shù)據(jù)的統(tǒng)計方法之一。它可以通過低維空間(通常是二維空間)展示多個研究對象(比如品牌)之間的聯(lián)系,利用平面距離來反映研究對象之間的相似程度。由于多維尺度分析法通常是基于研究對象之間的相似性(距離)的,只要獲得了兩個研究對象之間的距離矩陣, 我們就可以通過相應統(tǒng)計軟件做出他們的相似性知覺圖。在實際應用中,距離矩陣的獲得主要有兩種方法:一種是采用直接的相似性評價,先對所有評價對象進行兩兩組

6、合,然后要求被訪者對所有的這些組合間進行直接相似性評價,這種方法我們稱之為直接評價法;另一種為間接評價法, 由研究人員根據(jù)事先經(jīng)驗,找出影響人們評價研究對象相似性的主要屬性,然后對每個研究對象, 讓被訪者對這些屬性進行逐一評價,最后將所有屬性作為多維空間的坐標,通過距離變換計算對象之間的距離。多維尺度分析的主要思路是利用對被訪者對研究對象的分組,來反映被訪者對研究對象相似性的感知,這種方法具有一定直觀合理性。在工作中,通過多維尺度分析,可以將消費者對商品相似性的判斷產(chǎn)生一張能夠看出這 些商品間相關性的圖形。例如:有十個百貨商場,讓消費者排列出對這些百貨商場兩兩間相似的感知程度,根據(jù)這些數(shù)據(jù),用

7、多維尺度分析,可以判斷消費者認為哪些商場是相似的,從而可以判斷競爭對手。用于反映多個研究事物間相似(不相似)程度,通過適當?shù)慕稻S方法,將這種相似(不 相似)程度在低維度空間中用點與點之間的距離表示出來,并有可能幫助識別那些影響事物間相似性的潛在因素。這種方法在市場研究中應用得非常廣泛。3、簡述兩個變量之間的相關分析答題提示:答什么是相關,對連續(xù)型變量用相關系數(shù),對離散型變量用質(zhì)相關系數(shù) 答:相關分析(correlation analysis ),研究隨機變量之間的相關關系的一種統(tǒng)計方法。相關關系是一種非確定性的關系。相關性探討的是兩變量間相關情況的的大致趨勢。相關分析涉及兩個變量:應變量和自變

8、量。應變量 (response variable)是度量研究結果的變量;自變量是解釋或影響反應變量的變量。兩變量數(shù)據(jù)相關檢驗的步驟:一、圖示兩變量數(shù)據(jù)以及各個統(tǒng)計數(shù)字;二、查看整體狀態(tài)及數(shù)據(jù)的離散情況;三、如果有較穩(wěn)定的關系,就用簡單的數(shù)學模式描述該關系。對連續(xù)型變量常用相關系數(shù)刻畫兩個變量之間的相關性,而對離散型變量則用質(zhì)相關系數(shù)。4、聚類和判別分析的異同答:聚類分析是把研究目標分割成為具有相同屬性的小的群體。對變量的聚類稱為 R型聚類,而對觀測值聚類稱為 Q型聚類。它們在數(shù)學上是無區(qū)別的。聚類的基本想法:根據(jù)某種距離,把最近的聚在一起。這里的距離含義很廣,如歐氏距離、馬氏距離等距離,相似系

9、數(shù)也 可看作為距離。判別分析的基本思路是:設有G1、G2、GK個總體,從不同的總體中抽出不同的樣本,當然,根據(jù)不同的方法,建立的Fisher 判別、Bayes 判別。根據(jù)樣本一建立判別法則一判別新的樣品屬于哪一個總體。判別法則也是不同的。常用的判別方法有:距離判別、判別分析和聚類分析都是分類。其主要不同點就是,在聚類分析中一般人們事先并不知道或一定要明確應該分成幾類,完全根據(jù)數(shù)據(jù)來確定。而在判別分析中,至少有一個已經(jīng)明確知道類別的“訓練樣本”,利用這個數(shù)據(jù),就可以建立判別準則,并通過預測變量來為未知類別的觀測值進行判別了??梢韵染垲愐缘弥愋?,再進行判別.5、因子分析和主成分分析的異同答:主成

10、分分析和因子分析是多元統(tǒng)計方法中關系密切的兩種方法,應用范圍十分廣泛, 可以解決經(jīng)濟、教育、科技、社會等領域中的綜合評價問題。主成分分析采用降維的思想,將 研究對象的多個相關變量(指標)綜合為少數(shù)幾個不相關的變量,反映原變量提供的主要信息。因子分析是主成分分析的推廣和發(fā)展,它將具有錯綜復雜關系的變量綜合為數(shù)量較少的幾個因子,以再現(xiàn)原始變量與因子之間的相互關系,同時根據(jù)不同因子還可以對變量進行分類,它屬于多元分析中處理降維的一種統(tǒng)計方法。但是,在許多論文中用SPSS進行綜合分析時,出現(xiàn)這兩種方法運用混淆的錯誤。比如,主成分分析中對變量進行了因子旋轉,因子分析的公因子系數(shù)錯誤等問題。本文就此對主成

11、分分析和因子分析的異同進行比較,并在 SPSS DPSa件上如何實現(xiàn)給予說明。一、主成分分析與因子分析的異同點兩者的相同點:1、思想一致:都是降維的思想;2、應用范圍一致:都要求變量之間具有不完全的相關性;3、數(shù)據(jù)處理過程一致:數(shù)據(jù)的無量綱化,求相關系數(shù)矩陣的特征值和特征向量,通過累計貢獻率確定主成分個數(shù)、因子個數(shù); 4、合成方法一致:都沒有考慮原 始變量之間的關系,直接用線性關系處理變量與主成分和因子之間的關系。兩者的不同點:1、方差損失上:主成分解釋了原始變量的全部方差,無方差損失;因子模型中除了有公因子外還有特殊因子,公因子只解釋了部分信息,有方差損失;2、唯一性:主成分分析不存在因子旋

12、轉,主成分是唯一的;因子分析進行因子旋轉,解不唯一;3、8實際意義:主成分沒有實際意義;公因子有實際意義;4、應用:主成分側重信息貢獻、影響力綜合評價;因子分析側重成因清晰性的綜合評價。1 .因子分析中是把變量表示成各因子的線性組合, 變量的線性組合。2 .主成分分析的重點在于解釋個變量的總方差, 協(xié)方差。3 .主成分分析中不需要有假設(assumptions),包括:各個共同因子之間不相關,特殊因子( 和特殊因子之間也不相關。而主成分分析中則是把主成分表示成幾個而因子分析則把重點放在解釋各變量之間的因子分析則需要一些假設。因子分析的假設specific factor )之間也不相關,共同因子

13、4.主成分分析中,當給定的協(xié)方差矩陣或者相關矩陣的特征值是唯一的時候,的主成分一般是獨特的;而因子分析中因子不是獨特的,可以旋轉得到不到的因子。5.在因子分析中,因子個數(shù)需要分析者指定( spss根據(jù)一定的條件自動設定,只要是特征 值大于1的因子進入分析),而指定的因子數(shù)量不同而結果不同。在主成分分析中,成分的數(shù)量是一定的,一般有幾個變量就有幾個主成分。和主成分分析相比,由于因子分析可以使用旋轉技術幫助解釋因子,在解釋方面更加有優(yōu)勢。大致說來,當需要尋找潛在的因子,并對這些因子進行解釋的時候,更加傾向于使用因子分析,并且借助旋轉技術幫助更好解釋。而如果想把現(xiàn)有的變量變成少數(shù)幾個新的變量(新的變

14、量幾乎帶有原來所有變量的信息)來進入后續(xù)的分析, 則可以使用主成分分析。當然,這中情況也可以使用因子得分做到。所以這中區(qū)分不是絕對的??偟脕碚f,主成分分析主要是作為一種探索性的技術,在分析者進行多元數(shù)據(jù)分析之前,用主成分分析來分析數(shù)據(jù), 讓自己對數(shù)據(jù)有一個大致的了解是非常重要的。主成分分析一般很少單獨使用:a, 了解數(shù)據(jù)。(screening the data),b, 和 cluster analysis一起使用,c,和判別分析一起使用,比如當變量很多,個案數(shù)不多,直接使用判別分析可能無解,這時候可以使用主成份發(fā)對變量簡化。( reduce dimensionality ) d,在多元回歸中,

15、主成分分析 可以幫助判斷是否存在共線性(條件指數(shù)),還可以用來處理共線性。在算法上,主成分分析和因子分析很類似,不過,在因子分析中所采用的協(xié)方差矩陣的對角元素不在是變量的方差, 而是和變量對應的共同度 (變量方差中被各因子所解釋的部分。)。6、系統(tǒng)聚類與K-means聚類的基本原理答:系統(tǒng)聚類法基本原理和步驟為:1、先計算n個樣本兩兩間的距離2、構造n個類,每個類只包含一個樣本3、合并距離最近的兩類為一新類4、計算新類與當前各類的距離5、類的個數(shù)是否等于1,如果不等于回到3在做6、畫出聚類圖7、決定分類個數(shù)和類K-means聚類的基本原理:聚類可以走著瞧,不一定事先確定有多少類;但是K-mea

16、ns聚類卻要求先說好要分多少 類??雌饋碛行┲饔^。假定分3類,這個方法還進一步要求你事先確定3個點為“聚類種子”(多數(shù)軟件會自動選種子);也就是說,把這 3個點作為三類中每一類的基石。然后根據(jù)和這三個點的距離 遠近,把所有點分成三類。再把這三類的中心(均值)作為新的基石或種子(原來“種子”就沒用了),再重新按照距離分類。如此疊代下去,直到達到停止疊代的要求(比如,各類最 后變化不大了,或者疊代次數(shù)太多了)。顯然,前面的聚類種子的選擇并不必太認真,它們 很可能最后還會分到同一類中呢。7、Fisher判別和貝葉斯判別的基本原理答:Fisher判別法是一種先投影的方法。使多維問題簡化為一維問題來處理

17、。選擇一個適 當?shù)耐队拜S,使所有的樣品點都投影到這個軸上得到一個投影值。對這個投影軸的方向的要 求是:使每一類內(nèi)的投影值所形成的類內(nèi)離差盡可能小,而不同類間的投影值所形成的類間離差盡可能大。進行投影后,再根據(jù)距離判別思想由距離的遠近得到判別準則,從而進行判別分析。貝葉斯(BAYES判別思想是根據(jù)先驗概率求出后驗概率,并依據(jù)后驗概率分布作出統(tǒng) 計推斷。所謂先驗概率,就是用概率來描述人們事先對所研究的對象的認識的程度;所謂后 驗概率,就是根據(jù)具體資料、先驗概率、特定的判別規(guī)則所計算出來的概率。它是對先驗概率修正后的結果。8、舉例說明你在工作中如何應用主成分分析和因子分析(因主成分分析有什么什么缺點

18、,可用因子分析什么什么旋轉)答:主成分分析:將多個變量通過線性變換以選出較少個數(shù)重要變量的一種多元統(tǒng)計分析方法。在分析問題的時候,往往提出很多有關的變量來描述一個事物,在宏觀經(jīng)濟研究領域中,表述國家基本經(jīng)濟面貌的時有很多指標,如人口、國土面積、公路里程、GDP財政收入等等。在對人的描述的時候,有身高、體重、學歷、年齡、工作等多項可直接測量的指標。眾 多的指標中,有很多是相互關聯(lián)的, 不能清晰的反應數(shù)據(jù)問題,人們希望能將這些指標進行高度概括,用有限的指標精煉的概括,清晰地反應數(shù)據(jù)全貌。將原有變量重新組合成幾個相互無關的新變量,同時根據(jù)實際從中選出較少的變量盡可能多地反映原有變量統(tǒng)計信息,在數(shù)學上

19、也叫做降維處理。當我們展開區(qū)域競爭力研究的時候,可以利用主成分分析法。首先要根據(jù)區(qū)域競爭力選擇適合的指標體系,以綜合競爭力開展的研究的指標體系如:國內(nèi)生產(chǎn)總值(GDP、第三產(chǎn)業(yè)比重、工業(yè)占第二產(chǎn)業(yè)比重、郵電業(yè)務總量、用電量、全社會固定資產(chǎn)投資、外商直接 投資、科學研究等。取得31個?。ㄊ小⒆灾螀^(qū))的數(shù)據(jù)。對原始指標數(shù)據(jù)白標準化采集p維隨機向量 x = (X1,X2,,Xp)T), 31 個樣品 xi = (xi1,xi2,.,xip)T, i=1,2,31 ,由于指標間量綱不同,將數(shù)據(jù)進行標準化操作。求的相關系數(shù)矩陣 R的特征方程及p個特征根,及特征向量。將標準化的指標量轉化成主成分,并根據(jù)特

20、征根的大小確定主成分貢獻率,將前n個主成分累計貢獻率超過85%寸各個樣本的權系數(shù)重新組合,計算各個樣本在 n個主成分上的得分,根據(jù)得分將不同地區(qū)劃成不同的組合,這樣就可以將原有因指標眾多而無法分清的地區(qū)間區(qū)別, 可以通過有限個主成分將各地區(qū)區(qū)分出來,將競爭力相近的地區(qū)主成分得分基本靠近,幾何做圖的意義是,在主軸上的各樣本點分別集中在各自的主軸附近。進一步分析各個主軸的經(jīng)濟學含義。完成主成分分析。因子分析:它的目的在于研究原始變量的內(nèi)部關系,通過尋找變量的共同因素來簡化和分析變量中存在的復雜關系。它把每個變量分解為兩部分因素,一部分是由這些變量內(nèi)含的共同因素所構成,即所謂公共因素部分,另一部分是

21、每個變量各種獨有的因素,即所謂獨特因素或單一因素部分。仍然沿用對地區(qū)競爭力分析的案例,由于根據(jù)主成分分析得到的 n個主成分,將多個指標投影到少量的主成分之上,簡化了數(shù)據(jù)結構,但仍然無法明確主成分的含義,也無法明確指標間的關系。這樣利用因子分析, 將各個變量中的公共因子找到,也就是造成地區(qū)間競爭力不同的的共性因素,同時找到各地區(qū)不同的獨特因素。首先對各省數(shù)據(jù)進行標準化處理。根據(jù)正交因子模型:X=p+A*F+e,其中F為X的公共因子, 為X的特殊因子,A為因子 載荷矩陣。根據(jù)標準化數(shù)據(jù)計算協(xié)方差陣,并且求的其特征根和標準化特征向量,確定m個方差累積貢獻率達到 85%以上的公因子個數(shù)。由于公因子解不

22、唯一,為了取得更好對公因 子的經(jīng)濟學解釋,對公因子進行方差最大的正交旋轉,將各列載荷向?;?兩極方向分化,將大大有利于對公因子進行解釋。本案例中,得到2個公因子,gdp等指標在第一公因子上的載荷比較高,可以將第一公因子解釋為經(jīng)濟層面的硬件因素,而教育投入、科研投入等指標在第二公因子上載荷較高,可以將第二公因子解釋為軟件因素。最后還可以將公因子反過來表示為不同變量的線性組合,即得到每個樣本(每個省)的因子得分,來判斷各個省在兩個公因子的得分情況,清晰的看到有些省份在兩個公因子的得分都很到,有的部分得分高, 有的都很低,體現(xiàn)出東、中、西部的差距,與人們普遍感受是一致的。同時根據(jù)地區(qū)間差距,找到具體得分差在哪里,對今后該地區(qū)提高綜合競爭力有很好的指導意義。9、給定典型相關系數(shù)運行結果,解讀結果。提問內(nèi)容涉及(記不全了): canonical R系數(shù),P

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論