屬性數(shù)據(jù)分析資料_第1頁
屬性數(shù)據(jù)分析資料_第2頁
屬性數(shù)據(jù)分析資料_第3頁
屬性數(shù)據(jù)分析資料_第4頁
屬性數(shù)據(jù)分析資料_第5頁
免費預(yù)覽已結(jié)束,剩余48頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、屬性數(shù)據(jù)分析一屬性變量和屬性數(shù)據(jù)通常所指屬性數(shù)據(jù)(categoricaldata),是說反映事物屬性的數(shù)據(jù),也稱為定性數(shù)據(jù)或類別數(shù)據(jù),它是屬性變量取的值。屬性變量可能是表示事物屬性,取值為事物屬性的量反映事物的客觀屬性,例如變量“性別”取值為男,女;又如變量是中醫(yī)所分人的體質(zhì),取值為平和,氣虛,陽虛,陰虛,瘀血,痰濕,濕熱,氣郁,特凜。對事物表態(tài)的量表達人們主觀對事物的評論,例如變量是“某人對某個政策的態(tài)度”,取值是贊成,中立和反對;又如變量是“人對醫(yī)療效果的評價”,取值為特好,好,一般,差,很差。區(qū)間值變量取值為多個互不重疊區(qū)間:例如變量是“顧客的購買水平”,取值分為0,100),100,2

2、00),200,300)和300以上?!皩傩宰兞俊笔欠从呈挛锏目陀^屬性或?qū)κ挛锉響B(tài),以及區(qū)間值變量,它是一種變量,它取的值之間不能做加,減,乘,除等運算,而且所取的值只能是有限個,屬性變量取的值也稱為屬性變量的“水平”。二屬性數(shù)據(jù)表示形式屬性變量有4種表示形式:原始屬性變量形式、指示變量形式(調(diào)查數(shù)據(jù)常用)、頻數(shù)形式和列聯(lián)表。例1某連鎖超市要檢驗商品銷售情況與陳列方式是否相關(guān),隨機抽取了10家門店,分別以A、B、C共3種方式陳列(即第一個屬性變量是“陳列方式”,取值A(chǔ)B、C),各門店銷售情況分為“high”及“l(fā)ow”兩類(即第二個屬性變量是“銷量”,取值“high”和“l(fā)ow”)。這兩個屬性

3、變量的統(tǒng)計資料4種形式如下:屬性變量形式的樣本是把各個屬性變量的1次觀測值排成1行;例如例1中屬性變量“銷量”和“排列方式”的第1個觀測值(第1個門店)的觀測值是“high”和“B',就把“high”、“B”排在第一行,見下表表超市數(shù)據(jù)屬性變量形式銷量排列方式highBhighBhighBhighAhighClowBhighChighAlowBhighC指示變量形式是列出各個屬性變量的所有值,對每個值建立一個變量,例如例1中兩個屬性變量取值"high"、"low"、"A"、"B'、"C;建立5個指示

4、變量:sl,sh,ma,mb,mc.每次觀測中,屬性變量的哪個值出現(xiàn)了,就在對應(yīng)列中用1表示,否則用0表示;例如對于超市數(shù)據(jù)建立5個變量后:sh表示變量銷售額高,sl表示變量銷售額低,ma表示排列方式是A,mb并表示排列方式是B,mc表示排列方式是C。第1次觀測中屬性變量的值是“high”和“B”,這時觀測值就是1,0,0,1,0,見下表表超市數(shù)據(jù)指示變量形式shslmambmc10010100101001010100100010101010001101000101010001在做調(diào)查時(例如對街道行人作調(diào)查),通常要求被調(diào)查人在調(diào)查表上打勾和叉,整理這些調(diào)查表,勾和叉分別改為1和0,得到的就

5、是指示變量形式的樣本;大學(xué)生舌象體質(zhì)調(diào)查數(shù)據(jù)就是兩種形式數(shù)據(jù)混合,使用時必須注意。指示變量形式。把屬性變量形式匯總,同樣觀測數(shù)據(jù)只記一次,其相同次數(shù)稱為頻數(shù),得到的就是頻數(shù)形式數(shù)據(jù),超市數(shù)據(jù)頻數(shù)形式見下表;例如例1中銷量“high”且排列方式是“A”的門店有3個,頻數(shù)就記為3,匯總觀測值記為«high、A3”,下表中最后一列是頻數(shù)。表超市數(shù)據(jù)頻數(shù)形式銷量排列方式頻數(shù)highB3highA2highC3lowB2兩個屬性變量的列聯(lián)表就是把頻數(shù)形式數(shù)據(jù),寫成一個長方形表,其中最左列給出一個屬性變量(行變量)的值,最上面的變量名行給出另一個屬性變量(列變量)的值,頻數(shù)填在對應(yīng)格中,見下表,

6、列聯(lián)表能直觀反映數(shù)據(jù)特點,經(jīng)常使用。所以有時頻數(shù)形式數(shù)據(jù)也稱為列聯(lián)表。2個屬性變量的列聯(lián)表最常使用;3,4個屬性變量的頻數(shù)形式數(shù)據(jù)也能排在平面上。屬性變量多于2的列聯(lián)表稱為“高維列聯(lián)表”。表超市數(shù)據(jù)的列聯(lián)表排列方式銷量ABChigh233low020三對應(yīng)分析一般統(tǒng)計書籍只介紹到列聯(lián)表及其分析,上世紀(jì)70年代以來出現(xiàn)了許多分析屬性數(shù)據(jù)的方法:對應(yīng)分析,logistic回歸,廣義線性模型,重復(fù)測量模型等等。本次重點介紹對應(yīng)分析。對應(yīng)分析是研究屬性變量的值間關(guān)系,帶有直觀圖象展示的一種分析方法?!傲新?lián)表”分析能解決屬性變量間是否有聯(lián)系的判斷問題,但對于它們是怎樣聯(lián)系的卻不能給出具體結(jié)論。對應(yīng)分析要

7、研究屬性變量的取值之間是怎樣聯(lián)系的,它把屬性變量取的各個值投影成一幅“地圖”上的點,距離較近的點顯示關(guān)系較密切。對應(yīng)分析分為簡單對應(yīng)分析和多重對應(yīng)分析。簡單對應(yīng)分析分析兩個屬性變量間關(guān)系;多重對應(yīng)分析分析多個屬性變量間關(guān)系。(一)簡單對應(yīng)分析簡單對應(yīng)分析的主要步驟?;静襟E是:1輸入數(shù)據(jù)對于常用的列聯(lián)表數(shù)據(jù),將列聯(lián)表數(shù)據(jù)(連同變量名)拷入工作表后,還要增加一列:列變量名,該列按照表中列水平出現(xiàn)順序(從左到右),將它們從上到下安放一列中,這列通常按其含義加變量名“列名”。由于列聯(lián)表中通常已包含行名稱,無須另加一列輸入“行名”。2進入簡單對應(yīng)分析對話框從“統(tǒng)計>多變量>簡單對應(yīng)分析”入

8、口,就能進入“簡單對應(yīng)分析”對話框。選定“列聯(lián)表的列”,指定列聯(lián)表的各列。3填寫對話框在對話框的“列名”處填寫列變量名稱所在列,在“行名”處填寫行變量名稱所在列;進入“圖形”框后指定顯示哪些圖(其中“顯示行和列的對稱圖”最重要)。例2某公司在5個地區(qū)銷售4種商品(甲、乙、丙、?。?,某年銷售量匯總表如下表。試問銷售量按地區(qū)分布有何規(guī)律?銷售量按商品分布有何規(guī)律,二者有何聯(lián)系?表某公司5地區(qū)銷售數(shù)據(jù)(單位:件)1商品地區(qū)甲乙丙丁A160202120A2100253030A3100580200A440135110A5906012020解1)將表拷入工作表后,為了能在有關(guān)圖表中顯示各列名稱,應(yīng)補充一列

9、。因為商品列C2-C5的變量名從左到右依次為“甲、乙、丙、丁”,將列變量名稱“甲、乙、丙、丁”填入C6列,并將此列命名為“商品”。2)從“統(tǒng)計>多變量>簡單對應(yīng)分析”入口,進入“簡單對應(yīng)分析”對話框。3)在“輸入數(shù)據(jù)”中,選擇“列聯(lián)表的列”,指定為“甲乙丙丁”4列數(shù)據(jù),將“行名”指定為“地區(qū)”,將“列名”指定為“商品仍保留為默認(rèn)的“2”。4)點擊“圖形”,彈出“簡單對應(yīng)分析一圖形”對話框,選擇“只顯示行的對稱圖”,“只顯示列的對稱圖”及“顯示行和列的對稱圖”以便得到3幅圖。5)各框點擊“確定(OK)”,即可以得到計算結(jié)果和圖形。行對稱圖行圖A50.50A1A3A40.2520.00

10、量分-0.25-0.50-0.75-0.75-0.50-0.250.000.250.50分量1從行圖中可見A1,A2,地區(qū)銷售情況相似;A3,A4地區(qū)銷售情況相似。(比例相似)列對稱圖-1.00.0分量1-1.0丙A5乙A3A4丁A1甲取2對稱圖0.50.0-0.5-1.0-0.50.00.5分量1丙乙丁_甲列圖0.50.0-0.5-1.0-0.50.5從列圖中可見甲乙丙丁銷量不相似行列對稱圖從圖中可見A1,A2兩地賣甲商品較多,A3,A4兩地賣丁商品較多例3設(shè)已有大學(xué)生舌苔色和BMI決定的胖瘦程度二維列聯(lián)表如下,試做對應(yīng)分析。分析肥胖程度與苔色對應(yīng)。苔瘦中胖白8623062357黃11736

11、037灰4103里八、261解將上表考入工作表,最右邊添上一列,變量名為“BMI”,按照從上到下順序填上瘦,中,胖。2)從“統(tǒng)計>多變量>簡單對應(yīng)分析”入口,進入“簡單對應(yīng)分析”對話框。3)選定“列聯(lián)表的列”,將帶數(shù)值的列選入“列聯(lián)表的列"空格。4)將“苔色”選入行名空格,“BMI”選入列名空格5)點擊“圖形”,彈出“簡單對應(yīng)分析一圖形”對話框,選擇“只顯示行的對稱圖”,“只顯示列的對稱圖”及“顯示行和列的對稱圖”,各框點擊“確定”,即可以得到行對稱圖,列對稱圖,行和列的對稱圖。叢行對稱圖可見:4種苔色無關(guān)系。從列的對稱圖看出胖中瘦間無聯(lián)系。行和列的對稱圖如行列對稱圖對稱

12、圖2量分從行和列的對稱圖可見:體型中的人和苔色發(fā)白的人聯(lián)系緊,即苔色發(fā)白的人體型中等(二)多重對應(yīng)分析“多重對應(yīng)分析”用于分析多個屬性變量值間的關(guān)系,它每次可以同時分析兩個或更多個屬性變量?!岸嘀貙?yīng)分析”對話框能夠讀入兩種形式數(shù)據(jù):屬性變量形式和指示變量形式數(shù)據(jù)。無論哪種形式的數(shù)據(jù),實施多重對應(yīng)分析時,工作表中都要加一列,列舉所有屬性變量所取的所有值:讀入指示變量形式的數(shù)據(jù)時,按照屬性變量值在工作表的“變量名”行出現(xiàn)的先后順序從上到下排列;讀入屬性變量形式的數(shù)據(jù)時,先按照這些屬性變量在工作表中出現(xiàn)的先后順序,再對每個屬性變量值按照字典序從上到下排列。然后從“統(tǒng)計>多“多重對應(yīng)分析”變量

13、多重對應(yīng)分析”入口,進入“多重對應(yīng)分析”對話框,可以實施MINITAB計算“多重對應(yīng)分析”后輸出的結(jié)果中,最重要的是列圖。列圖是一個平面圖形,所有屬性變量的各個值都作為點安放在列圖上,距離較近的點顯示關(guān)系較緊密。例4(指示變量形式數(shù)據(jù))為了分析人們對某種新家具的看法,請80名顧客對“樣式”、“油漆”、“顏色”、“材料”和“價格”評價:分別給出“式樣好”、“式樣差”、“油漆好”、“油漆差”、“顏色好”、“顏色差”,“材料好”、“材料差”、“價格低”、“價格中”、“價格高”的評價。廠商希望從調(diào)查數(shù)據(jù)分析這5個變量的“值”間的關(guān)系。數(shù)據(jù)如下。試畫圖分析顧客對式樣、油漆、顏色、材料和價格的意見間的聯(lián)系

14、。表80名顧客對家具的評價樣好樣劣漆好漆劣色好色劣料好料劣價低價中價高101010010101010101000110|100110010101010101001010101000110Ti0011001101010101000101010110100101010100011011001010101001101010010J!_0101010J。101010100010110010101001100101010011001010101010101010010101010001110101001010101010010100110010101001010110100100110|10100101

15、010100011101010100011101010|1000110101001010101010101001010101000110101010001101100110010100110101:0010101010100101001100101010101000110101010100100101000110101010001101010010101010101000110101010001101010100010LJ101011010001010110100011001010101001101010010101010001101001100100101011010010011010100

16、10101010001101010100011101010100011010101000110101010001101010110100101010010101010101000111001101010010100110010解1)將表拷入工作表,在右邊加上一列,列名為“變量值”,內(nèi)容為各列的變量名。2)從“統(tǒng)計>多變量>多重對應(yīng)分析”入口,進入“多重對應(yīng)分析”對話框。3)選定“需要指示變量的列”將這含有指示變量的11列選入空格。4)將“變量值”選入“屬性名稱”空格。5)點擊“圖形”,彈出“多重對應(yīng)分析-圖形”對話框,在其中選定“顯示列圖”。6)各框點擊確定。結(jié)果分析:由列圖可見:

17、漆好、價高、料好、色好、樣好距離較近,聚為一類,這表明顧客對這批家具評價較好時,也覺得價格較高;另外漆劣、價低距離較近,聚為一類,這表明認(rèn)為家具價格低廉的顧客認(rèn)為漆不好;色劣、樣劣聚為一類,也就是說認(rèn)為這批家具色劣的顧客認(rèn)為家具式樣低劣;料劣、價中聚為一類,就是說認(rèn)為價格中等顧客也認(rèn)為主要問題是材料不好。例5例1為了分析某種疾病成因,考慮是否飲用某種飲料、吃快餐、上網(wǎng)、患病程度、性別這5個項目,把它們作為5個變量,它們分別取一些值(水平),為了分析這些水平間有何對應(yīng)關(guān)系。統(tǒng)計50名以上病人其資料如下表,試根據(jù)這資料作分析,看看哪些水平間關(guān)系最密切。表疾病與生活習(xí)慣數(shù)據(jù)病員飲用否吃快餐否性別上網(wǎng)

18、否患病程度1飲用不吃男上網(wǎng)低2飲用不吃男上網(wǎng)低3飲用吃男上網(wǎng)低4飲用吃男不上中5飲用吃男上網(wǎng)高6飲用不吃男上網(wǎng)低7飲用吃男上網(wǎng)低8飲用吃女上網(wǎng)中一9飲用不吃男上網(wǎng)低10飲用吃男上網(wǎng)高11飲用吃男上網(wǎng)高12飲用吃男上網(wǎng)高13飲用吃|男上網(wǎng)高14不飲吃女不上中15飲用吃男上網(wǎng)高比6飲用吃男上網(wǎng)高17飲用男上網(wǎng)高18飲用女上網(wǎng)中晅飲用吃女上網(wǎng)中20飲用吃男上網(wǎng)高21不飲不吃女上網(wǎng)低22飲用回男上網(wǎng)低23飲用閔男上網(wǎng)高24飲用吃男上網(wǎng)高25飲用吃女上網(wǎng)中26不飲吃女不上中27不飲同女不上中28不飲不吃女上網(wǎng)低29飲用不吃男上網(wǎng)低30不飲不吃女上網(wǎng)低31飲用吃|男上網(wǎng)高32飲用回男上網(wǎng)高33不飲吃女不上

19、中解1)將數(shù)據(jù)拷入工作表(01-06)o2)添一列在工作表中(C7),變量名為列名,以下空格順序填寫“不飲,飲用,不吃,吃,女、男,不上網(wǎng)、上網(wǎng),低,高,中”。3)從“統(tǒng)計>多變量>多重對應(yīng)分析”入口,進入“多重對應(yīng)分析”對話窗,4)在“屬性變量”中指定“飲用否-患病程度"(C2-C6)共5列(描黑后點擊“選擇”),在“類別名稱”中選入“列名”,在“分量數(shù)”仍保留為默認(rèn)的“2”。5)點擊“圖形”,彈出“多重對應(yīng)分析一圖形”對話窗,選擇“顯示列圖。6)各窗點擊“確定”,就可以得到計算結(jié)果從圖中可見:患病程度高的與飲用該飲料、男性、吃快餐、上網(wǎng)關(guān)系密切,女性與不飲用關(guān)系密切,

20、也就是說男性希望飲用、吃快餐、上網(wǎng);女性不希望飲用;不吃快餐的患病程度低;不上網(wǎng)的患病程度中等。(三)SAS作對應(yīng)分析SAS作對應(yīng)分析的必要性:功能強大可以考慮頻數(shù),畫圖清晰。1SAS簡介SAS系統(tǒng)可以通過多種方式生成數(shù)據(jù)集,并通過ASSIST菜單方式和程序方式(執(zhí)行SAS程序方式)實現(xiàn)人機會話。使用ASSIST模塊可實現(xiàn)菜單驅(qū)動式人機會話,而無需編程。但采用程序方式實現(xiàn)人機會話,利于初學(xué)者掌握和模仿使用,ASSIST菜單方式和MINITAB菜單方式相似,但是用到許多英文專業(yè)詞匯。本次僅介紹程序方式。編寫SAS程序要求很高,除字符串外不能有中文,不能有中文標(biāo)點符號,必須英文符號。1)SAS窗口

21、SAS系統(tǒng)實現(xiàn)程序方式人機會話主要通過4個窗口:PROGRAM(編輯器)窗口、LOG(日志)窗口、OUTPUT(輸出)窗口和GRAPH(圖形)窗口。(1) PROGRAM(編輯器)窗口用于存放給電腦的命令(一般為SAS程序),點擊菜單中跑步的小人為“提交”(submit)的快捷方式。(2) LOG(日志)窗口用于記錄計算過程,當(dāng)程序有錯誤時,日志窗口將錯誤語句用紅字標(biāo)出,往往還給出錯誤原因和修改建議。(3) OUTPUT(輸出)窗口用于存放電腦計算的結(jié)果。SAS計算結(jié)果很多,在輸出窗口形成許多數(shù)表,每個數(shù)表用表頭區(qū)分。(4) GRAPH(圖形)窗口用于輸出圖形型結(jié)果,具有較高分辯率。為得到這些

22、窗口可在屏幕下方找尋,也可在GLOBALS菜單下點擊。在PROGRAM窗口輸入SAS程序,并點擊“提交”(submit)快捷鍵(跑步小人),就可實現(xiàn)人機對話。2) )DATA步語句SAS程序由SAS語句組成。DATA語句以關(guān)聯(lián)詞DATA開頭,后跟數(shù)據(jù)集名。功能是:開始數(shù)據(jù)步;指示SAS產(chǎn)生數(shù)據(jù)集;指定產(chǎn)生的數(shù)據(jù)集名。如語句datawang2;指示SAS生成名為wang2的數(shù)據(jù)集。INPUT語句以關(guān)聯(lián)詞INPUT開頭,后跟變量名。用于指示SAS輸入數(shù)據(jù)時,數(shù)據(jù)對應(yīng)的變量。字符串型變量后要加$號,以說明是字符串變量。如果字符串型變量長于八個字母或中有空格,可在變量名后加數(shù)字說明在哪些列的符號是字符

23、串。如inputnoname%x1-x4z;表示數(shù)據(jù)體的順序是:數(shù)值型變量no、字符串變量name、數(shù)值型變量x1、數(shù)值型變量x2、數(shù)值型變量x3、數(shù)值型變量x4、數(shù)值型變量zo變量名只能用英文表示,字符串變量值可為中文。Datalineshuo或CARDS語句只由關(guān)聯(lián)詞datalines或,CARDS組成。表示以下為數(shù)據(jù)體。數(shù)據(jù)體每行寫一次觀察值,不同變量的值用空格分開不加任何符號,整型數(shù)與實型數(shù)無區(qū)別。賦值語句由變量+等號+表達式組成,如y=x1+2.5*x2+x3。它的作用是產(chǎn)生新的變量y,其每次觀察值由相應(yīng)x1,x2,x3觀察值計算??照Z句只由分號組成,表示數(shù)據(jù)體結(jié)束。例已知某組學(xué)生成

24、績?nèi)缦卤?,計算每個學(xué)生總分和平均成績學(xué)號姓名數(shù)學(xué)外語001趙大859287002錢二887797003孫三928895004李四828684可用如下程序dataclass1;健立名為class1的數(shù)據(jù)集*/inputnoname$shuxuueyuwenwaiyu;/*建立名為no、name(字符串型)、shuxuue、yuwenwaiyu*/zongfen=shuxuue+yuwen+waiyu;/*建立名為zongfen的變量,其值為shuxuue+yuwen+waiyu;*/pingjun=zongfen/3;/*建立名為pingjun的變量,其值為zongfen/3*/cards;/*

25、cards語句,以下為數(shù)據(jù)體*/001趙大859287002錢二887797003孫三928895004李四828684;/*空語句,結(jié)束數(shù)據(jù)步*/run;所得數(shù)楣集有五個變量,分別給出學(xué)生的語文,數(shù)學(xué),外語,總分和平均成績。為顯示該數(shù)據(jù)集,在編輯器(PROGRAM)窗口輸入命令procprintdata=class1;run;可在輸出窗口看到數(shù)據(jù)集的內(nèi)容。3) PROC步語句PROC步調(diào)用過程加工數(shù)據(jù)集。每個過程由若干句子組成,這些句子根據(jù)過程的需要而定。最常用的語句形為PROC語句,一般形式是Procxxxdata=yyy,功能是讓SAS調(diào)用xxx過程處理數(shù)楣集yyy。其他較常用語句有:V

26、AR語句,以關(guān)聯(lián)詞VAR開頭,用以規(guī)定參與的變量;OUTPUT語句,以關(guān)聯(lián)詞VAR開頭,用以規(guī)定輸出某個數(shù)據(jù)集的內(nèi)容。由于不同問題需要調(diào)用不同過程,不同過程PROC步所用語句也不相同4) SAS做對應(yīng)分析SAS使用CORESPi程作對應(yīng)分析,在PROCCORES的句中使用OUTC選項輸出畫圖所用數(shù)據(jù);再使用宏指令%plotit畫出圖形。如果不直接輸入列聯(lián)表或BURT表,而是輸入原始數(shù)據(jù),則要增加TABLE語句,由原始數(shù)據(jù)獲取列聯(lián)表或BURTWo2SAS作簡單對應(yīng)分析可以在數(shù)據(jù)步把兩個變量的列聯(lián)表直接輸入,也可以用原始屬性數(shù)據(jù)輸入。列聯(lián)表直接輸入時,代表每一行的符號“行名”排成一列,作為一個字符

27、串變量的值,代表每一列的符號“列名”作為自變量的符號。在原程序加工步中用VAR語句指定列名變量;ID語句指明行名變量。如果輸入原始變量,要用TABLES句生成列聯(lián)表,不用VAR語句。例5經(jīng)調(diào)查大學(xué)生舌色和體質(zhì)列聯(lián)表如下,做對應(yīng)分析體質(zhì)顏色平和氣虛陽虛陰虛瘀血痰濕濕熱氣郁特凜淡紅12424299395241832769223387紅16147147892642134214絳444112221暗628221130青紫614510110邊紅351130109103154尖紅14856123802235153416淡白211216656453解用Co1-co7表示舌頭7種顏色;ph1-ph9表示9種體

28、質(zhì)程序Datacolorph;/*建立數(shù)據(jù)集,名為colorph*/Inputcolor$ph1-ph9;/建立10個變量,變量名為color(字符串變量),phi至ph9*/Cards;/*以下是數(shù)據(jù)體*/Co112424299395241832769223387Co216147147892642134214Co3444112221Co4628221130Co5614510110Co6351130109103154Co714856123802235153416Co8211216656453;/*數(shù)據(jù)體結(jié)束*/proccorrespoutc=wang;/*調(diào)用corresp過程,輸出數(shù)據(jù)集為w

29、ang*/varph1-ph9;/*9個列變量是ph1-ph9*/idcolor;/*行變量是color*/run;/*執(zhí)行*/%plotit(data=wang,datatype=corresp,plotvars=Dim1Dim2)/*宏指令,用數(shù)據(jù)集wang畫對應(yīng)分析圖*/quit;/*退出畫圖過程*/執(zhí)行后得到圖形中舌色1(淡紅)和體質(zhì)1(平和)最接近。Co7和ph3最接近,也就是說舌色尖紅的人如果不是平和,就是陽虛。多重對應(yīng)分析3SAS作多重對應(yīng)分析為了了解人們對英國政府某項政策的態(tài)度,請被調(diào)查人對5個問題打勾:性別(男、女),低于30歲?(低于、高于),年收入8000鎊?(少于、多于

30、),情緒(悲觀、樂觀),贊成否?(贊成、反對);得到5個屬性變量,每個屬性變量各有2個值。整理74人的調(diào)查資料為表5-4。對所得數(shù)據(jù)做多重對應(yīng)分析。表5-4人們對英國政府某項政策的態(tài)度住另IJ低于30歲?年收入8000鎊?情緒/!/!»贊成否?mlowlessoptiyesflowlessopti_yesflowlessoptiyesflowlessoptiyesmhigh二lessoptiyesmhighlessoptiyesmhighlessoptiyesfhighlessoptiyesfhighlessoptiyesmlowmoreoptiyesmlowmoreoptiyesm

31、highmoreoptiyesmhighmoreoptiyesmhighmoreoptiyesfhighmoreoptiyesmlowlesspessyesmlowlesspessnomlowmorepessyesmlowlessoptinomlowlessoptinomlowlessoptinomlowlessoptinomlowlessoptinoflowlessoptinoflowlessoptinoflowlessoptinoflowlessoptinomhighlessoptinomhigh二lessoptinofhighlessoptinofhighlessoptinofhigh二

32、lessoptinoflowmoreoptinomhighmoreoptinomhighmoreoptinomhighmoreoptinomhighmoreoptinomlowlesspessnomlowlesspessnomlowlesspessnomlowlesspessno:mlowlesspessnomlowlesspessnomlowlesspessnomlowlesspessnomlowlesspessnomlowlesspessnomlowless_pessno.mlowlesspessnomlowlesspessnoflowlesspessno;flowlesspessnofl

33、owlesspessnoflowlesspessnoflowlesspessnoflowlesspessnoflowlesspessnoflowlesspessnoflowlesspessnomhighlesspessnomhighlesspessnomhighlesspessnomhighlesspessnomhighlesspessnofhighlesspessnofhighlesspessnofhighlesspessnofhighlesspessnofhighlesspessnofhighlesspessnomlowmorepessnomhighmorepessnomlowmoreop

34、tiyesmlowmoreoptiyes解:被加工的數(shù)據(jù)集是原始類別資料,需要用table語句生成BUR俄。以sexageincomemoralecommit表示變量性別,低于30歲?,年收入8000,情緒,贊成否。取的值是m,f;low,high;less,more;pess,opti;yes,no,分另1J表示:男、女;彳氐于、高于;少于、多于;悲觀、樂觀;贊成、反對。建立程序(程序名“對英國政策的態(tài)度”.sas)datacommit;inputsex$age$income$morale$commit$;datalines;mlowlessoptiyesflowlessoptiyesflo

35、wlessoptiyesflowlessoptiyesmhighlessoptiyesmhighlessoptiyesmhighlessoptiyesfhighlessoptiyesfhighlessoptiyesmlowmoreoptiyesmlowmoreoptiyesmhighmoreoptiyesmhighmoreoptiyesmhighmoreoptiyesfhighmoreoptiyesmlowlesspressyesmlowlesspressnommmmmmffffmmffflowlowlowlowlowlowlowlowlowlowhighhighhighhighhighmor

36、epressyeslessoptinolessoptinolessoptinolessoptinolessoptinolessoptinolessoptinolessoptinolessoptinolessoptinolessoptinolessoptinolessoptinolessoptinoflowmoreoptinomhighmoreoptinomhighmoreoptinomhighmoreoptinomhighmoreoptinomlowlesspressnomlowlesspressnomlowlesspressnomlowlesspressnomlowlesspressnoml

37、owlesspressnomlowlesspressnomlowlesspressnomlowlesspressnomlowlesspressnomlowlesspressnomlowlesspressnomlowlesspressnoflowlesspressnoflowlesspressnoflowlesspressnoflowlesspressnoflowlesspressnoflowlesspressnoflowlesspressnoflowlesspressnoflowlesspressnomhighlesspressnomhighlesspressnomhighlesspressn

38、omhighlesspressnomhighlesspressnofhighlesspressnofhighlesspressnofhighlesspressnofhighlesspressnofhighlesspressnofhighlesspressnomlowmorepressnomhighmorepressnomlowmoreoptiyesmlowmoreoptiyesproccorrespmcaoutc=wang;tablessexageincomemoralecommit;/*由原始屬性變量數(shù)據(jù)算出burt表,以供對應(yīng)分析使用*/run;%plotit(data=wang,data

39、type=corresp,href=0,vref=0)/*畫對應(yīng)分析圖,過原點畫縱軸和橫軸*/quit;執(zhí)行程序后得到對應(yīng)分析圖。optinu*pewlewmoie*從圖中可見“低于"30歲(low)、“少于8000鎊"(less)、“悲觀"(pess)、“反對"(no)距離較近,說明年青和收入少者持悲觀態(tài)度,反對該政策;“贊成"(yes)、“樂觀”(optim)、“高于”(high)距離較近,說明收入高的人持樂觀態(tài)度,贊成該政策;“男”、“女”和“多于”比較孤立,說明對政策的態(tài)度與“性別”無關(guān),年齡大的人對政策的態(tài)度不明朗。4模糊數(shù)據(jù)的處理對

40、于每一個個體x屬性變量的值應(yīng)當(dāng)是唯一確定的,有時出現(xiàn)模糊值現(xiàn)象。例如一個人的舌色既是淡紅又是舌尖紅。為此常用近似處理方法原始數(shù)據(jù)No淡紅舌尖紅紅1234100567801023451101357111近似數(shù)據(jù)No淡紅舌尖紅紅1234100567801023451002345010135710013570101357001精確數(shù)據(jù)No淡紅舌尖紅紅權(quán)12341006567801062345100323450103135710021357010213570012用MINITAB的頻數(shù)選項或SASWweight語句計算四logistic回歸當(dāng)因變量是屬性變量時,可以用logistic回歸建立預(yù)測方程L

41、ogistic回歸分析的目的是建立經(jīng)驗公式,以便由自變量預(yù)測因變量概率分布。當(dāng)因變量僅有兩個“狀態(tài)”時的Logistic回歸就是“二值Logistic回歸”;當(dāng)因變量的多個“狀態(tài)”(狀態(tài)數(shù)多于2)沒有順序關(guān)系時就是“名義值Logistic回歸”。使用MINITAB的二進制Logistic回歸對話框、名義Logistic回歸對話框,就能分別完成這2種回歸分析。Logistic回歸的自變量可以是數(shù)值變量,也可以是屬性變量。當(dāng)自變量是屬性變量時,要把它選入“因子”空格,以向MINITAB說明該自變量是屬性變量。實施這些對話框后,得到的結(jié)果主要由3張表組成:Logistic回歸表,斜率檢驗表和擬合優(yōu)度檢驗表;它門的表頭分別是“Logistic回歸表”,“檢驗斜率是否為零”和“擬合優(yōu)度檢驗"。Logistic回歸表給出參數(shù)的估計值,參數(shù)顯著性檢驗的p值(這兩項和線性回歸相同)和自變量的優(yōu)勢比;p值越小,例如小于0.05,自變量越重要,不能刪去;斜率檢驗表給出斜率檢驗的p值,p值越小,仞如小于0.05,Logistic所有自變量的效果越好;擬合優(yōu)度檢驗表

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論