




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、市場(chǎng)調(diào)查中數(shù)據(jù)分析 本講內(nèi)容本講內(nèi)容了解數(shù)據(jù)準(zhǔn)備的含義;掌握數(shù)據(jù)準(zhǔn)備的步驟和操作方法;了解常見(jiàn)的數(shù)據(jù)分析技術(shù)分類方法;掌握數(shù)據(jù)描述主要指標(biāo)含義和方法;掌握列聯(lián)表、方差分析的應(yīng)用;理解因子分析、聚類分析和判別分析的聯(lián)系和分析方法。第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 學(xué)習(xí)導(dǎo)航學(xué)習(xí)導(dǎo)航數(shù)據(jù)準(zhǔn)備列聯(lián)表分析方差分析分析技術(shù)分類與數(shù)據(jù)描述數(shù)據(jù)分析技術(shù)數(shù)據(jù)準(zhǔn)備的步驟聚類分析判別分析分析技術(shù)分類數(shù)據(jù)描述因子分析數(shù)據(jù)準(zhǔn)備物理檢查 數(shù)據(jù)編碼 數(shù)據(jù)錄入 數(shù)據(jù)清理 數(shù)據(jù)轉(zhuǎn)換 數(shù)據(jù)保存集中趨勢(shì)分析 頻數(shù)分析離散趨勢(shì)分析 數(shù)據(jù)分布定義問(wèn)題 構(gòu)造相關(guān)矩陣提取因子 因子命名 判斷模型擬合情況擬定分析方案 選擇距離指標(biāo)確定族群數(shù)目
2、族群解釋和命名定義問(wèn)題 選擇判別方法 估計(jì)判別函數(shù)系數(shù)及其顯著性運(yùn)用判別函數(shù)進(jìn)行判別估算判別的有效性第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 數(shù)據(jù)準(zhǔn)備的含義數(shù)據(jù)準(zhǔn)備的含義數(shù)據(jù)分析包含兩個(gè)基本工作步驟:數(shù)據(jù)準(zhǔn)備和數(shù)據(jù)分析。數(shù)據(jù)準(zhǔn)備:是對(duì)收集來(lái)的原始數(shù)據(jù)進(jìn)行一列處理,形成數(shù)據(jù)分析所需的標(biāo)準(zhǔn)數(shù)據(jù)表的過(guò)程。數(shù)據(jù)分析:是運(yùn)用一定的分析方法對(duì)數(shù)據(jù)進(jìn)行處理,使其顯示出解決管理決策問(wèn)題和營(yíng)銷研究問(wèn)題所需信息的過(guò)程。數(shù)據(jù)準(zhǔn)備一般包括問(wèn)卷的物理檢查、編碼、錄入、清理、轉(zhuǎn)換、保存等步驟。 第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 數(shù)據(jù)準(zhǔn)備的步驟數(shù)據(jù)準(zhǔn)備的步驟物理檢查 數(shù)據(jù)編碼 數(shù)據(jù)錄入 數(shù)據(jù)清理 數(shù)據(jù)轉(zhuǎn)換 數(shù)據(jù)保存第第8講講 數(shù)據(jù)分析數(shù)據(jù)
3、分析 物理檢查物理檢查檢查的內(nèi)容包括:?jiǎn)柧硎欠裉顚懲暾皇欠翊嬖谝?guī)律性回答是否存在沒(méi)有按要求回答,并盡可能了解其中的原因。 問(wèn)卷不完整的處理方法:數(shù)據(jù)缺失較少,直接保留記錄,按記錄的實(shí)際情況進(jìn)入分析,所缺數(shù)據(jù)按缺失值處理;當(dāng)樣本量較小時(shí),缺失值又十分重要,根據(jù)問(wèn)卷作業(yè)證明記載信息進(jìn)行回訪,盡可能補(bǔ)上缺失值;當(dāng)樣本量較大時(shí),問(wèn)卷的缺失值較多,采用直接丟棄整份問(wèn)卷或部分?jǐn)?shù)據(jù)。 第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 數(shù)據(jù)編碼數(shù)據(jù)編碼矩陣式原則:是針對(duì)整體數(shù)據(jù)編排格式而言的,即最終數(shù)據(jù)表必須是一張由若干行和若干列組成的矩陣式數(shù)據(jù)表格。 排他性原則:在一定范圍內(nèi),一個(gè)編碼只能對(duì)應(yīng)一個(gè)變量或答案,每個(gè)答案(包括沒(méi)
4、有作答、無(wú)法作答等情況)都有一個(gè)代碼與之對(duì)應(yīng),不能存在相互交叉。需要強(qiáng)調(diào)的是,當(dāng)一個(gè)變量的答案是多選時(shí),對(duì)于每一種答案應(yīng)采用一個(gè)代碼進(jìn)行列示,對(duì)受訪者沒(méi)有選中(注意:應(yīng)區(qū)別沒(méi)有回答的代碼)的答案分配一個(gè)統(tǒng)一的代碼。 【例】您的性別是:男 女 這一問(wèn)題的編碼應(yīng)包括: 變量:性別,或gend性別 答案:0女;1男;2沒(méi)有回答 第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 編碼的另外兩種情況編碼的另外兩種情況一是多維編碼,或稱復(fù)合編碼,即一個(gè)編碼包含的信息是多維的,如同身份證號(hào)碼包含省份、城市、生日、性別等信息一樣。多維編碼一般僅僅用于標(biāo)識(shí)定類變量,不利于統(tǒng)計(jì)分析,應(yīng)謹(jǐn)慎使用;二是定性資料編碼。定性資料的編碼絕非輕
5、而易舉,研究人員除了解編碼原則以外,還必須對(duì)手頭資料的研究目的有一定理解,更重要的是對(duì)文字信息的洞察力。研究者應(yīng)首先建立起一套編碼單位,對(duì)文本(最好是電子文本)進(jìn)行手工編碼,再進(jìn)行計(jì)算機(jī)分析。 第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 數(shù)據(jù)錄入數(shù)據(jù)錄入如果通過(guò)電腦輔助 訪談(CATI)或電腦輔助人員訪談(CAPI)收集數(shù)據(jù),研究者可以直接得到電子版數(shù)據(jù)表。對(duì)于非電腦輔助調(diào)查,研究者需要通過(guò)一定的手段將數(shù)據(jù)轉(zhuǎn)錄為電子表格。手工鍵盤錄入應(yīng)采用二次錄入,通過(guò)兩次錄入的結(jié)果對(duì)比檢查有無(wú)差異,或者抽取部分問(wèn)卷錄入結(jié)果進(jìn)行核查,核查比例一般不低于25%。第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 數(shù)據(jù)清理數(shù)據(jù)清理數(shù)據(jù)清理的任務(wù)包括
6、檢查數(shù)據(jù)的一致性和處理缺失值。一致性檢查包括三項(xiàng)基本工作: 第一,檢查有無(wú)超出編碼定義范圍的數(shù)據(jù)存在; 第二,檢查有無(wú)答案的邏輯矛盾; 第三,檢查有無(wú)兩行或多行數(shù)據(jù)完全一致或絕大部分一致。 缺失值處理方法一般有: 用均值代替; 用估計(jì)值代替; 整例刪除; 結(jié)對(duì)刪除。第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)轉(zhuǎn)換重新編碼:出于受訪者便利或事先無(wú)法預(yù)計(jì)等原因,問(wèn)卷設(shè)計(jì)中的某些數(shù)據(jù)可能需要進(jìn)行反向編碼、重新分組編碼等操作。反向編碼就是將原有編碼進(jìn)行反向替代。 數(shù)據(jù)編輯 單變量重新標(biāo)度。如指數(shù)形式或?qū)?shù)形式等; 變量組合運(yùn)算??赡苄鑼?duì)多個(gè)變量進(jìn)行四則運(yùn)算等; 量綱轉(zhuǎn)換。對(duì)不同變量的定量值進(jìn)行可比性處理
7、; 賦權(quán)。在必要時(shí)可能對(duì)不同的問(wèn)卷進(jìn)行賦權(quán),增加特定目標(biāo)受訪者對(duì)最終結(jié)果的影響力。 第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)保存應(yīng)注意以下幾點(diǎn):第一,多份實(shí)時(shí)備份,手工輸入數(shù)據(jù)文件被破壞帶來(lái)的物質(zhì)和精神損失是巨大的;第二,保存格式通用,因?yàn)閿?shù)據(jù)表可能供分析員在不同的軟件上使用,保存格式通用可以省去很多麻煩,節(jié)約大量的時(shí)間;第三,數(shù)據(jù)表需編號(hào),數(shù)據(jù)表編號(hào)最好采用文字加數(shù)字的方法,便于識(shí)別數(shù)據(jù)內(nèi)容和狀態(tài),這一點(diǎn)對(duì)于大規(guī)模數(shù)據(jù)分析十分重要。第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 數(shù)據(jù)分析技術(shù)分類數(shù)據(jù)分析技術(shù)分類依據(jù)測(cè)量尺度不同,數(shù)據(jù)分析技術(shù)被分為非測(cè)量型數(shù)據(jù)技術(shù)(nonmetric)和測(cè)量型數(shù)據(jù)技術(shù)
8、(metric),非測(cè)量型數(shù)據(jù)包括定類尺度和定序尺度,它們?cè)诒举|(zhì)上主要反映事物的分類,沒(méi)有真正的測(cè)量含義;測(cè)量型數(shù)據(jù)包括定距尺度和定比尺度,它們都能夠測(cè)量變量的值。依據(jù)統(tǒng)計(jì)技術(shù)屬性,數(shù)據(jù)分析技術(shù)被分為因果技術(shù)(dependence technique)和相依技術(shù)(interdependence technique),因果技術(shù)適用于一個(gè)或多個(gè)變量作為因變量,其他變量作為自變量的情況;相依技術(shù)適用于變量沒(méi)有自變量和因變量之分,只是測(cè)試變量之間的相關(guān)性或個(gè)體之間變量的相似程度。按分析變量數(shù)量的不同,數(shù)據(jù)分析技術(shù)被分為單元統(tǒng)計(jì)技術(shù)(univariate technique)和多元統(tǒng)計(jì)技術(shù)(multiv
9、ariate technique)。單元分析技術(shù)適用于單個(gè)元素分析,單元素的衡量指標(biāo)或多或少;多元統(tǒng)計(jì)技術(shù)適用于分析多個(gè)元素之間的關(guān)系,或多個(gè)元素同時(shí)對(duì)某一個(gè)因素的影響。 第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 數(shù)據(jù)描述技術(shù)數(shù)據(jù)描述技術(shù)集中趨勢(shì):用來(lái)反映數(shù)據(jù)的一般水平,常用的指標(biāo)有平均值、中位數(shù)和眾數(shù)等;離散趨勢(shì):主要用來(lái)反映數(shù)據(jù)之間的差異程度,常用的指標(biāo)有方差、標(biāo)準(zhǔn)差、全距、最大值和最小值。頻數(shù)分析:利于研究者初步觀察一些統(tǒng)計(jì)規(guī)律。數(shù)據(jù)分布:統(tǒng)計(jì)分析中,通常要假設(shè)樣本的分布屬于正態(tài)分布,因此要用偏度和峰度兩個(gè)指標(biāo)來(lái)檢查樣本是否符合正態(tài)分布。 第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 描述統(tǒng)計(jì)分析案例描述統(tǒng)計(jì)分析案
10、例某保險(xiǎn)公司有20個(gè)保險(xiǎn)銷售分公司,各公司2006年取得的銷售業(yè)績(jī)(單位:萬(wàn)元)如下,對(duì)銷售業(yè)績(jī)進(jìn)行描述分析。 公司編號(hào)公司編號(hào) 銷售業(yè)績(jī)銷售業(yè)績(jī) 公司編號(hào)公司編號(hào) 銷售業(yè)績(jī)銷售業(yè)績(jī) 公司編號(hào)公司編號(hào) 銷售業(yè)績(jī)銷售業(yè)績(jī) 公司編號(hào)公司編號(hào) 銷售業(yè)績(jī)銷售業(yè)績(jī)1265.36315.311403.616318.52286.17570.112265.517326.03340.48512.013356.618373.24410.89422.114632.619350.45418.210305.015521.420421.8第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 銷售業(yè)績(jī)的描述性分析銷售業(yè)績(jī)的描述性分析變量全距最小值
11、最大值銷售業(yè)績(jī)367.3265.3632.6樣本量均值標(biāo)準(zhǔn)差方差20390.745101.610510324.691第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 聯(lián)列表技術(shù)聯(lián)列表技術(shù)列聯(lián)表的本質(zhì):是兩個(gè)或兩個(gè)以上變量的交叉頻數(shù)分布表,它既可以幫助研究者初步描述和判斷變量之間的關(guān)系,也可以用構(gòu)造卡方統(tǒng)計(jì)量來(lái)檢驗(yàn)變量的關(guān)系。 第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 列聯(lián)表分析實(shí)例列聯(lián)表分析實(shí)例例:顧客對(duì)產(chǎn)品屬性重要性評(píng)價(jià)的最終答案如下,那么不同年齡受訪者的評(píng)價(jià)是否具有顯著的差別? 年齡段年齡段重要性重要性評(píng)價(jià)評(píng)價(jià)年齡年齡合計(jì)合計(jì)25周歲周歲2534周歲周歲3544周歲周歲4559周歲周歲60周歲周歲彩電品牌12226121
12、54792202411115731823930534183073058合計(jì)7810339225247第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 列聯(lián)表的分析結(jié)果列聯(lián)表的分析結(jié)果統(tǒng)計(jì)量統(tǒng)計(jì)量檢驗(yàn)檢驗(yàn)統(tǒng)計(jì)量值統(tǒng)計(jì)量值自由度自由度雙側(cè)雙側(cè)近似概率近似概率Pearson卡方(Pearson Chi-Square)24.28312.019對(duì)數(shù)似然比方法計(jì)算的卡方(Likelihood Ratio)25.15012.014線性相關(guān)的卡方(Linear-by-Linear Association)8.1751.004有效樣本量247 列聯(lián)表分析在SPSS中的實(shí)現(xiàn):點(diǎn)擊AnalyzeDescriptive Statitic
13、sCrosstabs,選中“彩電品牌”到Row(s),“年齡”到“Column(s)”,點(diǎn)擊下方【statistics】,選中“Chi-square”,依次點(diǎn)擊【continue】【ok】,結(jié)果如下: 第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 方差分析方差分析方差分析通常用于某一個(gè)或多個(gè)變量在兩組或兩組以上的組別之間的均值是否存在顯著差異,各組別的均值大小如何。方差分析通常假設(shè)各組均值相等,如F統(tǒng)計(jì)量拒絕原假設(shè),我們就認(rèn)為某變量在各組別之間存在顯著差異,企業(yè)應(yīng)采取不同的策略。 第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 因子分析因子分析因子分析是一種用于數(shù)據(jù)簡(jiǎn)化和降維的多元統(tǒng)計(jì)分析方法。面對(duì)眾多內(nèi)在相關(guān)的變量,因子分析
14、試圖使用少數(shù)幾個(gè)隨機(jī)變量來(lái)描述眾多變量所體現(xiàn)的一種基本結(jié)構(gòu),從而將數(shù)據(jù)維度降至一個(gè)可以掌握的水平。因子分析是解決多重共線性問(wèn)題的有效手段,能夠有效探索變量之間的內(nèi)在結(jié)構(gòu)。 第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 聚類分析聚類分析 聚類分析聚類分析:就是實(shí)現(xiàn)分類實(shí)現(xiàn)分類的一種多元統(tǒng)計(jì)方法,它根據(jù)聚類變量將受訪者分成相對(duì)同質(zhì)的族群。與因子分析不同,聚類分析通過(guò)將具有同質(zhì)性的受訪者個(gè)體聚為較少數(shù)量的族群來(lái)減少個(gè)體數(shù)量,即個(gè)體數(shù)量并不變化個(gè)體數(shù)量并不變化,而因子分析通過(guò)減少變量的數(shù)量來(lái)達(dá)到降維目的。 第第8講講 數(shù)據(jù)分析數(shù)據(jù)分析 判別分析判別分析判別分析:是在已有的觀察數(shù)據(jù)及其所屬類別信息的基礎(chǔ)上,建立判別式,然后對(duì)未知的數(shù)據(jù)進(jìn)行判別分
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 肝癌護(hù)理病歷書(shū)寫規(guī)范
- 藥店店員禮儀培訓(xùn)
- 優(yōu)化普惠金融服務(wù)體系實(shí)施方案
- 征信崗前培訓(xùn)
- 腫瘤護(hù)理評(píng)價(jià)體系構(gòu)建與實(shí)踐
- 糞便微生物降解-洞察及研究
- 體系文件培訓(xùn)總結(jié)
- 重慶幼兒師范高等??茖W(xué)?!堵殬I(yè)安全與衛(wèi)生學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 化療患者護(hù)理常規(guī)管理
- 護(hù)理就業(yè)創(chuàng)業(yè)指導(dǎo)
- 農(nóng)藝工中級(jí)試題庫(kù)與參考答案
- 原料藥儲(chǔ)存養(yǎng)護(hù)
- 【MOOC】計(jì)算機(jī)系統(tǒng)局限性-華東師范大學(xué) 中國(guó)大學(xué)慕課MOOC答案
- 國(guó)家開(kāi)放大學(xué)Python程序設(shè)計(jì)形考任務(wù)實(shí)驗(yàn)六-互聯(lián)網(wǎng)評(píng)論數(shù)據(jù)分析及其展示綜合案例
- 《Hadoop大數(shù)據(jù)原理與應(yīng)用》實(shí)驗(yàn)指導(dǎo)書(shū)
- 2024年琥珀課件:探索琥珀中的生命奧秘
- 靜脈留置針穿刺維護(hù)與常見(jiàn)并發(fā)癥處理
- 代加工食品協(xié)議范本2024年
- 江蘇省盱眙縣2024屆八年級(jí)英語(yǔ)第二學(xué)期期末質(zhì)量檢測(cè)試題含答案
- 結(jié)婚函調(diào)報(bào)告表
- 浙江省杭州市濱江區(qū)2023-2024學(xué)年八年級(jí)下學(xué)期期末科學(xué)試題(原卷版)
評(píng)論
0/150
提交評(píng)論