《社會調查研究方法》3版課件 第八章_第1頁
《社會調查研究方法》3版課件 第八章_第2頁
《社會調查研究方法》3版課件 第八章_第3頁
《社會調查研究方法》3版課件 第八章_第4頁
《社會調查研究方法》3版課件 第八章_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第八章 數據處理新編世紀社會學系列教材基本概念數據處理 資料檢查 資料校訂 數據文件 編碼 事前編碼 邊緣編碼 事后編碼 編碼手冊 欄位 登錄表 資料錄入 條形碼判讀器 光電掃描儀 數據清理 可能數值清理 一致性清理 缺失值 系統性缺失值 平均值估計法 回歸估計法第八章 數據處理第一節(jié) 資料檢查與校訂第二節(jié) 資料編碼 第三節(jié) 數據錄入與整理 第一節(jié) 資料檢查與校訂 資料檢查一第一節(jié) 資料檢查與校訂 資料校訂二1.檢查問卷2.回訪在實際訪問中, 訪問員的違規(guī)或舞弊行為主要表現為以下幾類:首先, 沒有按規(guī)定訪問指定的被訪者。其次, 用電訪或郵寄代替面訪。再次, 故意漏問某些較敏感或較難問的題目。最

2、后, 自己填答問卷。(一)資料檢查一為了提高問卷質量,對那些經過初步檢查的問卷,還要進行校訂工作,即從問卷中找出那些錯誤或不令人滿意的答案,并對之進行相應的處理。 (二)資料校訂二訪問員沒問某些問題,或沒記錄某些問題的答案訪問員的記錄字跡不清記錄的答案模棱兩可或含義不清楚訪問員在規(guī)定跳題的地方沒跳, 或在不該跳題的地方卻跳了。第二節(jié) 資料編碼 編碼的一般規(guī)則 一第二節(jié) 資料編碼 開放式題目的事后編碼技術二 編碼手冊的編制三 特殊題型的編碼四資料編碼原則上是將被訪者對一個問題的回答,分配一個相對應的計算機軟件能夠識別的代碼,這個代碼就是代表該項回答內容的編碼。 思考:除了確定編碼方式外,編碼時特

3、別需要注意哪些?(一)編碼的一般規(guī)則 一1.在編碼的過程中,除了要對被訪者每一個回答的選項進行編碼外,還需對問卷編號、訪問員編號等相關內容依統一標準進行編碼,這樣做可以為查找問卷錯誤提供極大的便利。2. 如果被訪者的回答內容本身就是一些數字資料,如被訪者的年齡、收入等, 在編碼時應盡可能保留原來資料的面貌, 以使資料的使用者有更大的空間自己處理所需要的變量類型。3.對于“不確定”、“不知道” 或 “其他” 這樣的特殊選項,在編碼設計時要使用固定的代碼,如 “ ”、“ ” 等,最好在整份問卷中都完全一致。此類代碼前后一致性程度越高,錄入時出錯的可能性就越小。 一開放式題目和封閉式題目中的“其他”

4、 選項,由于是被訪者用自己的話來回答問題,故答案的范圍無法事先預知,一般采取事后編碼。在事后編碼中,編碼員第一要對已出現的各種答案進行分類,即分析每一個答案,將相類似的歸并為一類。(二)開放式題目的事后編碼技術二1.研究者應該針對每一個需要事后編碼的項目給出一份代碼指南。2.代碼指南的編制要在設計問卷時就開始,在焦點小組討論、 深度訪談和試調查過程中,研究者要有意識地摘要記錄每個不同的答案。隨后將所有不同的答案做成分類表,并給每個答案建立草擬的代碼,從而形成初步的代碼指南。3.編碼時,研究者在為編碼員提供每一個編碼項目的代碼指南的同時,還應該附上幾張單頁編碼紙, 將需要編碼項目的名稱和謄寫答案

5、的位置清楚地標在每頁的頂端。(二)開放式題目的事后編碼技術二4.對于某個分類含義不十分清晰的答案,究竟是將其合并到已有的類別中去,還是設立一個新代碼呢? 一般而言,有經驗的編碼員通常會選擇后一種策略。5.對于事后編碼來說,如果有兩個或多個編碼員參與編碼工作,那么他們要么在不同的時間進行編碼,要么同時在同一地點,依照同一編碼手冊進行編碼。 (三)編碼手冊的編制二提供一套標準化的編碼作業(yè)程序編碼作業(yè)的一份操作檔案。 數據分析人員了解數據文件的指南。 時間緊迫(四)特殊題型的編碼四1復選題的編碼 2 排序題的編碼(見P220)第三節(jié) 數據錄入與整理 決定錄入方式和軟件 一第三節(jié) 數據錄入與整理 人工

6、錄入的注意事項 二 數據清理 三 缺失值的處理 四一人工錄入是以人工打字方式,直接將問卷或登錄表上編好碼的數據逐一輸入計算機。計算機輔助系統轉換是指采用“電腦輔助個人當面訪問”()系統或“電腦輔助電話訪問”( )系統搜集資料后,將每個調查員計算機中的資料由資料處理人員統一轉出的過程。 光電掃描是指將登錄到專門的光學掃描紙上編好碼的數據,用掃描儀器掃描到計算機中。 條形碼判讀器將問卷上與答案編碼相對應的條形碼直接掃描進計算機中的錄入方法。使用這種方法關鍵是先將與問題的每一個答案相對應的編碼都設置成條形碼,然后在印刷問卷的同時,一并印在問卷上。 目前比較常見的可用來進行錄入的軟件包括: 統計分析軟

7、件 、 數據庫管理軟件 、電子表格 和專門的錄入軟件 (一)決定錄入方式和軟件1.在正式錄入開始前,研究者必須統一規(guī)定需要錄入的資料內容和數據錄入格式。2.要對數據錄入員進行培訓,絕不能假定會計算機操作的人員就懂得如何進行數據錄入。3.數據錄入中的工作要點:二(二)人工錄入的注意事項 1. 設計一份工作進度表,用來掌控錄入工作進度, 明確錄入責任歸屬,避免重復錄入, 以及以此為依據計算錄入員的勞務。2.錄入一開始就應為每個錄入員提供一份有關錄入內容和格式的手冊。開始錄入最初幾份問卷時,研究人員必須在錄入現場回答和解決錄入中可能出現的問題。3.要為每個錄入員提供足夠的空間擺放問卷,避免已錄入和未

8、錄入的問卷、不同錄入員的問卷發(fā)生混淆, 造成錄入的遺漏或重復。4.每個錄入員在完成分配給自己的問卷后, 在送回問卷的同時,還應提交相應的數據文件拷貝。 要安排專職人員將每個錄入員提交的數據文件合并成總的數據文件。5. 在人工錄入中除了要設置一些防止差錯的方法外,最好能進行雙錄,即安排不同的錄入員,獨立地將問卷錄入兩次,然后進行交叉比對檢查。二數據錄入中的工作要點:(三)數據清理 三一致性清理涉及數據結構的檢查,通常會牽涉到兩個或兩個以上變量,所謂邏輯不一致數值,是指兩個或兩個以上變量之間出現了邏輯上彼此互斥的數值。 可能數值清理:可能數值清理是針對每一個變量,檢查它是否有超出合理范圍的數值。(

9、四)缺失值的處理 一1.缺失值的分析2.缺失值的預防3.缺失值的估計平均值估計法?;貧w估計法。刪除缺失值。排除缺失值。 復習思考題1.怎樣檢查調查資料的完整性和準確性?怎樣通過回訪來檢查資料的真實性?2.在實際訪問中,訪問員的違規(guī)或舞弊行為主要表現為哪幾種類型?3.在資料的校訂過程中需要關注哪些問題?4.除了確定編碼方式,資料編碼還需要注意哪些問題?5.為什么對開放式題目進行事后編碼時,要編制編碼指南?6.在編碼中,編碼手冊有哪些重要作用?7.通過登錄表錄入數據有哪些優(yōu)缺點?8.如何處理由非隨機性行為引起的系統性缺失?9.如何預防數據缺失的發(fā)生?推薦閱讀書目1.柯惠新, 丁立宏編著市場調查與分析北京: 中國統計出版社,20002.風笑天現代社會調查方法武漢: 華中科技大學出版社,2001參考文獻1.美巴比 .社會研究方法.北京: 華夏出版社,20002.風笑天現代社會調查方法.武漢: 華中科技大學出版社,20013.美 福勒 .調查研究方法.重慶: 重慶大學出版社,20044.柯惠新,丁立宏編著.市場調查與分析.北京: 中國統計出版社,20005.美 紐曼 .社

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論