全國大學(xué)生統(tǒng)計建模大賽論文_第1頁
全國大學(xué)生統(tǒng)計建模大賽論文_第2頁
全國大學(xué)生統(tǒng)計建模大賽論文_第3頁
全國大學(xué)生統(tǒng)計建模大賽論文_第4頁
全國大學(xué)生統(tǒng)計建模大賽論文_第5頁
已閱讀5頁,還剩40頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、南京市流動人口醫(yī)保問題統(tǒng)計研究 南京財經(jīng)大學(xué) 馬超、汪古月、陳萬琳目 錄摘要III一、緒論1(一)研究背景與問題的提出 1(二)問題研究綜述 1(三)建模思路與技術(shù)路線 2二、流動人口的人口學(xué)特征統(tǒng)計分析5(一)調(diào)研設(shè)計5(二)列聯(lián)表分析 5(三)對應(yīng)分析 8三、基于離散選擇模型的參保影響因素分析10(一)變量選取 10(二)基于因子分析思想解決多重共線性問題 10 1.多重共線性102.因子分析的思想113.具體構(gòu)造新因子過程12(三)基于二元離散選擇模型的實證研究 141.處理后的變量說明 14 2.logistic模型介紹153.實證分析174.模型預(yù)測功能20(四)基于多元離散選擇模型

2、的實證研究211.multinomial logistic模型介紹21 2.實證分析22四、基于結(jié)構(gòu)方程模型的滿意度分析25(一)結(jié)構(gòu)方程模型說明 25 1.模型簡介及概念說明252.結(jié)構(gòu)方程一般模型25(二)變量說明 26(三)實證分析 27 1.模型的評價272.模型輸出結(jié)果28五、主要結(jié)論及相應(yīng)政策建議30六、本文的創(chuàng)新與不足33參考文獻34附錄38摘 要上世紀(jì)90年代以來,隨著城鄉(xiāng)改革和對外開放的擴大,我國出現(xiàn)了人類歷史上最為壯觀的人口流動大潮。然而,在大規(guī)模農(nóng)村勞動力進入城市,為城市繁榮做出巨大貢獻的同時,他們在社會保障方面卻沒有得到應(yīng)有的待遇。本文通過對南京市流動人口的醫(yī)保狀況進行

3、調(diào)研,對流動人口參保的影響因素以及醫(yī)保滿意程度進行分析建模,以期給政府部門提供一些可靠的建議供參考決策,從而能建立一種具有一定針對性的讓流動人口普遍滿意的醫(yī)療保障制度,并能吸引流動人口積極參加到務(wù)工地的醫(yī)療保障中。首先從描述統(tǒng)計的角度進行分析,并將流動人口的參保選種和相應(yīng)的人口學(xué)特征變量,以列聯(lián)表的形式描繪出來,通過2檢驗,初步判斷是否參保與哪些變量有關(guān)。在此基礎(chǔ)上進行對應(yīng)分析,通過對應(yīng)分析圖直觀的反應(yīng)出參保選種與各變量間的關(guān)聯(lián)。其次,在描述統(tǒng)計的基礎(chǔ)上,使用離散選擇模型從定量的角度上進行實證分析,并得出結(jié)論:報銷比率的提高會促進流動人口的參保;從事職業(yè)與具體參加哪種保險并無顯著關(guān)系,但與是否

4、參加保險有關(guān);收入增加、受教育年數(shù)增加與具體參加哪種保險并無顯著關(guān)系,但對是否參保有積極的作用;戶籍對是否參保無顯著關(guān)系,但持非農(nóng)戶口的更有可能參加城鎮(zhèn)職工醫(yī)保。最后,通過建立結(jié)構(gòu)方程模型對流動人口的醫(yī)療狀況滿意度進行分析,得出結(jié)論:就醫(yī)服務(wù)質(zhì)量感知和醫(yī)保服務(wù)質(zhì)量感知影響了流動人口的滿意度;當(dāng)流動人口醫(yī)療滿意度提高,未來參保意愿就會提高,這個關(guān)系十分顯著;另外,政策認(rèn)知能顯著影響就醫(yī)和醫(yī)保服務(wù)質(zhì)量感知。本文建模的創(chuàng)新之處在于通過因子分析的思想尋找工具變量,以解決離散選擇模型中的多重共線性問題;另外,將那些在戶籍地參加了新農(nóng)合,但在務(wù)工地?zé)o法享受到相應(yīng)福利的那部分流動人口界定為無醫(yī)保者,這也是本

5、文的一大創(chuàng)新。關(guān)鍵詞:流動人口;醫(yī)療保障;logistic模型;結(jié)構(gòu)方程模型42 / 45文檔可自由編輯打印一、 緒論(一)研究背景與問題的提出上世紀(jì)90年代以來,隨著城鄉(xiāng)改革和對外開放的擴大,我國出現(xiàn)了人類歷史上最為壯觀的人口流動大潮。數(shù)量龐大的流動人口,其主體是從農(nóng)村轉(zhuǎn)移到城市的務(wù)工人員,即通常所說的農(nóng)民工。南京市作為江蘇省省會,有著較為發(fā)達的政治經(jīng)濟文化,是一個重要的流動人口流入地。然而流動人口在為市場經(jīng)濟的發(fā)展和城市的繁榮做出巨大貢獻的同時,他們在社會保障方面卻沒有得到應(yīng)有的待遇。主要表現(xiàn)在:(1)原則上規(guī)定用人單位必須給職工參加城鎮(zhèn)職工醫(yī)療保險(以下簡稱職工醫(yī)保),但由于農(nóng)民工文化程

6、度有限,一般都在小型不正規(guī)企業(yè),真正能參加職工醫(yī)保的人數(shù)很少。(2)城鎮(zhèn)居民基本醫(yī)療保險(以下簡稱居民醫(yī)保)明確規(guī)定了覆蓋人群為城鎮(zhèn)中那些不屬于城鎮(zhèn)職工基本醫(yī)療保險制度覆蓋范圍的學(xué)生、兒童以及其他非從業(yè)城鎮(zhèn)居民。即對于沒有南京戶口的流動人口,即使是那些沒有經(jīng)濟來源的婦女、兒童,也不太可能參加居民醫(yī)保事實上,在調(diào)研的150名流動人口中,確實無人參加居民醫(yī)保。因此在后文的分析中,不再單列一欄“城鎮(zhèn)居民醫(yī)?!?。(3)所以大部分流動人口只能參加新型農(nóng)村合作醫(yī)療(以下簡稱新農(nóng)合)。但新農(nóng)合除了保障水平低外,還存在著一個問題:流動人口在戶籍地參加了新農(nóng)合,然而對于長期在南京打工的流動人口來說,每次生病都返

7、鄉(xiāng)看病不太現(xiàn)實,在定點醫(yī)院看病再回鄉(xiāng)報銷的手續(xù)十分繁瑣。也就是說,一部分在戶籍地參加了新農(nóng)合的流動人口,來了南京后無法享受到應(yīng)有福利。對于這樣一部分人,本文將其視為無醫(yī)保者,這也是本次建模的一個創(chuàng)新之處,后文中提到的無醫(yī)保者均是這個概念。因此,建立健全有關(guān)流動人口的醫(yī)療保障制度,不僅對于解決該人群在城市務(wù)工期間的醫(yī)療保障問題具有重要的作用,而且對我國產(chǎn)業(yè)結(jié)構(gòu)的調(diào)整和市場經(jīng)濟的發(fā)展,乃至構(gòu)建和諧社會都具有極其重要的現(xiàn)實意義。(二)問題研究綜述國內(nèi)對這方面的研究較晚,大多是以定性分析為主,定量分析的較少。這些文獻大多集中在最近10年,也反映出我國逐漸開始重視到流動人口這個特殊群體的醫(yī)療保障問題。首

8、先,從對流動人口醫(yī)療保障制度及政策方面的分析來看,主要有以下一些觀點。王向(2003),佟艷超、劉芮(2010)對流動人口社會保障政策方面的分析后,提出了一個觀點,就是通過改革戶籍制度,最終把農(nóng)民工納入城市,一方面可以提高城市化率,另一方面可以更有效的解決流動人口的醫(yī)療保障問題。蔡建民(2006)提出要建立以農(nóng)民工為主體的流動人口社會保障體系框架,需要建立并完善包括現(xiàn)行社?;鸸芾頇C構(gòu)服務(wù)方式在內(nèi)的各項配套服務(wù)。陳海波、肖樣敏(2008)通過對衡陽市流動人口的調(diào)研,得出了類似的結(jié)論,建議構(gòu)建“協(xié)同互補型”的流動人口醫(yī)療保障體系。賈勇、王瓊(2009)主張通過加大對政策的宣傳力度,以此提高流動人

9、口醫(yī)療保險的參保率;重視不同人群的不同健康問題這一點很重要,并有針對性的采取醫(yī)療保障措施。常傳頌(2010)對浙江省農(nóng)民工醫(yī)療保障的現(xiàn)在調(diào)查后,主要站在法治的角度上,提出:國家必須制定一部相關(guān)法律;強化用工單位的法律責(zé)任;加強對農(nóng)民工醫(yī)療保障的監(jiān)管。其次,從流動人口醫(yī)療保障狀況及影響因素的實證分析方面,主要有以下一些觀點。彭績、程錦泉(2005)通過對深圳市流動人口進行分層隨機抽樣調(diào)查,采用定性研究與定量研究相結(jié)合的方法,結(jié)果表明,流動人口在社區(qū)衛(wèi)生服務(wù)提供與利用中均處于弱勢地位,即衛(wèi)生需求高,但利用率很低。王蘭芳、陳萬明、崔曉寧(2006)通過“適度性”測評,發(fā)現(xiàn)當(dāng)前江蘇省新農(nóng)合保障水平低于

10、適度性的下限,呈現(xiàn)低態(tài),必須從合作醫(yī)療的基金供給和基金支出2個方面采取適度性調(diào)控,以達到平衡策略。朱考金、狄金華(2008)通過對南京市的進城農(nóng)民工調(diào)研,發(fā)現(xiàn)農(nóng)民工居住狀況差,基本消費占了整個消費支出的很大比重,相比較而言,醫(yī)療支出的比重很小,與農(nóng)村居民相比,進城農(nóng)民工的身體健康情況略好,而在醫(yī)保處理這方面,農(nóng)民工比較消極,通常選擇成本低的方式。黃乾(2009)利用城市農(nóng)民工調(diào)研數(shù)據(jù),通過probit模型進行實證分析,研究農(nóng)民工參加醫(yī)保及模式選擇的影響因素,得出結(jié)論是提高農(nóng)民工的人力資本和收入水平,是增加農(nóng)民工醫(yī)療保障需求和提高醫(yī)療保障參保率的最重要途徑。劉宏、王俊(2010)利用CHNS(中

11、國健康與營養(yǎng)調(diào)查)數(shù)據(jù),從居民對醫(yī)療保障信息認(rèn)知情況進行分析,得出對醫(yī)療保障信息認(rèn)知如何顯著影響其衛(wèi)生醫(yī)療需求的結(jié)論。研究發(fā)現(xiàn),對醫(yī)療保障信息缺乏認(rèn)知的城鄉(xiāng)居民,在衛(wèi)生醫(yī)療需求方面不足,從而使醫(yī)療改革的效果大打折扣,體現(xiàn)出公共政策的重要性。(三)建模思路與技術(shù)路線本文建模目的是通過對南京市流動人口的醫(yī)保狀況調(diào)研分析,以期給政府部門提供一些可靠的建議供參考決策,從而能建立一種具有一定針對性的能讓流動人口普遍滿意的醫(yī)療保障制度,并引導(dǎo)流動人口積極參加醫(yī)保。圍繞著這個目標(biāo),筆者倒著逆推出本文的脈絡(luò),并以此為建模的路線。怎樣的醫(yī)保才是讓人滿意的,并能引導(dǎo)人參與?參考文獻調(diào)研考察匯總數(shù)據(jù)統(tǒng)計建模建模目的

12、什么樣的流動人口對應(yīng)會選擇哪種醫(yī)保?圖1.1 逆推建模思路由本文的建模目的,既然要建立一種讓流動人口普遍滿意的醫(yī)療保障制度從而讓流動人口積極參保,所以必然要先解決這樣兩個問題:1. 什么樣的流動人口對應(yīng)會選擇哪種醫(yī)保?2. 怎樣的醫(yī)保才是讓流動人口普遍滿意的?或者說流動人口對于醫(yī)保的滿意程度取決于哪些因素?這樣逆推得到的寫作思路可以避免出現(xiàn)為了建模而建模、陷入“唯方法論”、計量模型脫離主題的問題。思路上的邏輯關(guān)系 方法上的邏輯關(guān)系流動人口醫(yī)療保障滿意度分析流動人口人口學(xué)特征描述統(tǒng)計流動人口醫(yī)療保障參保影響因素分析研究意義文獻綜述政策建議列聯(lián)分析2檢驗描述統(tǒng)計圖表對應(yīng)分析結(jié)構(gòu)方程滿意度分析離散選

13、擇模型二元多元基于因子分析構(gòu)造工具變量圖1.2 技術(shù)路線根據(jù)以上建模思路,可以得到本文建模的技術(shù)路線,如圖1.2。有2條主要的脈絡(luò),一條是思路上的邏輯關(guān)系(圖1.2左半邊),一條是方法上的邏輯關(guān)系,圖中細(xì)箭頭代表邏輯上的遞進關(guān)系。本文在借鑒國內(nèi)外相關(guān)理論研究成果的基礎(chǔ)上,通過設(shè)計調(diào)查問卷,對南京市流動人口進行抽樣調(diào)查。先采用列聯(lián)分析和對應(yīng)分析,用圖表的方式直觀的先驗反應(yīng)出流動人口醫(yī)保選種與人口學(xué)特征之間的聯(lián)系,在此基礎(chǔ)上采用離散選擇模型解決第一個問題,即“什么樣的流動人口對應(yīng)會選擇哪種醫(yī)?!保辉俨捎媒Y(jié)構(gòu)方程模型解決第二個問題,即“流動人口對于醫(yī)保的滿意程度取決于哪些因素”。綜合以上建模得出的結(jié)

14、論提出政策建議,為完善流動人口醫(yī)療制度提出有益的決策參考。二、流動人口的人口學(xué)特征統(tǒng)計分析(一)調(diào)研設(shè)計通過前期文獻研究和專家座談,本次調(diào)研地點選擇流動人口日流動量較大的人才交流市場,從走出勞務(wù)市場的人中每隔4人抽取一人進行調(diào)研,共與150名流動人口進行面對面訪談。調(diào)研問卷共分4個部分:1.流動人口的基本情況,這其中包括了流動人口的個人基本信息、職業(yè)信息以及家庭信息;2.流動人口的醫(yī)療保障情況,其中包括了被訪者個人的參保信息、被訪者子女和配偶的參保信息,被訪者的就醫(yī)信息;3.流動人口對于務(wù)工當(dāng)?shù)氐木歪t(yī)滿意度情況;4.流動人口的參保認(rèn)知情況及參保意愿。(二)列聯(lián)表分析使用馬克威5.0軟件對調(diào)研問

15、卷中的一些重要變量進行描述性統(tǒng)計分析,得出被訪者的戶人均收入、受教育年限以及去年醫(yī)療支出額的均值、中位數(shù)、極值、標(biāo)準(zhǔn)差、偏峰度等信息,從而對南京市流動人口這個群體在宏觀有一個大致把握。如表2.1:表2.1 重要變量的描述統(tǒng)計表均值中位數(shù)最大值最小值標(biāo)準(zhǔn)差偏度峰度受教育年數(shù)6.0561503.010.393.53戶人均收入17179.13145003900034008141.510.492.47去年醫(yī)療支出額1300.47121050000893.881.065.43從中可以初步得出以下一些結(jié)論:1.南京市流動人口的文化程度偏低,受教育年數(shù)的中位數(shù)和均值都在6左右,即小學(xué)畢業(yè),有一半人不超過小學(xué)

16、文化;2.南京市流動人口屬弱勢群體。因為據(jù)南京市統(tǒng)計局發(fā)布的數(shù)據(jù),2010年南京城市居民家庭人均收入為31314.26元,而被訪問的流動人口家庭人均收入為17179.13元,僅為南京市總體水平的55%。3. 三個變量的偏度均大于0,表明數(shù)據(jù)右偏,即表明數(shù)據(jù)左邊比較密集,右邊分散。尤其是醫(yī)療支出的偏度最大,表明流動人口的醫(yī)療支出還處于一個低水平,大多數(shù)人的醫(yī)療支出很少,都集中在左邊,也就是說多數(shù)人的醫(yī)療水平是小于平均值1300元的,只是少數(shù)人醫(yī)療支出水平高的人拉動了平均水平。三個變量的峰度均大于0,表明它比正態(tài)分布要陡峭,為尖峰分布,成尖峰厚尾的特征,尤其是醫(yī)療支出數(shù)據(jù),峰度最大,從一個側(cè)面反映

17、了懸殊比較大。以上從單個變量的角度初步進行分析,但在研究流動人口參保狀況的時候,通常不僅需要單獨考察某一方面的信息,而且還要將幾個方面的信息聯(lián)合起來一并考察,從而得到更客觀合理的結(jié)果,因此這里進一步做列聯(lián)分析。使用SAS9.0軟件對流動人口參保情況的列聯(lián)分析,結(jié)果如表2.2,我們可以得到一些基本的人口學(xué)信息:(1)總共150名受訪流動人口中,參與新農(nóng)合的有66人(44%),參與職工醫(yī)保的有36人(24%),無醫(yī)保的有48人(32%)。其中,男性占59%,女性占41%,性別對于參保情況有統(tǒng)計學(xué)意義(2=8.715,P值=0.013),從經(jīng)濟學(xué)角度來看,性別與醫(yī)保沒有直接聯(lián)系,但考慮到性別與工作、

18、收入、教育等相關(guān),從而間接的影響到了參保狀況。(2)年齡方面,18-35歲的青壯年占49%,35歲以上者占51%,與性別的解釋類似,年齡對于參保情況也具有統(tǒng)計學(xué)意義。(3)受教育年數(shù)方面,受教育年數(shù)在3年以下的占19%,4-6年的占47%,7-9年的占26%,10年以上的占8%,受教育年數(shù)方面對于參保情況具有統(tǒng)計學(xué)意義,直觀上看,受教育時間長的人比短的人更有可能選擇醫(yī)療保障。(4)被訪者中農(nóng)村戶口的占79%,非農(nóng)戶口占21%,戶口對于參保情況具有統(tǒng)計學(xué)意義,從表中可以看出,有非農(nóng)戶口的人選擇職工醫(yī)療保險的人的相對比重更高,而農(nóng)村戶口的流動人口多為新農(nóng)合。(5)收入方面,年家庭人均收入在1萬元以

19、下的占22%,1萬到2萬的占41%,2萬到3萬的占32%,3萬以上的占7%,收入對于參保情況具有很顯著的統(tǒng)計學(xué)意義,收入高的人享有醫(yī)療保障的人比例明顯大,收入3萬元以上的人均有醫(yī)療保險。(6)被訪者中有超過一半(58%)的人沒有享受到報銷,沒有享受到報銷的這87人當(dāng)中,有48人是沒有參保,當(dāng)然不會有報銷,另外39人參保了卻沒有享受過報銷;另外可以發(fā)現(xiàn),參加職工醫(yī)保的人明顯報銷比率要比參加新農(nóng)合的人高。(7)健康自評方面,由差到好的5個等級所占比重依次為1%,7%,25%,51%,5%。職業(yè)方面,服務(wù)業(yè)占36%,工業(yè)占51%,商業(yè)占13%。健康自評與職業(yè)對于參保情況不具有統(tǒng)計學(xué)意義(P值分別為0

20、.224,0.223),不過,由于2檢驗是一個總體檢驗,不排除可能有少數(shù)類別間的聯(lián)系被淹沒在絕大多數(shù)無關(guān)類別的情形出現(xiàn),因此通常2不以嚴(yán)格的統(tǒng)計學(xué)上的0.05為判斷準(zhǔn)則,具體界值 表2.2 參保情況列聯(lián)表新農(nóng)合職工醫(yī)保無醫(yī)保合計2值P值人數(shù)構(gòu)成比人數(shù)構(gòu)成比人數(shù)構(gòu)成比人數(shù)構(gòu)成比性別男3857.582877.782245.83880.598.7150.013女2842.42822.222654.17620.41年齡18-353146.972466.671939.58740.496.3000.04335以上3553.031233.332960.42760.51受教育0-3710.61411.1117

21、35.42280.1921.5400.0024-63553.031336.112347.92710.477-91928.791313.11714.58390.2610以上57.58616.6712.08120.08暫住證有4974.242569.443368.751070.710.4930.782無1725.761130.561531.25430.29戶口農(nóng)村6192.421952.783981.251190.7922.4900.000非農(nóng)57.581747.22918.75310.21健康差00.0000.0024.1720.0110.6230.224較差46.06411.1136.2511

22、0.07一般1624.24925.001327.08380.25好3959.091952.781939.58770.51很好710.61411.111122.92220.15婚姻未婚1522.731027.78918.75340.231.7390.784已婚4771.212466.673470.831050.70離婚46.0625.56510.42110.07職業(yè)服務(wù)業(yè)2436.36925.002143.75540.365.7020.223工業(yè)3553.031952.782347.92770.51商業(yè)710.61822.2248.33190.13收入(萬元)1以下812.1238.332245

23、.83330.2239.8750.0001-23146.97925.002143.75610.412-32131.822055.56510.42460.323以上69.09411.1100.00100.07報銷比率03045.45925.0048100.00870.5867.3100.0000-25%2436.36719.4400.00310.2125%-1218.182055.5600.00320.21660.44360.24480.32150為多少并無統(tǒng)一標(biāo)準(zhǔn),有學(xué)者認(rèn)為如果P值大于0.2,就沒有做對應(yīng)分析的必要張文彤,董偉.SPSS統(tǒng)計分析高級教程M.北京:高等教育出版社,2004:30

24、9。介于此,筆者在下面的對應(yīng)分析中就排除了這2個變量,不過由于謹(jǐn)慎性原則,在后面章節(jié)的回歸方程中,還是會考慮這2個變量。(8)被訪者中有暫住證的占71%,無暫住證的占29%;未婚的占23%,已婚的占70%,離婚的占7%。這2個變量的P值過大(分別為0.782和0.784),故可認(rèn)為這2個變量對參保情況不具有統(tǒng)計學(xué)意義,可以不再做進一步分析。(三)對應(yīng)分析上一節(jié)使用了列聯(lián)表2檢驗的方法對數(shù)據(jù)進行了一個先驗的分析,得到了參保狀況和人口學(xué)特征等分類變量兩兩之間的聯(lián)系。但現(xiàn)在更進一步分析多個分類變量之間關(guān)系時,2檢驗顯得不夠,可以通過對應(yīng)分析的方法,將上一節(jié)的列聯(lián)表轉(zhuǎn)換成一張散點圖,從而將列聯(lián)表中包含

25、的類別關(guān)系信息用各散點空間位置關(guān)系的形式直觀的表現(xiàn)出來。圖2.1 對應(yīng)分析圖基于上一節(jié)列聯(lián)表2檢驗的研究,選定參保情況、受教育年數(shù)、家庭人均收入、年齡、性別、戶口、報銷比率作為變量進行對應(yīng)分析,而婚姻狀況、職業(yè)狀況、自評健康狀況、是否有暫住證由于2檢驗的P值過大,而不被選入進行對應(yīng)分析。對應(yīng)分析圖如圖2.1。圖2.2 判別度量由圖2.2判別度量可以看出,變量間都呈銳角,表明對應(yīng)分析效果不錯。從圖2.1對應(yīng)分析圖可以得出以下一些結(jié)論:(1)職工醫(yī)保、非農(nóng)戶口、較高報銷、10年以上教育、家庭人均收入3萬元以上之間有聯(lián)系。這類流動人口通常具有較高的素質(zhì)與穩(wěn)定的收入,雖然是流動人口,但是非農(nóng)戶口,這類

26、人一般有比較不錯的工作,公司會給予員工參加職工醫(yī)保,并有較高(超過25%)的報銷比率。(2)0-3年文化、家庭人均收入1萬元以下、無醫(yī)保之間有聯(lián)系,這類人文化程度很低,小學(xué)沒畢業(yè)或文盲半文盲,相應(yīng)的收入水平也低,他們進城后多半成為苦力,這就是城市中的弱勢群體。由于貧困不愿意主動花錢參加醫(yī)保,或者是無信息來源,不知道如何參保,或者是在戶籍地參加了新農(nóng)合,但所參合的新農(nóng)合在務(wù)工地(南京)不起作用,本人也不愿意在務(wù)工地參保。這樣的人群缺少起碼的醫(yī)療保障,并且他們多半從事苦力,易患疾病,所以這樣的人群應(yīng)該是政府部門重點關(guān)注對象。(3)低報銷和新農(nóng)合之間有聯(lián)系。由數(shù)據(jù)分析,可以得到這樣的結(jié)論,新農(nóng)合在報

27、銷比率上不如職工醫(yī)保。筆者認(rèn)為這主要有2個原因,一是我國的城鄉(xiāng)差距較大,農(nóng)村的醫(yī)療保健水平本身不如城市;二是流動人口在戶籍地參加了新農(nóng)合,現(xiàn)在到了務(wù)工地(南京),存在一個異地就醫(yī)的問題,即便戶籍地的新農(nóng)合能報銷,但手續(xù)煩雜,影響了報銷比率。 三、基于離散選擇模型的參保影響因素分析 在上一章的多重對應(yīng)分析中,我們將繁雜的數(shù)據(jù)以類別聯(lián)系的方式直觀的表現(xiàn)在了二維圖形中,一目了然的得出了很多有用的結(jié)論。但是對應(yīng)分析這種方法只能從直觀的角度定性分析問題,不能用于相關(guān)關(guān)系的假設(shè)檢驗,無法得到確切的統(tǒng)計結(jié)論,也無法從定量的角度更深層次的分析流動人口的參保情況。因此本章將在上一章研究的基礎(chǔ)上,采用離散選擇模型

28、,以定量分析的形式研究流動人口參保的影響因素,明確解決“什么樣的流動人口對應(yīng)會具體選擇哪種醫(yī)?!边@個問題,使結(jié)論更加細(xì)致客觀。(一)變量選取按照上章對應(yīng)分析及列聯(lián)表2檢驗,由于謹(jǐn)慎性原則,建模之初,本文將健康自評與職業(yè)(2檢驗P值分別為0.224,0.223)也納入到自變量當(dāng)中,而是否有暫住證和婚姻情況(2檢驗P值分別為0.782和0.784)則被排除在外。因此本文以流動人口是否參保作為被解釋變量,以被訪者年齡、受教育年數(shù)、自評健康狀況、家庭人口、家庭人均收入、報銷比率、性別、戶口、職業(yè)為解釋變量,具體如表3.1:表3.1 變量選取及說明變量變量說明因變量Y 參保情況0=無醫(yī)保1=參保 自變量

29、X1 年齡取絕對數(shù)X2 受教育年數(shù)取絕對數(shù)X3 自評健康狀況1=很差 2=較差 3=一般 4=較好 5=很好X4家庭人口取絕對數(shù)X5家庭人均收入取絕對數(shù)X6報銷比率取絕對數(shù)X7性別1=男 2=女X8戶口1=農(nóng)村戶口 2=非農(nóng)戶口X9職業(yè)1=服務(wù)業(yè) 2=工業(yè) 3=商業(yè)(二)基于因子分析思想解決多重共線性問題1.多重共線性由常識知,流動人口的年齡與受教育年數(shù)會有反向關(guān)系,即一般年齡大的人文化水平低;流動人口的家庭人均收入會與受教育年數(shù)有正向關(guān)系,即一般文化水平高的人收入相應(yīng)會高。經(jīng)檢驗,流動人口的年齡與受教育年數(shù)的偏相關(guān)系數(shù)為-0.44,流動人口的家庭人均收入與受教育年數(shù)的偏相關(guān)系數(shù)為0.538,

30、這2個數(shù)值都很高。至于收入與年齡之間的偏相關(guān)系數(shù)比較低(為0.241),很可能是因為文化對收入的正效應(yīng),與文化對年齡的負(fù)效應(yīng)正負(fù)相抵了。確定是否存在多重共線性可以通過輔助回歸的方法,輔助回歸結(jié)果如表3.2:表3.2 輔助回歸結(jié)果因變量自變量T統(tǒng)計量P值年齡受教育年數(shù)-5.870.00家庭人均收入受教育年數(shù)6.000.00由輔助回歸結(jié)果知,年齡、家庭人均收入分別與受教育年數(shù)回歸,都有很好的解釋作用,所以可以認(rèn)為他們之間存在顯著的共線性關(guān)系孫敬水.中級計量經(jīng)濟學(xué)M. 上海:上海財經(jīng)大學(xué)出版社,2009:126-133。模型存在多重共線性的時候會影響到方程的效果。從邏輯上講,本身就不應(yīng)該將冗余變量納

31、入模型進行分析;更重要的是,與多元回歸模型一樣,logistic回歸也對多重共線性比較敏感,當(dāng)存在多重共線性的時候,系數(shù)標(biāo)準(zhǔn)誤的估計將產(chǎn)生偏差(Berry & Feldman,1985),當(dāng)共線性嚴(yán)重時甚至?xí)?dǎo)致系數(shù)估計符號的變化(Hanushek & Jackson,1977)。這是建模中一個個比較嚴(yán)重而又經(jīng)常被學(xué)者們忽略的問題。模型中其他解釋變量之間也存在著一定的共線性,但相關(guān)系數(shù)都在0.4以下,這時多重共線性帶來的問題不嚴(yán)重,可以忽略王濟川,郭志剛.Logistic回歸模型方法與應(yīng)用M.北京:高等教育出版社,2001:190-191。2.因子分析的思想(1)學(xué)者孫敬水(2

32、008)建議將那些存在多重共線性的變量,通過主成份分析的方法,將存在相關(guān)性的變量組合成新的主成份,用較少的新指標(biāo)代替原來較多的舊變量,而這些較少的新指標(biāo)之間是不存在相關(guān)性的。所以再對新指標(biāo)建立回歸方程時,實際上就避免了多重共線性的問題。本文結(jié)合理論知識后,決定探索性的采用因子分析的思想來解決多重共線性問題。因為因子分析在某種程度上可以看成是主成份分析的推廣與擴展,它對問題的研究更加深入,與主成份分析類似,因子分析實質(zhì)上也是個“降維”的過程,同樣不受量綱的影響,將多個相關(guān)的變量用少量不相關(guān)的因子來代替。而比起主成份分析,因子分析有它特有的優(yōu)勢,可以通過因子軸的旋轉(zhuǎn),可以使得到新的因子載荷意義更加

33、明顯。(2)因子分析的基本思想是:設(shè)有N個樣本,P個指標(biāo),X=(X1,X2,,XP)T為隨機向量,要尋找的公因子為F=(F1,F(xiàn)2,,F(xiàn)m)T,則模型x1 = a11F1 + a12F2 + + a1mFm + 1x2 = a21F1 + a22F2 + + a2mFm + 2xp = ap1F1 + ap2F2 + + apmFm + p (3.1)就稱為因子模型,寫成矩陣形式為:X = AF + a (3.2)其中A=(aij)為因子載荷矩陣,aij為因子載荷,其實質(zhì)是公因子Fi和變量Xj的相關(guān)系數(shù)為特殊因子,代表公因子以外的影響因素,在實際分析時忽略不計。對求得的公因子,需要觀察它們在哪

34、些指標(biāo)上有較大的載荷,再據(jù)此說明該公因子的實際含義。通常會進一步作因子旋轉(zhuǎn),以求旋轉(zhuǎn)后能得到更加合理的解釋。(3)在建完因子分析模型后,可以通過回歸估計的方法寫出如下的因子表達式:Fi = bi1X1 + bi2X2 + + binXn (i=1,2,m) (3.3)通過上面4.3因子表達式,計算出F的因子得分(變量標(biāo)準(zhǔn)化后),后面建立回歸方程模型的時候用F的因子得分?jǐn)?shù)值代替原來的變量X數(shù)值,在解釋方程的時候再將F還原成X。這樣就基本解決了多重共線性問題。3.具體構(gòu)造新因子過程(1)提取公因子:對上文提到的變量中具有多重共線性的3個變量,即被訪者年齡,受教育年數(shù),家庭人均收入用SPSS16.0

35、進性分析。由表3.3Bartlett球形檢驗知,Sig值為0,表明各變量間確實具有較大相關(guān)性,可以提取公因子。表3.3 Bartlett球形檢驗卡方值66.544自由度3Sig值0.000表3.4 方差貢獻率因子個數(shù)單位根方差貢獻率累計方差貢獻率11.65355.11455.11420.93531.16886.28230.41213.718100.00由表3.4 可以看出,當(dāng)選取2個因子的時候,累計方差貢獻率達到了86.282%,說明選取2個因子基本能很好的解釋原來3個變量了。這里實際上是將3維降到了2維,用2個新的沒有相關(guān)性的變量代替原來3個變量。采用方差最大旋轉(zhuǎn)的方法后,結(jié)合因子載荷矩陣和

36、公式3.1,我們可以寫出該實際問題的因子模型,如下:Z年齡注:Z表示標(biāo)準(zhǔn)化,下同。 = 0.012F1 + 0.951F2Z受教育年數(shù) = 0.636F1 0.616F2 (3.4)Z家庭人均收入 = 0.949F1 + 0.022F2 通過觀察公式3.4中的因子載荷,可以發(fā)現(xiàn)公因子F1在受教育年數(shù)和家庭人均收入上的載荷比較高,受教育年數(shù)越長、家庭人均收入越高,F(xiàn)1的值越大,。公因子F2在受教育年數(shù)和年齡上的載荷比較高,受教育年數(shù)越短、年齡越大,F(xiàn)2的值越大。(2)選取工具變量:因子分析提取公因子的目的是找到新的2個指標(biāo)代替原來的3個,作為工具變量放入后面的模型中,從而沒有多重共線性。這里通過

37、回歸估計的方法并結(jié)合公式3.3,寫出上述2個公因子的因子表達式,如下: F1 = 0.231*Z年齡 + 0.385*Z受教育年數(shù) + 0.793*Z家庭人均收入 F2 = 0.805*Z年齡 - 0.372*Z受教育年數(shù) + 0.239*Z家庭人均收入 (3.5)將年齡、受教育年數(shù)和家庭人均收入的標(biāo)準(zhǔn)化數(shù)值,帶入公式3.5,就可以算出2個公因子對應(yīng)于每個樣本的具體數(shù)值,也就是因子得分。(3)檢驗多重共線性:這里對計算出的2列因子得分再進行一次簡單相關(guān)分析,檢驗結(jié)果如表3.5;同時再進行一次輔助回歸,結(jié)果如表3.6:可以看出,F(xiàn)1與F2之間已經(jīng)基本完全沒有相關(guān)性了;另外,F(xiàn)1、F2與其余變量之

38、間的相關(guān)性也很?。ㄋ韵嚓P(guān)系數(shù)均不超過0.35)。下面在建回歸方程的時候,就直接將公式3.5算出的因子得分?jǐn)?shù)值帶入,以代替此前的3個變量的具體數(shù)值。這樣就解決了此前的多重共線性問題。表3.5 Pearson相關(guān)系數(shù)表F1F2F1Pearson相關(guān)系數(shù)Sig值10.0001.000F2Pearson相關(guān)系數(shù)Sig值0.0001.0001表3.6 輔助回歸結(jié)果因變量自變量T統(tǒng)計量P值R2F1F2-1.83E-081.000(三)基于二元離散選擇模型的實證研究1.處理后的變量說明本文以流動人口是否參保作為被解釋變量,以被訪者年齡、受教育年數(shù)、家庭人均收入、自評健康狀況、家庭人口、報銷比率、性別、戶口

39、、職業(yè)為解釋變量。根據(jù)前文基于因子分析思想,提取了2個新的公因子F1和F2代替此前被訪者年齡、受教育年數(shù)、家庭人均收入這3個變量,處理后的變量如表3.7:表3.7 處理后的變量說明變量變量說明因變量Y 參保情況0=無醫(yī)保1=參保 自變量X1 自評健康狀況1=差 2=較差 3=一般 4=較好 5=很好X2家庭人口取絕對數(shù)X3報銷比率取絕對數(shù)X4性別1=男 2=女X5戶口1=農(nóng)村戶口 2=非農(nóng)戶口X6職業(yè)1=服務(wù)業(yè) 2=工業(yè) 3=商業(yè)X7 F1取值為公式4.5結(jié)果X8 F2取值為公式4.5結(jié)果在做離散選擇模型的時候,取決對數(shù)的連續(xù)型變量直接納入計算即可;而性別和戶口雖然是離散變量,但是只有2個取值

40、,像這樣的二分類也可以直接納入方程,也可以對系數(shù)得到很好的解釋;自評健康狀況這樣的有序自變量,學(xué)者葉勇(2001)從專業(yè)角度出發(fā)認(rèn)為可以將該變量作為連續(xù)型變量進行分析;而職業(yè)這樣的無序分類變量,1、2、3僅僅是一個代碼,不代表水平高低,并且3者之間差別并不能強行規(guī)定為“等距”,所以不能直接帶入方程,需要設(shè)定虛擬變量,設(shè)置如下:職業(yè)D1 = 1 工業(yè);0 其他職業(yè)D2 = 1 商業(yè);0 其他2.Logistic模型介紹(1)線性概率模型:這里由于被解釋變量為流動人口是否參保,是0-1變量,而不是連續(xù)型數(shù)值變量,如果直接用普通最小二乘法進行估計的話,即建立線性概率模型,會造成以下幾個問題:由于在線

41、性概率模型中殘差的非齊性,參數(shù)估計的估計方差將是有偏的,因此任何假設(shè)檢驗如t檢驗和F檢驗都是無效的; 由線性概率模型估計的事件概率值在遇到很大或很小的x時,可能會超出0,1區(qū)間,這是不合常理的,無法解釋的;最嚴(yán)重的問題在于它的函數(shù)形式,因為線性概率模型是線性的,即無論x取什么樣的值,回歸估計系數(shù)、都是常數(shù),而在最小二乘法估計的線性概率模型中,截距和斜率對于所有的x值并不是常數(shù)。(2)引入Logistic分布:由于上面提到的線性概率模型存在一些致命的缺陷,所以當(dāng)因變量是離散變量的時候,不能直接用最小二乘估計建立線性方程。需要使用非線性函數(shù),最好事件發(fā)生的概率P隨著x的增加也單調(diào)增加,隨著x的建設(shè)

42、單調(diào)減少,即一種值域在(0,1)區(qū)間內(nèi)并且有著S型的曲線。最常用的最流行的一種分布就是Logistic分布,如圖3.1。其累計分布函數(shù)為一個比較簡單的形式:P(yi = 1|xi)= Pi <= (+xi) = 1/(1+exp(-i) (3.6)Logistic函數(shù)很好的滿足了上述要求,首先值域在0-1范圍內(nèi),并且曲線呈S型,表明 被定義為一系列影響事件發(fā)生概率的因素的組合,即=+x。的作用對于發(fā)生某個事件的可能性是變化的,在中間的時候敏感變化大,兩頭變化小。這很符合常理,比如收入越高越傾向于參加醫(yī)保,收入水平在中間某個階段內(nèi)變化對參加醫(yī)保概率的影響較大,而收入太低或太高時則不那么敏感

43、(特別窮困的人收入增加一點也不會立刻去參加醫(yī)保,收入很多的人本身有完善醫(yī)保的可能性就很大,收入再增加一點改變的激勵不大)。 圖3.1 logistic函數(shù)的曲線圖(3)從Logistic函數(shù)到Logistic回歸模型:把上面公式3.6重新?lián)Q個形式寫成:P(yi = 1|xi)= (3.7)將事件發(fā)生的條件概率寫為P(yi = 1|xi)= pi,就可以得到下面的Logistic回歸模型:pi = = (3.8) 其中,pi為第i個樣本發(fā)生事件的概率,這是一個由解釋變量x構(gòu)成的非線性函數(shù)??梢酝ㄟ^數(shù)學(xué)上的一些技巧使之線性化,便于估計。(4)logit變換:這一步是將非線性的函數(shù)形式轉(zhuǎn)變?yōu)榫€性。首

44、先由3.8式很容易算出不發(fā)生事件的條件概率,如下:1-pi = 1- = (3.9)那么,事件發(fā)生概率與不發(fā)生概率之比為 = (3.10) 這個比值被稱為發(fā)生比(the odds of experiencing an event),簡稱odds,該值為正值(也有翻譯為優(yōu)勢比)。將發(fā)生比取對數(shù)就能得到一個線性函數(shù)了,如下:ln() = (3.11)上述過程就是logit變換,這個形式稱為logit形式,又叫y的logit,即logit(y)= ln()=ln odds。變換之后,logit(y)對其參數(shù)就是線性的了。同理,當(dāng)自變量由1個變成k個的時候,公式3.8擴展為: = (3.12)對應(yīng)的l

45、ogistic回歸模型就是以下的形式:ln = (3.13)其中,= P(yi=1|x1i,x2i,xki)為給定自變量x1i,x2i,xki 的值的條件下事件發(fā)生的概率。logistic回歸模型就是調(diào)查出x1i,x2i,xki 構(gòu)成樣本的值,并同時觀察在這些情況下事件發(fā)生與否,擁有這些信息后通過極大似然估計法估計出模型各參數(shù)值,研究者就能運用這些信息來分析和表達在特定情況下事件發(fā)生與否的發(fā)生比以及發(fā)生的概率,然后結(jié)合實際經(jīng)濟學(xué)理論進性解釋推斷。3.實證分析按照表3.7中的變量選取,使用SPSS16.0對數(shù)據(jù)進行分析,結(jié)果如表3.8:由表3.8模型1可知,方程總體通過了顯著性檢驗,但除了報銷比

46、率、關(guān)于職業(yè)的虛擬變量、公因子F1通過了顯著性檢驗外,其余變量沒能通過顯著性檢驗。由此,本文將那些不顯著的變量按照sig值由大到小,逐個剔除,直到所有變量均通過了顯著性檢驗,由此得到了模型2,如上表3.8右側(cè)部分。根據(jù)虛擬變量的同進同出原則,雖然職業(yè)D1虛擬變量沒能通過顯著性檢驗,但由于虛擬變量整體通過了顯著性檢驗,虛擬變量D2也通過了顯著性檢驗,因此這里將D1也放在方程中不做剔除。表3.8 流動人口是否參保影響因素分析模型1模型2 (剔除模型1不顯著變量)估計系數(shù)(WALD值)Exp()值Exp()95%置信區(qū)間估計系數(shù)(WALD值)Exp()值Exp()95%置信區(qū)間健康自評0.354(1

47、.396)家庭人口-0.128(0.170)報銷比率0.128(15.097)*1.1361.0651.2120.127(15.708)*1.1361.0661.209性別0.428(0.766)戶口-0.116(0.032)職業(yè)(5.445)*(7.214)*職業(yè)D10.867(1.276)2.3800.52910.7100.595(1.385)1.8130.6734.885職業(yè)D2-1.735(3.157)*0.0760.0261.196-1.933(4.147)*0.1450.0230.930F11.516(18.535)*4.5532.2839.0771.405(19.317)*4.0

48、752.1787.624F2-0.244(0.847)常數(shù)項-1.444(0.396)0.556(0.582)Omnibus檢驗2=81.909 sig=0.0002=79.026 sig=0.000HL檢驗2=11.783 sig=0.1612=11.585 sig=0.171偽決定系數(shù)Cox & Snell=0.421 Nagelkerke=0.589Cox & Snell=0.410 Nagelkerke=0.573-2對數(shù)似然106.152109.035預(yù)測正確率83.382.0注:*、*、*分別為在1%、5%、10%顯著性水平下顯著;帶 標(biāo)記的一行是對虛擬變量整體進行

49、檢驗。比較模型1和模型2,綜合各種指標(biāo)來看,2個模型并無明顯優(yōu)劣之分,只是模型1的擬合優(yōu)度及預(yù)測準(zhǔn)確性上略微好一點點??紤]到模型2中那些顯著的變量,wald值均有不同程度的提高,即變量更加顯著;另外參數(shù)估計的95%置信區(qū)間更小,精度更好;并且模型2的變量少,使logistic方程表達式更加簡潔,便于解釋。 綜上所述,本文更傾向于建立模型2那樣的方程,如下:logit(y)= ln()=ln odds=0.556 + 0.127*報銷比率 + 0.595*職業(yè)D1 1.933*職業(yè)D2 + 1.405*F1 (3.14)根據(jù)公式3.5因子表達式可知,公因子F1 = 0.231*Z年齡 + 0.3

50、85*Z受教育年數(shù) + 0.793*Z家庭人均收入,把它帶回到公式3.14中,如下:logit(y)= ln()=ln odds=0.556 + 0.127*報銷比率 + 0.595*職業(yè)D1 1.933*職業(yè)D2 + 0.325*Z年齡 + 0.541*Z受教育年數(shù) + 1.114Z家庭人均收入 (3.15)為了書寫簡便,按照表3.1的變量說明,用字母來代替公式中的中文,如下:logit(y)= ln()=ln odds=0.556 + 0.127*X6 + 0.595* D1 1.933* D2 + 0.325*ZX1 + 0.541*ZX2 + 1.114ZX5(3.16) 由于這里的Z

51、X1 、ZX2、 ZX5都是標(biāo)準(zhǔn)化處理過后的數(shù)據(jù),為了方便直觀意義上的解釋,這里在形式上把它還原成原始數(shù)值,還原方法:將標(biāo)準(zhǔn)化數(shù)值寫出(原始數(shù)值-均值)/標(biāo)準(zhǔn)差的形式。這樣公式3.15就可以寫成:logit(y)= ln()=ln odds=-4.197 + 0.127*X6 + 0.595* D1 1.933* D2 + 0.037*X1 + 0.180*X2 + 0.00137*X5 (3.16)公式3.16就是完整的流動人口參合醫(yī)保影響因素的logistic方程。其中X6 表示報銷比率,D1代表工業(yè)的虛擬變量,D2代表商業(yè)的虛擬變量,X1代表年齡,X2代表受教育年數(shù),X5代表家庭人均收入。從上面的模型中,我們可以得出以下一些結(jié)論:(1)報銷比率的提高會促進流動人口的參保。當(dāng)報銷比率提高1個百分點的時候,參保人數(shù)與不參保人數(shù)之比,這個比值(發(fā)生比)是沒提高報銷率之前的1.136倍(exp(0.127)=1.136,下同)。有的時候我們不單單考慮只提高1個百分點的情況,如果報銷比率提高10個百分點,發(fā)生比就是之前的3.561倍(exp(10*0.127)=3.561,下同,可依此類推)。(2)和從事服務(wù)業(yè)的流動人口相比,從事工業(yè)的參保人數(shù)與

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論