相關(guān)與回歸的陷阱課件_第1頁
相關(guān)與回歸的陷阱課件_第2頁
相關(guān)與回歸的陷阱課件_第3頁
相關(guān)與回歸的陷阱課件_第4頁
相關(guān)與回歸的陷阱課件_第5頁
已閱讀5頁,還剩9頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

相關(guān)與回歸的陷阱

(一)離群點(diǎn)與強(qiáng)影響點(diǎn)

(二)觀測值范圍(一)圖的解釋

患者OAP和糧食中DON含量的散點(diǎn)圖

例2續(xù)已知例2數(shù)據(jù)中38個(gè)對象骨關(guān)節(jié)炎得分OAP(y)和糧食中DON含量(x)的均數(shù)和標(biāo)準(zhǔn)差及兩變量之間的相關(guān)系數(shù),通過最小二乘法得到的回歸直線的斜率為(一)回歸直線的擬合截距最后得到回歸直線的方程為有些時(shí)候通過散點(diǎn)圖,我們發(fā)現(xiàn)兩變量間存在某種趨勢,但是這種趨勢不是線性的。這時(shí)可以采用數(shù)據(jù)轉(zhuǎn)換將非線性數(shù)據(jù)轉(zhuǎn)換后得到線性關(guān)聯(lián)。

(三)非線性關(guān)聯(lián)例3某環(huán)境檢測部門測得某地距污染源的距離和中心線上大氣中氰化物平均濃度(在不同時(shí)點(diǎn)測量各點(diǎn)的氰化物濃度并計(jì)算各點(diǎn)平均值),數(shù)據(jù)如表所示。排放源下風(fēng)向中心線上的平均濃度隨距離的增大而減小,最高值在中心線50米附近。用恰當(dāng)?shù)幕貧w方程反映中心線上氰化物平均濃度隨距污染源的距離變化而變化的關(guān)系。(三)非線性關(guān)聯(lián)點(diǎn)編號距污染源距離氰化物平均濃度點(diǎn)編號距污染源距離氰化物平均濃度1500.681121880.2542630.559132000.1773750.489142130.1634880.472152250.13351000.453162500.11261130.443172750.12071250.352183000.09781380.301193250.08891500.269203500.057101630.258213750.043111750.231224000.033某地距污染源的距離(m)和中心線上大氣氰化物平均濃度(mg/m3)數(shù)據(jù)(三)非線性關(guān)聯(lián)中心線上大氣氰化物平均濃度與距污染源距離的散點(diǎn)圖(A)和殘差圖(B)

(三)非線性關(guān)聯(lián)在圖(A)中我們可以觀察到隨距污染源距離增加,中心線上的大氣氰化物平均濃度的改變速度越來越小,圖(B)為相應(yīng)的殘差圖,其結(jié)構(gòu)所描述的是簡單直線關(guān)系的殘差形態(tài),圖(B)整體上呈曲線并表現(xiàn)出一定的規(guī)律,所以判斷直線回歸不適合此據(jù)。

這里將原始值進(jìn)行對數(shù)轉(zhuǎn)換(logtransformation)后,替代原始值進(jìn)行分析,如下圖。

中心線上大氣氰化物平均濃度與距污染源距離對數(shù)值的關(guān)系探索兩變量間的關(guān)聯(lián)性時(shí),單獨(dú)分析發(fā)現(xiàn)存在關(guān)聯(lián)或無關(guān)聯(lián),但以變量的某種屬性進(jìn)行分層分析即引入第三變量分層時(shí),再分析原來兩個(gè)變量的關(guān)系,原有的關(guān)聯(lián)會(huì)在某些層內(nèi)發(fā)生某些變化甚至方向相反,這個(gè)第三變量就是潛在影響變量。(四)潛在影響變量例2續(xù)根據(jù)大骨節(jié)病發(fā)生情況將地區(qū)分為:東部(開始監(jiān)測時(shí)病情很平穩(wěn),在17年的監(jiān)測過程中沒有大的變化),中部(開始監(jiān)測時(shí)病情較嚴(yán)重而活躍,但在監(jiān)測過程中持續(xù)下降,其間無明顯反彈)和西部病區(qū)(甘肅、陜西、青海和西藏地區(qū),其特征為病情嚴(yán)重而活躍),進(jìn)一步可探討東中西三個(gè)地區(qū)的糧食中DON含量的關(guān)系(數(shù)據(jù)見下表),增加區(qū)域信息后的數(shù)據(jù)如下:(四)潛在影響變量(四)潛在影響變量患者編號地區(qū)DON含量OAP患者編號地區(qū)DON含量OAP患者編號地區(qū)DON含量OAP1東0.0014.1515中74.789.2726西247.295.172東0.0011.1316中74.6714.1027西289.5411.183東0.007.2517中86.099.2628西306.3119.104東0.005.1918中75.892.2029西327.2311.155東0.004.1519中116.335.2730西358.3211.136東0.003.2920中128.585.2631西389.2219.127東0.002.2621中178.429.1932西419.3520.058東0.000.0122中177.3813.2433西426.8521.339東28.763.2723中204.6316.1534西426.9019.1810東48.543.3424中215.9914.1635西458.0417.0911東57.944.2825中206.900.0336西468.3420.0112東69.187.20

37西577.5224.2413東225.4114.16

38西588.9519.0614東187.897.20

38名大骨節(jié)病患者OAP(分)與糧食中DON含量(μg/g)由圖看出中部地區(qū)和西部地區(qū)總趨勢為上升趨勢,但是東部地區(qū)的關(guān)聯(lián)則不明顯,且觀察點(diǎn)集中在OAP和糧食中DON含量都較低的區(qū)域。(四)潛在影響變量不同地區(qū)患者

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論