版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第5章機器學(xué)習(xí)與實現(xiàn)一元線性回歸多元線性回歸線性回歸應(yīng)用舉例一元線性回歸第5章
引例1:有一則新聞:預(yù)計20××年中國旅游業(yè)總收入將超過3000億美元。這個數(shù)據(jù)是如何預(yù)測出來的呢?引例2:身高預(yù)測問題:子女的身高(y),父母的身高(x)旅游總收入(y)居民平均收入(x)……變量之間的相互關(guān)系,主要有3種:①確定的函數(shù)關(guān)系,。②不確定的統(tǒng)計相關(guān)關(guān)系,。③沒有關(guān)系,不用分析。以上兩個例子均屬于第(2)種情況。一元線性回歸第5章
一元線性回歸模型y為因變量(隨機變量),x為自變量(確定的變量),
為模型系數(shù),
每給定一個x,就得到y(tǒng)的一個分布。一元線性回歸第5章
對回歸模型兩邊取數(shù)學(xué)期望,得到以下回歸方程:每給定一個x,便有y的一個數(shù)學(xué)期望值與之對應(yīng),它們是一個函數(shù)關(guān)系。一般地,通過樣本觀測數(shù)據(jù),可以估計出以上回歸方程的參數(shù),一般形式為:其中為對期望值及兩個參數(shù)的估計一元線性回歸第5章
對總體(x,y)進行n次獨立觀測,獲得n個樣本觀測數(shù)據(jù),即(x1,y1),(x2,y2),…,(xn,yn),將其繪制在圖像上。如何對這些觀測值給出最合適的擬合直線呢?使用最小二乘法。其基本思路是真實觀測值與預(yù)測值(均值)總的偏差平方和最小,計算公式如下:求解以上最優(yōu)化問題,即得到:其中最后得到了基于經(jīng)驗的回歸方程一元線性回歸第5章
總離差平方和TSS、回歸平方和RSS、殘差平方和ESS,計算公式分別如下:可以證明:回歸方程的線性關(guān)系是否顯著,可以用一個指標(biāo)公式來計算:稱為擬合優(yōu)度(判定系數(shù)),值越大表明直線擬合程度越好。多元線性回歸第5章
前文介紹了只有一個自變量和一個因變量的一元線性回歸模型,然而在現(xiàn)實中自變量通常包含多個,這時稱它為多元線性回歸模型對于總體的n個觀測值,滿足以下公式:其中
相互獨立,且記,則其矩陣形式為其中
即為待估計的向量多元線性回歸第5章
對
兩邊取期望值,即得到以下回歸方程:其一般的形式如下其中
分布為期望值及回歸系數(shù)的估計的參數(shù)估計(最小二乘法,過程略)為的參數(shù)估計(推導(dǎo)過程略)為其中,H稱為對稱冪等矩陣與一元線性回歸模型類似,擬合優(yōu)度(判定系數(shù))公式為:線性回歸應(yīng)用舉例第5章
在發(fā)電場中電力輸出(PE)與溫度(AT)、壓力(V)、濕度(AP)、壓強(RH)有關(guān),相關(guān)測試數(shù)據(jù)(部分)如表所示ATVAPRHPE8.3440.771010.8490.01480.4823.6458.491011.474.2445.7529.7456.91007.1541.91438.7619.0749.691007.2276.79453.09…………………………需實現(xiàn)的功能如下:(1)利用線性回歸分析命令,求出PE與AT、V、AP、RH之間的線性回歸關(guān)系式系數(shù)
向量(包括常數(shù)項)和擬合優(yōu)度(判定系數(shù)),并在命令窗口輸出。(2)現(xiàn)有某次測試數(shù)據(jù)AT=28.4、V=50.6、AP=1011.9、RH=80.54,試預(yù)測其PE值。線性回歸應(yīng)用舉例第5章
1.讀取數(shù)據(jù),確定自變量x和因變量yimportpandasaspddata=pd.read_excel('發(fā)電場數(shù)據(jù).xlsx')x=data.iloc[:,0:4].valuesy=data.iloc[:,4].values線性回歸應(yīng)用舉例第5章
(1)導(dǎo)入線性回歸模塊(簡稱LR)。
fromsklearn.linear_modelimportLinearRegressionasLR(2)利用LR創(chuàng)建線性回歸對象lr。
lr=LR()(3)調(diào)用lr對象中的fit()方法,對數(shù)據(jù)進行擬合訓(xùn)練。
lr.fit(x,y)(4)調(diào)用lr對象中的score()方法,返回其擬合優(yōu)度,觀察線性關(guān)系是否顯著。
Slr=lr.score(x,y)#判定系數(shù)R2(5)取lr對象中的coef_、intercept_屬性,返回x對應(yīng)的回歸系數(shù)和回歸系數(shù)常數(shù)項。
c_x=lr.coef_#x對應(yīng)的回歸系數(shù)
c_b=ercept_#回歸系數(shù)常數(shù)項2.線性回歸分析線性回歸應(yīng)用舉例第5章
(1)可以利用lr對象中的predict()方法進行預(yù)測。
importnumpyasnp
x1=np.array([28.4,50.6,1011.9,80.54])
x1=x1.reshape(1,4)
R1=lr.predict(x1)(2)也可以利用線性回歸方程式進行預(yù)測,這個方法需要自行計算。
r1=x1*c_x
R2=r1.sum()+c_b#計算預(yù)測值print('x回歸系數(shù)為:',c_x)print('回歸系數(shù)常數(shù)項為:',c_b)print('判定系數(shù)為:',Slr)print('樣本預(yù)測值為:',R1)3.利用線性回歸模型進行預(yù)測執(zhí)行結(jié)果
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度智能倉儲物流系統(tǒng)安裝施工合同協(xié)議3篇
- 2025拆除工程合同協(xié)議
- 2025年學(xué)校土地承包經(jīng)營及教育設(shè)施建設(shè)合同協(xié)議6篇
- 二零二五年個人出租車承包合同范本及司機培訓(xùn)及考核制度3篇
- 2025年國際貿(mào)易合同范本
- 2024年金屬貨架購銷合同
- 2025版航空航天用鋁合金購銷合同2篇
- 2024版房產(chǎn)測量項目合作協(xié)議3篇
- 二零二五年定制工作服環(huán)保材料研發(fā)合同3篇
- 2024演藝經(jīng)紀(jì)人與藝人藝人經(jīng)紀(jì)合同續(xù)約合同3篇
- 2023年新版烏斯特統(tǒng)計公報即將發(fā)布
- 污水處理廠安全生產(chǎn)風(fēng)險分級管控體系方案全套資料匯編完整版
- 人教部編版三年級語文上冊古詩詞日積月累默寫模板
- 高危急性胸痛的快速診斷和誤診病案分析
- (完整版)綜合醫(yī)院康復(fù)醫(yī)學(xué)科建設(shè)與管理指南
- GB/T 41649-2022木制玩具中甲醛釋放量的測定燒瓶法
- JJF 1384-2012開口/閉口閃點測定儀校準(zhǔn)規(guī)范
- GB/T 33720-2017LED照明產(chǎn)品光通量衰減加速試驗方法
- 教師政治紀(jì)律方面存在的問題及整改措施集合5篇 教師政治紀(jì)律方面存在的問題及整改措施怎么寫
- GB/T 16552-2017珠寶玉石名稱
- GB/T 14982-2008粘土質(zhì)耐火泥漿
評論
0/150
提交評論