版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第36卷第1期2009年1月Vo!. 36 No. 1Jm 2009浙江大學(xué)學(xué)報(bào)(理學(xué)版)Journal of Zhejiang University(Science Edition)http:/www. journals, zju. edu. cn/sciDOI: 10. 3785/j. issn. 1008-9497. 2009. 01. 007主成分回歸和偏最小二乘法在高爐冶煉中的應(yīng)用曾九孫I,劉祥官I,羅世華2,顏 光I(1浙江大學(xué)數(shù)學(xué)系,浙江杭州310027; 2.江西財(cái)經(jīng)大學(xué)信息管理學(xué)院,江西南昌331305)摘 要:以鄧邦鋼秋公司2 000 m3荷爐采集的數(shù)據(jù)為樣本采用主版分回歸
2、(PCR)方法研尤了各運(yùn)行參數(shù)對高爐 鐵水含硅量的貢獄實(shí)現(xiàn)了高維復(fù)雜數(shù)據(jù)的降維.考慮到偏最小二乘法(PLS)在處理多重共線性數(shù)據(jù)中的優(yōu)勢利 用PLS對高爐鐵水含硅童進(jìn)行預(yù)測結(jié)果表明,主成分回歸和偏最小二來法在對高爐冶煉過程中產(chǎn)生的大童數(shù)攜 的處理具有其獨(dú)到的優(yōu)勢取得了顯著的效果.關(guān) 鍵 詞:商爐冶煉;高維復(fù)雜數(shù)據(jù)$主成分回歸;僞最小二乘法中圖分類號:TG250. 2文獻(xiàn)標(biāo)識碼:A 文章編號:1008-9497(2009)01-033-04ZENG Jiu-sun1 LIU Xiang-guan1 . LUO Shi-hua2 9 YAN Guang1 (】 Department of Math
3、ematics 9 Zhejiang University Hangzhou 310027, China ; 2 School of Information Management» Jiangxi University of Finance & Economics Nanchang 331305* China)Application of principal component regression and partial least square in blast furnace iron-making. Journal of Zhejiang University(Sci
4、ence Edition), 2009,36(1) :3336Abstract: With datasets from 2 000 m blast furnace of Han Steel as a sample space* principal component regression (PCR) was used to investigate the contribution of operating parameters to the silicon content of hot metal in blast furnace iron-rraking and so the complex
5、ity of data was reduced. Considering the advantages of partial least square (PLS) in deal ng with collinear data, it is used to predict silicon content. The result showed that PCR and PLS had ih&r own advantages for application in iron-making processKey Words: bast furnace iron-making; principal
6、 component regression; partial least square第36卷第1期2009年1月第36卷第1期2009年1月收稲日期:2007-0M3.基金項(xiàng)目:國家科技部車點(diǎn)推廣項(xiàng)冃資助(No. 2OO5ECOOO166)作者簡介:曾九孫(1982)列.博L研究生主要從事系統(tǒng)辨識方血的研究.高爐冶煉過程包含看眾多的子工序,包括配料、 上料、布料、鼓風(fēng)、富氧、噴煤、出渣、岀鐵等在生 產(chǎn)過程中,包含著眾多的影響參數(shù),使得高爐鐵水含 硅量發(fā)生劇烈波動.這些影響參數(shù)本身之間存在著 復(fù)雜的線性相關(guān),如何消除數(shù)據(jù)的相關(guān)性同時又不 損失重要信息成為一個需要進(jìn)行深入思考的問題.為了對高爐冶
7、煉過程進(jìn)行平穩(wěn)控制,大量的非 線性方法包括神經(jīng)網(wǎng)絡(luò)、模糊數(shù)學(xué)、混沌和分形時間 序列方法37得到了廣泛的應(yīng)用,并取得了一定的 成果.然而,這些方法僅僅考慮單一的因素(鐵水含 硅量)或少數(shù)幾個關(guān)鍵參數(shù),造成了大星有用信息的 丟失閃而存在一定的局限性目前處理奇堆復(fù)雜數(shù)據(jù)應(yīng)用最廣泛的方法是主 成分回歸(PCR)和偏最小二乘法(PLS)C7.主成 分回歸的主要目的是要提取隱藏在矩陣X中的相 關(guān)信息,然后用于預(yù)測變量Y的值.這種做法可以 保證只使用那些獨(dú)立變量,噪音將被消除,從而達(dá)到 改善預(yù)測模型質(zhì)屋的目的.當(dāng)然,它也有一定的缺 陷,由于高爐數(shù)據(jù)過于復(fù)雜,導(dǎo)致主成分分析所提取 的成分?jǐn)?shù)過多從而造成預(yù)測模型
8、精確度不夠.但是 它可以有效分析X中各個變凰對Y的貢獻(xiàn),在分析 運(yùn)行參數(shù)對鐵水含硅量的影響時,依然有著其獨(dú)待 的作用.偏最小二乘法則可以避免主成分回歸在預(yù)測中 的缺陷同時對變凰X和Y都進(jìn)行分解從變量X 和丫中提取成分(通常稱為因子),再將因子按照它 第1期曾九孫等:主成分回歸和偏最小二乘法在高爐冶煉中的應(yīng)用37們之間的相關(guān)性從大到小排列將主成分回歸和偏 最小二乘法結(jié)合起來,一方面可以有效分析各個運(yùn) 行參數(shù)對鐵水含硅戢的影響另一方面可以準(zhǔn)確預(yù) 測鐵水含硅量對指導(dǎo)髙爐生產(chǎn)有若較大的意義.1主成分回歸主成分冋歸是一種多變量回歸方法,首先對數(shù) 據(jù)矩陣X進(jìn)行主成分分析(PCA),將得到的變量轉(zhuǎn) 換成新的
9、變量,再對得到的新變雖采用多元回歸進(jìn) 行建模.主成分分析的數(shù)學(xué)模型如下.X=CX, ,X2,X J為nXp數(shù)據(jù)矩陣,對X做奇異值分解(SVD),得到導(dǎo)式:X*X» =UX|, Ax,P;x, 才'式中U為標(biāo)準(zhǔn)化得分矩陣,T為未標(biāo)準(zhǔn)化的得分矩 陣,P為權(quán)重矩陣,P的列向曲為X的特征向武或主 成分(PCs). A為對角矩陣,其對角線上前P個元素A, 為奇異值,是協(xié)方差矩陣*X各個特征值的平方根. A,與第一個主成分(PC1的得分相關(guān),對應(yīng)于由第一 個主成分PC1所解釋的方差,且有A.利用奇異值分解進(jìn)行主成分分析有兩個優(yōu)勢. 首先新變量U是正交的(U'U = 2),這樣就可
10、以很容 易地得到矩陣的逆;此外第一個主成分解釋了數(shù)據(jù) 矩陣X的大部分方差,包含有用的信息,而最后一 個主成分解釋了數(shù)據(jù)矩陣的少部分方差,則被認(rèn)為 是僅包含噪聲.一般來說,留下解釋85%以上方差 的r(r<min(n,Z>)個主成分,其余主成分就可以去 掉,這樣就有效地降低了數(shù)據(jù)的維數(shù).在進(jìn)行主成分分析之后就可以利用新得到的 數(shù)據(jù)變量進(jìn)行回歸了,得到回歸方程Ku】=,其中系數(shù)矩陣對新的樣本X",,fIX” =X】x,PpXe,就可以得到預(yù)測值F:V = /1XrXl.主成分冋歸一方面可以有效地降低數(shù)據(jù)的維 數(shù),另一方面可以得出各個變址對各個主成分的貢 獻(xiàn)但回歸得到的成分?jǐn)?shù)量
11、可能太多,不能得到精確 的模型.下面將介紹的偏最小二乘法可以有效避免 這個缺陷,從而提髙回歸和預(yù)測的精度.2偏最小二乘法偏最小二乘法最早宙瑞典化學(xué)家woli>8i提 出,在化學(xué)統(tǒng)計(jì)學(xué),生物學(xué)一9等學(xué)科中得到廣泛應(yīng) 用,是多元線性回歸,典型相關(guān)分析和主成分分析的有 機(jī)結(jié)合,較傳統(tǒng)的回歸分析、主成分分析有著巨大的優(yōu) 勢,從而使模型梢度、穩(wěn)定性和實(shí)用性都得到提高.偏最小二乘法的思路是:首先,從自變就X中 提取相互獨(dú)立的成分-5 = 1,2,),從因變量Y中 提取相互獨(dú)立的成分冷(人=1,2,).然后建立這 些成分與自變量的回歸方程.與主成分回歸不同的 是,偏最小二乘回歸所提取的成分既能較好地概
12、括 自變量系統(tǒng)中的信息,又能很好地解釋因變量并排 除系統(tǒng)中的噪聲干擾.因而有效地解決了自變量間 多重相關(guān)性情況下的回歸建模問題3】.當(dāng)因變量Y的階數(shù)為1時,為單變量偏最小二 乘回歸模型(PLS1),階數(shù)大于1時為多變量偏最小 二乘回歸模型.本文討論的是單變量模型,對于多變 量模型,處理的方法也類似.記Fo=Y,E> = X,偏最小二乘法步驟如下.2.1第1成分"的提取已知F°,E>,可從中提取第1個成分6U» = E°W|.其中W】為E。的第1個軸,為組合系數(shù), II昭| =1.同時,從艮中提取第1個成分©滿足 S=F°G
13、,式中G為凡的第1個軸,| G II =1. 在此要求釘,能分別較好地表達(dá)X與丫中的數(shù)據(jù) 變異信息,且S對ui有較大的解釋能力.根據(jù)主成 分分析和典型相關(guān)分析的思路,取即可滿足條件.得到w.后,可得成分,分別求Fo、 E>對勺的回歸方程為E0=tiP+El , F0=ttrl 4-Ft,其中,R=EJs/| b ir,向童 n-Fji./ll h |2. EF為回歸方程的殘差矩陣.2.2第2成分卩的提取以碼取代E。,”取代F°,用上面的方法求第 2個軸W2和第2個成分“,有W2 = 眾 *心= E.Wj,同樣,F,分別對“做回歸,得到E = Z 22 * 只="廠2+
14、形.2.3第力成分匚的提取同理可推求第h成分-,/»的個數(shù)可以用交叉 有效性原則進(jìn)行識別/小于X的秩.2.4求偏鍛小二乘回歸模型綜合以上分析,可以得到偏最小二乘回歸模型其中,w=州,肥,w,r=E,和,出 為殘差矩陣.2.5交叉有效性原則利用交叉有效性原則來確定提取的成分個數(shù) h.記M為原始數(shù)據(jù),5,","是偏最小二乘回歸 過程中提取的成分是使用全部樣本點(diǎn)并取仃, ",山個成分回歸建模后,第個樣本點(diǎn)的擬合 值.以是在建模時刪去第個樣本點(diǎn),取S,“, 山個成分建模后,再由此模型計(jì)算的擬合值.記PRESS-2(.)2,t J變量PRESS取最小時表明模型的擬
15、合效果最好, 這時提取的成分個數(shù)h即為最佳成分?jǐn)?shù).這就是交 叉有效性原則.3數(shù)值實(shí)驗(yàn)本文所用的數(shù)據(jù)來自于邯鄲鋼鐵公司7片高爐 2005年9月至2006年2月的實(shí)際生產(chǎn)數(shù)據(jù).采集 的參數(shù)共有30個,包括原燃料數(shù)據(jù)如礦石中Mn和 P的含量、煤氣成分、壓力條件以及控制變量和狀態(tài) 變量等.這30個變量組成自變量矩陣X,鐵水含硅 量數(shù)據(jù)組成應(yīng)變量矩陣Y.在利用主成分回歸和偏最小二乘法對數(shù)據(jù)進(jìn)行建 模之前,需要對數(shù)據(jù)做標(biāo)準(zhǔn)化變換.公式為亍=口.其 a中,"為變量工的均值訶為X的標(biāo)準(zhǔn)差.對標(biāo)準(zhǔn)化之后的 自變呈矩陣X做主成分分析結(jié)果如圖13所示.O9876543210 000.00.00提取的主要成
16、分個數(shù)3025圖1主成分分析模刑捕獲的方差百分比1 Percentage of variance captured by PCA model3052205蛍 變105O圖2運(yùn)行參數(shù)在第】主成分空間的因子載荷Fi# 2 Compor.ent plot of operator parametersin the first principal space圖3運(yùn)行參數(shù)在第2主成分空間的因子載荷Fig. 3 Component plot of operator parametersin the second principal spare圖1表明模型的第1主成分及第2主成分捕獲 的方差均在15%左右,大
17、約13個主成分就能捕獲 85%以上的方差.因此這30個變量就可以用新的 13個變量來代替,但是并沒有損失太多的信息.這 樣就降低了數(shù)據(jù)的維數(shù),以利于對新的數(shù)據(jù)進(jìn)行回 歸.當(dāng)然,這樣的結(jié)果雖然降低了數(shù)據(jù)維數(shù),但13個 變鼠進(jìn)行回歸依然較多,難以得到理想的結(jié)果.由于第1主成分和第2主成分所捕獲的方差較 大,均在15%左右.對第1主成分和第2主成分各 個變量的貢獻(xiàn)進(jìn)行分析,貢獻(xiàn)大于0. 05的變屋被認(rèn) 為對主成分有較大貢獻(xiàn).圖2中貢獻(xiàn)大于0. 05的幾 個變量包括前爐Si和工長冃測Si,礦石中Mn和P 的含量,煤氣CO含量和頂壓;圖3中貢獻(xiàn)大于0.05 的幾個變倉包括風(fēng)量,風(fēng)溫,風(fēng)壓,噴煤速率等控制
18、 變量和狀態(tài)變量.本文提取了一些對髙爐冶煉過程 有較大影響的變帚,從而證明了以往只利用4個變 就或者鐵水含硅昴:進(jìn)行建模的方法是有缺陷的.圖4 Press相對于所取成分?jǐn)?shù)的變化Fig. 4 The variation of press against number of components extracted from PLS model從圖4可以看出,僅從PLS模型中提取一個成 分時Press M小,提取的成分越多效果反而越差.因 此提取一個成分利用PLS模型來預(yù)測鐵水含硅量. 預(yù)測結(jié)果如圖5所示.利用偏最小二乘法對同一批數(shù)據(jù)建模需要利用 交叉有效性原則確定提取的成分?jǐn)?shù),最主要的參數(shù) 是P
19、ress,如圖4所示.圖5邯鋼7卩高爐Si預(yù)測結(jié)果圖Fig. 5 Predictive result graph of silicon contentfrom BF No. 7 of Han Steel圖5顯示在士0.】的生產(chǎn)許可范圍內(nèi),這一方 法對連續(xù)50爐數(shù)據(jù)的預(yù)測命中率達(dá)到96%.并且 實(shí)際值和預(yù)測值的波動趨勢吻合得也較好,這表明 偏最小二乘冋歸方法對生產(chǎn)有較好的指導(dǎo)作用,在 實(shí)際應(yīng)用中也是有價值的.表1給岀了相同條件下主成分回歸和偏最小二 乘法預(yù)測結(jié)果的對比,可以看出由于提取了太多的主 成分(13個),主成分回歸得到的結(jié)果不如偏最小二乘 法.但是由于主成分回歸可以較好地分析各個變拭對
20、為爐冶煉過程的貢獻(xiàn),在生產(chǎn)中也具有較大的價值. 表1主成分回歸和偏最小二乘法預(yù)測結(jié)果對比表 Table 1 Comparison of predictive results of PCR and PLS建模方法命中率/%提取成分?jǐn)?shù)主成分回歸8413偏最小二乘法9614結(jié)論在高爐冶煉過程的控制中,過去的模型大多根 據(jù)經(jīng)驗(yàn)提取少數(shù)幾個參數(shù)或者僅利用鐵水含硅量數(shù) 據(jù)進(jìn)行建模,這樣造成了大赴的信息丟失本文采用 了兩種多變雖回歸方法對髙爐冶煉過程進(jìn)行分析, 不僅有效降低了數(shù)據(jù)的維數(shù),而且分析得到了各個 變誡對冶煉過程的貢獻(xiàn),從而得到了較好的預(yù)測結(jié) 果這兩種多變量回歸方法計(jì)算過程相對簡單,充分 利用了工廠
21、采集到的信息,為離爐冶煉過程的控制 提供了一種新的思路.參考文獻(xiàn)(References):岀版社,2005.ZHOU Chuan-dian. Manual of Blast Furnace Ironmak- ing TechniqueM Beijing: Press of Metallurgical Industry* 2005 2 CHEN Jian. A predictive system for blast furnaces by integrating a neural network with qualitative analysis J Engineering Applicatio
22、n of Artificial Intelligence« 2001.14(1),77-85.3 LUO Shi-hua, LIU Xiang-guan9 ZHAO Min, et al. Prediction for silicon content in molten iron using a combined fuzzy-associative-rules bank C/ Lecture Notes in Computer Science Berlin: Springer,2005 :667- 676.4 部傳厚,劉祥官高爐冶煉過程的混沌性辨識J 金H 學(xué)報(bào).2004 >4
23、0(4):347-350.GAO Chuan-hout LIU Xiang-guan. Chaotic identification of blast furnace iron-making process J Acta Metallvrgica Sinica,2004,40(4):347-350.5 羅世華,劉祥官.商爐鐵水含硅軼的分形結(jié)構(gòu)分析口. 物理學(xué)報(bào) >2006>55(7) ,3343-3348.LUO Shi-hua> LIU Xiang-guan The fractual structure of silicDn content in molten iron in blast furnace J Acta Physics Sinica > 2006,5(7): 3343-3348.6 JOLLIFFE Ian T. A note on the use of principal components in regression J Applied Statisti
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年個人股權(quán)委托管理轉(zhuǎn)讓合同范本3篇
- 2025年度個人合伙退伙合同范本精要3篇
- 現(xiàn)代社會生活中的常見隱患及其家庭預(yù)防策略研究報(bào)告
- 智慧醫(yī)療與健康科技的發(fā)展
- 二零二五年度車間承包與安全生產(chǎn)責(zé)任合同4篇
- 游戲化學(xué)習(xí)小學(xué)生注意力培養(yǎng)的新模式
- 網(wǎng)絡(luò)安全技術(shù)與隱私保護(hù)措施研究
- 2025年度虛擬現(xiàn)實(shí)體驗(yàn)店租賃合同
- 網(wǎng)絡(luò)環(huán)境下家庭信息的安全存儲與分享策略
- 玉林2025年廣西玉林市第一人民醫(yī)院招聘24人筆試歷年參考題庫附帶答案詳解
- 2024人教新目標(biāo)(Go for it)八年級英語上冊【第1-10單元】全冊 知識點(diǎn)總結(jié)
- 劇本殺店長合同范例
- 華中師范大學(xué)第一附中2025屆高考仿真模擬數(shù)學(xué)試卷含解析
- 農(nóng)村自建房施工合同模板
- GB/T 44731-2024科技成果評估規(guī)范
- 影視動畫設(shè)計(jì)與制作合同
- 2023學(xué)年廣東省深圳實(shí)驗(yàn)學(xué)校初中部九年級(下)開學(xué)語文試卷
- 企業(yè)新員工培訓(xùn)師帶徒方案
- 2025屆河南省鄭州一中高三物理第一學(xué)期期末學(xué)業(yè)水平測試試題含解析
- 個體工商戶章程(標(biāo)準(zhǔn)版)
- 河南省安陽市2024年中考一模語文試卷(含答案)
評論
0/150
提交評論