




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
基于神經(jīng)網(wǎng)絡(luò)的農(nóng)產(chǎn)品產(chǎn)量估算模型實(shí)證研究目錄TOC\o"1-2"\h\u24898基于神經(jīng)網(wǎng)絡(luò)的農(nóng)產(chǎn)品產(chǎn)量估算模型實(shí)證研究 112452一、緒論 114878(一)研究背景 130723(二)研究意義 211207(三)國(guó)內(nèi)外研究現(xiàn)狀 34819(四)研究?jī)?nèi)容及技術(shù)路線 513978二、有關(guān)理論介紹 624758(一)數(shù)據(jù)處理 6383(二)數(shù)據(jù)處理的流程 725470(三)多元線性回歸 819298(四)BP神經(jīng)網(wǎng)絡(luò)模型 86462(五)遺傳算法 1120862三、產(chǎn)量預(yù)測(cè)模型建立 1227639(一)多元線性回歸模型 126352(二)BP神經(jīng)網(wǎng)絡(luò)模型 172982(三)基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)模型 1915480四、總結(jié)與展望 22緒論研究背景黨的十九大報(bào)告明確指出:“要堅(jiān)持質(zhì)量第一、效益第一,以供給側(cè)結(jié)構(gòu)性改革為主線,提質(zhì)增效,加快推進(jìn)經(jīng)濟(jì)發(fā)展變化,提高全要素生產(chǎn)率。近年來(lái),宏觀經(jīng)濟(jì)形勢(shì)在我國(guó)國(guó)內(nèi)產(chǎn)生,國(guó)內(nèi)乃至國(guó)際與棉花相關(guān)的產(chǎn)業(yè)都發(fā)了發(fā)生翻天覆地的變化。為了應(yīng)對(duì)這種現(xiàn)象的出現(xiàn),中共中央在經(jīng)濟(jì)會(huì)議上明確提出供給側(cè)結(jié)構(gòu)性改革這一理念、要求我國(guó)經(jīng)濟(jì)總基調(diào)為穩(wěn)中求進(jìn)的趨勢(shì)。此外,還要貫徹實(shí)施創(chuàng)新、協(xié)調(diào)、綠色、可持續(xù)等發(fā)展理念。即要做到不僅要增加效益,而且要提高產(chǎn)品質(zhì)量,這就得要求我們從實(shí)際出發(fā),切實(shí)的去認(rèn)識(shí)當(dāng)前經(jīng)濟(jì)發(fā)展新常態(tài),打破原先固有的經(jīng)濟(jì)格局,進(jìn)而不斷的去適應(yīng)相關(guān)行業(yè)發(fā)展的新變化、新形式,這才是行業(yè)生存發(fā)展的必由之路。在中國(guó)有許多重要的優(yōu)質(zhì)棉花生產(chǎn)基地其中之一就在新疆維吾爾自治區(qū)。同時(shí)新疆維吾爾自治區(qū)也是全國(guó)唯一的長(zhǎng)絨棉生產(chǎn)基地,“世界棉花看中國(guó),中國(guó)棉花看新疆”,這句口號(hào)并不是空穴來(lái)風(fēng),但一方面由于新疆生產(chǎn)的優(yōu)質(zhì)棉的市場(chǎng)調(diào)控機(jī)制建立的不夠完善,對(duì)新疆棉的發(fā)展有很大的影響。其中比較突出的問(wèn)題在于新疆棉花的定位價(jià)格存在著轉(zhuǎn)箱的壓力,即使使用了價(jià)格補(bǔ)貼等多種措施,但效果甚微,其次新疆棉花種植的面積較大但是種類太多,質(zhì)量上難以統(tǒng)一,而且組織起來(lái)所需要的相關(guān)程序相當(dāng)復(fù)雜,此外,在生產(chǎn)過(guò)程中棉花加工不僅會(huì)加深環(huán)境污染,造成棉紡織業(yè)難以融資,進(jìn)而導(dǎo)致出現(xiàn)產(chǎn)業(yè)聚集效應(yīng),這不單單會(huì)對(duì)新疆棉花產(chǎn)業(yè)質(zhì)量的發(fā)展?fàn)顩r造成影響。且長(zhǎng)此以往,會(huì)造成我國(guó)國(guó)內(nèi)的棉花產(chǎn)量波動(dòng)變換大,出現(xiàn)許多類似于“生產(chǎn)過(guò)?!币约啊肮┎粦?yīng)求”的問(wèn)題,以及會(huì)造成“買棉難”與“賣棉難”等等棘手的問(wèn)題。如今,國(guó)內(nèi)的棉花生產(chǎn)產(chǎn)業(yè)仍然有著反反復(fù)復(fù)的波動(dòng)幅度。棉花將長(zhǎng)期處于“不足”與“過(guò)?!钡淖儎?dòng)中。棉花并不像其他農(nóng)作物一樣有著強(qiáng)的抗干擾能力,氣候因素、棉花價(jià)格以及棉花產(chǎn)量都是棉花生產(chǎn)過(guò)程中非常關(guān)鍵的特征因素,這些因素能夠可以對(duì)國(guó)民經(jīng)濟(jì)造成很深遠(yuǎn)的影響,更進(jìn)一步可能造成全球市場(chǎng)發(fā)展不平衡。國(guó)家和政府應(yīng)該積極采取措施,推動(dòng)棉花供給側(cè)結(jié)構(gòu)改革,對(duì)流通體制的變革進(jìn)行深化,進(jìn)而構(gòu)建一個(gè)同意的市場(chǎng)體系。隨著棉花生產(chǎn)水平的提高,棉紡織業(yè)高質(zhì)量發(fā)展的推進(jìn),“去庫(kù)存”這一目標(biāo)將能夠有效的實(shí)現(xiàn)。此外應(yīng)該積極地提供棉花監(jiān)測(cè)預(yù)警信息,這樣才可以使得棉花的生產(chǎn)、銷售、倉(cāng)儲(chǔ)以及進(jìn)出口行業(yè)持久的發(fā)展,可以使得棉花相關(guān)行業(yè)的市場(chǎng)風(fēng)險(xiǎn)以及周期性波動(dòng)減弱。進(jìn)而保護(hù)產(chǎn)業(yè)鏈各方利益,實(shí)現(xiàn)棉花產(chǎn)業(yè)的可持續(xù)發(fā)展,這才是棉花供給側(cè)改革的必由之路。研究意義2017年第十九次全國(guó)人民代表大會(huì)上,習(xí)近平總書記明確指出:“中國(guó)特色社會(huì)主義已經(jīng)進(jìn)入了新時(shí)代,我國(guó)的主要矛盾已經(jīng)轉(zhuǎn)化為人民日益增長(zhǎng)的對(duì)美好生活需要發(fā)展不平衡不充分之間的矛盾。即:人民的生活水平以及生活質(zhì)量在不斷提高。而“衣、食、住、行”這四個(gè)方面自古以來(lái)就是衡量生活水平的標(biāo)志,尤其是棉花產(chǎn)業(yè)是這四個(gè)方面的基礎(chǔ)。最近幾年來(lái),綠色食品,綠色出行等綠色理念開(kāi)始成為如今一種可持續(xù)時(shí)尚的潮流。引起了人們對(duì)純天然產(chǎn)品的追求,這使得各種天然纖維開(kāi)始重新出現(xiàn)在國(guó)家趨勢(shì)發(fā)展的前沿。當(dāng)然,作為天然纖維的棉花,這一種歷史悠久的纖維材料越來(lái)越受到人們的歡迎。自古以來(lái),就有“世界棉花看中國(guó),中國(guó)棉花看新疆”這一口號(hào),新疆的棉花憑借其良好的光澤、透氣性、彈性等因素,使得其品質(zhì)遠(yuǎn)遠(yuǎn)超過(guò)普通棉花。所以優(yōu)質(zhì)的新疆棉花不僅受到廣大消費(fèi)者青睞,而且使得新疆維吾爾自治區(qū)的人民為其驕傲。自古以來(lái)中國(guó)就是農(nóng)業(yè)大國(guó),而新疆一直是我國(guó)十分重要的農(nóng)業(yè)大省。新疆維吾爾自治州的農(nóng)業(yè)的國(guó)民生產(chǎn)總值對(duì)于我國(guó)農(nóng)業(yè)的國(guó)民生產(chǎn)總值占有很大比重。作為我國(guó)重要農(nóng)作物之一的棉花,其在經(jīng)濟(jì)和農(nóng)業(yè)方面有著十分重要的地位。在我國(guó)西北邊陲的新疆,其經(jīng)濟(jì)收入會(huì)隨著棉花單產(chǎn)的增加而提高,且隨著棉花單產(chǎn)的提高,新疆一半以上的農(nóng)戶將會(huì)變得富裕,隨著棉花種植收入點(diǎn)的增加,農(nóng)戶將能夠獲得更好的生活質(zhì)量,這意味著棉花種植農(nóng)戶的生產(chǎn)積極性將會(huì)明顯提高,且不僅能夠增加國(guó)內(nèi)生產(chǎn)總值,而且可以提升廣大人民對(duì)國(guó)家的認(rèn)可度。農(nóng)作物的種植面增加能夠減少生態(tài)方面的破壞,可以有效的解決水土流失以及荒漠化等生態(tài)問(wèn)題。根據(jù)新疆棉花產(chǎn)量為主題,本文采用信息學(xué)常用方法對(duì)數(shù)據(jù)進(jìn)行提取和分析。對(duì)棉花生長(zhǎng)發(fā)育的氣象因素進(jìn)行研究,利用多元線性回歸模型、BP神經(jīng)網(wǎng)絡(luò)模型以及基于遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)模型對(duì)棉花產(chǎn)量進(jìn)行綜合研究,更為精確地得到預(yù)測(cè)棉花產(chǎn)量,找到更合適預(yù)測(cè)棉花產(chǎn)量的方法。這不僅對(duì)促進(jìn)整個(gè)棉花產(chǎn)業(yè)的進(jìn)程,而且能夠總體增加棉花種植農(nóng)戶的收入,這對(duì)人們提高對(duì)國(guó)家的認(rèn)可度,對(duì)社會(huì)的可持續(xù)發(fā)展有著極其重要的現(xiàn)實(shí)意義。國(guó)內(nèi)外研究現(xiàn)狀國(guó)內(nèi)研究現(xiàn)狀近些年來(lái),我國(guó)的科研人員在農(nóng)作物產(chǎn)量預(yù)測(cè)方面有著諸多成果。其研究方法可以分為可以遙感技術(shù)法、統(tǒng)計(jì)動(dòng)力學(xué)法、氣象因子預(yù)測(cè)法、傳統(tǒng)農(nóng)學(xué)預(yù)測(cè)方法、數(shù)學(xué)統(tǒng)計(jì)估算法、機(jī)器學(xué)習(xí)方法等等,宗宸生等科研人員通過(guò)改善粒子群算法與常見(jiàn)的BP神經(jīng)網(wǎng)絡(luò)模型相結(jié)合,進(jìn)而構(gòu)建出了IPSO-BP產(chǎn)量預(yù)測(cè)模型,這一模型給我們進(jìn)行糧食生產(chǎn)過(guò)程預(yù)測(cè)和決策提供很重要的理論幫助。邢聰仁等科研人員利用BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中常用的隨機(jī)森林算法,構(gòu)建了對(duì)于2018-2020年安徽省糧食產(chǎn)量的組合預(yù)測(cè)模型。通過(guò)這個(gè)模型所計(jì)算出的預(yù)測(cè)產(chǎn)量與現(xiàn)實(shí)測(cè)量過(guò)程中的實(shí)際產(chǎn)量之間的誤差不足5%,這對(duì)于我們對(duì)于糧食預(yù)測(cè)提供了巨大的幫助。張浩等利用免疫算法與遺傳算法的優(yōu)點(diǎn),改善BP神經(jīng)網(wǎng)絡(luò)在農(nóng)作物產(chǎn)量預(yù)測(cè)中的缺陷,進(jìn)而構(gòu)建了一個(gè)以自適應(yīng)免疫遺傳算法(AIGA)的BP神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的農(nóng)作物產(chǎn)量預(yù)測(cè)模型。施瑤等科研人體利用1987-2017國(guó)內(nèi)糧食產(chǎn)量數(shù)據(jù)為研究對(duì)象,一種以自適應(yīng)權(quán)重的螢火蟲算法為基礎(chǔ)的SAFA-LSSVM糧食產(chǎn)量預(yù)測(cè)模型被給出,這個(gè)模型大大的減少LSSVM這個(gè)模型用來(lái)進(jìn)行產(chǎn)量預(yù)測(cè)的誤差以及產(chǎn)量預(yù)測(cè)的準(zhǔn)度也得到了很大的提升。李毅念等研究人體使用特殊的裝置設(shè)備對(duì)田間麥穗群體圖像進(jìn)行采集,通過(guò)不斷改變這些圖像色彩空間、對(duì)這些所獲得的圖像進(jìn)行有效的分割、以及對(duì)圖像上的那些明顯的凹點(diǎn)進(jìn)行檢測(cè),以這些為基礎(chǔ)進(jìn)一步得到圖像中的所有的麥穗數(shù)量,以及使用機(jī)器方法研究所獲得的圖像里面的像素點(diǎn)從而得出來(lái)小麥的籽粒數(shù)目,從而預(yù)測(cè)出來(lái)小麥的產(chǎn)量。李婉通過(guò)分析作物所處的平均溫度、光照強(qiáng)度、降水量、以及最高最低溫度和實(shí)驗(yàn)的土壤濕度等共8個(gè)生產(chǎn)要素進(jìn)行測(cè)量,構(gòu)建出了以遺傳算法為基礎(chǔ)的優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)模型,并且通過(guò)該模型進(jìn)行了對(duì)甘蔗產(chǎn)量的預(yù)測(cè)。李娟麗等研究人員建立了一個(gè)以ARIMA為基礎(chǔ)的模型,憑借這個(gè)模型預(yù)測(cè)出了新疆2011年-2015年的棉花產(chǎn)量。并且通過(guò)這個(gè)模型得到的預(yù)測(cè)產(chǎn)量和實(shí)際產(chǎn)量之間平均誤差為2%-16%。林靖皓等研究人員構(gòu)建一個(gè)C-BiGRU的自我感知模型,并用該模型對(duì)廣西的芒果總產(chǎn)量的數(shù)值進(jìn)行分析,得到的數(shù)值與實(shí)際產(chǎn)量誤差很小。其又構(gòu)建了一個(gè)以CNN與GRU的模型結(jié)構(gòu),分析后對(duì)于產(chǎn)量預(yù)測(cè)的部分參數(shù)實(shí)施了調(diào)整和處理。又通過(guò)對(duì)1991年-2002年的芒果數(shù)據(jù)完成了測(cè)試,這一次測(cè)試將九個(gè)主要的氣象因子考慮在內(nèi),憑借這個(gè)模型以及九個(gè)主要?dú)庀笠蜃虞^為準(zhǔn)確的預(yù)測(cè)了廣西等地2003年-2014年芒果的總產(chǎn)量。實(shí)際通過(guò)C-BiGRU這一模型自有的預(yù)測(cè)機(jī)制預(yù)測(cè)出來(lái)產(chǎn)量和現(xiàn)實(shí)測(cè)量的實(shí)際產(chǎn)量之間的均方誤差只有10.67。王少航等研究人員通過(guò)構(gòu)建一個(gè)Greymarkov模型,并由該模型較為準(zhǔn)確地預(yù)測(cè)了河南省在1996-2015年的農(nóng)作物總產(chǎn)量,且通過(guò)該模型計(jì)算出來(lái)的產(chǎn)量均值相對(duì)誤差為小于1.4%。他的研究方法主要選擇了對(duì)農(nóng)作物產(chǎn)量影響十分重要的四個(gè)因素,并且通過(guò)使用這四個(gè)屬性結(jié)合Greymarkov模型對(duì)河南省的糧食產(chǎn)量進(jìn)行了預(yù)測(cè)。隨后使用基于遺傳算法所獲得的灰色模型對(duì)馬爾可夫鏈進(jìn)行了完善建模,最終得到了農(nóng)作物產(chǎn)量的精準(zhǔn)預(yù)測(cè)。使用HenanGrainYield;Jiyu26I復(fù)合灰色模型進(jìn)行測(cè)量2017年-2021年吉林省的玉米總產(chǎn)量。最后通過(guò)模型得到的預(yù)測(cè)結(jié)果與實(shí)際結(jié)果之間的平均誤差低至4.23%。這一結(jié)果的得到主要是根據(jù)平穩(wěn)時(shí)間序列模型與灰色模型GM所得到的。國(guó)外研究現(xiàn)狀眾所周知,傳統(tǒng)的農(nóng)作物產(chǎn)量的預(yù)測(cè)方法包括統(tǒng)計(jì)調(diào)查方法、天氣預(yù)報(bào)方法以及農(nóng)業(yè)預(yù)測(cè)方法。特別是統(tǒng)計(jì)調(diào)查方法,這一方法的工作原理是通過(guò)直接考察主要影響農(nóng)作物產(chǎn)量的因素,如平均溫度、降水量、光照強(qiáng)度、土壤濕度等主要因素,建立線性回歸模型對(duì)作物產(chǎn)量進(jìn)行估計(jì)。但是這種方式雖然操作起來(lái)十分容易,但是考慮到其并沒(méi)有一種可靠有效的機(jī)制來(lái)使得這種方法在實(shí)際操作過(guò)程在取得好的效果,故這種方法并不被廣泛推廣作為主流的作物產(chǎn)量預(yù)測(cè)方法。農(nóng)業(yè)預(yù)測(cè)法則是根據(jù)農(nóng)作物產(chǎn)量形成一種機(jī)制進(jìn)行有效的預(yù)測(cè),這種預(yù)測(cè)方法有著高產(chǎn)量的估計(jì)精度以及高預(yù)測(cè)效果,但這種方法的實(shí)施機(jī)制需要非常多的參數(shù)進(jìn)行處理,且這些參數(shù)并不是很容易能夠獲取,所以這種方法沒(méi)法廣泛推廣和應(yīng)用。天氣預(yù)測(cè)方法這項(xiàng)方法已經(jīng)發(fā)展相對(duì)成熟,天氣預(yù)測(cè)方法它的工作原理是通過(guò)分析影響作物產(chǎn)量的主要?dú)庀笠蛩貋?lái)進(jìn)行預(yù)測(cè)產(chǎn)量。但是,這種方法受氣象數(shù)據(jù)的影響非常大,且該方法很容易受限因?yàn)槲覀兯玫降臍庀髷?shù)據(jù)缺乏連續(xù)性以及地面氣象站的空間分布不充分等問(wèn)題所導(dǎo)致。從而這種方法由于其適用條件過(guò)多,導(dǎo)致其推廣較為困難。總的來(lái)說(shuō),傳統(tǒng)的產(chǎn)量估測(cè)方法其工作原理主要基于實(shí)地考察,雖然這種方法測(cè)量出來(lái)的農(nóng)作物產(chǎn)出精確度高,但這些方法所需要眾多的參數(shù),而這些參數(shù)的采集需要大量的人力物力財(cái)力,且工作開(kāi)展不僅費(fèi)時(shí)費(fèi)力,而且其高昂的成本,使得這些方法的適用性不是很強(qiáng)。總的來(lái)說(shuō),隨著農(nóng)業(yè)經(jīng)濟(jì)發(fā)展以及各種經(jīng)濟(jì)危機(jī)的到來(lái),對(duì)作物產(chǎn)量的準(zhǔn)確預(yù)測(cè)以及評(píng)估已經(jīng)成為了現(xiàn)代農(nóng)業(yè)的新要求,在這種環(huán)境下,傳統(tǒng)的產(chǎn)量估測(cè)方法可以不再能夠適用于如今這個(gè)動(dòng)態(tài)變化的大環(huán)境下。反而這些傳統(tǒng)預(yù)測(cè)方法會(huì)限制農(nóng)作物估測(cè)的要求,影響作物行業(yè)的發(fā)展。美國(guó)預(yù)測(cè)產(chǎn)量的方法常使用普查統(tǒng)計(jì)數(shù)據(jù),由于美國(guó)大部分土地平坦,所以農(nóng)作物種植面積大,正是因?yàn)橛羞@種環(huán)境,所以對(duì)于產(chǎn)量的統(tǒng)計(jì)較為簡(jiǎn)便,且統(tǒng)計(jì)這項(xiàng)工作一般都是由美國(guó)國(guó)家統(tǒng)計(jì)局獨(dú)立完成,統(tǒng)計(jì)完成后與預(yù)測(cè)的作物產(chǎn)量進(jìn)行對(duì)比,估計(jì)其平均誤差。歐洲相較于其他國(guó)家農(nóng)業(yè)生產(chǎn)水平走在國(guó)際前列,它有著更為先進(jìn)的農(nóng)業(yè)生產(chǎn)科學(xué)技術(shù),尤其是遙感技術(shù),這就使得他通過(guò)這種技術(shù)預(yù)測(cè)的數(shù)據(jù)較為準(zhǔn)確的與實(shí)際作物產(chǎn)量相擬合。但是這種方法需要提前一到兩個(gè)月計(jì)劃生產(chǎn)。但是由于如今氣象服務(wù)科技水平受限,難以有效的對(duì)一個(gè)月后的的天氣信息進(jìn)行預(yù)測(cè),從而導(dǎo)致所得的預(yù)測(cè)結(jié)果與實(shí)際結(jié)果往往有較大的出入,因此,這種方法往往不適用于長(zhǎng)期預(yù)測(cè)。日本的產(chǎn)量預(yù)測(cè)方法主要是將氣象因素預(yù)測(cè)模型與作物的動(dòng)態(tài)生長(zhǎng)模擬統(tǒng)計(jì)模型相結(jié)合,而影響作物產(chǎn)量的這些氣象因素主要包括各種生物活動(dòng)的影響、濃度、降水量、太陽(yáng)輻射強(qiáng)度、溫度等自然因子,該模型以這些主要?dú)庀笠蛩刈鳛樽宰兞?,然后使用該模型?duì)大豆產(chǎn)量進(jìn)行預(yù)測(cè)。加拿大由于其只有單一的作物大面積種植。故其常用遙感技術(shù)對(duì)作物的產(chǎn)量進(jìn)行預(yù)測(cè)。例如:通過(guò)使用以遙感技術(shù)為基礎(chǔ)的MODIS-NDVI模型對(duì)于用于加拿大在收獲前兩個(gè)月作物產(chǎn)量進(jìn)行預(yù)測(cè)。研究?jī)?nèi)容及技術(shù)路線研究?jī)?nèi)容本文研究新疆烏蘇、庫(kù)車、新河以及沙雅等20多個(gè)棉花生產(chǎn)大縣的氣象數(shù)據(jù),這些氣象因素包含溫度、降水量以及光照強(qiáng)度等自然因子,這些氣象數(shù)據(jù)均屬于國(guó)家青藏高原科學(xué)數(shù)據(jù)中心。本文通過(guò)研究每棉花生產(chǎn)大縣來(lái)自國(guó)家青藏高原科學(xué)每日的溫度、光照強(qiáng)度、降水量進(jìn)行記錄,以每日0時(shí)開(kāi)始,三小時(shí)為一個(gè)小周期,記錄幅度為2018-2021年。選取的數(shù)據(jù)為2018-2021年各個(gè)產(chǎn)棉大縣的單位面積棉花產(chǎn)量,這些所得到的數(shù)據(jù)均來(lái)自與新疆統(tǒng)計(jì)年鑒。本研究首先將所得到的數(shù)據(jù)先進(jìn)行數(shù)據(jù)整理,在進(jìn)行數(shù)據(jù)篩選,將這些數(shù)據(jù)整理成2018-2021年中每個(gè)年份的平均降水量、平均溫度、平均太陽(yáng)強(qiáng)度以及最高與最低溫度等與棉花產(chǎn)量相關(guān)的數(shù)據(jù),然后將所分好類的數(shù)據(jù)進(jìn)行數(shù)據(jù)歸一化的處理,將這些處理過(guò)后的數(shù)據(jù)提取出來(lái)依次構(gòu)建多元線性回歸模型、BP神經(jīng)網(wǎng)絡(luò)以及以遺傳算法為基礎(chǔ)的BP神經(jīng)網(wǎng)絡(luò)模型。然后根據(jù)這三個(gè)模型對(duì)于棉花產(chǎn)量實(shí)際估計(jì)準(zhǔn)確度,選擇準(zhǔn)確度最高的那個(gè)模型作為能夠被廣泛推廣的模型。技術(shù)路線圖1-SEQ圖\*ARABIC\s11技術(shù)路線有關(guān)理論介紹數(shù)據(jù)處理數(shù)據(jù)處理(dataprocessing)是對(duì)所獲得的數(shù)據(jù)進(jìn)行采集、存儲(chǔ)、查找、加工、變換以及傳輸。系統(tǒng)工程和自動(dòng)控制流程中有一個(gè)基本環(huán)節(jié)就是數(shù)據(jù)處理。數(shù)據(jù)處理貫穿于社會(huì)生產(chǎn)和社會(huì)生活的各個(gè)領(lǐng)域并且數(shù)據(jù)處理技術(shù)的發(fā)展及其應(yīng)用的廣度和深度,極大地影響了人類社會(huì)發(fā)展的進(jìn)程。根據(jù)處理設(shè)備的結(jié)構(gòu)方式、工作方式,以及數(shù)據(jù)的時(shí)間空間分布方式的不同,數(shù)據(jù)處理有不同的方式。不同的處理方式要求不同的處理工具。每種處理方式都有自己的特點(diǎn),應(yīng)當(dāng)根據(jù)應(yīng)用問(wèn)題的實(shí)際環(huán)境選擇合適的處理方式。數(shù)據(jù)處理可以分為以下幾個(gè)部分?jǐn)?shù)據(jù)采集:數(shù)據(jù)采集就是從現(xiàn)實(shí)世界的數(shù)據(jù)中進(jìn)行采樣,這一過(guò)程就是完成從現(xiàn)實(shí)世界把數(shù)據(jù)轉(zhuǎn)移到我們當(dāng)前任務(wù)環(huán)境中的過(guò)程,值得注意的是,在采樣過(guò)程中,要保證采樣的數(shù)據(jù)分布規(guī)律和現(xiàn)實(shí)世界中的數(shù)據(jù)分布規(guī)律一樣,因?yàn)橹挥羞@樣,采樣得到的數(shù)據(jù)在一定程度上才能能夠代替現(xiàn)實(shí)世界中的數(shù)據(jù)。數(shù)據(jù)標(biāo)注:數(shù)據(jù)標(biāo)注是通過(guò)數(shù)據(jù)標(biāo)注人員借助計(jì)算機(jī)標(biāo)注工具軟件對(duì)人工智能學(xué)習(xí)數(shù)據(jù)進(jìn)行加工的一種行為通常數(shù)據(jù)標(biāo)注的類型包括:數(shù)據(jù)標(biāo)注的類型包括了圖像數(shù)據(jù)標(biāo)注、視頻數(shù)據(jù)標(biāo)注、語(yǔ)音數(shù)據(jù)標(biāo)注、文本數(shù)據(jù)標(biāo)注、3D點(diǎn)云數(shù)據(jù)標(biāo)注。標(biāo)注的方式有人工標(biāo)注、半自動(dòng)標(biāo)注、自動(dòng)標(biāo)注、眾包等。具體選用哪種方式標(biāo)注數(shù)據(jù),要看數(shù)據(jù)量和數(shù)據(jù)的類型,有些通用數(shù)據(jù)是開(kāi)源采樣自動(dòng)標(biāo)注方法的,比如使用訓(xùn)練好的人臉檢測(cè)模型來(lái)標(biāo)注人臉框的位置,而有些特殊數(shù)據(jù)只能使用人工標(biāo)注的方法。數(shù)據(jù)增樣:數(shù)據(jù)增樣一般也稱為數(shù)據(jù)增強(qiáng),如果數(shù)據(jù)在采樣過(guò)程中就已經(jīng)包括了各種復(fù)雜環(huán)境下的數(shù)據(jù),那么可以不用進(jìn)行數(shù)據(jù)增強(qiáng),但是現(xiàn)實(shí)情況是,我們大部分?jǐn)?shù)據(jù)都是不夠完善的,也就是不足以表達(dá)真實(shí)環(huán)境中的數(shù)據(jù)分布情況,這個(gè)時(shí)候重新采集數(shù)據(jù)又比較困難,于是就有了數(shù)據(jù)增強(qiáng)。數(shù)據(jù)清洗:清洗的目的就是清洗掉這部分?jǐn)?shù)據(jù)。其中刪除錯(cuò)誤數(shù)據(jù)可以通過(guò)代碼工具來(lái)實(shí)現(xiàn),也可以人工實(shí)現(xiàn)。數(shù)據(jù)標(biāo)準(zhǔn)化:數(shù)據(jù)標(biāo)準(zhǔn)化是數(shù)據(jù)統(tǒng)一的量度,目的是為了讓不同維度的數(shù)據(jù)適合統(tǒng)一規(guī)則的約束。數(shù)據(jù)標(biāo)準(zhǔn)化不只是發(fā)生在數(shù)據(jù)出入網(wǎng)絡(luò)模型之前,更多的是在網(wǎng)絡(luò)模型中對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化操作。一般來(lái)說(shuō)在數(shù)據(jù)輸入網(wǎng)絡(luò)模型之前,對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理是為了統(tǒng)一原始數(shù)據(jù)的量綱,減小異常數(shù)據(jù)對(duì)于模型訓(xùn)練的影響,更好的獲取數(shù)據(jù)中有效的特征。數(shù)據(jù)處理的流程數(shù)據(jù)收集:海量的數(shù)據(jù)收集是數(shù)據(jù)挖掘的一個(gè)重要環(huán)節(jié),如果沒(méi)有大量的數(shù)據(jù),那么通過(guò)數(shù)據(jù)挖掘獲得的信息極有可能是虛假的、不可靠的。需要收集一切和研究問(wèn)題相關(guān)的數(shù)據(jù),如結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、異構(gòu)數(shù)據(jù)。數(shù)據(jù)預(yù)處理:數(shù)據(jù)預(yù)處理是模型建立前最重要的步驟,準(zhǔn)確整齊的數(shù)據(jù)才能使模型得到可靠結(jié)果,而錯(cuò)誤雜亂的數(shù)據(jù)會(huì)使模型結(jié)果出現(xiàn)較大誤差。首先對(duì)數(shù)據(jù)進(jìn)行抽取,在大量的數(shù)據(jù)中抽取與研究問(wèn)題相關(guān)的數(shù)據(jù)。然后對(duì)數(shù)據(jù)進(jìn)行清洗,包括空缺值和異常值處理。選取的數(shù)據(jù)不一定是正確的,遇到空值時(shí)多使用該數(shù)據(jù)的平均數(shù)或者眾數(shù)來(lái)表示或者填寫符合線性擬合的預(yù)測(cè)值,遇到異常值數(shù)據(jù)通常將其剔除。最后就是數(shù)據(jù)轉(zhuǎn)換,通過(guò)平滑聚集、數(shù)據(jù)概化、規(guī)范化等方式將數(shù)據(jù)轉(zhuǎn)換成適合算法處理的形式。建立模型:建立模型是一個(gè)不斷重復(fù)的過(guò)程,運(yùn)用收集來(lái)的部分?jǐn)?shù)據(jù)多次建模,這部分?jǐn)?shù)據(jù)叫做訓(xùn)練集。使用沒(méi)有進(jìn)行建模的數(shù)據(jù)對(duì)模型精準(zhǔn)度進(jìn)行測(cè)試,這部分?jǐn)?shù)據(jù)叫做測(cè)試集。使用測(cè)試集數(shù)據(jù)對(duì)模型精準(zhǔn)度測(cè)試的結(jié)果不是客觀準(zhǔn)確的,因?yàn)闇y(cè)試集和訓(xùn)練集的數(shù)據(jù)來(lái)自一個(gè)數(shù)據(jù)源,所以還需要與訓(xùn)練集、測(cè)試集不同源的數(shù)據(jù)集對(duì)模型的精準(zhǔn)度再度測(cè)試,這個(gè)數(shù)據(jù)集叫做驗(yàn)證集。模型評(píng)價(jià):將模型建立完成并得出結(jié)果,需要對(duì)模型性能進(jìn)行評(píng)價(jià),判斷模型是否具有推廣價(jià)值,精度是否達(dá)到要求。數(shù)據(jù)挖掘算法建立的模型往往具有很高的準(zhǔn)確度,是測(cè)試集的數(shù)據(jù)和訓(xùn)練集的數(shù)據(jù)同源造成的。模型準(zhǔn)確率高的情況可能有許多未被在意的先前條件,冒然的大范圍推廣會(huì)產(chǎn)生巨大的人力物力損失,所以模型推廣使用要十分謹(jǐn)慎。判斷模型是否可以推廣主要有兩個(gè)方法,一是找專業(yè)的人員或機(jī)構(gòu)進(jìn)行評(píng)價(jià),二是運(yùn)用大量不同來(lái)源的數(shù)據(jù)對(duì)模型進(jìn)行驗(yàn)證,觀察其準(zhǔn)確率是否穩(wěn)定。如果以上條件都滿足或滿足其一,可以小范圍推廣使用模型。使用小范圍推廣模型得到的數(shù)據(jù)與真實(shí)數(shù)據(jù)進(jìn)行比對(duì),如果模型結(jié)果依然準(zhǔn)確,再慢慢擴(kuò)大推廣范圍。多元線性回歸回歸分析(RegressionAnalysis)是統(tǒng)計(jì)學(xué)常常用來(lái)進(jìn)行數(shù)據(jù)分析的方法,其最主要的應(yīng)用就是判斷所給定的兩個(gè)或多個(gè)變量之間是否具有相關(guān)性、構(gòu)建數(shù)學(xué)模型來(lái)進(jìn)行判斷所給出的特殊因子是否對(duì)實(shí)際結(jié)果有著顯著的影響。也就是說(shuō),多元線性回歸方程能夠更好的判斷一個(gè)自變量因子對(duì)因變量的影響。總的來(lái)說(shuō),我們可以使用線性回歸進(jìn)行分析所給定的自變量用來(lái)對(duì)因變量的條件期望進(jìn)行預(yù)測(cè)。線性回歸模型實(shí)際上就是構(gòu)建因變量Y和自變量自變量X之間是否存在相關(guān)性的一個(gè)模型。BP神經(jīng)網(wǎng)絡(luò)模型BP神經(jīng)網(wǎng)絡(luò)是一種常用的機(jī)器學(xué)習(xí)模型,憑借其優(yōu)越的性能使得越來(lái)越多的人對(duì)它進(jìn)行認(rèn)同和驗(yàn)證,到處都能看到它的應(yīng)用。此外,優(yōu)秀的自學(xué)能力也是BP神經(jīng)網(wǎng)絡(luò)模型被廣大人們青睞的一點(diǎn),它可以通過(guò)學(xué)習(xí)逼近任何非線性映射,適用于遙感數(shù)據(jù)的處理。在此基礎(chǔ)上,本章將BP神經(jīng)網(wǎng)絡(luò)方法使用到棉花產(chǎn)量的預(yù)測(cè)中,并使用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)計(jì)算一開(kāi)始的權(quán)重和閾值,以提高產(chǎn)量模型的預(yù)測(cè)性能,農(nóng)業(yè)的智能化的發(fā)展的技術(shù)支持BP神經(jīng)網(wǎng)絡(luò)(BackPropagationNeuralNetwork),這一方法主要是由于將誤差進(jìn)一步的反向傳播到多層前饋網(wǎng)絡(luò),身為使用最多的神經(jīng)網(wǎng)絡(luò)模型之一。BP神經(jīng)網(wǎng)絡(luò)(backpropagationneuralnetwork)是一種依照誤差逆向傳播算法所訓(xùn)練出來(lái)的多層前饋神經(jīng)網(wǎng)絡(luò),它的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)可以劃分為輸入層、隱藏層、輸出層。而當(dāng)它的隱藏層數(shù)目是1的時(shí)候,所構(gòu)建的BP神經(jīng)網(wǎng)絡(luò)將能夠以任意精度逼近預(yù)測(cè)目標(biāo)。由于其不僅作為一種有著先進(jìn)性及優(yōu)越性的機(jī)器學(xué)習(xí)模型,BP神經(jīng)網(wǎng)絡(luò)模型從而常常被廣泛應(yīng)用于各個(gè)領(lǐng)域并逐漸被各個(gè)專家學(xué)者認(rèn)可和采納。而且其憑借其出色的自學(xué)能力使得BP神經(jīng)網(wǎng)絡(luò)算法擁有優(yōu)秀的非線性映射性能、自我學(xué)習(xí)性能、自適應(yīng)性能、以及較強(qiáng)的泛化性能以及不錯(cuò)的容錯(cuò)性能,這些優(yōu)異的能力使得他成為了當(dāng)前被最廣泛使用的神經(jīng)網(wǎng)絡(luò)之一,BP神經(jīng)網(wǎng)絡(luò)其學(xué)習(xí)規(guī)則是使用梯度下降法去修復(fù)權(quán)值閾值,也就是說(shuō)他的工作原理是通過(guò)使用梯度搜索方法讓這個(gè)神經(jīng)網(wǎng)絡(luò)模型計(jì)算出來(lái)的預(yù)測(cè)產(chǎn)出與實(shí)際產(chǎn)出之間差距盡可能的小,進(jìn)而通過(guò)這個(gè)神經(jīng)網(wǎng)絡(luò)模型去計(jì)算出較為精準(zhǔn)的信息。BP神經(jīng)網(wǎng)絡(luò)包含輸入層、輸出層以及隱藏層。在這三層中隱藏層往往是一個(gè)或者是由多個(gè)組成,隱藏層的主要功能是映射的實(shí)現(xiàn),隱藏層和外不一般都沒(méi)有直接的關(guān)聯(lián),但輸入和輸出兩者之間的聯(lián)系往往由其決定。BP神經(jīng)網(wǎng)絡(luò)一般分為只有兩個(gè)階段,信號(hào)進(jìn)行前向傳播處于第一階段,也就是一開(kāi)始從輸入層進(jìn)入隱含層,接著到達(dá)輸出層;誤差的反向傳播處于第二個(gè)階段,即一開(kāi)始是從輸出層通往隱含層,然后到達(dá)輸入層這些過(guò)程會(huì)使得隱含層到輸出層的權(quán)重和偏值進(jìn)行調(diào)整,同時(shí)也會(huì)使得輸入層通往隱含層的權(quán)重與偏值進(jìn)行修正。圖2-1為一個(gè)三層BP神經(jīng)網(wǎng)絡(luò)模型拓?fù)浣Y(jié)構(gòu)示意圖。由這個(gè)圖不難看出BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)它的每一層有著許多個(gè)神經(jīng)元,而且在這每一層神經(jīng)元都只有兩個(gè)相鄰層的神經(jīng)元連結(jié),處于同一層的神經(jīng)元沒(méi)有連結(jié)關(guān)系。
圖2-SEQ圖\*ARABIC\s11BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練主要由正向傳播和誤差反向傳播這兩個(gè)過(guò)程組成,具體的訓(xùn)練過(guò)程可以參考2-2,當(dāng)處于正向傳播時(shí),信號(hào)一般都是由輸入層進(jìn)入網(wǎng)絡(luò),接著在隱藏層中進(jìn)行非線性變換,最終通過(guò)輸出層來(lái)生成輸出信號(hào)。目標(biāo)輸出結(jié)果和實(shí)際輸出結(jié)果之間如果其有著很大的差距,則此時(shí)進(jìn)入反向傳播過(guò)程,也就是把誤差通過(guò)隱含層往輸入層一層一層的傳遞。而進(jìn)行反向傳播時(shí),所計(jì)算出來(lái)的誤差會(huì)分別分配往每一層全部的神經(jīng)單元,借此來(lái)得到每一層神經(jīng)單元之間的誤差信號(hào),憑借這個(gè)誤差信號(hào)為基礎(chǔ)去校對(duì)每一個(gè)單元所占的權(quán)重。如此重復(fù)使用信息正向傳播以及誤差反向傳播的過(guò)程,借此來(lái)不斷修正網(wǎng)絡(luò)中每一層所占的權(quán)重,最后得到目標(biāo)輸出結(jié)果與實(shí)際輸出結(jié)果兩者之間為最小的誤差,此時(shí)便訓(xùn)練終止。圖2-SEQ圖\*ARABIC\s12遺傳算法遺傳算法(GeneticAlgorithm,簡(jiǎn)稱GA)一開(kāi)始是使用計(jì)算機(jī)對(duì)生物系統(tǒng)進(jìn)行研究的一種算法,遺傳算法是一種隨機(jī)全局搜索優(yōu)化方法,它用來(lái)對(duì)處于自然選擇以及遺傳過(guò)程中發(fā)生的現(xiàn)象進(jìn)行模擬,主要是模仿復(fù)制、交叉以及變異這些常見(jiàn)的現(xiàn)象,它的原理是從隨意一個(gè)種群開(kāi)始,接著隨機(jī)進(jìn)行模擬選擇、交叉以及變異這些現(xiàn)象,進(jìn)而使得出現(xiàn)一群能夠適應(yīng)環(huán)境的群體逐漸出現(xiàn),也能夠使得這些選定的群體適應(yīng)環(huán)境的變化,使得其能夠找到更合適它們居住的生活空間,就這樣不斷地適應(yīng)變化,從而能夠得到一個(gè)更優(yōu)異的群體,即這一優(yōu)異的群體就是所要求問(wèn)題的優(yōu)質(zhì)解。遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)流程如圖2-3所示。圖2-SEQ圖\*ARABIC\s13產(chǎn)量預(yù)測(cè)模型建立多元線性回歸模型本文通過(guò)SPSS軟件構(gòu)建多元線性回歸模型。表4-1是通過(guò)該模型所得到的數(shù)據(jù)。通過(guò)該模型得到的和改善后的分別是0.338及0.321,由于該模型所得到的數(shù)值相對(duì)較小。這就表示了多元線性回歸模型用來(lái)進(jìn)行棉花產(chǎn)量預(yù)測(cè)會(huì)使得其只有較低的擬合程度。標(biāo)準(zhǔn)估算的誤差一般指的是通過(guò)比較預(yù)測(cè)所得到的結(jié)果以及和計(jì)算出來(lái)的平均結(jié)果之間存在的誤差,由表可知標(biāo)準(zhǔn)估計(jì)的誤差為221.352。德賓-沃森值是用來(lái)檢驗(yàn)得到的隨機(jī)誤差項(xiàng)之間有沒(méi)有自相關(guān)性的數(shù)據(jù),且這些數(shù)據(jù)的數(shù)值位于0-4之內(nèi),如果所得到的德賓-沃森值接近0或者是4的時(shí)候就說(shuō)明其有著自相關(guān)性,如果得到的數(shù)據(jù)數(shù)值靠近2的時(shí)候就說(shuō)明其不包含自相關(guān)性。構(gòu)建的多元線性回歸模型所得到的德賓-沃森其數(shù)值是1.325,顯然他靠近2,這就說(shuō)明這些隨機(jī)誤差項(xiàng)沒(méi)有自相關(guān)性。模型1R改善后的標(biāo)準(zhǔn)估計(jì)的誤差德賓-沃森0.5820.3380.321221,3521.325表3-SEQ表\*ARABIC\s11不難發(fā)現(xiàn)在表3-1里面最為關(guān)鍵的的兩個(gè)值為F值的大小以及顯著性的值的大小。所構(gòu)建的線性回歸模型能否有實(shí)際用途的兩個(gè)指標(biāo)分別為F值的大小以及顯著性值的大小。顯著性值的大小一般用作于模型中所得到的自變量和因變量?jī)烧咧g能否具有較為明顯的線性關(guān)系的一個(gè)依據(jù)。如果通過(guò)該模型求得的顯著性值低于5%,那么我們就承認(rèn)當(dāng)求得的F值高于Fa(p,m-p-1)的值時(shí)說(shuō)明所構(gòu)建的這個(gè)模型里面的所有的自變量的變化會(huì)導(dǎo)致模型里面的因變量發(fā)生明顯變化,同時(shí)也說(shuō)明所構(gòu)建的該模型有著實(shí)際價(jià)值。Fa(p,m-p-1)里面的p常常用來(lái)表示模型中所包含的自變量個(gè)數(shù),m通常被記做是樣本容量,m-p-1是所構(gòu)建該模型的自由度,a通常被記做是顯著性水平的標(biāo)志(通常0.05為一般數(shù)值)。通過(guò)該模型計(jì)算出來(lái)的Fa(p,m-p-1)值為1.36,由于所得到的F值6.4遠(yuǎn)大于Fa(k,n-k-1)1.48,由表格不難看出該模型的所得到的顯著性的大小為0.000(記0.000就是小于0.001),可以得知所構(gòu)建的多元線性回歸模型里面所包含的自變量與實(shí)際的因變量有著較為良好的線性關(guān)系,也就是說(shuō)所構(gòu)建的多元線性回歸模型包含一定的實(shí)際價(jià)值。所構(gòu)建模型中的線性回歸的平方和指的是模型里面的各個(gè)自變量的回歸值以及所得到的因變量的平均值之間的離差平方和,要說(shuō)明在某一程度上所構(gòu)建的線性回歸模型擬合程度高即為所求得的這一個(gè)值如果它越大。模型中的殘差平方和指的是每個(gè)因變量所對(duì)應(yīng)的數(shù)值與這些因變量所對(duì)應(yīng)的回歸值之間的離差平方和大小。如果模型擬合程度好則說(shuō)明所得到的殘差平方和數(shù)值越小。不難看出所構(gòu)建的多元線性回歸模型其所對(duì)應(yīng)的回歸平方和相對(duì)而言則比較小,而所對(duì)應(yīng)的殘差平方和相對(duì)而言則比較大,這表明所構(gòu)建的多元線性回歸模型具有較差的擬合程度。模型1平方和均方自由度F顯著性殘差22452425.43421421.567563回歸12244758.3462321.578307.4210.000總計(jì)34697183.77593表3-SEQ表\*ARABIC\s12表3-2里面的T值以及顯著性值是用來(lái)評(píng)價(jià)模型中每一個(gè)自變量是否有著較為明顯的影響因變量的能力。如果所求的自變量的顯著性值低于5%,則表明這個(gè)自變量變化有著明顯影響因變量的能力。T值與F值原理相同(T檢驗(yàn)為單樣本)。由3-3不難看出對(duì)棉花單產(chǎn)量有明顯影響的自變量包括7、8月的平均溫度、5、7、10月的平均降雨量、8、9、10月的平均太陽(yáng)光照強(qiáng)度、8、10月的最高溫度和9月最低溫度。表3-3中的B對(duì)應(yīng)建立的多元線性回歸方程中的系數(shù),而這些數(shù)值的正負(fù)號(hào)則表示了這些得到自變量對(duì)棉花單產(chǎn)量的影響呈現(xiàn)的是正向影響還是負(fù)向影響。表格中的標(biāo)準(zhǔn)化系數(shù)值的大小則代表的是這一自變量處于標(biāo)準(zhǔn)情況對(duì)棉花單產(chǎn)的影響程度,如果該數(shù)值所對(duì)應(yīng)的絕對(duì)值越大則說(shuō)明其對(duì)棉花單產(chǎn)的影響程度越大。未標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)化系數(shù)T顯著性B標(biāo)準(zhǔn)誤差Beta不變量970.921475.2442.5350.005五月平均溫度17.412413.4510.2421.4220.412六月平均溫度15.24215.2110.2310,1240.145七月平均溫度43.42317.5730.2330.2650.012八月平均溫度75.45719.5750.3753.0810,015九月平均溫度-18.75216.748-0.142-1.4240.153十月平均溫度-8.68418.6580.048-0.3270.594五月降水量73.74942.3120.1532.3140.026六月降水量11.38128.4140.1240.3210.639七月降水量132.85727.4750.3144.7750.001八月降水量37.23132.5730.0671.4750.342九月降水量-35.34428.853-0.072-0.1220.247十月降水量-140.24541.232-0.175-3.4510.000五月平均光照強(qiáng)度0.4120.6540.0470.7340.573六月平均光照強(qiáng)度1.2400.6390.0581.4780.147七月平均光照強(qiáng)度-1.4730.8590.1481.6580.134八月平均光照強(qiáng)度2.3610.8640.185-1.8470.014九月平均光照強(qiáng)度-2.4510.947-0.128-2.4520.047十月平均光照強(qiáng)度-2.1411.132-0.164-2,4660.025五月最高溫度4,5877.4750.0140.2410.947六月最高溫度0.76911.9470.0050.0680.893七月最高溫度5.47114.7960.0540.4630.758八月最高溫度-22.65713.274-0.187-2.4630.034九月最高溫度-3.4688.236-0.046-0.5420.648十月最高溫度-18.4758.648-0.143-2,3740.032五月最低溫度-4.6587.463-0.147-0.2370.846六月最低溫度-12.7466.743-0.179-1.4750.147七月最低溫度-5.4737.928-0.046-0.8930.257八月最低溫度-25.7587.753-0.068-0.6530.364九月最低溫度14.5747.4730.0951.5760.002十月最低溫度7.1866.6540.0160.2430,465表3-SEQ表\*ARABIC\s13注:表格中的0.000表示的是它的值低于0.001通過(guò)表3-3的數(shù)據(jù)不難建立多元線性回歸方程:把所收集的數(shù)據(jù)代入公式中便可以求出棉花的預(yù)測(cè)產(chǎn)量。圖3-1是回歸標(biāo)準(zhǔn)差殘差的正態(tài)P-P圖。顯然可以看出圖3-1內(nèi)散點(diǎn)均分布在對(duì)角線附近,這就說(shuō)明了所構(gòu)建的模型其殘差基本符合正態(tài)分布,構(gòu)建的線性回歸里面的自變量與因變量的關(guān)系結(jié)果可靠。圖3-SEQ圖\*ARABIC\s11選取新疆北部的石河子市以及新疆南部的阿克蘇市2019-2020年的棉花實(shí)際單產(chǎn)量和所建立模型預(yù)測(cè)單產(chǎn)量進(jìn)行比對(duì)。得到的比較結(jié)果見(jiàn)表3-4。不難看出選取的驗(yàn)證區(qū)域其棉花的的真實(shí)產(chǎn)量比較其預(yù)測(cè)產(chǎn)量其相對(duì)誤差約為10,絕對(duì)誤差值約為181.5,從而可以看出所構(gòu)建的模型其不具有良好的預(yù)測(cè)精度。年份預(yù)測(cè)產(chǎn)量實(shí)際產(chǎn)量絕對(duì)誤差相對(duì)誤差2019石河子市1676.31831.5155.28.4%2019阿克蘇市1769.11957.2188.19.6%2020石河子市1843.51653.2190.311.5%2020阿克蘇市2015.71823.4192.310.5%表3-SEQ表\*ARABIC\s14為了更加準(zhǔn)確的驗(yàn)證建立的模型的準(zhǔn)確度,分別求出通過(guò)這個(gè)模型的預(yù)測(cè)產(chǎn)量和實(shí)際測(cè)量的真實(shí)產(chǎn)量?jī)烧叩木秸`差(MSE)、平均絕對(duì)誤差(MAE)以及平均絕對(duì)百分比誤差(MAPE)計(jì)算公式如下:表示的是棉花的實(shí)際單產(chǎn)量,表示的是模型預(yù)測(cè)的棉花單產(chǎn)量。根據(jù)給定的公式以及結(jié)合上述表格3-4內(nèi)的數(shù)據(jù),不難計(jì)算出來(lái)通過(guò)該模型預(yù)測(cè)出來(lái)產(chǎn)量的均方誤差(MSE)為46672.3、預(yù)測(cè)出來(lái)的平均絕對(duì)誤差(MAE)約為180.2、計(jì)算出來(lái)的平均絕對(duì)誤差(MAPE)約為10.4%。不難看出,這三個(gè)所求的值均偏大。所以可以總結(jié)說(shuō),所建立的多元線性回歸方程只含有較低的擬合度。這個(gè)模型將會(huì)使得預(yù)測(cè)的棉花產(chǎn)量準(zhǔn)確度較低,不適合作為棉花產(chǎn)量預(yù)測(cè)模型BP神經(jīng)網(wǎng)絡(luò)模型記所構(gòu)建的BP神經(jīng)網(wǎng)絡(luò)模型里面的的輸入層、輸出層以及隱藏層,且每一層的層數(shù)都令其為1層。本次實(shí)驗(yàn)使用的氣象因子為平均降雨量、平均溫度、平均光照強(qiáng)度、最高溫度以及最低溫度共5種,模型中使用的各個(gè)氣象因子均選擇的是4-9月的數(shù)據(jù),一共有5*6=30個(gè)輸入數(shù)據(jù),而這個(gè)模型只包含棉花單產(chǎn)量這一個(gè)輸出屬性。即所得到的這個(gè)BP神經(jīng)網(wǎng)絡(luò)模型的有30個(gè)輸入節(jié)點(diǎn),每個(gè)輸出層只有一個(gè)節(jié)。選擇一個(gè)恰當(dāng)?shù)碾[含節(jié)點(diǎn)是模型成功的關(guān)鍵,如果我們所得到較少數(shù)量的隱含層節(jié)點(diǎn)將會(huì)使得使用的算法無(wú)法得到足夠數(shù)量的有用信息,進(jìn)而這將會(huì)對(duì)構(gòu)建的模型精準(zhǔn)度造成很大的影響。當(dāng)隱含層節(jié)點(diǎn)數(shù)目太多,則會(huì)使得所構(gòu)建的模型存在著擬合過(guò)度等棘手問(wèn)題。由于當(dāng)前并不存在一個(gè)較為精準(zhǔn)的公式去計(jì)算隱含層所存在最高的最適節(jié)點(diǎn)數(shù)目。于是實(shí)驗(yàn)通過(guò)使用較多BP神經(jīng)網(wǎng)絡(luò)建模,得到了三個(gè)能夠計(jì)算所包含隱含層節(jié)點(diǎn)個(gè)數(shù)的經(jīng)驗(yàn)公式: ()所得到的三個(gè)公式,其中m是輸出層神經(jīng)元數(shù)目,n是輸入層神經(jīng)元數(shù)目,z則是0-10之間自然數(shù)。本研究拿來(lái)對(duì)BP神經(jīng)網(wǎng)絡(luò)模型計(jì)算隱含層節(jié)點(diǎn)數(shù)目的方法共7個(gè)。通過(guò)分析可知所構(gòu)建的BP神經(jīng)網(wǎng)絡(luò)模型其和5-10月的平均溫度、降雨量、光照強(qiáng)度、最高溫度以及最低溫度有關(guān)。將模型構(gòu)建完畢并對(duì)這個(gè)模型實(shí)際的預(yù)測(cè)結(jié)果實(shí)施綜合評(píng)價(jià),由此來(lái)確定所構(gòu)建的模型的優(yōu)缺點(diǎn)。最后把測(cè)試集得到的預(yù)測(cè)產(chǎn)量數(shù)據(jù)與實(shí)際得到的實(shí)際產(chǎn)量數(shù)據(jù)進(jìn)行比對(duì)并做圖分析。圖3-SEQ圖\*ARABIC\s12實(shí)際產(chǎn)量與預(yù)測(cè)產(chǎn)量散點(diǎn)圖注:橫豎軸單位為千克每公頃圖3-SEQ圖\*ARABIC\s13實(shí)際產(chǎn)量與預(yù)測(cè)產(chǎn)量折線圖注:橫軸單位為組,豎軸單位為千克每公頃圖4-8里面散點(diǎn)的橫坐標(biāo)為實(shí)際產(chǎn)量,縱坐標(biāo)為預(yù)測(cè)產(chǎn)量,圖4-9中橫坐標(biāo)代表數(shù)據(jù)編號(hào),縱坐標(biāo)表示單產(chǎn)量。通過(guò)分析可知所構(gòu)建的模型他所預(yù)測(cè)的產(chǎn)量與實(shí)際產(chǎn)量之間存在較大的差距,也就是說(shuō)明所構(gòu)建的模型不具有較高的預(yù)測(cè)精準(zhǔn)度。為了更好的驗(yàn)證所構(gòu)建的模型能否準(zhǔn)確的預(yù)測(cè)結(jié)果,隨機(jī)抽取7組數(shù)據(jù)從總的56組測(cè)試之中,并通過(guò)計(jì)算該模型計(jì)算出的預(yù)測(cè)產(chǎn)量與實(shí)際產(chǎn)量之間的誤差,見(jiàn)表4-8。顯然可以看出,通過(guò)構(gòu)建BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行棉花產(chǎn)量預(yù)測(cè),通過(guò)這個(gè)模型得到的的預(yù)測(cè)值與實(shí)際產(chǎn)量的值兩者之間有著較大的絕對(duì)誤差以及相對(duì)誤差較大同時(shí)結(jié)果也相對(duì)比較穩(wěn)定。預(yù)測(cè)產(chǎn)量(kg/ha)實(shí)際產(chǎn)量(kg/ha)絕對(duì)誤差相對(duì)誤差1640.21370.5269.719.67%1776.51658.4118.17.1%1758.61900.2141.67.4%1848.12028.7180.68.9%1628.81467.2161.611.1%1900.91749.4151.58.6%1549.31689.3140.08.2%表3-SEQ表\*ARABIC\s15通過(guò)公式上述所給的三個(gè)公式計(jì)算出來(lái)的預(yù)測(cè)產(chǎn)量和實(shí)際產(chǎn)量?jī)烧咧g的均方誤差(MSE)、平均絕對(duì)誤差(MAE)、平均絕對(duì)百分比誤差(MAPE)依次為38943.7、166.1、10.13%,顯然得到的這三項(xiàng)數(shù)值均總體偏大。綜合可知,通過(guò)BP神經(jīng)網(wǎng)絡(luò)模型去預(yù)測(cè)棉花產(chǎn)量結(jié)果穩(wěn)定,精準(zhǔn)度較低,所以該模型不太切合對(duì)棉花單產(chǎn)量進(jìn)行預(yù)測(cè)。最關(guān)鍵的一點(diǎn)是BP神經(jīng)網(wǎng)絡(luò)模型也有許多固有缺陷,最突出的就是拿他來(lái)解決局部最優(yōu)解這一類問(wèn)題。傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)一般使用的都是梯度下降法去修正權(quán)值與閾值,這是由于這一點(diǎn)會(huì)使得它在訓(xùn)練過(guò)程中往往會(huì)陷入局部最優(yōu)解,此外初始權(quán)值對(duì)BP神經(jīng)網(wǎng)絡(luò)模型影響較大,很容易會(huì)使得預(yù)測(cè)精度不足。基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)模型記BP神經(jīng)網(wǎng)絡(luò)輸入層節(jié)點(diǎn)為30個(gè),隱含層節(jié)點(diǎn)為7個(gè),輸出層節(jié)點(diǎn)為1個(gè)。計(jì)算BP神經(jīng)網(wǎng)絡(luò)一共有30*7+1*7=217個(gè)權(quán)值,7+1=8個(gè)閾值,遺傳算法部分所需要優(yōu)化的參數(shù)為217+8=225。遺傳算法中染色體的長(zhǎng)度為225。遺傳算法中的參數(shù)設(shè)置為:最大進(jìn)化代數(shù)為150代、種群規(guī)模為35,交叉概率為0.8,變異概率為0.03。模型的訓(xùn)練集和測(cè)試集比例為9:1(BP神經(jīng)網(wǎng)絡(luò)模型與優(yōu)化模型同時(shí)運(yùn)行使用相同
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 粉末涂料購(gòu)銷合同5篇
- Unit 4 Integration 教學(xué)設(shè)計(jì)2024-2025學(xué)年牛津譯林版英語(yǔ)七年級(jí)上冊(cè)
- 建設(shè)工程承包合同書范本5篇
- 監(jiān)控設(shè)備首件工程施工方案
- 奔龍苗木栽種合同8篇
- 剪力墻防水工程施工方案
- 10《滅火與逃生》教學(xué)設(shè)計(jì)-2023-2024學(xué)年五年級(jí)下冊(cè)科學(xué)青島版
- 第三單元《用大腦思考》教學(xué)設(shè)計(jì)(共3課)-2024-2025學(xué)年科學(xué)新蘇教版一年級(jí)上冊(cè)
- 100以內(nèi)加減法豎式計(jì)算綜合監(jiān)控題帶答案
- 第二單元綜合探究 把握邏輯規(guī)則 糾正邏輯錯(cuò)誤 教學(xué)設(shè)計(jì)-2023-2024學(xué)年高中政治統(tǒng)編版選擇性必修三邏輯與思維
- 全國(guó)川教版信息技術(shù)八年級(jí)下冊(cè)第一單元第2節(jié)《制作創(chuàng)意掛件》信息技術(shù)教學(xué)設(shè)計(jì)
- DL-T-1846-2018變電站機(jī)器人巡檢系統(tǒng)驗(yàn)收規(guī)范
- 重大事故隱患判定標(biāo)準(zhǔn)與相關(guān)事故案例培訓(xùn)課件(建筑)
- 《我的寒假生活》
- 陜2018TJ 040建筑節(jié)能與結(jié)構(gòu)一體化 復(fù)合免拆保溫模板構(gòu)造圖集
- DZ/T 0430-2023 固體礦產(chǎn)資源儲(chǔ)量核實(shí)報(bào)告編寫規(guī)范(正式版)
- (高清版)WST 442-2024 臨床實(shí)驗(yàn)室生物安全指南
- 歷史時(shí)間軸全
- 2019譯林版高中英語(yǔ)全七冊(cè)單詞總表
- 高速行業(yè)網(wǎng)絡(luò)安全與維護(hù)
- 2024年能源電力行業(yè)數(shù)字化轉(zhuǎn)型解決方案
評(píng)論
0/150
提交評(píng)論