全國(guó)31地區(qū)農(nóng)作物數(shù)據(jù)挖掘_第1頁(yè)
全國(guó)31地區(qū)農(nóng)作物數(shù)據(jù)挖掘_第2頁(yè)
全國(guó)31地區(qū)農(nóng)作物數(shù)據(jù)挖掘_第3頁(yè)
全國(guó)31地區(qū)農(nóng)作物數(shù)據(jù)挖掘_第4頁(yè)
全國(guó)31地區(qū)農(nóng)作物數(shù)據(jù)挖掘_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

-.z.31地區(qū)農(nóng)作物數(shù)據(jù)挖掘摘要本文針對(duì)農(nóng)作物種植面積問(wèn)題,運(yùn)用多元統(tǒng)計(jì)分析軟件spss16.0中的聚類和線性回歸,對(duì)31個(gè)地區(qū)農(nóng)作物數(shù)據(jù)進(jìn)展了挖掘。由挖掘出來(lái)的信息,答復(fù)了之前提出的問(wèn)題,給國(guó)家和個(gè)人的決策提供了依據(jù)。關(guān)鍵詞:農(nóng)作物;數(shù)據(jù)挖掘;spss一、問(wèn)題的提出我國(guó)處于溫?zé)岬貛?,眾多省市都適合種植農(nóng)作物,不同地區(qū)之間農(nóng)作物的種類和種植面積也有差異。各地區(qū)之間該如何劃分,劃分之后對(duì)國(guó)家有什么政策性的建議,對(duì)個(gè)人有什么啟示。除了地區(qū)之間的不同,如果按照時(shí)間來(lái)看,不同年份是否有明顯的差異。二、相關(guān)問(wèn)題文獻(xiàn)綜述蔣雪中、趙銳、李強(qiáng)子、*炳方和何隆華〔2002,2〕采用GVG線采樣系統(tǒng),通過(guò)GVG實(shí)地采樣,將其統(tǒng)計(jì)結(jié)果與解譯遙感影像提取的作物種植面積成數(shù)結(jié)果進(jìn)展了比照分析[1]。*炳方和李強(qiáng)子〔2004,11〕采用整群抽樣和樣條采樣技術(shù)相結(jié)合的方法,進(jìn)展農(nóng)作物種植面積估算,在中國(guó)現(xiàn)有的耕地?cái)?shù)據(jù)庫(kù)根底上,根據(jù)兩次抽樣獲得的成數(shù),計(jì)算得到具體*一種農(nóng)作物類別的種植面積[2]。關(guān)于農(nóng)作物種植面積的地區(qū)劃分的研究還很少,進(jìn)展相關(guān)研究有一定的借鑒意義。三、數(shù)據(jù)的搜集和整理為了研究些問(wèn)題,我從中國(guó)統(tǒng)計(jì)年鑒的農(nóng)業(yè)數(shù)據(jù)局部選取了全國(guó)31個(gè)農(nóng)作物生產(chǎn)地區(qū)的農(nóng)作物產(chǎn)量數(shù)據(jù),進(jìn)展數(shù)據(jù)挖掘,希望從數(shù)據(jù)挖掘結(jié)果中得到有用的信息。從中國(guó)統(tǒng)計(jì)年鑒中獲得的數(shù)據(jù)不具備完整的格式,把數(shù)據(jù)轉(zhuǎn)化成E*cel格式,再根據(jù)數(shù)據(jù)的描述性質(zhì)不,分成兩大類,即31地區(qū)農(nóng)作物種植面積數(shù)據(jù)和1978年到2021年農(nóng)作物種植面積。下面是要進(jìn)展挖掘的兩組數(shù)據(jù):數(shù)據(jù)來(lái)源:中國(guó)統(tǒng)計(jì)年鑒四、數(shù)據(jù)挖掘1、數(shù)據(jù)挖掘工具的選取能夠進(jìn)展數(shù)據(jù)挖掘的工具很多,像weka、spss、e*cel等,選擇一款適宜的工具進(jìn)展準(zhǔn)確的信息發(fā)現(xiàn),是至關(guān)重要的。王文敦和*角〔2006,10〕運(yùn)用spss中的主成分、聚類分析和回歸模型,對(duì)海峽西岸各個(gè)城市的綜合質(zhì)量指數(shù)進(jìn)展分析,得到了海峽西岸經(jīng)濟(jì)區(qū)中心的參考城市[3]。趙選民和薛建樓〔2021,2〕從我國(guó)上市房地產(chǎn)公司的財(cái)務(wù)指標(biāo)中選取幾個(gè)核心指標(biāo),利用spss軟件中的聚類分析,對(duì)房地產(chǎn)公司進(jìn)展了劃分,為投資者提供決策依據(jù)[4]。肖生苓、牟娌娜、王維和高曉紅〔2021,8〕通過(guò)建立超市顧客指標(biāo)體系,運(yùn)用k-means算法對(duì)超市顧客進(jìn)展聚類分析,幫助超市企業(yè)準(zhǔn)確識(shí)別不同類型的顧客群,尤其是忠誠(chéng)的高盈利顧客,為超市經(jīng)營(yíng)給出建議[5]。他們都是用spss中的聚類分析進(jìn)展相關(guān)數(shù)據(jù)挖掘,最終也得出了理想的結(jié)果,所以我選用spss中聚類分析進(jìn)展數(shù)據(jù)的分析,另外也運(yùn)用線性回歸進(jìn)展數(shù)據(jù)分析。2、數(shù)據(jù)的帶入和討論我選用的軟件是spss16.0,主要對(duì)兩組數(shù)據(jù)進(jìn)展聚類分析和線性回歸分析[6]。2.1對(duì)31地區(qū)的農(nóng)作物種植面積進(jìn)展分析首先進(jìn)展聚類分析,大局部地區(qū)被劃分為第一類,二三類較少,劃分不明顯,進(jìn)展四類和五類劃分。Case3Clusters16:河南3Case4Clusters16:河南41:北京117:湖北21:北京117:湖北22:天津118:湖南22:天津118:湖南23:河北219:廣東13:河北219:廣東14:山西120:廣西14:山西120:廣西15:**121:海南15:**121:海南16:遼寧122:重慶16:遼寧122:重慶17:吉林123:四川27:吉林123:四川28:**224:貴州18:**324:貴州19:上海125:云南19:上海125:云南110:江蘇226:西藏110:江蘇226:西藏111:浙江127:陜西111:浙江127:陜西112:安徽228:甘肅112:安徽228:甘肅113:福建129:青海113:福建129:青海114:江西130:寧夏114:江西130:寧夏115:山東231:新疆115:山東231:新疆1分成四類時(shí),分類結(jié)果還是第一類比擬多,不是很理想。進(jìn)展第五類劃分,從分類結(jié)果看,這次分類比擬理想,**單屬于5類,**單屬于第4類,**、**、**、**、**、**、**、**、**、**、**和**屬于第三類,**、**、**、**、**、**和**屬于第二類,、**、**、**、**、**、**、**、**和**屬于第一類。Case5Clusters16:河南51:北京117:湖北22:天津118:湖南23:河北219:廣東34:山西320:廣西35:**321:海南16:遼寧322:重慶17:吉林323:四川28:**424:貴州39:上海125:云南310:江蘇226:西藏111:浙江127:陜西312:安徽228:甘肅313:福建129:青海114:江西330:寧夏115:山東231:新疆3接著,進(jìn)展線性回歸分析,從下表中的B和Beta組數(shù)據(jù)可以得出,線性回歸方程的兩種形式,分別是:非標(biāo)準(zhǔn)化回歸方程:Y=88.229+1.128**1+1.042**2+1.180**3+0.838**4+1.509**5+0.328**6+0.976**7+1.248**8+1.017**9+0.835**10+0.194**11標(biāo)準(zhǔn)化回歸方程:Y=0.341**1+0.343**2+0.379**3+0.155**4+0.117**5+0.02**6+0.088**7+0.106**8+0.134**9+0.021**10+0.018**11CoefficientsModelUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.ErrorBeta1(Constant)88.229145.237.607.551稻谷1.128.200.3415.656.000小麥1.042.165.3436.325.000玉米1.180.133.3798.876.000豆類.838.280.1552.989.008薯類1.509.413.1173.658.002花生.328.838.020.392.700油菜籽.976.516.0881.892.074棉花1.248.347.1063.596.002蔬菜1.017.491.1342.070.052茶園面積.8351.070.021.780.445果園面積.194.324.018.600.555ModelsummaryModelRRSquareAdjustedRSquareStd.ErroroftheEstimateDurbin-Watson1.997.993.989387.21942.183ANOVAModelSumofSquaresdfMeanSquareFSig.1Regression4.088E8113.716E7247.858.000Residual2848838.23319149938.854Total4.116E830從Modelsummary表格中R=0.997,可知該回歸方程擬合的質(zhì)量不錯(cuò)。而ANOVA表格中Sig.=0.000,說(shuō)明回歸方程是顯著的?;貧w方程中稻谷、小麥、玉米、薯類和棉花表現(xiàn)顯著,是衡量農(nóng)作物種植面積的重要指標(biāo)。2.2對(duì)年份數(shù)據(jù)進(jìn)展聚類分析和線性回歸分析首先,進(jìn)展聚類分析,把年份分成三、四和五類,如下表。Case3Clusters13:19992Case4Clusters13:199921:1978114:200031:1978114:200032:1980115:200132:1980115:200133:1985116:200233:1985116:200234:1990117:200334:1990117:200335:1991218:200435:1991218:200436:1992219:200536:1992219:200537:1993220:200637:1993220:200638:1994221:200738:1994221:200739:1995222:202139:1995222:2021310:1996223:2021310:1996223:2021411:1997224:2021311:1997224:2021412:1998212:19982Case5Clusters13:199931:1978114:200042:1980115:200143:1985116:200244:1990117:200345:1991218:200446:1992219:200547:1993220:200648:1994221:200749:1995222:2021410:1996323:2021511:1997324:2021512:19983從表中可以看到,所有的類別都是按照時(shí)間的先后順序劃分的,而按照五類劃分最為適宜。能充分的反響國(guó)家農(nóng)業(yè)政策的調(diào)整對(duì)農(nóng)作物種植面積的影響。ModelSummaryModelRRSquareAdjustedRSquareStd.ErroroftheEstimateDurbin-Watson1.999.999.995305.59232.950從表中可以看出,R=0.999,說(shuō)明該回歸方程擬合的質(zhì)量不錯(cuò)。ANOVAModelSumofSquaresdfMeanSquareFSig.1Regression3.931E8172.312E7247.588.000Residual560320.103693386.684Total3.936E823表中Sig.=0.000,小于0.05的顯著水平,認(rèn)為該回歸方程是顯著的。CoefficientsModelUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.ErrorBeta1(Constant)62046.80513171.8124.711.003稻谷1.334.239.6225.579.001小麥.322.376.249.856.425玉米.257.146.2361.762.128豆類.118.051.1312.315.060薯類1.714.378.3584.535.004油類-.4811.125-.250-.427.684花生.9742.629.204.370.724油菜籽.7581.325.241.572.588棉花.150.387.027.388.712麻類-4.6917.357-.260-.638.547黃紅麻5.1347.711.261.666.530糖類-11.13811.275-.768-.988.361甘蔗10.78711.300.803.955.377甜菜14.42913.387.7021.078.322蔬菜1.398.2801.8064.992.002茶園面積3.1121.294.2032.404.053果園面積-.879.365-.600-2.405.053雖然回歸方程式顯著的,但是從這*表中,可以看出,除了稻谷、小麥、薯類和蔬菜表現(xiàn)顯著外,其余各項(xiàng)都不顯著。五、結(jié)論通過(guò)spss軟件中聚類分析和線性回歸分析,我們得到了表格和信息。從31地區(qū)的農(nóng)作物種植面積的聚類分析中,我們認(rèn)識(shí)到**和**是農(nóng)作物種植大省,分別被歸為第五類和第四類。而**、**、**、**、**、**、**、**、**、**、**和**被歸為第三類,**、**、**、**、**、**和**被歸為第二類,、**、**、**、**、**、**、**、**和**被歸為第一類。線性回歸分析中,稻谷、小麥、玉米、薯類和棉花表現(xiàn)最為顯著,是衡量農(nóng)作物種植面積的重要指標(biāo)。所以,國(guó)家在制定農(nóng)業(yè)相關(guān)政策時(shí),要首先考慮到**和**農(nóng)作物種植大省的利益,其次是第二類,第三類,第一類。在給各個(gè)省市定位和制定開展戰(zhàn)略時(shí),也要參考這些指標(biāo)。另外,稻谷、小麥、玉米、薯類和棉花是我們開展農(nóng)業(yè)的重點(diǎn)。而對(duì)我們個(gè)人來(lái)講,則要根據(jù)各省市地區(qū)的農(nóng)業(yè)和工業(yè)情況,選擇優(yōu)勢(shì)行業(yè)進(jìn)展開展,進(jìn)展創(chuàng)業(yè)。從1978年到2021年,農(nóng)作物種植面積的分析中,我們得出隨著社會(huì)的開展,農(nóng)作物種植面積整體上升,這說(shuō)明伴隨著我國(guó)工業(yè)的開展,農(nóng)業(yè)也取得了穩(wěn)步開展,這也從實(shí)際上驗(yàn)證了我國(guó)以農(nóng)業(yè)促進(jìn)工業(yè),工業(yè)反哺農(nóng)業(yè)的理論。而線性回歸分析,再一次的說(shuō)明了稻谷、小麥、薯類、玉米和蔬菜在農(nóng)業(yè)生產(chǎn)中的重要位置。參考文獻(xiàn)[1]蔣雪中,趙銳,李強(qiáng)子,*炳方,何隆華.利用GVG線采樣技術(shù)提取農(nóng)作物種植面積及其精度分析[J].**氣象學(xué)院學(xué)報(bào),2002,(1).[2]*炳方,李強(qiáng)子.基于兩個(gè)獨(dú)立抽樣框架的農(nóng)作

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論