數(shù)學建模競賽論文的前兩頁_第1頁
數(shù)學建模競賽論文的前兩頁_第2頁
數(shù)學建模競賽論文的前兩頁_第3頁
數(shù)學建模競賽論文的前兩頁_第4頁
數(shù)學建模競賽論文的前兩頁_第5頁
已閱讀5頁,還剩30頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、2014河南大學第一屆大學生數(shù)學建模競賽承 諾 書我們仔細閱讀了全國大學生數(shù)學建模競賽章程和全國大學生數(shù)學建模競賽參賽規(guī)則(以下簡稱為“競賽章程和參賽規(guī)則”,可從全國大學生數(shù)學建模競賽網(wǎng)站下載)。我們完全明白,在競賽開始后參賽隊員不能以任何方式(包括電話、電子郵件、網(wǎng)上咨詢等)與隊外的任何人(包括指導教師)研究、討論與賽題有關(guān)的問題。我們知道,抄襲別人的成果是違反競賽章程和參賽規(guī)則的,如果引用別人的成果或其他公開的資料(包括網(wǎng)上查到的資料),必須按照規(guī)定的參考文獻的表述方式在正文引用處和參考文獻中明確列出。我們鄭重承諾,嚴格遵守競賽章程和參賽規(guī)則,以保證競賽的公正、公平性。如有違反競賽章程和參

2、賽規(guī)則的行為,我們將受到嚴肅處理。我們授權(quán)全國大學生數(shù)學建模競賽組委會,可將我們的論文以任何形式進行公開展示(包括進行網(wǎng)上公示,在書籍、期刊和其他媒體進行正式或非正式發(fā)表等)。我們參賽選擇的題號是(從A/B/C/D中選擇一項填寫): A 我們的參賽報名號為(如果賽區(qū)設置報名號的話) AS0209 所屬學校(請?zhí)顚懲暾娜?河南大學 參賽隊員 (打印并簽名) :1. 楊亞丹 2. 石玉龍 3. 張增鑫 指導教師或指導教師組負責人 (打印并簽名): (論文紙質(zhì)版與電子版中的以上信息必須一致,只是電子版中無需簽名。以上內(nèi)容請仔細核對,提交后將不再允許做任何修改。如填寫錯誤,論文可能被取消評獎資

3、格。) 日期: 2014 年 6 月 2 日賽區(qū)評閱編號(由賽區(qū)組委會評閱前進行編號):2014河南大學第一屆大學生數(shù)學建模競賽編 號 專 用 頁賽區(qū)評閱編號(由賽區(qū)組委會評閱前進行編號):賽區(qū)評閱記錄(可供賽區(qū)評閱時使用):評閱人評分備注全國統(tǒng)一編號(由賽區(qū)組委會送交全國前編號):全國評閱編號(由全國組委會評閱前進行編號):偏原子電荷的快速預測摘要本文講述的就是尋找了一種方法,根據(jù)原子的拓撲指數(shù)使得能在最短的時間內(nèi)較為準確的預測該原子的偏原子電荷的值。其中的創(chuàng)新點就是類比了模糊聚類分析里面定義相關(guān)系數(shù)的方法處理了如何從多個拓撲指數(shù)里面找到與單個拓撲指數(shù)最相似的那個。問題一,將用訓練集中所給的

4、數(shù)據(jù)進行分組,然后根據(jù)每組數(shù)據(jù)建立一個函數(shù)模型,其次用平均數(shù)的方法求出能夠代表本組拓撲指數(shù)的一個特征拓撲指數(shù),最后用歐式距離法找到與待預測原子的拓撲指數(shù)最相似的那個特征拓撲指數(shù),并找出該特征拓撲指數(shù)所對應的函數(shù)模型,將待預測的拓撲指數(shù)帶入其中便得到它的偏原子電荷的值。問題二,將第一問中得出的偏原子電荷,與實際的偏原子電荷進行比對,利用定義的夾角余弦法計算出兩者之間的相似度,發(fā)現(xiàn)該模型對于訓練集中的數(shù)據(jù)誤差大于測試集中的數(shù)據(jù)的誤差。對此我們也做了兩幅圖直觀將結(jié)果展示出來。問題三,計算預測速度,預測速度也是一個模型的的重要衡量標尺,由此計算建立出來的模型在處理一組數(shù)據(jù)時需要3秒左右,具有很快的計算

5、速度。關(guān)鍵詞:拓撲指數(shù)、函數(shù)模型、特征拓撲指數(shù)、模糊聚類分析、歐式距離、夾角余弦、評價、快速一、問題重述偏原子電荷與原子的很多性質(zhì)密切相關(guān),例如化學位移,因而是科學研究中一個很重要的基礎數(shù)據(jù)。該數(shù)值不能夠直接由實驗測定,而是由量化方法計算,其中一種重要的方法是NBO(Natural Bond Orbital)。但是,量化計算方法耗時太長,不能作為化學信息學軟件(例如chemoffice)的插件,難以為廣大用戶使用?;诖耍梢粋€有商業(yè)競爭力的插件是十分必要的,建立數(shù)學模型是其中重要的一步。請完成下面三個問題:(1)根據(jù)訓練集中的數(shù)據(jù),建立偏原子電荷的數(shù)學模型,以此預測未知原子的偏原子電荷;(

6、2)建立的模型需要采用訓練集和測試集的數(shù)據(jù)進行評價,給出具體的評價方法(例如:相關(guān)系數(shù)(R2)、均方根差(RMSE)與結(jié)果;(3)預測速度也是評價模型的重要標準。因而請給出:用所建立的模型預測測試集中全部原子的偏原子電荷所需的時間。提供的數(shù)據(jù)(H.rar文件):train.txt是訓練數(shù)據(jù)集,test.txt是測試數(shù)據(jù)集。每行代表一個原子的拓撲指數(shù)(第1136列元素)和該原子的偏原子電荷(第137列)。二、問題分析該問題的核心就是基于原有的數(shù)據(jù),如何用數(shù)學模型建立起偏原電子與該原子的拓撲指數(shù)的關(guān)系,并且能達到任給一組拓撲指數(shù),用所建的模型快速預測出其偏原子電荷的效果。對此分了幾個步驟做。(1)

7、首先,對全部數(shù)據(jù)按照偏原電子數(shù)進行從大到小的排列,并根據(jù)偏原電子數(shù)進行適當?shù)膭澐郑卜值?2組,每組數(shù)據(jù)建立一個線性方程組,解得解后用每組解建立一個函數(shù)共得到52個函數(shù)。(2)然后,再建立一個簡單模型整合出每組中所有拓撲指數(shù)的一個代表(就是能夠代表這組拓撲指數(shù)的特征數(shù),在這里我們稱它為特征拓撲指數(shù))。(3)求出所要預測的原子的拓撲指數(shù)與每組特征拓撲指數(shù)的相似度(這里我們?nèi)藶槎x了一個近似度的計算方法),求出最大相似度所對應的那個特征拓撲指數(shù)。(4)最后將所要預測的原子的拓撲指數(shù)帶入那個特征拓撲指數(shù)所對應的方程中,即得到預測的偏原子電荷數(shù)。這就是所建的模型。(5)第二問中要求給出具體評價方法即是

8、在第一問第三步驟中所定義的近似度的方法,因為它解決的就是兩個向量之間的相似度問題,而且我們也將這兩組數(shù)據(jù)畫出圖形,這樣就可以從直觀上和數(shù)值上全面地評價這個模型。對于第三個問題,會運用matlab計算出該模型的預測速度。三、問題假設(1)假設train.txt訓練數(shù)據(jù)集和test.txt測試數(shù)據(jù)集中所給的數(shù)據(jù)都是相對準確的。(2)假設原子的拓撲指數(shù)與偏原子電荷之間有一定的線性關(guān)系。四、符號說明,兩個向量中的元素 ,向量中元素的平均值兩向量之間的夾角兩向量的相關(guān)系數(shù)兩向量之間的距離五、模型建立與求解1分組將數(shù)據(jù)導入到excel里面,根據(jù)偏原子電荷數(shù)從大到小排列,并將排列好的偏原子數(shù)列用matlab

9、畫出圖像。Y=訓練集中的偏原子電荷;X=1:1:3036;Plot(x,y,*)由圖像特殊的點人為的大致劃分三個部分如圖所示,B點以前共分了8組數(shù)據(jù)(每組數(shù)據(jù)不一定相等),B點以后,為了計算方便,平均每60個數(shù)據(jù)分為一組,得到44組數(shù)據(jù),其中最后一個組有26個數(shù)據(jù)。這樣根據(jù)每組數(shù)據(jù)對應的拓撲指數(shù)及假設(2)可以構(gòu)建一個線性方程組CX=D(其中C表示每組數(shù)據(jù)的拓撲指數(shù)所構(gòu)成的矩陣,D表示與每行拓撲指數(shù)所對應的偏原子電荷),進而求出X=CD(X即拓撲指數(shù)的系數(shù)行向量),最終會得到52組X。在這里定義一個函數(shù),形如Y=XA,其中Y是因變量是一個數(shù)表示偏原子電荷數(shù),X是拓撲指數(shù)的系數(shù)行向量,A是自變量

10、,也是一個行向量表示一個原子的拓撲指數(shù)。這樣就得到了52個函數(shù)。(matlab編程見附錄)。2求特征拓撲指數(shù)每組數(shù)據(jù)的拓撲指數(shù)可以看出成一個矩陣(列數(shù)大于行數(shù)),將矩陣的每一列的值相加求平均,得到一行平均數(shù),這一行平均數(shù)我們定義它為就是該組數(shù)據(jù)的特征拓撲指數(shù)。視為它代表了這一組的特征,原因為這組數(shù)據(jù)有相接近的偏原子電荷數(shù)。這樣,就得到了52組特征拓撲指數(shù),而且它與52個函數(shù)一一對應。3定義相似度由于定義的這個相似度是找到最佳的拓撲指數(shù)的關(guān)鍵,尤為重要。所以類比模糊數(shù)學里面的相似系數(shù)的定義方法我們定義了三種方法,然后再測試尋找最優(yōu)方法。(1)夾角余弦法(2)相關(guān)系數(shù)法(3)歐式距離法把每組特征拓

11、撲指數(shù)和待預測的拓撲指數(shù)都看成1行136列的矩陣,每種方法解決的都是待測拓撲指數(shù)與特征拓撲指數(shù)的相似度,方法(1)的cos值的范圍是01且值越接近1說明夾角越小說明兩個向量越相似。同樣方法(2)的r值的范圍也是01,值越靠近1說明越相似。方法(3)的d的值的范圍是0+,d的值越接近0說明兩個向量越接近。經(jīng)多個隨機數(shù)據(jù)(test.txt測試數(shù)據(jù)集里面的數(shù)據(jù))的測試,發(fā)現(xiàn)三種方法做出的結(jié)果都一樣,但是由于方法(3)形式簡單用時最少,所以最終決定用方法(3)即歐氏距離法。4預測找到最佳相似度所對應的那組特征拓撲指數(shù)后也就確定了用哪個方程預測,接下來只需將待預測的這組拓撲指數(shù)帶入對應方程,即得到了它的

12、偏原子電荷數(shù)。(matlab編程見附錄)六、模型評價與結(jié)論1模型評價總體來說,此模型運用了分組歸類法、線性方程組的數(shù)值解法、統(tǒng)計學、模糊數(shù)學等方法,運用的數(shù)學軟件工具有matlab、MathType編輯器,還有excel作為輔助工具。最終得出一套完整的預測方案。該方案最大的優(yōu)點就是快速便捷,我們把所有的的編程匯總到一塊,實現(xiàn)了任意輸入一個拓撲指數(shù),在不到4秒的時間就出現(xiàn)了結(jié)果。這樣就解決了第一問,用夾角余弦法計算出train.txt訓練數(shù)據(jù)集中真實偏原子電荷數(shù)與預測的偏原子電荷數(shù)的cos值為0.8081,test.txt測試數(shù)據(jù)集中真實偏原子電荷數(shù)與預測的偏原子電荷數(shù)的cos值為0.8136。

13、夾角余弦的程序:function =yuxian(M,N)m=length(M);s=0;l=0;k=0;a=abs(sum(M.*N);for i=1:ml=M(i)2+l;k=N(i)2+k;end=a/(sqrt(l*k);如下是誤差圖訓練集中的數(shù)據(jù)誤差圖X=1:3036;Y1=訓練集中的偏原子電荷;Y2=帶入模型后求得的偏原子電荷;Plot(x,y1,+,x,y2,*)測試集中的數(shù)據(jù)誤差圖X=1:1109;Y1=測試集中的給定的偏原子電荷;Y2=帶入模型后預測的偏原子電荷;Plot(x,y1,+,x,y2,*)第二問根據(jù)第三問需要,對程序稍作改動,計算出預測測試集中全部原子的偏原子電荷

14、所需的時間為299秒。(matlab編程見附錄)2模型改進由于預測的數(shù)據(jù)與原數(shù)據(jù)有一定的偏差,說明此模型有進一步的改進空間。由于定義的三種相似度的方法預測結(jié)果都一樣,所以可以改進的地方不在這里,而第一步分組最可能出現(xiàn)問題,如果能找出一種更為恰當?shù)姆纸M方法,那么應該會得到更好的結(jié)果。3模型求解將測試集中的數(shù)據(jù)輸入程序中根據(jù)模型的特征,從所有的模型中找到最相似的,從上面選取對這組數(shù)據(jù)求解時需要用的模型。確定模型之后,求出該模型的每個拓撲指數(shù)所對應的x的值。將需要測試的數(shù)據(jù)B*x就可以得到我們所預測的偏原子電荷。模型推廣1 該模型可以用于預測氣溫,由于氣溫可能由多種因素決定,將這些因素對氣溫的影響考

15、慮進去,再依據(jù)以往天氣的氣溫情況和影響當天氣溫的因素,建立大型的數(shù)據(jù)庫,用這些決定性的因素去擬合以往的氣溫情況,來預測和判斷未來一段時間的氣溫情況,具有較大的可信性和準確性。2 該模型還可以運用于警局篩選犯罪嫌疑人的信息,收集以往犯罪嫌疑人的信息和特征,由這些特征去建立龐大的身份信息庫,在對未來抓捕可能重復作案的犯人時,輸入犯人留下的特征就可以得到和這個犯人具有較大相似程度的犯人信息,警局在對這些信息進行篩選,就會比較容易的確定犯罪重復犯案的嫌疑人。參考文獻1蕭鐵樹 數(shù)學實驗(第二版) 北京: 高等教育出版社 20062韓中庚 數(shù)學建模方法及其應用 北京: 高等教育出版社 20053石生明 高

16、等代數(shù) 北京: 高等教育出版社 附錄:Text1 為測試集Train1 拓撲指數(shù)Train2 偏原子電荷程序一:ticO=load('text1.txt') ;for o=1:1109 B=O(o,:); wopashuiendtoc程序2A= load('train1.txt'); b= load('train2.txt') ;C1= 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.7083 0 0 0 0 0 0 0.2917 0 0 0 0 0 0 0 0 0.1250 0.0417 0.0417 0 0 0

17、.5000 0 0 0.1667 0 0 0.0833 0.0417 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.0833 0.1250 0.1667 0 0 0.2500 0.2917 0 0 0.0833 0 0.0833 0.2083 0.0833 0 0 0 0.2917 0.0417 0 0.0833 0 0 0 0 0 0 0 0 0 0 0 0 0 0.0417 0.1667 0.1667 0.0417 0 0.1250 0.5417 0.0417 0 0.2917 0.1250 0 0.2083 0.0833 0.0417 0 0 0.0

18、833 0.1667 0.0417 0.0417 0 0 0 0.1250 0 0 0 0 0 0 0 0 0;C2= 0.0488 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.9268 0 0 0 0 0 0 0 0 0 0.0244 0 0 0 0 0 0.0732 0.1220 0.0488 0 0 0.4390 0 0 0.1951 0 0 0 0.0244 0 0 0 0 0 0 0 0 0.0732 0 0 0 0 0.0244 0 0 0 0 0 0 0 0.1463 0.1951 0.0488 0 0.2683 0.3659 0 0 0.1707

19、 0.1220 0.0244 0.1220 0.0976 0 0 0 0.1220 0.0488 0.0244 0.2683 0 0 0 0 0.0244 0 0 0 0 0 0 0 0 0.1220 0.1951 0.1707 0 0 0.2683 0.6585 0 0 0.2439 0.1707 0.0244 0.2439 0.0488 0 0.0244 0 0.0732 0.1463 0.0732 0 0 0.0244 0 0.0488 0 0 0.0244 0 0 0.0244 0 0 0;C3= 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.9268

20、 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.0732 0.0976 0.0976 0 0 0.3171 0 0 0.0732 0 0.0488 0.1463 0 0 0 0 0 0 0 0 0 0.0488 0 0 0 0 0.0244 0 0 0 0 0 0 0.0488 0.1220 0.1707 0.0244 0 0.0976 0.3902 0 0 0.1463 0 0.0732 0.1951 0.1220 0 0 0 0.0488 0.0732 0.0488 0.2439 0 0 0 0 0 0 0 0 0 0 0 0 0 0.0976 0.2195 0.2195

21、 0.0244 0 0.2195 0.6341 0 0 0.1707 0.0488 0.0732 0.1707 0.0488 0 0 0 0.0732 0.0488 0.0488 0.0244 0 0.0244 0 0.0976 0 0 0.0244 0 0 0 0 0 0;C4= 0 0.0238 0 0 0 0 0.0952 0 0 0 0 0 0 1.0476 0.2619 0.0238 0 0 0 0.0238 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.2381 0.2619 0.0714 0 0.1190 1.0952 0.0238 0 0.2381 0 0.0

22、952 0.2381 0.0714 0.0476 0.0476 0 0.0238 0.0476 0 0.0238 0 0.0238 0 0.0476 0 0 0.0238 0 0 0 0 0 0 0.0952 0.6190 0.1190 0.0714 0.0476 0.4048 0.6905 0.0238 0 0.3810 0.2381 0.1190 0.5000 0.1905 0.0238 0.0476 0.0238 0.1190 0.2143 0 0.4048 0 0 0 0.1667 0 0 0 0 0.0714 0 0 0 0 0.2143 0.4524 0.3571 0.0476 0

23、.0238 0.2143 0.4286 0.0238 0 0.3333 0.6190 0.0952 0.3333 0.0714 0.0238 0.0238 0.0238 0.1905 0.0238 0.0952 0.1190 0 0 0 0.0952 0 0.0238 0 0 0.0476 0.0238 0 0 0;C5= 0 0.0238 0 0 0 0 0.0952 0 0 0 0 0 0 1.0476 0.2619 0.0238 0 0 0 0.0238 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.2381 0.2619 0.0714 0 0.1190 1.0952

24、0.0238 0 0.2381 0 0.0952 0.2381 0.0714 0.0476 0.0476 0 0.0238 0.0476 0 0.0238 0 0.0238 0 0.0476 0 0 0.0238 0 0 0 0 0 0 0.0952 0.6190 0.1190 0.0714 0.0476 0.4048 0.6905 0.0238 0 0.3810 0.2381 0.1190 0.5000 0.1905 0.0238 0.0476 0.0238 0.1190 0.2143 0 0.4048 0 0 0 0.1667 0 0 0 0 0.0714 0 0 0 0 0.2143 0

25、.4524 0.3571 0.0476 0.0238 0.2143 0.4286 0.0238 0 0.3333 0.6190 0.0952 0.3333 0.0714 0.0238 0.0238 0.0238 0.1905 0.0238 0.0952 0.1190 0 0 0 0.0952 0 0.0238 0 0 0.0476 0.0238 0 0 0;C6= 0 0 0 0 0 0 0.0423 0 0 0 0 0 0 0.7042 0.2394 0 0 0 0 0.0141 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.0141 0.1127 0.1408 0 0 0.0

26、845 0.7887 0 0 0.2394 0 0.1127 0.1127 0.0423 0.0141 0.0423 0 0 0.0141 0 0 0 0 0 0.0282 0 0 0.0423 0 0 0 0 0 0 0.0845 0.1549 0.1831 0 0.0141 0.2817 0.5915 0 0 0.2535 0.1690 0.0563 0.4366 0.1972 0.0282 0 0 0.1408 0.0704 0.0423 0.3099 0 0 0 0.0423 0.0141 0.0141 0 0 0 0 0 0 0 0.0704 0.1831 0.1127 0.0141 0 0.2254 0

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論