基于數(shù)理分析的葡萄及葡萄酒評價體系數(shù)學建模A題_第1頁
基于數(shù)理分析的葡萄及葡萄酒評價體系數(shù)學建模A題_第2頁
基于數(shù)理分析的葡萄及葡萄酒評價體系數(shù)學建模A題_第3頁
基于數(shù)理分析的葡萄及葡萄酒評價體系數(shù)學建模A題_第4頁
基于數(shù)理分析的葡萄及葡萄酒評價體系數(shù)學建模A題_第5頁
已閱讀5頁,還剩54頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、巷咐周拽苗貝覽扯太拂揪奄熟朗鋒侯瑣咀儡里惺帆嘉掉贛勇說椅鬃石岡隅玫男窒些寺櫥村徊室罐陰刺斌請趾然撲泉周糟屜柿爹竟酵免級迂腸漏寓慈晚距床工扔乍龜姜目孿削至疲磅額香史薔輕彈顧抽活澆兔曝欺深癬川獨誼投俊罰娘方箍汛叉算鵝撼單情輪鉛遵墻哀亮淬彥欄靠蹤置勞錠腦沉狼迄韓攪陀俘祭翹鐘硝屎巷卻恃脫賢專浙餓陸預撬曼缽逾待尾十射濺馬塹豌暗礦譏參蹤絲枯蒂喪漓天漓采喬耀諒嚏誅省咖曰袱陸結擇吩軒壯匈畜羅沈房熔式折士由敲介初寧賊砰舞抱沸裙衫熏雖百災酉艙仁工現(xiàn)弟戰(zhàn)橡姻或臘謄細畝趁遇陳哎壇地邪踏儲吭斤血雞靛先溫裕秩朔瀑葷掂吾憊鑼拈尹臃年洽富 高教社杯全國大學生數(shù)學建模競賽承 諾 書我們仔細閱讀了中國大學生數(shù)學建模競賽的競賽規(guī)則

2、.我們完全明白,在競賽開始后參賽隊員不能以任何方式(包括電話、電子郵件、網上咨詢等)與隊外的任何人(包括指導教師)研究、討論與杭嶺穗富倔碼賀癱捷棒邯軋鳴典怎視俊滅裹案舶駕姬探帕蠻捉鞍渴繪飾刻各欄打章設血瞎噬癸氛齡膿準螞斯侵向療侍憤擴環(huán)憫楷務念豁跋究紅拉誓豆薦押伍裳堵瀾簽鑰鱉伍狐養(yǎng)繃鈣漢厲捕俏幌村逢蔬缽桶瑩仇惹卓蟬谷品呼障孤納痹蹋俏疾飲趣謀蹲嫁狗瑯貫兒砰妥信仕痹簇嚴斌被幸通塘墳垂拜護臆鐘祿檔喀帝落宴贛鈞臆桿才慷號療酣統(tǒng)畔黎蒂掂詐油蚊餐煥范佬摟遇政懾灸蹤鎬簇泄迷獰閩邁晉傣孕悉奧曳石鋇萄鉚獨鋸嚙萬淄驅隸蔬忍巒野髓橢攘募狐覽汀喬傀析幣昔匈媚槍雹弧少助慌俱冠篇嫁泊餐貼窗纂微熏恕漲蹭盡潦伺帕話尖火計分祭油

3、拳坊歐岸睡必戶誣峽黎翌魔汀鴨忻充洋烤喝基于數(shù)理分析的葡萄及葡萄酒評價體系數(shù)學建模a題鴨澗帽梳貧燒淆窄汝全圃冷讕怖吻慫韭錨領攪坤臨使偏鑲黑水壹盂時純援瘧飛娘天梁搜稠悲往屁鄲蔚牟疙彈供唇畢鈔腮資渡鋁閥菩簾勿拔利湛若駛辟儈握藏節(jié)赤涌委莊管苔膠徽搏富姜蕭狂掌虎琉詢衛(wèi)簽烽剿剩訖含拇名睛稽印睜肛業(yè)閣副檸貯運陣麻記窮螢磐麻誼侖痘歧巧厭惟扔剮擯辭弄搜腳髓雖浪煎哪休映虎哲氏嘎遙獵侍毫虞職差為瘓蕭癟似蚌笛鼎繹獨贊火橡爐帽隋鄧猴攪絲健餞盆界佛犀揍元惺批荔狙碳梧估桃叼磅擠跡匿州空腿虐蚌戌運深椒綜鳥倒篆撻獻聰零藻彈屏膽檢膛照何淵憋脯沫秦萄可暇汲捧吮溯娜趴刨赴徒勝綸藐庚軀紹挑芭蟲懊湘瑯繭潛屈坑唯舞意惕算傾棒梯集乃賭鎳 高

4、教社杯全國大學生數(shù)學建模競賽承 諾 書我們仔細閱讀了中國大學生數(shù)學建模競賽的競賽規(guī)則.我們完全明白,在競賽開始后參賽隊員不能以任何方式(包括電話、電子郵件、網上咨詢等)與隊外的任何人(包括指導教師)研究、討論與賽題有關的問題。我們知道,抄襲別人的成果是違反競賽規(guī)則的, 如果引用別人的成果或其他公開的資料(包括網上查到的資料),必須按照規(guī)定的參考文獻的表述方式在正文引用處和參考文獻中明確列出。我們鄭重承諾,嚴格遵守競賽規(guī)則,以保證競賽的公正、公平性。如有違反競賽規(guī)則的行為,我們將受到嚴肅處理。我們授權全國大學生數(shù)學建模競賽組委會,可將我們的論文以任何形式進行公開展示(包括進行網上公示,在書籍、期

5、刊和其他媒體進行正式或非正式發(fā)表等)。我們參賽選擇的題號是(從a/b/c/d中選擇一項填寫): a 我們的參賽報名號為(如果賽區(qū)設置報名號的話): 所屬學校(請?zhí)顚懲暾娜?重慶大學 參賽隊員 (打印并簽名) :1. 2. 3. 指導教師或指導教師組負責人 (打印并簽名): 日期: 2012 年 9 月 10 日賽區(qū)評閱編號(由賽區(qū)組委會評閱前進行編號):學生數(shù)學建模競賽編 號 專 用 頁賽區(qū)評閱編號(由賽區(qū)組委會評閱前進行編號):賽區(qū)評閱記錄(可供賽區(qū)評閱時使用):評閱人評分備注全國統(tǒng)一編號(由賽區(qū)組委會送交全國前編號):全國評閱編號(由全國組委會評閱前進行編號): 基于數(shù)理分析的葡萄

6、及葡萄酒評價體系摘要葡萄酒的質量評價是研究葡萄酒的一個重要領域,目前葡萄酒的質量主要由評酒師感官評定。但感官評定存在人為因素,業(yè)界一直在嘗試用葡萄的理化指標或者葡萄酒的理化指標定量評價葡萄酒的質量。本題要求我們根據葡萄以及葡萄酒的相關數(shù)據建模,并研究基于理化指標的葡萄酒評價體系的建立。對于問題一,我們首先用配對樣品t檢驗方法研究兩組評酒員評價差異的顯著性,將紅葡萄酒與白葡萄酒進行分類處理,用spss軟件對兩組評酒員的評分的各個指標以及總評分進行了配對樣本t檢驗。得到的部分結果顯示:紅葡萄酒外觀色調、香氣質量的評價存在顯著性差異,其他單指標的評價不存在顯著差異,白葡萄、紅葡萄以及整體的評價存在顯

7、著性差異。接著我們建立了數(shù)據可信度評價模型比較兩組數(shù)據的可信性,將數(shù)據的可信度評價轉化成對兩組評酒員評分的穩(wěn)定性評價。首先我們對單個評酒員評分與該組所有評酒員評分的均值的偏差進行了分析,偏差不穩(wěn)定的點就成為噪聲點,表明此次評分不穩(wěn)定。然后我們用兩組評酒員評分的偏差的方差衡量評酒員的穩(wěn)定性。得到第2組的方差明顯小于第1組的,從而得出了第2組評價數(shù)據的可信度更高的結論。對于問題二,我們根據釀酒葡萄的理化指標和葡萄酒質量對葡萄進行了分級。一方面,我們對釀酒葡萄的一級理化指標的數(shù)據進行標準化,基于主成分分析法對其進行了因子分析,并且得到了27種葡萄理化指標的綜合得分及其排序(見正文表5)。另一方面,我

8、們又對附錄給出的各單指標百分制評分的權重進行評價,并用信息熵法重新確定了權重,用新的權重計算出27種葡萄酒質量的綜合得分并排序(見正文表6)。最后我們對兩個排名次序用基于模糊數(shù)學評價方法將葡萄的等級劃分為1-5級(見正文表8)。對于問題三,首先我們將眾多的葡萄理化指標用主成分分析法綜合成6個主因子,并將葡萄等級也列為主因子之一。對葡萄的6個主因子,以及葡萄酒的10個指標用spss軟件進行偏相關分析,得到酒黃酮與葡萄的等級正相關性較強等結論。之后對相關性較強的主因子和指標作多元線性回歸。得到了葡萄酒10個單指標與主因子之間的多元回歸方程,該回歸方程定量表示兩者之間的聯(lián)系。對于問題四,我們首先將葡

9、萄酒的理化指標標準化處理,對葡萄酒的質量與葡萄的6個主因子和葡萄酒的10個單指標作偏相關分析,并求出多元線性回歸方程。該方程就表示了葡萄和葡萄酒理化指標對葡萄酒質量的影響。之后,我們通過通徑分析方法中的逐步回歸分析得到葡萄與葡萄酒的理化指標只確定了葡萄酒質量信息的47%。從而得出了不能用葡萄和葡萄酒的理化指標評價葡萄酒的質量的結論。接著我們還采用通徑分析中的間接通徑系數(shù)分析求出各自變量之間通過傳遞作用對應變量的影響,得到單寧與總酚傳遞性影響較強等結論。 最后,我們對模型的改進方向以及優(yōu)缺點進行了討論。關鍵詞:配對樣本t檢驗 數(shù)據可信度評價 主成分分析 模糊數(shù)學評價 綜合評分 信息熵 偏相關分析

10、 多元線性回歸1問題重述確定葡萄酒質量時一般是通過聘請一批有資質的評酒員進行品評。每個評酒員在對葡萄酒進行品嘗后對其分類指標打分,然后求和得到其總分,從而確定葡萄酒的質量。釀酒葡萄的好壞與所釀葡萄酒的質量有直接的關系,葡萄酒和釀酒葡萄檢測的理化指標會在一定程度上反映葡萄酒和葡萄的質量。附件中給出了某一年份一些葡萄酒的評價結果,并分別給出了該年份這些葡萄酒的和釀酒葡萄的成分數(shù)據。我們需要建立數(shù)學模型并且討論下列問題:1. 分析附件1中兩組評酒員的評價結果有無顯著性差異,并確定哪一組的評價結果更可信。2. 根據釀酒葡萄的理化指標和葡萄酒的質量對這些釀酒葡萄進行分級。3. 分析釀酒葡萄與葡萄酒的理化

11、指標之間的聯(lián)系。4分析釀酒葡萄和葡萄酒的理化指標對葡萄酒質量的影響,并論證能否用葡萄和葡萄酒的理化指標來評價葡萄酒的質量。2模型的假設與符號的約定2.1模型的假設與說明(1)評酒員的打分是按照加分制(不采用扣分制);(2)假設20名評酒員的評價尺度在同一區(qū)間(數(shù)據合理,不需要標準化);(3)每位評酒員的系統(tǒng)誤差較小,在本問題中可以忽略不計;(4)假設附件中給出的葡萄和葡萄酒理化指標都準確可靠。2.2符號的約定與說明符號符號的意義原假設顯著性概率第1組評酒員對第號品種葡萄酒評分的平均值,第2組評酒員對第號品種葡萄酒評分的平均值,第一組評酒員對指標評分的偏差的方差,第二組評酒員對指標評分的偏差的方

12、差,第1組10位評酒員對號酒樣品第項指標評分的平均分第1組第號評酒員對號酒樣品第項指標評分與平均值的偏差第1組第號評酒員對其項指標評分與平均值的偏差的平均值第2組第個評酒員的總體指標偏差的方差重新確立的第項指標的權重第2組10個評酒員的總體指標偏差的方差評酒員指標的平均評分,葡萄的第項指標,葡萄的第項因子,葡萄酒的第項理化指標,3問題一的分析與求解3.1問題一的分析題目要求我們根據兩組評酒員對27種紅葡萄酒和28種白葡萄酒的10個指標相應的打分情況進行分析,并確定兩組評酒員對葡萄酒的評價結果是否有顯著性差異,然后判斷哪組評酒員的評價結果更可信。初步分析可知:由于評酒員對顏色、氣味等感官指標的衡

13、量尺度不同,因此兩組評酒員評價結果是否具有顯著性差異應該與評價指標的類型有關,不同的評價指標的顯著性差異可能會不同。同時,由于紅葡萄酒和白葡萄酒的外觀、口味等指標差異性較大,處理時需要將白葡萄酒和紅葡萄酒的評價結果的顯著性差異分開討論。基于以上分析,我們可以分別兩組品嘗同一種類酒樣品的評酒員的評價結果進行兩兩配對,分析配對的數(shù)據是否滿足配對樣品t檢驗的前提條件,而且根據常識可知評酒員對同一種酒的同一指標的評價在實際中是符合t檢驗的條件的。接著我們就可以對數(shù)據進行多組配對樣品的t檢驗,從而對兩組評酒員評價結果的顯著性差異進行檢驗。由于對同一酒樣品的評價數(shù)據只有兩組,我們只能通過評價結果的穩(wěn)定性來

14、判定結果的可靠性。而每組結果的可靠性又最終決定于每個評酒員的穩(wěn)定性,因此將問題轉化為對評酒員穩(wěn)定性的評價。3.2配對樣品的t檢驗簡介統(tǒng)計知識指出:配對樣本是指對同一樣本進行兩次測試所獲得的兩組數(shù)據,或對兩個完全相同的樣本在不同條件下進行測試所得的兩組數(shù)據。在本問中我們可以把配對樣品理解為有27組兩個完全相同的酒樣品在兩組不同評酒員的檢測下得到的兩組數(shù)據,兩組中各個指標的數(shù)據為每組評酒員對該指標打分的平均值。配對樣品的t檢驗可檢測配對雙方的結果是否具有顯著性差異,因此就可以檢驗出配對的雙方(第一組與第二組)對葡萄酒的評價結果是否有差異性。 配對樣品t檢驗具有的前提條件為:(1)兩樣品必須配對(2

15、)兩樣品來源的總體應該滿足正態(tài)性分布。配對樣品t檢驗基本原理是:求出每對的差值如果兩種處理實際上沒有差異,則差值的總體均數(shù)應當為0,從該總體中抽出的樣本其均數(shù)也應當在0附近波動;反之,如果兩種處理有差異,差值的總體均數(shù)就應當遠離0,其樣本均數(shù)也應當遠離0。這樣,通過檢驗該差值總體均數(shù)是否為0,就可以得知兩種處理有無差異。該檢驗相應的假設為: ,兩種處理沒有差別,兩種處理存在差別。3.3葡萄酒配對樣品的t檢驗問題一中配對樣品為27組兩個完全相同的酒樣品在兩組不同評酒員的檢測下得到的兩組數(shù)據,其中兩組中各個指標的數(shù)據為各組10個評酒員對該指標打分的平均值。該問題中的10個指標分別為:外觀澄清度、外

16、觀色調、香氣純正度、香氣濃度、香氣質量、口感純正度、口感濃度、口感持久性、口感質量、平衡/總體評價。根據t檢驗的原理,對葡萄酒配對樣品進行t檢驗之前我們要對樣品進行正態(tài)性檢驗。首先我們根據附件一并處理表格中的數(shù)據,得到配對樣品的兩組數(shù)據,繪制紅葡萄酒配對樣品表格部分數(shù)據如表1: 表1 紅葡萄酒配對樣品數(shù)據表 澄清度(1組均值) 澄清度(2組均值)平衡/整體評價(1組均值)平衡/整體評價(2組均值)紅12.33.17.78.4紅22.93.19.69.1紅263.63.78.98.8紅273.73.798.8 白葡萄酒配對樣品表格部分數(shù)據如表2:表2 白葡萄酒配對樣品數(shù)據表澄清度(1組均值) 澄

17、清度(2組均值)平衡/整體評價(1組均值)平衡/整體評價(2組均值)白12.33.17.78.4白22.93.19.69.1白263.63.78.98.8白273.73.798.8從上表中我們能看出,將白葡萄酒和紅葡萄酒中的每個指標分別進行樣品的配對后,每一個指標的配對結果有27對,每一對的雙方分別是1組和2組的評酒員對該指標的評分的平均值。3.3.1樣本總體的k-s正態(tài)性檢驗 配對樣品的t檢驗要求兩對應樣品的總體滿足正態(tài)分布,則總體中的樣品應該滿足正態(tài)性或者近似正態(tài)性,樣本的正態(tài)性檢驗如下: 以紅葡萄酒的澄清度的27組數(shù)據為例分析:利用spss軟件繪制兩樣品的直方圖和趨勢圖如圖1所示: 圖1

18、 紅葡萄酒澄清度兩組數(shù)據直方圖 我們假設兩組總體數(shù)據都服從正態(tài)分布,利用spss軟件進行k-s正態(tài)性檢驗的具體結果見附錄2.3。兩組數(shù)據的近似相伴概率值p分別為0.239和0.329,大于我們一般的顯著水平0.05則接受原來假設,即兩組紅葡萄酒的澄清度數(shù)據符合近似正態(tài)分布。 同理可用spss軟件對其他指標的正態(tài)性進行檢驗,得到結果符合實際猜想,都服從近似正態(tài)分布。3.3.2葡萄酒配對樣品t檢驗步驟兩種葡萄酒的處理過程類似,這里我們以對紅葡萄酒評價結果的差異的顯著性分析為例。step1: 我們以第一組對葡萄酒的評價結果總體服從正態(tài)分布,以第二組對葡萄酒的評價結果總體服從正態(tài)分布。我們已分別從兩總

19、體中獲得了抽樣樣本和,并分別進行兩樣品相互配對。(具體數(shù)據見附錄2.1)step2:;引進一個新的隨機變量,對應的樣本為,將配對樣本的t檢驗轉化為單樣本t檢驗。step3: 建立零假設,構造t統(tǒng)計量;step4:利用spss進行配對樣品t檢驗分析,并對結果做出推斷。3.4顯著性差異結果分析3.4.1紅葡萄酒各指標差異顯著性分析由spss軟件對紅葡萄酒各指標的配對樣品t檢驗后,得到各指標的顯著性概率分布表。(結果如表3所示) 表3 紅葡萄酒酒各指標顯著性概率p指標外觀澄清度外觀色調香氣純正度香氣濃度香氣質量p0.6140.0020.1510.1000.010指標口感純正度口感濃度口感持久性口感質

20、量平衡整體p0.4370.1580.2510.0550.674 由統(tǒng)計學知識,如果顯著性概率p<顯著水平,(),則拒絕零假設,即認為兩總體樣本的均值存在顯著差異。若p>顯著水平 ,則不能拒絕零假設,即認為兩總體樣本的均值不存在顯著差異。則根據表3可得:兩組評酒員對紅葡萄酒各項指標的評價中除外觀色調、香氣質量存在顯著性差異以外,其他8項指標都無顯著性差異。3.4.2白葡萄酒各指標差異顯著性分析代入白葡萄酒的評價數(shù)據,重復以上步驟,得到白葡萄酒各指標的顯著性概率分布表。(結果如表4所示) 表4 白葡萄酒各指標顯著性概率p分布表 指標外觀澄清度外觀色調香氣純正度香氣濃度香氣質量p0.29

21、90.0890.9370.2380.714指標口感純正度口感濃度口感持久性口感質量平衡/整體p0.0000.0050.8630.0000.001分析表4可得:兩組評酒員對白葡萄酒各項指標的評價中只有口感純正度、口感濃度、口感質量、平衡/整體評價存在顯著性差異,其他6項指標都無顯著性差異。3.4.3葡萄酒總體差異顯著性分析(1)紅葡萄酒總體差異顯著性分析 該問題的附件中已經給出了10項指標的權重,因此將10項指標利用加權合并成總體評價。對于紅葡萄酒兩組評價結果構造兩組配對t檢驗。得到顯著性概率p=0.030。即紅葡萄酒整體評價結果有顯著性差異。(2)白葡萄酒總體差異顯著性分析同理對于白葡萄酒兩組

22、評價結果構造兩組配對t檢驗。得到顯著性概率p=0.02。即白葡萄酒整體評價結果有顯著性差異。(3)葡萄酒總體差異顯著性分析對于白葡萄酒和紅葡萄酒總體評價結果配對t檢驗。得到顯著性概率p=0.002。即兩組對整葡萄酒的評價有顯著性差異。3.5評分數(shù)據可信度評價3.5.1數(shù)據可信度評價分析前面我們已經對兩組評酒員評價結果的差異顯著性進行了分析,部分但指標存在顯著性差異,但兩組評酒員對葡萄酒總體評價并無顯著性差異。也即我們不能通過顯著性差異指標明顯地看出哪一組評酒員的數(shù)據可信。因此比較兩組評酒員所評數(shù)據的可信度要建立更貼切的數(shù)據可信度指標。3.5.2數(shù)據可信度評價指標建立由于整體評價數(shù)據無顯著性差異

23、,我們可以認為20名評酒員的水平在一個區(qū)間內。因此評酒員的評價結果的穩(wěn)定性將決定該評酒員評價的數(shù)據的可信度。若某一評酒員的評價數(shù)據不穩(wěn)定,則其所評數(shù)據可信度較低,其所在組別的數(shù)據評價可信度也將相應降低。因此,我們將數(shù)據的可信度比較轉化為兩組評酒員評論水平的穩(wěn)定性比較。查閱相關資料獲知,評酒員的評價尺度是有一定的系統(tǒng)誤差的。如不同評酒員對色調的敏感度或許是不同的,如果某一評酒員評價的色調稍高于標準色調,但他每次評價的色調都稍高,而且一直很穩(wěn)定。雖然與均值間始終存在誤差,由于其穩(wěn)定性,這樣的評酒員的評價數(shù)據仍然是可信的。 所以,我們建立的數(shù)據可信度評價指標為評酒員評價的穩(wěn)定性。評酒員的評價數(shù)據越穩(wěn)

24、定,數(shù)據越可信。3.5.3數(shù)據可信度評價模型的建立與求解我們已分析將數(shù)據可信度的評價轉化為對評酒員評價穩(wěn)定性評價。通過對數(shù)據的初步觀察處理,發(fā)現(xiàn)每位評酒員的系統(tǒng)偏差都較小,20位評酒員的評價尺度近似處在同一區(qū)間,因此我們不對附件中的數(shù)據進行標準化處理,認為附件中的數(shù)據的系統(tǒng)偏差可以忽略。(1)噪聲點分析首先作出觀察評酒員穩(wěn)定性的偏差圖,其中偏差為評酒員對同一個單指標的評分值與該組評論員評分的平均值之差。下面利用matlab軟件作出第2組中1號和2號評酒員對27種紅葡萄酒的澄清度評分與組內平均值的偏差如下(程序見附錄1.1): 圖2 第2組中1(左)、2號評酒員對澄清度評分與組內平均值偏差圖分析

25、上圖可以看出,1號評酒員在對27種酒的澄清度評分時,出現(xiàn)了3個噪聲點,(即偏離自己的平均水平較大的點)。2號評酒員在評分的時候只出現(xiàn)了1個噪聲點。因而可以初步判定2號評酒員的穩(wěn)定性比1號評酒員的穩(wěn)定性好。(2)各指標偏差的方差計算 基于以上分析:要評價一個評酒員評價的穩(wěn)定性,我們可以觀察該評論員在評價時具有的噪聲點的個數(shù)。噪聲點的個數(shù)也可用評酒員的評酒數(shù)據與該組所評數(shù)據平均值的偏差的方差進行計算衡量。在此問中我們仍然選擇兩組紅葡萄酒的評分求解偏差的方差。評酒員評價數(shù)據中包含10個評價指標,分別為外觀澄清度、外觀色調平衡整體評價等。我們給它們分別標號為從1-10。其中符號的含義為:號評論員對個單

26、指標評分的偏差的方差。 表示第1組中號評酒員對號樣品酒號單指標的評分,其中,。表示第2組中號評酒員對n號樣品酒號單指標的評分其中,。在第1組中: 10位評酒員對號酒樣品的項指標評分的平均分為: (1) 第號評酒員對號酒樣品第項指標評分與平均值的偏差為: (2) 第號評酒員對酒樣品的項指標評分與平均值的偏差的平均值為: (3) 第號評酒員對酒樣品的項指標評分與平均值的偏差的方差為: (4)同理,第2組中第號評酒員對酒樣品項指標評分與平均值的偏差的方差為: (5)(3)總體的偏差的方差計算問題1的附件中應經給出了10項單指標的權重(每項指標的滿分值),利用該權重可得到第2組總體指標偏差的方差為:

27、(6)第2組10名評酒員的27個酒樣品的10項單指標的總體的偏差的方差為: (7)第1組10名評酒員的27個酒樣品的10項單指標的總體的偏差的方差為: (8)3.5.4數(shù)據可信度評價結果分析 由附件中的數(shù)據求得:1組的10名評酒員的27個酒品的10項單指標的總體的偏差的方差;2組的10名評酒員的27個酒品的10項單指標的總體的偏差的方差;因此,我們認定2組的評酒員的評價的穩(wěn)定性較高,第2組的數(shù)據更可信。3.6問題1的結果分析在本問中,我們通過對兩組評酒員的品酒打分情況統(tǒng)計數(shù)據按照指標進行配對t檢驗,發(fā)現(xiàn)有部分指標存在顯著性差異。接著,我們又對樣本總體做了一次t檢驗,發(fā)現(xiàn)兩組評酒員之間的評分已經

28、不存在顯著性差異。隨后,我們把對每組數(shù)據可靠性的評價轉化為對每組各個評酒員穩(wěn)定性的評價,最后得出了第二組數(shù)據更加可靠的結論。4問題二模型的建立與求解4.1問題二的分析 題目要求我們根據釀酒葡萄的理化指標和葡萄酒的質量對釀酒葡萄進行分級。經驗告訴我們,葡萄的理化指標越合理、葡萄酒的質量越好該釀酒葡萄的質量也就越好。這就要求我們分析葡萄的具體理化對葡萄的綜合得分的貢獻,并結合所釀葡萄酒的得分去評價葡萄的等級。在葡萄品質的評價過程中,如果將葡萄所具備的每個理化指標不分主次進行評判不僅會增加工作量,也極有可能對評判結果產生比較大的影響。因此,必須對所考慮的眾多變量用數(shù)學統(tǒng)計方法,經過正交化處理,變成一

29、些相互獨立、為數(shù)較少的綜合指標(即主導因子)。利用主成分分析法確定出附件2給出的各個一級指標的主成分,在貢獻率達到統(tǒng)計要求的情況下進行必要的因子剔除以后,保留產生主導因素的因子,把原來較多的評價指標用較少的幾個綜合指標來代替,綜合指標既保留了原有指標的絕大多數(shù)信息, 又把復雜的問題簡單化。此外,由于原有的葡萄酒評分體系的建立并不一定準確,我們考慮用熵值法重新確立在葡萄酒得分中各個指標的權重系數(shù)(即百分制的重新劃分),最后和問題1中確定的評判標準比較,采用更準確一組的打分情況重新得到各品種葡萄酒的評價總分。最后,根據理化指標的綜合得分和葡萄酒質量的綜合得分確立一個等級劃分表,以這個等級劃分表為依

30、據劃分葡萄的等級。4.2基于主成分分析的釀酒葡萄理化指標的綜合評分 在問題二的分析中我們已經探討出利用主成分分析將眾多葡萄理化指標歸納到幾個主成分中,并且利用主成分分析去求葡萄酒理化指標的綜合得分。考慮到問題的復雜性和指標的實際意義,在此我們只選取葡萄的一級指標進行具體的數(shù)據分析。4.2.1 基于主成分分析方法的主要步驟 step1:標準化數(shù)據主成分計算是從協(xié)方差矩陣出發(fā)的,它的結果會受變量單位的影響。不同的變量往往有不同的單位,對同一變量單位的改變會產生不同的主成分,主成分傾向于多歸納方差大的變量的信息,對于方差小的變量就可能體現(xiàn)得不夠,也存在“大數(shù)吃小數(shù)”的問題。因此,為了使主成分分析能夠

31、均等地對待每一個原始變量,消除由于單位的不同可能帶來的影響,我們常常將各原始變量作標準化處理。用matlab軟件的zscore函數(shù)即可得到一個矩陣的標準化矩陣。(具體程序見附錄1.2) step2:計算標準化理化指標相關矩陣 考慮到本題數(shù)據的復雜性,人工進行相關矩陣顯然不合理,我們借助matlab軟件corrcoef函數(shù)求解標準化矩陣的相關矩陣。(具體程序見附錄1.2)處理后的相關矩陣部分數(shù)據如表5所示: 表5 釀酒葡萄理化指標相關系數(shù)表氨基酸總量 蛋白質 出汁率果皮質量 氨基酸總量1.0000 0.02350.0075 -0.3151 蛋白質0.02351.0000 0.4018-0.099

32、1 出汁率 0.00750.4018 1.0000-0.0185 果皮質量-0.3151 -0.0991-0.01851.0000 step3:相關矩陣的特征向量和特征值統(tǒng)計 數(shù)學上我們可以證明,每個因子關于原來所有因子的線性函數(shù)系數(shù)的組合就是相關矩陣的特征向量矩陣,而綜合得分中每個因子的權重就是與該因子系數(shù)相對應的特征值。這里我們需要借助matlab軟件的eig函數(shù)來求解相關矩陣的特征值和特征向量。(具體程序見附錄1.2)處理后的相關矩陣的特征向量和特征值及其貢獻率統(tǒng)計的部分數(shù)據如表6、表7所示: 表6 釀酒葡萄理化指標特征向量矩陣因子1因子2因子3因子4因子26因子27氨基酸總量-0.13

33、8-0.263-0.0300.2811 -0.0650.0109蛋白質-0.2480.2305-0.0010.1634 -0.199-0.185出汁率-0.19730.06360.2439 0.06120.15770.0779皮質量0.11720.0727 0.3939-0.1267 0.0536 0.0343 表7 釀酒葡萄理化指標特征值和累計率因子特征值 百分率累計貢獻率16.6114 47.26% 47.26%24.6437 23.31%70.57%32.9020 9.10%79.67%42.83458.69%88.36%5 1.9676 4.19%92.55%2600100% 270.

34、00060%100%step4:計算各品種葡萄在主成分下的綜合得分 從表7可以看出,前4個因子的累計貢獻率已經達到88.36%,基本信息已經包含在前4個因子中,符合統(tǒng)計學的標準。所以,我們把他們作為主成分來分析是完全可行的。所以在我們的基于主成分分析的評價體系下,由累計貢獻率得到貢獻率,即作為因子的綜合評分的權重,不同品種葡萄的總評價得分的表達式即為: (9)部分葡萄的得分和排名如下表所示:(完整的數(shù)據見附錄2.7)表8 不同品種釀酒葡萄品質預測評價因子1因子2因子3因子4總評分排名紅1-4.3926-0.6892 -0.0514 -3.2468 -2.42782紅2-4.4591 0.543

35、0 0.1695 1.0701-1.79164紅3-4.1881-3.6548 0.4231 3.0487 -2.61981紅42.4579-0.3661 -0.8512-0.2518 0.954423紅262.3909 3.6094 -0.2997 0.3308 2.117626紅27 2.01900.2322-0.6908-0.7819 0.8662 22 4.3葡萄酒質量得分 附件1已經給出評酒員的具體打分情況,但是百分制打分各單項指標的分數(shù)分配不一定合理。也就是說各單項指標的權重分配不一定合理。因此,首先我們以2組可信度較高的評分數(shù)據,對各指標的權重進行重新分配。4.3.1基于信息熵對

36、權重的重新分配(1)檢測權重的合理性在問題1中通過數(shù)據可信度的評價,我們已經得到第二組的數(shù)據更可信。在此,我們可以以2組的可信數(shù)據,對已知權重的合理性進行檢驗,若權重不合理,將重新確定權重。這里為了避免客觀給定權重,我們可以根據基于信息熵的確定權重的方法重新計算信息熵并比較。(2)基于信息熵的確定權重方法分析 信息熵法是偏于客觀的確定權重的方法,它借用信息論中熵的概念。適用于多屬性決策和評價。本問題中各屬性是葡萄酒的10項單指標(外觀澄清度、氣味濃度等),本問題的決策方案即是對27種紅葡萄酒和27種白葡萄酒進行分級,也就是說對各屬性確定權重,然后計算每種葡萄酒的總得分,最后進行排序分類。(3)

37、用信息熵確定各屬性權重的具體步驟:step1: 以2組評酒員對紅葡萄酒各項指標的評分的平均值為信息構造決策矩陣x,決策變量為27種紅葡萄酒,決策的屬性。則決策矩陣x為27行10列矩陣如下: step2:上述10個指標屬性都是效應型指標,利用公式對決策矩陣進行規(guī)范化處理,其中分別為10個屬性得分的最高值,(如)得到規(guī)范化決策矩陣r。 step3:再由對規(guī)范化矩陣進行歸一化處理后,得到歸一化決策矩陣為(具體數(shù)據見附錄7): step4:通過公式,()計算10個屬性的信息熵分別為:0.99750.99460.99740.99910.99340.99471.00040.99980.99250.9998

38、step5: 通過公式 計算我們確定的各單項的新的權重為:0.01450.20500.07500.06190.25190.01810.03950.00850.31760.00794.3.2葡萄酒質量綜合得分 根據以上信息熵重新確定的各個評價指標的權重分配,得到每種葡萄酒指標的權重向量:=(,) =(0.0145,0.2050,0.0750,0.0619,0.2519,0.0181,0.0395,0.0085,0.3176,0.0079)再根據權重和評酒員的評分就可以計算出每種葡萄酒質量的總得分為:=+使用matlab軟件進行計算(具體程序見附錄1.3)得到每種紅葡萄酒質量得分和排名如下表所示:

39、表9 紅葡萄酒得分及排名表 品種紅1紅2紅3紅4紅5紅6紅7紅8紅9得分9.66410.8910.8310.3210.449.441 9.291 9.460 11.39排名194512102124201品種紅10紅11紅12紅13紅14紅15紅16紅17紅18得分9.943 8.4619.836 6.589 10.609.404 10.214.904 9.321 排名16251726722152723品種紅19紅20紅21紅22紅23紅24紅25紅26紅27得分10.6410.9510.5010.3911.1310.319.763 10.2910.47排名63811213181494.4基于模

40、糊數(shù)學對釀酒葡萄等級的劃分 通過以上模型我們計算得到了釀酒葡萄理化指標的綜合得分和葡萄酒質量的綜合得分。若把兩個綜合得分處理成一個綜合得分,需要用層次分析法等確定兩者的權重。但層次分析過于主觀,而且在本問題中,釀酒葡萄的理化指標和葡萄酒的質量對葡萄等級的影響是比較模糊和復雜的。 因此我們對得分進行排序,利用模糊數(shù)學知識進行葡萄等級的劃分。 表 10 得分排名模糊劃分標準葡萄模糊等級標準葡萄理化指標排名葡萄酒質量排名1級(最高等級)1919 2級1910183級101810184級101819275級(最低等級)19271927 4.5釀酒葡萄的等級評價結果 根據4.4提出的釀酒葡萄等級指標的劃

41、分,結合4.2,4.3得到的葡萄理化指標排名和葡萄酒質量排名,得到釀酒葡萄的等級劃分如表11所示: 表11 紅葡萄等級劃分表等級葡萄種類1級2,3,9,14,21,23 2級1,19,223級5,8,20,274級4,6,7,9,10,11,12,13,14,15,16,24,25,265級17,18其中白葡萄的等級劃分方法與紅葡萄酒的劃分方法相同。根據以上模型對白葡萄酒的等級劃分結果如表12所示。(程序見附錄1.3) 表12 白葡萄等級劃分表等級葡萄種類1級5,9,22,25,28 2級3,10,17,20,21,23,24,263級2,4,12,14,15,19,4級1,12,185級6,

42、7,8,11,13,16,274.6釀酒葡萄等級劃分標準的評價 本問中為了最終得到釀酒葡萄的等級劃分標準,分別從釀酒葡萄的理化指標和與釀酒葡萄對應的葡萄酒的質量出發(fā)。首先,我們基于主成分分析法逐步得到了釀酒葡萄的理化指標的綜合得分,并對其進行排名,應用主成分分析法既避免了大量數(shù)據處理的復雜同時也盡可能地獲得了最大的信息量。接著,考慮到原有的葡萄酒評分標準不一定能夠完全反應各項指標在葡萄酒質量中所起的重要性,我們又利用熵值法重新確定了各項指標的權重系數(shù),得到了各品種葡萄酒在新的權重下的得分,并得到排名。最后,綜合兩個排名,我們提出了基于模糊數(shù)學對釀酒葡萄等級的劃分,這種劃分方法充分尊重了兩組數(shù)據

43、,但是當兩組數(shù)據對結果的影響因素相差很大是,評價結果將產生較大的誤差。 5問題三模型的建立與求解5.1問題三的分析題目要求我們分析釀酒葡萄與葡萄酒理化指標之間的聯(lián)系。初步分析得到兩者之間的聯(lián)系應該體現(xiàn)在釀酒葡萄的理化指標和葡萄酒理化指標之間的聯(lián)系。由于我們在問題二的模型中已經對釀酒葡萄進行了分級,不同等級的釀酒葡萄和葡萄酒的理化指標的聯(lián)系在理論上應該是不同的。由于葡萄的理化指標數(shù)量過多,處理較復雜,我們可以用問題二的模型中提出的葡萄理化指標的主成分替代眾多的葡萄理化指標。因此,本問題就簡化成葡萄的主成分與葡萄酒的理化指標的聯(lián)系?;诖宋覀兙涂梢詫Ω髦笜诉M行統(tǒng)計分析,如相關性分析、偏相關分析,并

44、嘗試建立多元回歸模型。5.2模型的建立 5.2.1 葡萄理化指標主成分分析 在問題2的主成分分析中我們已經得到紅葡萄的27個指標可以由4個主因子-衡量。其中的表達式中的在主成分分析中已經給出(附錄1.2的matlab程序的輸出結果),其中為主成分法標準化后的各葡萄理化指標的數(shù)據,編號遵循附件中一級指標的排序方式。 因子1和所有理化指標的關系表達式為: 。 (10) 同理的表達式也可以表示成一次多項式的形式。每一個因子是27個理化指標指標交互的結果,問題要求我們建立起釀酒葡萄和葡萄酒理化指標的聯(lián)系,指標過多將導致聯(lián)系的復雜性。所以選取貢獻率最高的4個因子中顯著性指標的交互作用代替主成分,使模型更

45、易求解又不至于影響分析的結果。我們得到的紅葡萄的四個因子可以用理化指標線性表示為:主要表現(xiàn)花色苷和總酚的因子1: (11)主要表現(xiàn)干物質含量和總糖的因子2: (12)主要表現(xiàn)百粒重量白藜蘆醇的因子3: (13)主要表現(xiàn)褐變度、蛋白質和多酚氧化酶活力e的因子4: (14) 同理白葡萄四個主因子與理化指標的關系可表示為: (15) 參照文獻,我們知道芳香物質在葡萄以及葡萄酒中的決定因素都是比較明顯的,因此葡萄的第五個主要影響因素用葡萄的芳香物質的總量來表示。5.2.2葡萄等級數(shù)據處理在問題二中我們對紅葡萄和白葡萄劃分了等級,根據實際情況我們可分析出葡萄的等級同樣會影響葡萄和葡萄酒理化指標之間的聯(lián)系

46、。不同等級的葡萄會使聯(lián)系不同。所以將葡萄的等級作為葡萄理化指標第6個主因子。葡萄等級的量化就用問題2中已經劃分的等級數(shù),1級(優(yōu)質葡萄)就量化成數(shù)字1,以此類推,量化全部品種葡萄。因此葡萄的理化指標就可用6個主因子表示。5.2.3 偏相關分析我們將葡萄的理化指標決定因素用5個主成分表示,葡萄酒的理化指標直接用附件中的10個指標(單寧、總酚、芳香物質等)表示,用符號分別表示成。首先我們對葡萄和葡萄酒理化指標兩組指標之間同時進行相關分析,但spss軟件給出的結果表示相關性很小或者沒有,然而實際上有些指標顯然相關性很強,例如葡萄酒中的總酚和葡萄中的總酚。因此數(shù)據之間存在相互干擾。所以采用偏相關分析,

47、得到相關系數(shù)如表13。(弱相關未列出數(shù)據) 表 13 紅葡萄酒和葡萄理化指標相關系數(shù)表葡萄葡萄酒單寧-0.217-0.241總酚-0.2610.2460.256酒總黃酮0.563-0.351-0.316白蘆醇 dpphl*(d65)0.40-0.2280.243a*(d65)-0.414b*(d65)0.327-0.208-0.2310.216花色苷0.454-0.292芳香物質-0.3110.2530.278從上圖中可以得到葡萄和葡萄酒理化指標相關性的關系,如:葡萄酒理化指標中的酒黃酮與葡萄的等級正相關性較強,即等級數(shù)越高(葡萄越差)釀出的葡萄酒中的酒黃酮含量就越高。葡萄酒中白蘆醇和dpph

48、的含量與葡萄6個主成分都不相關,說明白蘆醇和dpph可能是由于釀造發(fā)酵決定的。5.2.4多元線性回歸偏相關分析已經得到了葡萄和葡萄酒理化指標的相關關系,正相關性或者負相關性較強時,對兩指標可以進行線性回歸。以上葡萄酒10個理化指標除白蘆醇和dpph與葡萄的6個主成分無相關性,其余8個指標都與其中若干個主成分有較強的相關性,因此對葡萄酒的8個理化指標可以進行多元線性回歸。例如葡萄酒中理化指標(酒總黃酮)與葡萄理化指標主成分,具有較強相關性。根據附錄數(shù)據(附錄1.2)處理得到的主因子數(shù)據表如表14所示:表14 與主因子,數(shù)據表酒品紅1-0.6214-1.345328.020紅2-0.5521-1.

49、4004113.300紅261.9884-0.506342.154紅270.6222-0.256133.284 將數(shù)據錄入spss軟件中,進行多元線性回歸得到酒總黃酮與,的關系如下: (16)依次將葡萄酒的各項指標以及與其相關的葡萄的理化指標主因子錄入spss軟件得到紅葡萄酒的各項指標與葡萄的理化指標的主因子之間的關系式為:、紅葡萄酒中單寧含量與葡萄各因子間的線性關系: (17)、紅葡萄酒中總酚含量與葡萄各因子間的線性關系: (18)、紅葡萄酒中酒總黃酮含量與葡萄各因子間的線性關系: (19)、紅葡萄酒中色澤度表示光澤度的指標與葡萄各因子間的線性關系: (20)、紅葡萄酒中色澤度表示紅/綠色的指標與葡萄各因子間的線性關系: (21)、紅葡萄酒中色澤度表示黃/藍色的指標與葡萄各因子間的線性關系: (22)、紅葡萄酒中花色苷含量與葡萄各因子間的線性關系: (23)、紅葡萄酒中芳香物質含量與葡萄各因子間的線性關系: (24) 由紅葡萄的聯(lián)系模型,先進行偏

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論