淺析數(shù)據(jù)挖掘在化學化工中研究進展論文_第1頁
淺析數(shù)據(jù)挖掘在化學化工中研究進展論文_第2頁
淺析數(shù)據(jù)挖掘在化學化工中研究進展論文_第3頁
淺析數(shù)據(jù)挖掘在化學化工中研究進展論文_第4頁
淺析數(shù)據(jù)挖掘在化學化工中研究進展論文_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1/1淺析數(shù)據(jù)挖掘在化學化工中研究進展論文隨著數(shù)據(jù)庫技術(shù)的不斷進展,各行各業(yè)所積累的數(shù)據(jù)也越來越多,人們已不能滿意數(shù)據(jù)表面所供應(yīng)的信息,并且漸漸開頭嘗試挖掘出大量數(shù)據(jù)背后所隱蔽的更加有用的信息,數(shù)據(jù)挖掘技術(shù)便由此應(yīng)運而生。隨后,數(shù)據(jù)挖掘技術(shù)便在信息產(chǎn)業(yè)和商業(yè)服務(wù)等領(lǐng)域產(chǎn)生了重大影響,人們利用數(shù)據(jù)挖掘技術(shù)從所積累的數(shù)據(jù)庫中得到了過去所不行能獵取的學問。隨著數(shù)據(jù)挖掘技術(shù)取得成效之后,很多不同領(lǐng)域的討論人員也顯示出了極大的愛好。

自計算機誕生以來,信息技術(shù)便不斷地推動著化工行業(yè)的進展。信息化時代的到來,促進了信息技術(shù)和化學工業(yè)的進一步結(jié)合,為數(shù)據(jù)挖掘技術(shù)在化工領(lǐng)域的應(yīng)用打下了堅實的基礎(chǔ)。隨著大數(shù)據(jù)時代的來臨,數(shù)據(jù)挖掘技術(shù)勢必會對化學與化工領(lǐng)域產(chǎn)生更加深遠、更加全面的影響。近年來,許多討論者針對以往積累的數(shù)據(jù),將數(shù)據(jù)挖掘技術(shù)運用到自己的討論課題中,取得了許多極具應(yīng)用價值的討論成果。本文通過整合近年來數(shù)據(jù)挖掘技術(shù)在化學化工領(lǐng)域所取得的突破性進展,評述了數(shù)據(jù)挖掘技術(shù)在化工建模、工藝條件的優(yōu)化、數(shù)據(jù)庫平臺的創(chuàng)建和平安生產(chǎn)等方面的應(yīng)用。

1數(shù)據(jù)挖掘技術(shù)

數(shù)據(jù)挖掘技術(shù)是智能系統(tǒng)理論的重要內(nèi)容,同樣也是數(shù)據(jù)庫處理的重要的技術(shù)手段。它是利用關(guān)聯(lián)規(guī)章、分類、聚類等分析方法從大量無序的、存在噪聲的、冗余的或缺損的數(shù)據(jù)中提取出有用的潛在信息,并為進一步的討論供應(yīng)數(shù)據(jù)支撐的數(shù)據(jù)庫處理技術(shù)。數(shù)據(jù)挖掘技術(shù)的操作流程一般為:信息收集、數(shù)據(jù)集成、數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘過程、模式評估和學問表示幾個階段。其中數(shù)據(jù)挖掘過程為該流程的技術(shù)核心,運用的主要方法有:統(tǒng)計方法、決策樹、規(guī)章推理、模糊集、遺傳算法、神經(jīng)網(wǎng)絡(luò)、主元分析、偏最小二乘法等。

2數(shù)據(jù)挖掘在化學化工中的應(yīng)用

2.1化工建模的應(yīng)用

化工過程建模始終是化工領(lǐng)域的難點。由于在實際過程中,化工過程系統(tǒng)的許多條件因素具有交互性和嚴峻的非線性,因此化工過程建模具有很大的困難。然而數(shù)據(jù)挖掘技術(shù)具有豐富的算法,神經(jīng)網(wǎng)絡(luò)算法能夠以任意精度靠近任意非線性映射,對處理含噪聲和非線性數(shù)據(jù)具有較大的優(yōu)勢;遺傳算法在解決非線性問題時不依靠于問題模型的特性,不僅具有魯棒性和全局最優(yōu)性,還具有高效率和可并行性等特點;主元分析在解決非線性數(shù)據(jù)時能夠做到數(shù)據(jù)簡化、數(shù)據(jù)壓縮、建模等;偏最小二乘法對多因變量對多自變量的回歸建模具有較為明顯的優(yōu)勢。

孔德根等對18種酚類化合物的量子化學參數(shù)進行了優(yōu)化計算,采納多元線性回歸分析和人工神經(jīng)網(wǎng)絡(luò)反傳誤差算法,討論了酚類化合物對抑制黑曲霉毒性的定量構(gòu)效關(guān)系,并采納去一法通過對模型的猜測力量和穩(wěn)健性的驗證篩選出了最佳的計算模型。分析表明酚類化合物的分子體積和苯環(huán)上的凈電荷增量與其對黑曲霉的抑制毒性呈正相關(guān),而最低空軌道能與黑曲霉的抑制毒性呈負相關(guān)。該文章的建模方法為評估和猜測其他化合物對抑制黑曲霉的毒性供應(yīng)了參考。

林凌等提出了一種針對體表組織內(nèi)進行的高譜圖技術(shù)。該技術(shù)通過對組織內(nèi)的光譜信息和圖像信息等多元信息進行關(guān)聯(lián),然后采納數(shù)據(jù)挖掘技術(shù),對數(shù)據(jù)和病癥進行分析建模。通過該模型挖掘出組織的圖像、光譜以及二者交互項與疾病之間的關(guān)系,大大提高了臨床皮膚病的診斷精度和精確?????度。還能夠有效地改善光譜技術(shù)和光學相干層析技術(shù)對組織成分和位置信息探測不足和缺乏系統(tǒng)性、多元性等局限性,為皮膚病的早期診斷供應(yīng)了技術(shù)支撐,并且對人體內(nèi)更深層組織以及器官的檢測供應(yīng)了思路。

Kusiak等通過收集2023~2023年間甲烷生產(chǎn)的工業(yè)數(shù)據(jù),對甲烷生產(chǎn)的參數(shù)進行了探究,采納自適應(yīng)神經(jīng)模糊推理系統(tǒng)(ANFIS)對甲烷的生產(chǎn)猜測進行建模。并通過百分比誤差、偏差因子、均方根誤差、歸一化均方根誤差和全都性指數(shù)等五個指標對該模型進行了評估。結(jié)果表明,利用自適應(yīng)神經(jīng)模糊推理系統(tǒng)所建立的模型性能優(yōu)異,所猜測的數(shù)據(jù)與實測值顯示出了高度的全都性。與采納神經(jīng)網(wǎng)絡(luò)、支持向量機、隨機森林等算法所建立的甲烷生產(chǎn)猜測模型比較也顯示出了更好的猜測精度。該模型不僅能夠?qū)淄榈纳a(chǎn)過程進行更精確?????的模擬和猜測,而且能夠指導并優(yōu)化甲烷的生產(chǎn)過程。

劉天玲等采納主成分分析、局部線性嵌入、支持向量機、偏最小二乘和小波變換五種模式識別方法,利用NIR技術(shù)建立了玉米種子的分類識別模型。該模型已勝利運用于108玉米雜交種和母本178種子的識別,而且具有較高的識別精度和分類精度。Rommel等提出了一種基于機器學習算法和電感耦合等離子體質(zhì)譜法測定有機甘蔗樣品真實性的識別模型。該模型可以采納RandomForest和NaiveBayes算法對樣品進行分析識別,RandomFores算法通過檢測32個化學元素作為參考,精確?????率約為90%;NaiveBayes算法只需檢測8個化學元素作為參考,但是精確?????率卻提升到了95.4%。此模型能夠便利且高效的區(qū)分出樣品中的有機甘蔗。Sabanci等則使用UCI機器學習數(shù)據(jù)庫分別運用KNN、NaiveBayes、J48和多層感知器的數(shù)據(jù)集等數(shù)據(jù)挖掘算法建立了種子物種分類的數(shù)學模型。并勝利運用于小麥種子的分類,當神經(jīng)元數(shù)目為7時,分類勝利的精確?????率約為97.1749%,MAE誤差和均方根誤差分別為0.0298和0.1181,顯示出較好的分類識別效果。

2.2優(yōu)化工藝條件的應(yīng)用

數(shù)據(jù)挖掘能從海量的交互、高維、無序的自變量數(shù)據(jù)庫中發(fā)覺潛在的且能夠?qū)蛞蜃兞康挠杏眯畔?。并且能夠?qū)μ囟ǖ囊蜃兞拷柚诸悰Q策樹算法、聚類算法和分類樹算法等對多維無序的自變量進行擇優(yōu)。利用數(shù)據(jù)挖掘的這一特點,可以對化工工藝條件進行優(yōu)化。將多維、非線性的工藝條件作為自變量,特定的工藝結(jié)果作為因變量采納不同的算法進行優(yōu)化,直至找到最佳的工藝條件。姜求宇等運用數(shù)據(jù)挖掘技術(shù)實現(xiàn)了對固相合成納米氧化鎳工藝參數(shù)的優(yōu)化。通過勻稱設(shè)計方法分析了多因素對納米氧化鎳透光率的影響,并對試驗結(jié)果進行了逐步回歸分析和最優(yōu)化計算,最終得到固相合成納米氧化鎳的最優(yōu)工藝參數(shù),在該條件下得到的氧化鎳的收率為95.5%,平均粒徑在7nm。該方法對科研工作中的小型的數(shù)據(jù)庫的工藝條件的優(yōu)化處理具有較強的有用性。

周永生等針對生化企業(yè)的簡單性和所產(chǎn)生的數(shù)據(jù)的無序性、交互性等特點提出了帶有確定性決策項的關(guān)聯(lián)規(guī)章挖掘算法。相較于傳統(tǒng)的關(guān)聯(lián)規(guī)章挖掘算法,該算法從環(huán)境因子和環(huán)境因子數(shù)據(jù)項的關(guān)系入手,削減了無關(guān)頻繁項目集的產(chǎn)生,縮短了算法的運行時間,提高了算法的運行效率。該算法對生化企業(yè)生產(chǎn)環(huán)境的優(yōu)化具有很好的適應(yīng)性。同年,該算法已勝利的運用于發(fā)酵法生產(chǎn)檸檬酸的試驗中,并能夠較快的得到高轉(zhuǎn)化率和高總酸量的優(yōu)化生產(chǎn)環(huán)境。該算法的提出有利于提高生化企業(yè)優(yōu)化工藝參數(shù)的效率和精確?????性。

He等通過對基因組進行數(shù)據(jù)挖掘,找出了在甘露醇作為底物的條件下,NADH還原酶(PgCR)對4-氯乙酰乙酸乙酯(COBE)還原成(S)-4-氯-3-羥基丁酸乙酯((S)-CHBE)具有較高的催化活性和優(yōu)良的立體選擇性。并對其反應(yīng)條件進行了優(yōu)化,在反應(yīng)溫度為30℃,反應(yīng)pH為7,底物甘露醇為2.5mmol/mmolCOBE,NAD+為0.1μmol/(mmolCOBE),細胞用量為1g/mL時,CHBE的產(chǎn)量可達到99%,高對映體過量值99%。郭羽婷等以吉林高校“無機制備與合成化學國家重點試驗室”所建立的開放骨架磷酸鋁合成反應(yīng)數(shù)據(jù)庫為討論對象,采納MWMR算法,探究了溶劑、模板劑等合成參數(shù)對于開放骨架磷酸鋁合成的影響。該討論成果對含有(8,6)元環(huán)結(jié)構(gòu)開放骨架磷酸鋁定向合成參數(shù)的優(yōu)化具有肯定的指導意義。

2.3數(shù)據(jù)庫平臺的應(yīng)用

數(shù)據(jù)庫是指支持管理決策過程的、集成的、交互的一個數(shù)據(jù)集合。它是對大量無序、非線性的數(shù)據(jù)通過聚類、關(guān)聯(lián)、模糊集、最大權(quán)重和最小冗余等特征算法等整合的信息系統(tǒng)。通過一個直觀的、簡潔的人機交互界面,人們可以便利的查找與分析各種數(shù)據(jù)之間的關(guān)聯(lián),并且在查詢的條件中引入模糊偏好,使得搜尋的結(jié)果更具有敏捷性。因而通過數(shù)據(jù)挖掘技術(shù)對收集的數(shù)據(jù)進行關(guān)聯(lián)、聚類,建立化工數(shù)據(jù)庫或開發(fā)化工應(yīng)用軟件,也是數(shù)據(jù)挖掘技術(shù)在化學化工領(lǐng)域的一個應(yīng)用熱點。

楊善升等運用數(shù)據(jù)挖掘技術(shù),開發(fā)了一種適用于合成氨過程優(yōu)化和監(jiān)測的應(yīng)用軟件。該軟件集成了模式識別、人工智能、統(tǒng)計學習理論等多種優(yōu)化方法,具有操作簡潔、功能強大和適應(yīng)性強等特點。而且該軟件已勝利運用于云南云維集團有限公司合成氨過程的生產(chǎn)優(yōu)化中,并取得了良好的效果。

Peng等基于J2EE通過對中藥中有效成分的信息進行歸納、總結(jié)、關(guān)聯(lián)、聚類等討論建立了中藥有效成分化合物的數(shù)據(jù)庫。通過該數(shù)據(jù)庫可以便利討論者對藥物的化學性質(zhì)和藥理性質(zhì)有一個系統(tǒng)的熟悉,并且通過各類化合物的化學性質(zhì)與藥理性質(zhì)的關(guān)聯(lián)與聚類,有助于討論者進行新藥的開發(fā)。Ghadbeigi等對200個出版刊物中鋰離子電池材料進行了數(shù)據(jù)挖掘,整合并創(chuàng)建了包括各類電池材料的超過16000個數(shù)據(jù)的鋰離子電池的大型數(shù)據(jù)庫。該數(shù)據(jù)庫不僅包含了電極材料的關(guān)鍵性能參數(shù),如能量密度、功率密度、放電容量等,還對相關(guān)電極材料的資源分布和儲量等信息也進行了分析。利用該數(shù)據(jù)庫不僅可以分析出陰極材料和陽極材料所具有的特性,而且依據(jù)對不同材料性能的挖掘,有助于討論人員探究新型的鋰離子電極材料。肖建茂等利用數(shù)據(jù)挖掘技術(shù)探究了各種鋰離子電池材料的物理化學性質(zhì)與材料組成和組織結(jié)構(gòu)等的關(guān)系,并依據(jù)材料基因工程的基本思想通過高通量第一性原理構(gòu)建了鋰電池材料設(shè)計的技術(shù)平臺。該平臺通過數(shù)據(jù)挖掘可以總結(jié)出性能優(yōu)良的鋰離子電池材料的結(jié)構(gòu)特性,有助于新型鋰離子電池材料的探究和現(xiàn)有材料的改性討論。

2.4平安生產(chǎn)的應(yīng)用

化工廠是平安事故頻發(fā)的一類企業(yè),掌握平安事故的傳統(tǒng)方法當心防范和親密監(jiān)控只能被動的對平安事故進行排查,對平安事故的掌握效果不佳。隨著數(shù)據(jù)挖掘技術(shù)的不斷進展,使得化工廠在平安事故的管控方面占據(jù)主動成為了可能。數(shù)據(jù)挖掘技術(shù)供應(yīng)了模糊集理論、主觀Bayes算法等不確定性推理方法,來對事故緣由和事故征兆之間具有的模糊性和隨機性等不確定關(guān)系進行討論。依據(jù)化工廠存儲的大量的運行數(shù)據(jù),通過數(shù)據(jù)挖掘技術(shù)的特定算法,挖掘出各個事故征兆對結(jié)論的支持度,得到相應(yīng)地征兆權(quán)值,進而計算出相應(yīng)的閥限值。通過采集到的事故征兆的多少,依據(jù)合理的規(guī)章可信度公式,轉(zhuǎn)變規(guī)章可信度,從而對生產(chǎn)進行監(jiān)控并對潛在的危急進行猜測。

曹順安針對火電廠的水汽化學過程的故障的診斷方法的缺乏,利用FP_growth算法設(shè)計了一種基于可信度理論的診斷模型。該模型不僅適用性較廣,而且對故障具有較強的識別力量,能夠在故障初期征兆尚未完全消失、某些次要征兆值未能獵取等狀況下,對可能會發(fā)生的故障進行識別,并作出警告。這對于火電廠的平安生產(chǎn)具有非常重要的意義。

Cheng等通過對2000~2023年之間在臺灣發(fā)生的349例石化行業(yè)的重大職業(yè)事故進行了數(shù)據(jù)挖掘技術(shù)的分類和回歸樹分析,并對事故的分布和發(fā)生的緣由以及事故的頻發(fā)點進行了統(tǒng)計學分析。認為對于石化行業(yè),天氣的變化、材料結(jié)構(gòu)的缺陷、內(nèi)部材料溫度和壓力的變化、人們的疏忽等都會導致平安事故的發(fā)生。故因?qū)κ鹿实念l發(fā)點定期進行風險評估,制造商也應(yīng)當提高機械和設(shè)備入口點的平安和愛護裝置,高危作業(yè)的施工人員也應(yīng)當定期進行平安教育培訓。

李鵬等運用數(shù)據(jù)挖掘技術(shù)對中國石油化工股份有限公司的催化裂扮裝置所積累的海量數(shù)據(jù)進行深化探究討論與分析,解決催化裂扮裝置報警問題、結(jié)焦問題和收率問題,進一步提高了催化裂扮裝置運行力量,并取得了良好的經(jīng)濟收益和社會效益。石榮雪等通過對文獻數(shù)據(jù)庫進行大數(shù)據(jù)分析,挖掘出了國內(nèi)因鍋爐化學水工況選取不當而造成事故狀況,并進行了數(shù)據(jù)分析,確定了一些常見鍋爐機組的最適化學水工況,并給出了相應(yīng)的建議。對國內(nèi)鍋爐平安生產(chǎn)具有肯定的參考價值。

3結(jié)束語

自20世紀90年月以來,隨著科研工的不斷努力,數(shù)據(jù)挖掘技術(shù)已

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論