版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
緒論能源系統(tǒng)大數(shù)據(jù)分析理論與實(shí)踐第一節(jié)2匯報(bào)提綱什么是能源?什么是智慧?為什么需要智慧能源?如何實(shí)現(xiàn)智慧能源?GPT類的技術(shù)將帶來(lái)哪些變革?課程安排3人類文明與能源的關(guān)系-卡爾達(dá)舍夫等級(jí)卡爾達(dá)舍夫等級(jí)其實(shí)就是一種用來(lái)衡量一個(gè)文明的技術(shù)的先進(jìn)程度的方法,以可以制造的能量多少來(lái)衡量,這也是目前學(xué)界較為認(rèn)同的一種方法,大致可以分成下面三個(gè)等級(jí):級(jí)別I:該文明是行星能源的主人,也就是說(shuō)他們有能力控制整顆母星以及周圍衛(wèi)星的能源。級(jí)別II:該文明有能力收集整個(gè)恒星系統(tǒng)的能源.例如:我們可以取得木星上的氫氣作為自己的能源嗎?其實(shí)主要的問(wèn)題就是我們的科技等級(jí)還做不到,一旦到達(dá)了二級(jí)就可以做到了。級(jí)別III:又稱為星系文明,可以控制整個(gè)星系的能量,比如銀河系,這個(gè)能量就大的嚇人了,目前來(lái)看這已經(jīng)是科幻小說(shuō)的領(lǐng)域了。這個(gè)級(jí)別的文明基本上和二級(jí)文明運(yùn)作模式差不多,可以收集星球中的能量,只不過(guò)不是一個(gè)星球,而是數(shù)百萬(wàn)個(gè)星球,星系對(duì)于這種文明來(lái)說(shuō)基本上就是他們的游樂(lè)園,甚至星系中心的黑洞也可能被他們用作能量來(lái)。4卡爾達(dá)舍夫提出一個(gè)方程來(lái)確定一個(gè)文明所處的級(jí)別,K代表級(jí)別,P代表文明的能耗.人類連這一個(gè)文明等級(jí)都達(dá)不到,人類大約處在0.75級(jí)作用。人類文明與能源的關(guān)系-卡爾達(dá)舍夫等級(jí)5薪柴時(shí)代薪柴是人類第一代主體能源?;鹨彩侨祟愓莆盏牡谝豁?xiàng)技術(shù),恩格斯在評(píng)價(jià)火的作用時(shí)說(shuō):“磨擦生火第一次使人支配了一種自然力,從而最終把人同動(dòng)物分開?!比祟惸茉词?煤炭時(shí)代隨著蒸汽機(jī)的發(fā)明,機(jī)械力開始大規(guī)模代替人力,低熱值的木材已經(jīng)滿足不了巨大的能源需求,煤炭以其高熱值、分布廣的優(yōu)點(diǎn)成為全球第一大能源。這也隨之帶動(dòng)了鋼鐵、鐵路、軍事等工業(yè)的迅速發(fā)展,大大促進(jìn)了世界工業(yè)化進(jìn)程,煤炭時(shí)代所推動(dòng)的世界經(jīng)濟(jì)發(fā)展超過(guò)了以往數(shù)千年的時(shí)間。人類能源史7石油時(shí)代19世紀(jì)末,人們發(fā)明了以汽油和柴油為燃料的內(nèi)燃機(jī)。福特成功制造出世界第一輛量產(chǎn)汽車。這一時(shí)期起,石油以其更高熱值、更易運(yùn)輸?shù)忍攸c(diǎn),于20世紀(jì)60年代取代了煤炭第一能源的地位,成為第三代主體能源。石油作為一種新興燃料不僅直接帶動(dòng)了汽車、航空、航海、軍工業(yè)、重型機(jī)械、化工等工業(yè)的發(fā)展,甚至影響著全球的金融業(yè),人類社會(huì)也被飛速推進(jìn)到現(xiàn)代文明時(shí)代。人類能源史8新能源時(shí)代20世紀(jì)30年代以來(lái),隨著科學(xué)技術(shù)的進(jìn)步,各類新能源開始投入使用,而化石能源帶來(lái)的全球性危機(jī),也進(jìn)一步加快了新能源技術(shù)進(jìn)步和實(shí)際應(yīng)用速度。人類能源史9全球能源消耗趨勢(shì)10能源對(duì)當(dāng)前國(guó)際關(guān)系的影響11可控核聚變?人類下一個(gè)千年能源未來(lái)史?12什么是能源?什么是智慧?為什么需要智慧能源?如何實(shí)現(xiàn)智慧能源?GPT類的技術(shù)將帶來(lái)哪些變革?課程安排匯報(bào)提綱13智慧是一個(gè)漢語(yǔ)詞語(yǔ),拼音是zhìhuì,一指聰明才智,二指梵語(yǔ)“般若”(音bo-re)的意譯。出自《墨子·尚賢中》:“若此之使治國(guó)家,則此使不智慧者治國(guó)家也,國(guó)家之亂,既可得而知已。”智慧是生命所具有的基于生理和心理器官的一種高級(jí)創(chuàng)造思維能力,包含對(duì)自然與人文的感知、記憶、理解、分析、判斷、升華等所有能力。智慧與智力不同,智慧表達(dá)智力器官的綜合終極功能,與“形而上之道”有異曲同工之處;智力則謂“形而下之器”,是生命的一部分技能。什么是智慧?141997年電腦深藍(lán)國(guó)際象棋比賽中戰(zhàn)勝人類冠軍152011年電腦Watson美國(guó)綜藝節(jié)目危險(xiǎn)邊緣戰(zhàn)勝人類冠軍AI能思考嗎?162016年電腦AlphaGo在圍棋比賽中戰(zhàn)勝人類冠軍172017-2023GPT技術(shù)的發(fā)展模型參數(shù)的不斷增大技術(shù)創(chuàng)新的不斷引入應(yīng)用場(chǎng)景的不斷擴(kuò)展18人工智能是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。它企圖了解智能的實(shí)質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機(jī)器,該領(lǐng)域的研究包括機(jī)器人、語(yǔ)言識(shí)別、圖像識(shí)別、自然語(yǔ)言處理和專家系統(tǒng)等。研究熱度時(shí)間什么是人工智能(AI)19如何理解當(dāng)下的人工智能浪潮?20連馬桶都叫智慧了嗎?!如何理解當(dāng)下的人工智能浪潮?21什么是能源?什么是智慧?為什么需要智慧能源?如何實(shí)現(xiàn)智慧能源?GPT類的技術(shù)將帶來(lái)哪些變革?課程安排匯報(bào)提綱我國(guó)區(qū)域供熱供冷系統(tǒng)占全國(guó)總能耗約5%,運(yùn)行過(guò)程中普遍有10%-20%的能源浪費(fèi)主要原因:粗放式運(yùn)行管理突出矛盾:運(yùn)行管理人員專業(yè)素養(yǎng)普遍較低與節(jié)能理論技術(shù)水平要求高之間的矛盾技術(shù)瓶頸:普遍稀缺能夠及時(shí)發(fā)現(xiàn)運(yùn)行過(guò)程問(wèn)題的能力22重建設(shè),輕運(yùn)行重硬件,輕軟件重維持,輕節(jié)能我國(guó)區(qū)域供熱供冷面積趨勢(shì)圖北方區(qū)域供熱南方區(qū)域供冷供熱年均增長(zhǎng)率12%為什么需要“人工智能+”?-以城市能源為例23住宅建筑熱電聯(lián)產(chǎn)余熱驅(qū)動(dòng)制冷污水廢水余熱商業(yè)建筑工業(yè)過(guò)程太陽(yáng)能發(fā)熱天然冷源垃圾焚燒余熱可再生熱源圖片來(lái)源:聯(lián)合國(guó)環(huán)境規(guī)劃署.城市區(qū)域能源[R].2015.區(qū)域供熱供冷系統(tǒng)是一種大規(guī)模復(fù)雜熱力系統(tǒng),包括熱源、冷源、流體輸配管網(wǎng)和冷熱負(fù)荷,具有大惰性、大滯后、非線性等特性致力于解決城市能源智能化問(wèn)題24典型領(lǐng)域我國(guó)大型公建用電總量趨勢(shì)圖用電總量(萬(wàn)億kWh)我國(guó)大型公共建筑約占建筑總面積4%,但能耗卻占我國(guó)建筑總能耗的20%以上[1];大型公共建筑普遍有10%-30%能源浪費(fèi),主要原因是中央空調(diào)系統(tǒng)運(yùn)行效率遠(yuǎn)低于預(yù)期[1]。[1]中國(guó)建筑節(jié)能年度發(fā)展研究報(bào)告[M].清華大學(xué)建筑節(jié)能研究中心,2014.機(jī)場(chǎng)劇院醫(yī)院醫(yī)院辦公樓商業(yè)中心機(jī)場(chǎng)以我國(guó)公共建筑的中央空調(diào)系統(tǒng)為例冷媒循環(huán)回風(fēng)溫度傳感器溫度傳感器表冷器壓縮機(jī)膨脹閥蒸發(fā)器冷卻塔冷凝器送風(fēng)放熱吸熱放熱變風(fēng)量末端(空氣-空氣)冷水機(jī)組(水-制冷劑-水)新風(fēng)排風(fēng)空氣處理機(jī)組(水-空氣)7種主要隱性故障制冷劑泄漏存在不凝結(jié)氣體冷凝器結(jié)垢冷卻水流量過(guò)少制冷劑充注過(guò)多冷凍水流量過(guò)少蒸發(fā)器結(jié)垢
…43種故障新風(fēng)風(fēng)閥故障混風(fēng)風(fēng)閥故障表冷器閥門故障加熱器閥門故障…10種故障風(fēng)閥閥門故障流量傳感器故障溫度傳感器故障控制器故障…中央空調(diào)系統(tǒng)故障種類繁多,人工檢測(cè)診斷理論難度高、工作量大且不及時(shí)。以中央空調(diào)系統(tǒng)運(yùn)維管理中設(shè)備故障診斷為例上海27幢酒店建筑供冷設(shè)備裝機(jī)容量與實(shí)際運(yùn)行負(fù)荷單位建筑面積冷機(jī)裝機(jī)容量的平均值為120W/m2實(shí)測(cè)單位建筑面積夏季尖峰負(fù)荷多數(shù)在30~40W/m2,基本上不超過(guò)50W/m2冷機(jī)裝機(jī)容量普遍偏大上海市公共建筑供冷供熱系統(tǒng)現(xiàn)狀調(diào)研注:數(shù)據(jù)來(lái)自上海市建筑科學(xué)研究院朱偉峰調(diào)研成果上海50幢大型公共建筑水泵裝機(jī)容量與實(shí)際運(yùn)行情況夏季高負(fù)荷下,實(shí)測(cè)一次冷凍水流量/一次冷凍泵裝機(jī)容量(不包含備用水泵)的平均值為44.5%上海市公共建筑供冷供熱系統(tǒng)現(xiàn)狀調(diào)研注:數(shù)據(jù)來(lái)自上海市建筑科學(xué)研究院朱偉峰調(diào)研成果2862%的公共建筑安裝BA系統(tǒng)52%的建筑提供監(jiān)測(cè)或啟??刂普嬲龑?shí)現(xiàn)BA智能控制的建筑較少,少于5%上海65幢大型公共建筑注:數(shù)據(jù)來(lái)自上海市建筑科學(xué)研究院朱偉峰調(diào)研成果上海市公共建筑供冷供熱系統(tǒng)自控現(xiàn)狀調(diào)研29總體能效水平≈
設(shè)備性能X控制水平X運(yùn)維管理水平時(shí)間運(yùn)維水平理想水平實(shí)際水平1980s2018時(shí)間控制性能理想性能實(shí)際性能1980s2018理論技術(shù)水平設(shè)備性能理想性能實(shí)際性能1980s2018隨著制造工藝提升和理論技術(shù)進(jìn)步,設(shè)備性能已經(jīng)大幅度提升,整體水平較高弱電工程人員往往控制出身,對(duì)系統(tǒng)一知半解,控制策略適應(yīng)性差運(yùn)維管理人員的檢測(cè)、診斷和優(yōu)化能力嚴(yán)重欠缺時(shí)間設(shè)備性能運(yùn)維管理控制策略影響實(shí)際制冷系統(tǒng)能效水平的主要因素30據(jù)美國(guó)RP-1312項(xiàng)目統(tǒng)計(jì),一個(gè)典型的AHU中共有68類故障[1]:6個(gè)受控設(shè)備有25類故障5個(gè)設(shè)備中有11類故障8個(gè)控制器中有8類故障12個(gè)傳感器中有24類故障案例:阿姆斯特丹博物館AHU故障
冷卻盤管閥持續(xù)處于最大開度,熱水負(fù)荷抵消了冷水負(fù)荷。室內(nèi)環(huán)境溫度沒(méi)有受到影響,持續(xù)三周后才被發(fā)現(xiàn),浪費(fèi)了大量的能源。[1]J.WenandS.Li,2011.ASHRAE1312-RP:ToolsforEvaluatingFaultDetectionandDiagnosticMethodsforAir-HandlingUnits-Finalreport,DrexelUniversity,PA,UnitedStates.冷負(fù)荷熱負(fù)荷舉例一:空氣處理機(jī)組(AHU)典型故障31期望故障征兆調(diào)適實(shí)際變風(fēng)量系統(tǒng)風(fēng)閥卡死冷/熱量不足定風(fēng)量系統(tǒng)調(diào)整送風(fēng)溫度實(shí)際應(yīng)用中,大部分變風(fēng)量系統(tǒng)最終變成了定風(fēng)量系統(tǒng)一個(gè)典型VAVBox有10類故障,香港理工團(tuán)隊(duì)對(duì)香港某商用建筑的1251個(gè)VAVbox核查,發(fā)現(xiàn)20.9%存在故障[1]J.Y.Qin,S.W.Wang,AfaultdetectionanddiagnosisstrategyofVAVair-conditioningsystemsforimprovedenergyandcontrolperformances,EnergyandBuildings37(2005)1035-1048.舉例二:變風(fēng)量末端(VAVBox)典型故障32冷卻水量不足制冷劑充注過(guò)量不凝性氣體冷凝器結(jié)垢16.2%21.3%20.0%8.2%制冷劑泄露蒸發(fā)器結(jié)垢數(shù)據(jù)來(lái)自美國(guó)RP-1043項(xiàng)目實(shí)測(cè)據(jù)美國(guó)RP-1403項(xiàng)目調(diào)研,運(yùn)行維護(hù)不善可能導(dǎo)致8類冷水機(jī)組軟故障,且難以人工察覺舉例三:冷水機(jī)組典型故障33運(yùn)維技術(shù)人員專業(yè)素養(yǎng)普遍不高教育程度不高,缺乏必要的基本知識(shí)只會(huì)開機(jī)關(guān)機(jī)和簡(jiǎn)單記錄運(yùn)行數(shù)據(jù)只會(huì)簡(jiǎn)單的維修,經(jīng)常錯(cuò)誤操作運(yùn)行管理模式落后責(zé)任、權(quán)利、利益不明缺少有效具體考核方法設(shè)計(jì)、施工、調(diào)試、運(yùn)行等過(guò)程脫節(jié)舉例三:冷水機(jī)組典型故障34領(lǐng)域的主要矛盾:日益增長(zhǎng)的節(jié)能需求和能源領(lǐng)域不平衡不充分的發(fā)展之間的矛盾根本原因當(dāng)前歷史條件下由于我國(guó)社會(huì)整體水平不高所導(dǎo)致的歷史階段性問(wèn)題人系統(tǒng)人系統(tǒng)原有的二元關(guān)系下難以解決升維到三元關(guān)系,提供了新的自由度人工智能對(duì)我國(guó)現(xiàn)階段能源系統(tǒng)節(jié)能領(lǐng)域問(wèn)題本質(zhì)的思考35莫拉維克悖論(1980)“要讓電腦如成人般地下棋是相對(duì)容易的,但是要讓電腦猶如一歲小孩一般的感知和行動(dòng)能力,卻是相當(dāng)困難甚至是不可能的”對(duì)于計(jì)算機(jī),困難的問(wèn)題是易解的,簡(jiǎn)單的問(wèn)題是難解的。人類獨(dú)有高階智慧在感知環(huán)境和行動(dòng)能力方面,目前仍具有顯著優(yōu)勢(shì)能夠?qū)嶋H手工處置問(wèn)題計(jì)算機(jī)有強(qiáng)大的計(jì)算存儲(chǔ)能力對(duì)海量數(shù)據(jù)的大規(guī)模計(jì)算、預(yù)測(cè)、推理、抽象、仿真和存儲(chǔ)方面,具有壓倒性優(yōu)勢(shì)人工智能與人具有能力互補(bǔ)性36專業(yè)素養(yǎng)難以提高工作負(fù)荷依舊較重人力成本逐漸攀升難以吸引優(yōu)秀人才信息化成本越來(lái)越低互聯(lián)網(wǎng)物聯(lián)網(wǎng)普及數(shù)據(jù)采集量越來(lái)越多計(jì)算能力大幅提升應(yīng)用邊際成本極低“人工智能”條件逐漸成熟“人”的進(jìn)步緩慢我來(lái)幫您如何解決“人”的問(wèn)題37規(guī)模性:日常大量應(yīng)用重復(fù)性:大量重復(fù)工作可能性:人能夠做得到!當(dāng)前人工智能的價(jià)值和能力大多體現(xiàn)在具有如下特征的領(lǐng)域:對(duì)象問(wèn)題當(dāng)前人工智能在工科研究領(lǐng)域探索人類未知方面的作用十分有限!制冷低溫領(lǐng)域符合左邊特征的:1.批量生產(chǎn)制冷設(shè)備2.個(gè)性化制冷系統(tǒng)-冷庫(kù)-建筑中央空調(diào)系統(tǒng)產(chǎn)品相關(guān)1.設(shè)計(jì)缺陷不足2.潛在優(yōu)化設(shè)計(jì)空間3.產(chǎn)品缺陷運(yùn)行維護(hù)相關(guān)1.故障檢測(cè)診斷2.優(yōu)化控制運(yùn)行什么樣的對(duì)象問(wèn)題適合AI+?對(duì)象問(wèn)題38什么是能源?什么是智慧?為什么需要智慧能源?如何實(shí)現(xiàn)智慧能源?GPT類的技術(shù)將帶來(lái)哪些變革?課程安排匯報(bào)提綱39關(guān)鍵科學(xué)問(wèn)題如何讓計(jì)算機(jī)具備領(lǐng)域?qū)<宜降睦碚撝R(shí);如何能夠在傳感器缺失導(dǎo)致的信息不足和不確定情況下深度理解數(shù)據(jù);如何具有通用化的自主性的能效分析、優(yōu)化運(yùn)行、人機(jī)協(xié)同,和持續(xù)學(xué)習(xí)的能力人工智能+熱力學(xué)系統(tǒng)的實(shí)際約束傳感器數(shù)量少質(zhì)量不高所導(dǎo)致的“信息不足”問(wèn)題由于信息不足進(jìn)一步導(dǎo)致推理過(guò)程的“不確定性”問(wèn)題個(gè)人認(rèn)知:當(dāng)下智慧+熱力學(xué)的科學(xué)問(wèn)題40智能電網(wǎng)太陽(yáng)能發(fā)電基于消防水池的水蓄冷吸收式冷機(jī)發(fā)電機(jī)冷機(jī)基于模型預(yù)測(cè)控制方法(MPC)的分布式能源優(yōu)化控制案例:凈零能耗建筑系統(tǒng)的優(yōu)化設(shè)計(jì)與優(yōu)化控制產(chǎn)電用電策略蓄冷用冷策略電網(wǎng)價(jià)格高的時(shí)候向電網(wǎng)賣多余的電電網(wǎng)價(jià)格低的時(shí)候蓄冷電網(wǎng)價(jià)格高的時(shí)候放冷案例:凈零能耗建筑系統(tǒng)的優(yōu)化設(shè)計(jì)與優(yōu)化控制42第一類:海量數(shù)據(jù)高度冗余語(yǔ)音識(shí)別(Google)每天超過(guò)5億條的社交語(yǔ)言數(shù)據(jù)積累。微軟機(jī)器翻譯已達(dá)到人類平等水平圖像識(shí)別(Google)幾十億量級(jí)音頻庫(kù)識(shí)別80種語(yǔ)言95%的準(zhǔn)確率數(shù)據(jù)量:測(cè)點(diǎn)數(shù)量遠(yuǎn)遠(yuǎn)少于能夠描述完整熱力過(guò)程所需要(量級(jí)之差)冗余度低:物理(測(cè)點(diǎn))冗余度低,數(shù)值(物理公式角度)冗余度低當(dāng)下熱門的三類人工智能熱力系統(tǒng)現(xiàn)狀千萬(wàn)量級(jí)圖片訓(xùn)練16000個(gè)CPU運(yùn)行3天自動(dòng)生成“貓”的概念機(jī)器翻譯當(dāng)下深度學(xué)習(xí)和大數(shù)據(jù)技術(shù)對(duì)熱力系統(tǒng)效果如何?43
熱力領(lǐng)域現(xiàn)狀A(yù)lphaGoZero在3天內(nèi)進(jìn)行490萬(wàn)次自我對(duì)弈練習(xí),以100:0的戰(zhàn)績(jī)完勝AlphaGo無(wú)人駕駛上路前完成超過(guò)100億公里虛擬行程測(cè)試第二類:低成本大量交互試錯(cuò)當(dāng)下熱門的三類人工智能當(dāng)下深度學(xué)習(xí)和大數(shù)據(jù)技術(shù)對(duì)熱力系統(tǒng)效果如何?44系統(tǒng)之間差異較大:每個(gè)系統(tǒng)的組成、設(shè)計(jì)理念、拓?fù)浣Y(jié)構(gòu)、運(yùn)行策略和傳感器安裝均不一樣,可類比性很低熱力領(lǐng)域現(xiàn)狀購(gòu)物醫(yī)療餐飲導(dǎo)航人的衣食住行需求的標(biāo)準(zhǔn)化程度遠(yuǎn)超能源領(lǐng)域金融租房傳媒第三類:與人的需求相關(guān)的大數(shù)據(jù)技術(shù)當(dāng)下熱門的三類人工智能當(dāng)下深度學(xué)習(xí)和大數(shù)據(jù)技術(shù)對(duì)熱力系統(tǒng)效果如何?45什么是能源?什么是智慧?為什么需要智慧能源?如何實(shí)現(xiàn)智慧能源?GPT類的技術(shù)將帶來(lái)哪些變革?課程安排匯報(bào)提綱46人工通用智能的火花:GPT-4的早期實(shí)驗(yàn)2023年3月微軟研究院發(fā)表154頁(yè)重磅論文論文地址:/pdf/2303.12712v1.pdf它比之前的AI模型表現(xiàn)出更多的通用智能我們證明,除了對(duì)語(yǔ)言的掌握,GPT-4還能解決跨越數(shù)學(xué)、編程、視覺、醫(yī)學(xué)、法律、心理學(xué)等領(lǐng)域的新穎而困難的任務(wù),而不需要任何特殊的提示47我們對(duì)GPT-4的研究完全是現(xiàn)象學(xué)的:我們專注于GPT-4能做的令人驚訝的事情,但我們沒(méi)有解決為什么以及如何實(shí)現(xiàn)如此卓越的智能的基本問(wèn)題。它是如何推理、計(jì)劃和創(chuàng)造的?當(dāng)它的核心只是簡(jiǎn)單的算法組合--梯度下降和大規(guī)模變換器與極其大量的數(shù)據(jù)的結(jié)合時(shí),它為什么會(huì)表現(xiàn)出如此普遍和靈活的智能?這些問(wèn)題是LLM的神秘和魅力的一部分,它挑戰(zhàn)了我們對(duì)學(xué)習(xí)和認(rèn)知的理解,激發(fā)了我們的好奇心,并推動(dòng)了更深入的研究。關(guān)鍵的方向包括正在進(jìn)行的對(duì)LLMs中的涌現(xiàn)現(xiàn)象的研究2023年3月微軟研究院發(fā)表154頁(yè)重磅論文涌現(xiàn)現(xiàn)象論文地址:/pdf/2303.12712v1.pdf48GPT發(fā)展歷史模型參數(shù)的不斷增大技術(shù)創(chuàng)新的不斷引入應(yīng)用場(chǎng)景的不斷擴(kuò)展49GPT賦能各行各業(yè)ChipGPT
GPT大模型自動(dòng)完成設(shè)計(jì)芯片Source:KaiyanChang,etal.“ChipGPT:Howfararewefromnaturallanguagehardwaredesign”Framework+PromptEngineering50GPT賦能各行各業(yè)信息搜索...日常辦公編寫程序51GPT賦能各行各業(yè)
GPT大模型游戲公司Source:ChenQian,etal.“CommunicativeAgentsforSoftwareDevelopmen”Source:RongshengWang,etal.XrayGLM-/WangRongsheng/XrayGLMXrayGLMGPT大模型進(jìn)行醫(yī)學(xué)影像診斷多模態(tài)GPTChatDev多智能體交互52論文中的一些測(cè)試用例:冷機(jī)閥門故障診斷53論文中的一些測(cè)試用例:空調(diào)系統(tǒng)冷凍水供回水溫度分析54論文中的一些測(cè)試用例:建筑能耗建模55用SCL語(yǔ)言寫一個(gè)PLC里面用的冷水機(jī)組負(fù)載調(diào)控代碼56室內(nèi)溫濕度的PID控制57室內(nèi)溫濕度的PID控制58GPT+建筑能源領(lǐng)域數(shù)據(jù)挖掘方面的展望
負(fù)荷預(yù)測(cè)優(yōu)化控制故障診斷數(shù)據(jù)挖掘解決思路:GPT有強(qiáng)大的理解、生成自然語(yǔ)言和模式識(shí)別能力,在特定應(yīng)用中有潛力部分取代人工。行業(yè)問(wèn)題與需求:數(shù)據(jù)挖掘方法在建筑能源系統(tǒng)的應(yīng)用過(guò)程中過(guò)于依賴人工,亟需類人的通用性的數(shù)據(jù)挖掘能力.建筑數(shù)據(jù)空調(diào)照明電梯……數(shù)據(jù)導(dǎo)入部分替代人工解決問(wèn)題59GPT在建筑能源管理中的應(yīng)用基于GPT-4具有的強(qiáng)大編程、理解自然語(yǔ)言和推理能力,我們期望其能夠自動(dòng)完成建筑能源系統(tǒng)中的能源負(fù)荷預(yù)測(cè),故障診斷和異常檢測(cè)任務(wù)。60基于GPT輔助的建筑負(fù)荷預(yù)測(cè)的初步嘗試通過(guò)人工與GPT的交互,可以實(shí)現(xiàn)建筑負(fù)荷預(yù)測(cè)的任務(wù)的自動(dòng)編程,涉及數(shù)據(jù)預(yù)處理、特征工程、模型訓(xùn)練、模型評(píng)估、結(jié)果可視化和模型解釋等環(huán)節(jié).評(píng)估指標(biāo):代碼的正確性:預(yù)測(cè)精度:一致性:MAE、MSE、RMSE、MAPE、R2、CV-RMSE61基于GPT輔助的建筑負(fù)荷預(yù)測(cè)的初步嘗試62基于GPT輔助的建筑負(fù)荷預(yù)測(cè)的初步嘗試63GPT在能源負(fù)荷預(yù)測(cè)任務(wù)上的性能GPT-4能夠自動(dòng)的通過(guò)編寫程序?qū)崿F(xiàn)數(shù)據(jù)預(yù)處理到模型解釋的全部過(guò)程預(yù)測(cè)精度GPT生成模型解釋方法代碼GPT在負(fù)荷預(yù)測(cè)任務(wù)上的不足無(wú)法正確選擇合適的特征變量GPT-4更傾向于首先選擇室外空氣溫度、室外空氣相對(duì)濕度和歷史冷負(fù)荷作為模型輸入,與時(shí)間相關(guān)的變量通常會(huì)被忽略。缺少對(duì)于時(shí)間相關(guān)變量的選擇無(wú)法正確利用python包進(jìn)行模型解釋應(yīng)用LIME來(lái)解釋分類任務(wù),而不是解釋回歸任務(wù)。GPT模型對(duì)特定領(lǐng)域的理解還不夠深入,或者在理解和應(yīng)用Python庫(kù)時(shí)還存在缺陷。GPT在負(fù)荷預(yù)測(cè)任務(wù)上的不足基于GPT的空氣處理機(jī)組故障診斷故障編號(hào)故障類型1排氣風(fēng)門卡?。ㄍ耆蜷_)2排氣風(fēng)門卡?。ㄍ耆P(guān)閉)3回風(fēng)機(jī)卡在固定轉(zhuǎn)速4回風(fēng)機(jī)完全失靈5室外空氣風(fēng)門泄漏6室外空氣風(fēng)門卡?。ㄍ耆P(guān)閉)7冷卻盤管閥卡?。ㄍ耆蜷_)8冷卻盤管閥正向卡住(部分打開)9冷卻盤管閥被卡?。ㄍ耆P(guān)閉)10冷卻盤管閥被反向卡住(部分打開)11加熱盤管閥泄漏12送風(fēng)機(jī)后空氣處理機(jī)組管道泄漏13送風(fēng)機(jī)前空氣處理機(jī)組管道泄漏14冷卻盤管閥控制不穩(wěn)定以空氣處理機(jī)組(AHU)為例,從ASHRAERP-1312項(xiàng)目中收集故障數(shù)據(jù)和正常數(shù)據(jù),并考慮14種故障類型,用以評(píng)估GPT性能。每次評(píng)估用相同的Prompt和GPT-4進(jìn)行5次獨(dú)立對(duì)話。Case1:僅提供故障數(shù)據(jù)和潛在故障的列表,GPT可否正確診斷?Case2:提供故障時(shí)候的數(shù)據(jù)和故障列表,以及無(wú)故障時(shí)候的數(shù)據(jù),GPT可否正確診斷?Case3:提供故障時(shí)候的數(shù)據(jù),以及無(wú)故障時(shí)候的數(shù)據(jù),GPT可否正確診斷?提供無(wú)故障數(shù)據(jù)的描述已知一個(gè)夏季運(yùn)行的空氣處理機(jī)組在某一天穩(wěn)定運(yùn)行時(shí)相關(guān)參數(shù)如下:相關(guān)變量的平均值如下:加熱盤管閥位置0.0%;冷卻盤管閥位置41.92%;……相關(guān)變量的標(biāo)準(zhǔn)差如下:送風(fēng)溫度0.26℃;送風(fēng)機(jī)轉(zhuǎn)速3.24%;……提供潛在故障的范圍根據(jù)以上提供的數(shù)據(jù),分析判斷當(dāng)天AHU是否出現(xiàn)故障。如果有,請(qǐng)給出故障類型并做出解釋。可選的故障類型如下:故障1排氣風(fēng)門卡?。ㄈ_)故障2排氣風(fēng)門卡住(全關(guān))故障3回風(fēng)機(jī)卡在固定轉(zhuǎn)速故障4……提供故障數(shù)據(jù)的描述已知一個(gè)夏季運(yùn)行的空氣處理機(jī)組在某一天穩(wěn)定運(yùn)行時(shí)獲得的故障數(shù)據(jù)如下:相關(guān)變量的平均值如下:冷卻盤管閥位置41.92%;……相關(guān)變量的標(biāo)準(zhǔn)差如下:冷卻盤管閥位置10.78%;……Prompt示例:基于GPT的空氣處理機(jī)組故障診斷68基于GPT的空氣處理機(jī)組故障診斷69基于GPT的空氣處理機(jī)組故障診斷70基于GPT的空氣處理機(jī)組故障診斷71基于GPT的空氣處理機(jī)組故障診斷不使用故障列表,回答自由度提高,某些故障診斷能力提升(如故障10),但穩(wěn)定性有所下降。使用故障和正常數(shù)據(jù)和故障列表,診斷正確率與推理正確性均得到提高,但還是無(wú)法診斷某些故障。僅使用故障數(shù)據(jù),在某些故障上效果很好,但有相當(dāng)一部分故障無(wú)法被診斷。評(píng)價(jià)指標(biāo):診斷正確率:在m次對(duì)話中,統(tǒng)計(jì)GPT正確診斷故障的次數(shù)。推理正確率:在m次對(duì)話中,統(tǒng)計(jì)GPT正確解釋診斷結(jié)果的次數(shù)。基于GPT的空氣處理機(jī)組故障診斷GPT在故障診斷上的不足部分情況下,不理解故障和征兆之間的關(guān)系GPT無(wú)法理解某些故障下關(guān)鍵變量的變化關(guān)系。GPT-4無(wú)法理解“冷卻盤管閥卡死(部分打開)”的故障下關(guān)鍵征兆的變化,導(dǎo)致誤診。GPT在故障診斷上的不足由于知識(shí)過(guò)多,存在過(guò)擬合現(xiàn)象(混淆知識(shí)點(diǎn))GPT-4認(rèn)為為了節(jié)能而關(guān)閉排風(fēng)閥門是正常的。因此,它無(wú)法正確診斷“排風(fēng)閥門卡住(完全關(guān)閉)”故障。GPT-4學(xué)習(xí)了過(guò)多的知識(shí),但是又沒(méi)有精準(zhǔn)理解知識(shí)之間的關(guān)系,因此其推理可能會(huì)過(guò)度擬合。75GPT對(duì)腦力勞動(dòng)的革命:生成式AI(AIgenerateactions)76GPT對(duì)腦力勞動(dòng)的革命:生成式AI(AIgenerateactions)77GPT對(duì)腦力勞動(dòng)的革命:生成式AI(AIgenerateactions)78GPT對(duì)腦力勞動(dòng)的革命:生成式AI(AIgenerateactions)79浙大趙陽(yáng)研究員團(tuán)隊(duì)在暖通GPT方面的初步嘗試目前學(xué)會(huì)了暖通本科生課程,和ChatGPT相比具有更為體系的專業(yè)基礎(chǔ)知識(shí)80結(jié)論:未來(lái)已來(lái),工業(yè)4.0革命的序幕即將拉開GPT初步具有通用人工智能,具有一定的普適應(yīng)用價(jià)值,是新生產(chǎn)力未來(lái)大部分知識(shí)的生產(chǎn)創(chuàng)造的邊際成本趨近于零從SaaS(軟件即服務(wù))到MaaS(模型即服務(wù))生成式AI是解決暖通痛點(diǎn)問(wèn)題的有潛力發(fā)展方向AGI的模型將成為智能社會(huì)的“水暖電”數(shù)字孿生具有高效性、可解釋性、可靠性等優(yōu)點(diǎn),有望成為暖通制冷生成式AI的底座亟需思考未來(lái)制冷暖通人才的培養(yǎng)的改革81人們不僅容易高估未來(lái)1-2年的趨勢(shì),
而且更容易低估未來(lái)10年的趨勢(shì)!關(guān)于未來(lái):AGI技術(shù)日新月異加速發(fā)展未來(lái)會(huì)有幾百幾千個(gè)類GPT模型類GPT技術(shù)之后會(huì)是什么樣的人工智能?它會(huì)引爆什么新的技術(shù)?類GPT模型將對(duì)暖通領(lǐng)域顛覆什么?帶來(lái)什么?未來(lái)的價(jià)值點(diǎn)在哪里?暖通及傳統(tǒng)工科未來(lái)的發(fā)展?82GPT類技術(shù)帶來(lái)的曙光,將有望打破之前的認(rèn)知先前認(rèn)知(摘自本人2018年的一個(gè)學(xué)術(shù)報(bào)告)GPT類的初期通用人工智能技術(shù)將加速引領(lǐng)進(jìn)入智能化時(shí)代83在此之前,阻礙AI技術(shù)在我們領(lǐng)域應(yīng)用的難題之一在于“升維”的復(fù)雜度和難度高。也就是不同維度的智能能力的疊加。GPT技術(shù)有潛力天然打通這些環(huán)節(jié)。先前認(rèn)知(摘自本人2018年的一個(gè)學(xué)術(shù)報(bào)告)GPT類的初期通用人工智能技術(shù)將加速引領(lǐng)進(jìn)入智能化時(shí)代84初期通用人工智能技術(shù)將加速引領(lǐng)進(jìn)入智能化時(shí)代2018年初期AGI類技術(shù)出現(xiàn),有可能將這個(gè)時(shí)間點(diǎn)大幅度提前先前認(rèn)知(摘自本人2018年的一個(gè)學(xué)術(shù)報(bào)告)85其他熱力系統(tǒng)云腦綜合能源云腦電力云腦燃?xì)庠颇X智慧城市智慧地球復(fù)雜熱力系統(tǒng)云腦是未來(lái)綜合能源云腦的基礎(chǔ)節(jié)點(diǎn)從以人交互為主變?yōu)橐詿o(wú)中心云腦互聯(lián)為主“云腦”間相互協(xié)同,動(dòng)態(tài)優(yōu)化能源生產(chǎn)、運(yùn)輸和利用過(guò)程(例如動(dòng)態(tài)電價(jià)下的發(fā)電用電規(guī)劃,等)建筑能源系統(tǒng)云腦公共建筑和能源站等未來(lái)的智慧能源時(shí)代:云腦互聯(lián)86什么是能源?什么是智慧?為什么需要智慧能源?如何實(shí)現(xiàn)智慧能源?GPT類的技術(shù)將帶來(lái)哪些變革?課程安排匯報(bào)提綱87本課程主要關(guān)于智慧能源及大數(shù)據(jù)技術(shù)的最新發(fā)展,講授大數(shù)據(jù)技術(shù)和人工智能在能源系統(tǒng)數(shù)據(jù)分析中的應(yīng)用及其原理,讓學(xué)生掌握能源系統(tǒng)大數(shù)據(jù)處理的編程方法,具備開發(fā)能源系統(tǒng)大數(shù)據(jù)分析的理論基礎(chǔ)。本課程將采用實(shí)際能源系統(tǒng)數(shù)據(jù)進(jìn)行案例教學(xué),培養(yǎng)學(xué)生具備大數(shù)據(jù)實(shí)踐能力。理論數(shù)據(jù)實(shí)踐課程目標(biāo)88能夠”手撕”基礎(chǔ)算法,熟練掌握算法原理能夠”手寫”算法代碼能夠用python解決智慧能源基礎(chǔ)類型問(wèn)題代碼編程實(shí)戰(zhàn)基礎(chǔ)算法周一:算法理論<授課教師>周四:編程答疑<助教和博碩同學(xué)>課后作業(yè)交作業(yè)課程要求歡迎交流!能源系統(tǒng)數(shù)據(jù)預(yù)處理能源系統(tǒng)大數(shù)據(jù)分析理論與實(shí)踐第二節(jié)90目錄能源系統(tǒng)中的數(shù)據(jù)數(shù)據(jù)清洗方法數(shù)據(jù)降維方法數(shù)據(jù)規(guī)范化方法數(shù)據(jù)轉(zhuǎn)換方法數(shù)據(jù)分割方法91數(shù)據(jù)來(lái)源溫度傳感器水泵電機(jī)壓力傳感器能源系統(tǒng)的數(shù)據(jù)通常來(lái)自傳感器的測(cè)量信號(hào)和執(zhí)行器的執(zhí)行信號(hào):數(shù)據(jù)的格式和特點(diǎn)能源系統(tǒng)運(yùn)行數(shù)據(jù)注意:不是所有運(yùn)行數(shù)據(jù)的連續(xù)變量都具有嚴(yán)格的連續(xù)含義,如定頻運(yùn)行的水泵。93連續(xù)數(shù)值變量:取值為連續(xù)區(qū)間類別變量:取值為離散值如:水管流速,房間溫濕度等如:設(shè)備開關(guān)、時(shí)間變量頻率:50HZ0HZ10相對(duì)濕度:[0,1]設(shè)備開關(guān)狀態(tài):{0,1}數(shù)據(jù)的表現(xiàn)形式能源系統(tǒng)運(yùn)行數(shù)據(jù)的存儲(chǔ):二維數(shù)據(jù)表94典型建筑運(yùn)行數(shù)據(jù)格式分析數(shù)據(jù)的時(shí)序關(guān)系分析變量的靜態(tài)關(guān)系采集間隔:秒、分鐘、小時(shí)、天…實(shí)際分析角度:靜態(tài)關(guān)系、時(shí)序關(guān)系…特定時(shí)間點(diǎn)收集到的觀測(cè)值采集時(shí)間數(shù)據(jù)存在的問(wèn)題95能源系統(tǒng)運(yùn)行機(jī)理復(fù)雜,數(shù)據(jù)采集、儲(chǔ)存的過(guò)程中容易出現(xiàn)各種問(wèn)題,數(shù)據(jù)整體質(zhì)量低,存在缺失值、異常值。因此,需要引入數(shù)據(jù)清洗方法:正常值缺失值異常值某實(shí)際建筑2017年運(yùn)行數(shù)據(jù)中:缺失值占比約為8%異常值占比約為5%數(shù)據(jù)預(yù)處理方法96能源領(lǐng)域中,不同的應(yīng)用需求對(duì)數(shù)據(jù)有著不同的要求,因此需要引入一系列數(shù)據(jù)預(yù)處理方法,提高后續(xù)工作的可靠性:常見數(shù)據(jù)預(yù)處理方法匯總目錄能源系統(tǒng)中的數(shù)據(jù)數(shù)據(jù)清洗方法數(shù)據(jù)降維方法數(shù)據(jù)規(guī)范化方法數(shù)據(jù)轉(zhuǎn)換方法數(shù)據(jù)分割方法97數(shù)據(jù)清洗98目的:改善原始數(shù)據(jù)質(zhì)量缺失值實(shí)例:冷機(jī)2017年1月1日冷凍出水溫度數(shù)據(jù)集溫度/℃冷凍水出水溫度陡增,不符合領(lǐng)域認(rèn)知溫度/℃該時(shí)間段內(nèi)沒(méi)有對(duì)應(yīng)數(shù)據(jù)缺失值:各種原因?qū)е碌臄?shù)據(jù)缺失現(xiàn)象,數(shù)據(jù)樣本存在未完整記錄的數(shù)值異常值:不符合常理或系統(tǒng)運(yùn)行規(guī)律的數(shù)值,如取值超出正常范圍、連續(xù)呈現(xiàn)固定狀態(tài)等異常值實(shí)例:冷機(jī)2017年1月20-22日冷凍出水溫度數(shù)據(jù)集缺失值處理異常值識(shí)別能源領(lǐng)域中的缺失值缺失值出現(xiàn)的主要原因:人工采集錯(cuò)誤:數(shù)據(jù)采集人員疏忽大意等人為因素導(dǎo)致的部分?jǐn)?shù)據(jù)沒(méi)有被記錄采集儀表故障:傳感器接觸不良、發(fā)生故障等原因?qū)е碌牟糠謹(jǐn)?shù)據(jù)沒(méi)有被采集數(shù)據(jù)儲(chǔ)存故障:斷電或者數(shù)據(jù)儲(chǔ)存設(shè)備損壞等原因?qū)е碌牟糠謹(jǐn)?shù)據(jù)沒(méi)有被儲(chǔ)存缺失值的影響:個(gè)別變量的數(shù)據(jù)缺失:無(wú)法對(duì)數(shù)據(jù)缺失時(shí)段的統(tǒng)計(jì)規(guī)律進(jìn)行有效分析某些變量的數(shù)據(jù)缺失:回歸建模過(guò)程中缺少這些變量的有效信息,影響模型精度99缺失值處理方法100舉例:假設(shè)目前只有50個(gè)歷史數(shù)據(jù)樣本可供使用,且其中20個(gè)數(shù)據(jù)樣本包含缺失值丟棄補(bǔ)全缺失值處理方法丟棄:缺失值樣本的比例較小,不會(huì)顯著影響數(shù)據(jù)分析的質(zhì)量補(bǔ)全:缺失值樣本的比例過(guò)大,或者樣本采集的成本過(guò)高丟棄補(bǔ)全單變量補(bǔ)全單變量補(bǔ)全:用目標(biāo)變量的數(shù)據(jù)特征來(lái)推斷缺失值101均值/中位數(shù)插補(bǔ):表中所有有值數(shù)據(jù)的統(tǒng)計(jì)量:
均值:24
中位數(shù):25T=6和T=7時(shí)刻的缺失值由數(shù)據(jù)集的均值或中位數(shù)填補(bǔ)均值插補(bǔ)補(bǔ)全方法單變量補(bǔ)全多變量補(bǔ)全中位數(shù)插補(bǔ)正向/反向時(shí)序插補(bǔ)移動(dòng)平均法插補(bǔ)單變量補(bǔ)全102正向/反向時(shí)序插補(bǔ):正向:采用最鄰近缺失值的上一時(shí)刻數(shù)值進(jìn)行補(bǔ)全:
選取T=5時(shí)刻的真實(shí)值(30)反向:采用最鄰近缺失值的下一時(shí)刻數(shù)值進(jìn)行補(bǔ)全:
選取T=8時(shí)刻的真實(shí)值(35)均值插補(bǔ)補(bǔ)全方法單變量補(bǔ)全多變量補(bǔ)全中位數(shù)插補(bǔ)正向/反向時(shí)序插補(bǔ)移動(dòng)平均法插補(bǔ)單變量補(bǔ)全103移動(dòng)平均插補(bǔ):固定時(shí)間窗口w,計(jì)算最鄰近缺失值的w個(gè)連續(xù)數(shù)值的均值設(shè)w=3,則T=6時(shí)刻的缺失值:計(jì)算T=3、4、5時(shí)刻的數(shù)據(jù)均值(20+25+30)/3=25T=7時(shí)刻的缺失值:計(jì)算T=4、5時(shí)刻的真實(shí)值和T=6時(shí)刻的填補(bǔ)值的均值(25+30+25)/3=27均值插補(bǔ)補(bǔ)全方法單變量補(bǔ)全多變量補(bǔ)全中位數(shù)插補(bǔ)正向或反向時(shí)序插補(bǔ)移動(dòng)平均法插補(bǔ)多變量補(bǔ)全多變量補(bǔ)全:尋找其他參考變量與目標(biāo)變量的關(guān)系來(lái)估算缺失值104K鄰近算法補(bǔ)全方法單變量補(bǔ)全多變量補(bǔ)全基于回歸思想基于K近鄰的缺失值填充:通過(guò)參考變量(較易獲得且準(zhǔn)確的變量,如時(shí)間、溫度…)的取值確定樣本鄰近關(guān)系,根據(jù)K個(gè)最鄰近的完整樣本數(shù)值計(jì)算缺失值令K=3。T=6時(shí),參考變量取值為21,最鄰近的3個(gè)參考變量取值為18、15、14,分別對(duì)應(yīng)T=8、5、9時(shí)刻的樣本T=6時(shí)刻的目標(biāo)變量:計(jì)算對(duì)應(yīng)三個(gè)時(shí)刻目標(biāo)變量的均值,即(30+35+30)/3=32多變量補(bǔ)全105基于回歸思想的缺失值填補(bǔ):
×2K鄰近算法補(bǔ)全方法單變量補(bǔ)全多變量補(bǔ)全基于回歸思想異常值人工采集錯(cuò)誤:人工輸入的疏忽儀表測(cè)量誤差:儀器測(cè)量誤差或性能漂移導(dǎo)致,最為常見數(shù)據(jù)處理錯(cuò)誤:運(yùn)行算法時(shí),一些操作錯(cuò)誤可能導(dǎo)致數(shù)據(jù)出現(xiàn)異常值6.1℃60.1℃T1:6.1℃T2:6.2℃T3:8.2℃……T:42.1℃F:6.1Hz106異常值出現(xiàn)的常見原因:異常值的影響:導(dǎo)致數(shù)據(jù)挖掘出現(xiàn)不可解釋的結(jié)果/誤導(dǎo)性結(jié)果大量異常值會(huì)大大降低回歸模型的精度和可靠性箱線圖箱線圖是一種用于顯示一組數(shù)據(jù)分布情況的統(tǒng)計(jì)圖,常用于快速識(shí)別異常值箱線圖的繪制方法:找出一組數(shù)據(jù)的上邊緣、下邊緣、中位數(shù)和兩個(gè)四分位數(shù)連接兩個(gè)四分位數(shù)畫出箱體將上邊緣和下邊緣與箱體相連接,中位數(shù)在箱體中識(shí)別原理:異常值往往明顯偏離正常測(cè)量值107單變量識(shí)別:觀測(cè)目標(biāo)變量自身的分布情況,利用統(tǒng)計(jì)方法確定少概率異常樣本異常值識(shí)別方法:單變量識(shí)別多變量識(shí)別四分間距法(箱線圖)3σ法箱線圖108上邊緣Q3+1.5IQR下邊緣Q1-1.5IQR下四分位數(shù)Q1上四分位數(shù)Q3中位數(shù)異常值異常值四分位距IQR=Q3-Q1下四分位數(shù):一組數(shù)據(jù)從小到大排序后處于25%位置上的值上四分位數(shù):一組數(shù)據(jù)從小到大排序后處于75%位置上的值四分間距法示例例:對(duì)于表中數(shù)據(jù)109
序列目標(biāo)樣本1102153204255306407208259301035四分間距法的應(yīng)用110ZhangC,ZhaoY,LiT,ZhangX,LuoJ.Acomprehensiveinvestigationofknowledgediscoveredfromhistoricaloperationaldataofatypicalbuildingenergysystem.JournalofBuildingEngineering2021;42:102502.1113σ法3σ原則:假設(shè)一組檢測(cè)數(shù)據(jù)中只含有隨機(jī)誤差,通過(guò)計(jì)算得到標(biāo)準(zhǔn)偏差σ,按一定概率確定一個(gè)區(qū)間,將超過(guò)這個(gè)區(qū)間的誤差剔除。使用前提:樣本數(shù)據(jù)呈正態(tài)或近似正態(tài)分布,且測(cè)量次數(shù)充分大3σ原則:數(shù)值分布在(μ-σ,μ+σ)中的概率為68.27%數(shù)值分布在(μ-2σ,μ+2σ)中的概率為95.45%數(shù)值分布在(μ-3σ,μ+3σ)中的概率為99.73%服從正態(tài)分布的數(shù)據(jù)取值幾乎全部集中在(μ-3σ,μ+3σ)區(qū)間內(nèi),超出這個(gè)范圍的可能性僅占不到0.3%,這些超出范圍的數(shù)據(jù)可以認(rèn)為是異常值μ為平均值σ為標(biāo)準(zhǔn)差例:對(duì)于表中數(shù)據(jù)112
討論:3-sigma認(rèn)定的上下限范圍要比IQR方法更大,因此,3-sigma方法也是更為保守的一種異常值識(shí)別方法。序列目標(biāo)樣本11021532042553064072082593010353σ法示例1133σ法的應(yīng)用某冷水機(jī)組冷卻水出水溫度分布異常值占比:0.8%-3σ+3σ多變量識(shí)別方法很多復(fù)雜的異常情況并不能從單一維度進(jìn)行有效識(shí)別多變量識(shí)別方法114二維空間異常點(diǎn)示意圖基于距離的異常值識(shí)別方法基于密度的異常值識(shí)別方法注:多變量異常識(shí)別方法多通過(guò)聚類算法實(shí)現(xiàn)。例如,通過(guò)k-means聚類實(shí)現(xiàn)基于距離的方法,通過(guò)DBSCAN聚類實(shí)現(xiàn)基于密度的方法。它們將在第三章進(jìn)行介紹?;诰嚯x基于密度目錄能源系統(tǒng)中的數(shù)據(jù)數(shù)據(jù)清洗方法數(shù)據(jù)降維方法數(shù)據(jù)規(guī)范化方法數(shù)據(jù)轉(zhuǎn)換方法數(shù)據(jù)分割方法115數(shù)據(jù)降維方法能源系統(tǒng)運(yùn)行數(shù)據(jù)的冗余性:116某能源系統(tǒng)#1數(shù)據(jù)采集結(jié)果…樣本數(shù)量大樣本維度變量維度采集頻率高,相鄰數(shù)據(jù)差異小某能源系統(tǒng)#2數(shù)據(jù)采集結(jié)果監(jiān)測(cè)變量為24個(gè)樣本維度變量維度樣本維度降維方法117樣本維度降維方法依賴抽樣技術(shù):隨機(jī)抽樣:從數(shù)據(jù)集中隨機(jī)選擇一定比例的數(shù)據(jù)隨機(jī)分層采樣:對(duì)數(shù)據(jù)集進(jìn)行劃分并對(duì)子數(shù)據(jù)集分別隨機(jī)抽樣隨機(jī)抽樣示意圖隨機(jī)分層抽樣示意圖隨機(jī)抽樣隨機(jī)分層采樣樣本維度降維方法118基于規(guī)則的樣本篩選在時(shí)間維度上,某時(shí)刻的數(shù)據(jù)與前后幾分鐘的數(shù)據(jù)間相似度較高。在進(jìn)行數(shù)據(jù)降維時(shí),可以只選擇每個(gè)整點(diǎn)的數(shù)據(jù)作為樣本,提升計(jì)算效率基于規(guī)則的樣本篩選基于規(guī)則的樣本篩選方法通常需要結(jié)合領(lǐng)域知識(shí)與實(shí)際情況,因地制宜地進(jìn)行設(shè)置變量維度降維方法119變量維度降維方法基于領(lǐng)域知識(shí)的方法:基于專家經(jīng)驗(yàn)選取變量中最相關(guān)的變量組合基于統(tǒng)計(jì)學(xué)方法:篩選出與建模目標(biāo)變量高度相關(guān)的變量過(guò)濾式:根據(jù)相關(guān)性指標(biāo)對(duì)變量進(jìn)行排序選擇包裹式:對(duì)不同組合的輸入變量進(jìn)行數(shù)據(jù)試驗(yàn)獲取最佳特征子集;嵌入式:使用機(jī)器學(xué)習(xí)算法確定最優(yōu)特征變量。注:具體實(shí)現(xiàn)過(guò)程將在第四章《特征工程》中介紹基于領(lǐng)域知識(shí)基于統(tǒng)計(jì)方法能耗進(jìn)水溫度出水溫度流量
目錄能源系統(tǒng)中的數(shù)據(jù)數(shù)據(jù)清洗方法數(shù)據(jù)降維方法數(shù)據(jù)規(guī)范化方法數(shù)據(jù)轉(zhuǎn)換方法數(shù)據(jù)分割方法120數(shù)據(jù)規(guī)范化的意義121能源系統(tǒng)數(shù)據(jù)中的變量:能源系統(tǒng)常見數(shù)據(jù)類型的變化范圍不同量綱變量的影響變化范圍小的變量對(duì)模型效果影響微弱溫度:18~26℃相對(duì)濕度:30%~80%建筑負(fù)荷:kW~MW量綱不同范圍不同溫度T/℃相對(duì)濕度φ0130
數(shù)據(jù)規(guī)范化的意義122建筑能源領(lǐng)域主流數(shù)據(jù)規(guī)范化處理方法:
Z-score標(biāo)準(zhǔn)化方法、最大最小歸一化方法Z-score標(biāo)準(zhǔn)化
12310050408030原始數(shù)據(jù)x
歸一化后的數(shù)據(jù)x’-0.868-1.2150.5210.1741.562-0.174前提假設(shè):數(shù)據(jù)滿足正態(tài)分布將原始數(shù)據(jù)集歸一化為均值為0,方差為1的數(shù)據(jù):
σ:原數(shù)據(jù)集的標(biāo)準(zhǔn)差Z-score標(biāo)準(zhǔn)化124物理意義:以標(biāo)準(zhǔn)差度量原始數(shù)據(jù)偏離均值的程度
σ:原數(shù)據(jù)集的標(biāo)準(zhǔn)差34.13%34.13%13.59%13.59%2.14%2.14%0.14%0.14%0+1σ+2σ+3σ+4σ-1σ-2σ-3σ-4σ標(biāo)準(zhǔn)差:Z分?jǐn)?shù):0+1.0+2.0+3.0+4.0-1.0-2.0-3.0-4.0
最大最小歸一化對(duì)原始數(shù)據(jù)進(jìn)行線性變換,將數(shù)據(jù)值映射到[0,1]之間:
最大值:80最小值:-1000125前提假設(shè):數(shù)據(jù)中不存在極端值-10000504080300.0000.9260.9720.9631.0000.954原始數(shù)據(jù)x歸一化后的數(shù)據(jù)x’
無(wú)法描述數(shù)據(jù)本身的分布規(guī)律最大最小歸一化
126物理意義:以百分比度量數(shù)據(jù)的相對(duì)大小
最大值:80最小值:0100504080300.1250.0000.6250.5001.0000.375原始數(shù)據(jù)x歸一化后的數(shù)據(jù)x’010304050800.12500.3750.50.6251不改變數(shù)據(jù)分布目錄能源系統(tǒng)中的數(shù)據(jù)數(shù)據(jù)清洗方法數(shù)據(jù)降維方法數(shù)據(jù)規(guī)范化方法數(shù)據(jù)轉(zhuǎn)換方法數(shù)據(jù)分割方法127數(shù)據(jù)轉(zhuǎn)換方法等寬法:將變量整體浮動(dòng)范圍分割成若干個(gè)等長(zhǎng)度的區(qū)間,將不同區(qū)間賦予不同的類別等頻法:將變量整體浮動(dòng)范圍分割成若干個(gè)包含相同樣本數(shù)的區(qū)間,將不同區(qū)間賦予不同的類別128等頻法示意圖
等寬法示意圖
連續(xù)數(shù)值型變量→類別型變量:部分算法只能處理離散變量離散變量計(jì)算成本更低等寬法的應(yīng)用129以2℃為單位,對(duì)某空調(diào)系統(tǒng)冷凍出水溫度進(jìn)行等距分箱:某空調(diào)系統(tǒng)冷凍出水溫度
等頻法的應(yīng)用130以20%為間隔,對(duì)某空調(diào)系統(tǒng)冷凍出水溫度進(jìn)行等頻分箱:某空調(diào)系統(tǒng)冷凍出水溫度
數(shù)據(jù)轉(zhuǎn)換方法131有明顯大小關(guān)系的類別型變量,可以通過(guò)簡(jiǎn)單的數(shù)字編碼將其轉(zhuǎn)換為離散的數(shù)值型變量:水泵運(yùn)行功率離散變量0Hz關(guān)機(jī)0
20Hz低速運(yùn)行150Hz高速運(yùn)行2類別型變量→連續(xù)數(shù)值型變量:保障算法的有效性數(shù)據(jù)轉(zhuǎn)換方法132時(shí)間周一周二周三周四周五周六周日轉(zhuǎn)化成1行,m-1列的矩陣100000類別型變量-連續(xù)數(shù)值型轉(zhuǎn)換方法:沒(méi)有明顯大小關(guān)系的類別型變量,通常采用獨(dú)熱(one-hot)編碼的方法進(jìn)行數(shù)據(jù)轉(zhuǎn)換:m個(gè)類別0100000010000001000000100000010000001000000目錄能源系統(tǒng)中的數(shù)據(jù)數(shù)據(jù)清洗方法數(shù)據(jù)降維方法數(shù)據(jù)規(guī)范化方法數(shù)據(jù)轉(zhuǎn)換方法數(shù)據(jù)分割方法133數(shù)據(jù)分割方法*134能源系統(tǒng)運(yùn)行過(guò)程本身存在明顯的周期性:工況環(huán)境……某辦公建筑一個(gè)月的負(fù)荷曲線工作日休息日數(shù)據(jù)分割方法*135分割方法:無(wú)監(jiān)督有監(jiān)督基于決策樹進(jìn)行能耗分級(jí)基于小波分解進(jìn)行負(fù)荷數(shù)據(jù)分割具體方法在后續(xù)章節(jié)介紹136課后習(xí)題深圳某公共建筑一年的運(yùn)行數(shù)據(jù)異常缺失使用python對(duì)缺失值進(jìn)行填充,對(duì)異常值進(jìn)行識(shí)別上傳python代碼文件與處理后的表格歡迎交流!137138線性插值x0定義:線性插值是一種針對(duì)一維數(shù)據(jù)的插值方法,它根據(jù)一維數(shù)據(jù)序列中需要插值的點(diǎn)的左右鄰近兩個(gè)數(shù)據(jù)點(diǎn)來(lái)進(jìn)行數(shù)值的估計(jì)。計(jì)算公式:已知點(diǎn)(x0,y0)和(x1,y1),填充插值點(diǎn)x處的數(shù)據(jù)y,我們可以根據(jù)(x0,y0)和(x1,y1)兩點(diǎn)所連的直線的斜率,計(jì)算出插值處y的值。xx1y0yy1XYx0y0x?x1y1139線性插值Time空調(diào)系統(tǒng)冷凍出水溫度7/19:007.637/19:107.637/19:207.637/19:30?7/19:407.597/19:507.61……Time空調(diào)系統(tǒng)冷凍出水溫度7/19:007.637/19:107.637/19:207.637/19:307.63+10*(7.59-7.63)/20=7.617/19:407.597/19:507.61……線性插值二次插值計(jì)算公式:已知(i,j)、(i+1,j)、(i,j+1)、(i+1,j+1)四個(gè)點(diǎn)的數(shù)據(jù)f(i,j)、f(i+1,j)、f(i,j+1)、f(i+1,j+1),填充(p,q)處的缺失值f(p,q)。
在線性插值中,缺失數(shù)據(jù)y由一個(gè)自變量x決定,但在某些情況下,當(dāng)缺失數(shù)據(jù)f(p,q)由兩個(gè)自變量p和q決定時(shí),則需要用二次插值來(lái)計(jì)算插值點(diǎn)的數(shù)據(jù)。f(i,j+1)f(i,j)f(i+1,j+1)f(i+1,j)f(p,q)f(p,j)f(p,j+1)140樣條插值定義:插值樣條是由一些多項(xiàng)式組成的,每一個(gè)多項(xiàng)式都是由相鄰的兩個(gè)數(shù)據(jù)點(diǎn)決定的,這樣,任意的兩個(gè)相鄰的多項(xiàng)式以及它們的導(dǎo)數(shù)在連接點(diǎn)處都是連續(xù)的。一次樣條插值:已知四個(gè)點(diǎn)(3,2.5),(4.5,1),(7,2.5),(9,0.5)。兩點(diǎn)確定一條直線,我們可以在每?jī)牲c(diǎn)間畫一條直線,就可以把所有點(diǎn)連起來(lái)。3.02.52.01.51.00.50.02.03.04.05.06.07.08.09.010.0本質(zhì)上,一次樣條插值是分段線性插值,對(duì)于處于不同區(qū)間內(nèi)的缺失值,可使用不同的線性回歸式進(jìn)行計(jì)算。但是,一次樣條插值在節(jié)點(diǎn)處不夠光滑,如何解決這一問(wèn)題?141樣條插值二次樣條插值:曲線不光滑的原因是連接點(diǎn)處的一次函數(shù)導(dǎo)數(shù)不相同。如果可以用二次函數(shù)代替,保證不同分段函數(shù)在節(jié)點(diǎn)處的導(dǎo)數(shù)相同,便可以使得曲線在連接點(diǎn)處光滑,這便是二次樣條插值。如下圖所示,共有4個(gè)點(diǎn),x0,x1,x2,x3,有3個(gè)區(qū)間,需要3個(gè)二次樣條,每個(gè)二次樣條均為二次函數(shù)ax2+bx+c,故總計(jì)需要估計(jì)9個(gè)未知參數(shù)。142樣條插值
143樣條插值二次樣條插值連續(xù)光滑,看起來(lái)效果還行,但是前兩個(gè)點(diǎn)之間是直線,這是假設(shè)a1為0造成的,同時(shí),曲線末端過(guò)于陡峭。二次函數(shù)最高項(xiàng)系數(shù)為0,導(dǎo)致變成直線,那三次函數(shù)最高項(xiàng)系數(shù)為0,還是曲線,插值效果應(yīng)該更好。于是,便有了三次樣條插值。3.02.03.01.00.0-1.04.05.06.07.08.09.0144樣條插值三次樣條插值:三次樣條思路與二次樣條基本相同,假設(shè)有4個(gè)點(diǎn),3個(gè)區(qū)間,那么需要3個(gè)三次樣條,每個(gè)三次樣條為ax3+bx2+cx+d,故總計(jì)需要估計(jì)12個(gè)未知參數(shù)。計(jì)算方法:1.內(nèi)部節(jié)點(diǎn)處的函數(shù)值應(yīng)該相等。2.函數(shù)的第一個(gè)端點(diǎn)和最后一個(gè)端點(diǎn),應(yīng)該分別在第一個(gè)方程和最后一個(gè)方程中。3.兩個(gè)函數(shù)在節(jié)點(diǎn)處的一階導(dǎo)數(shù)應(yīng)該相等。4.兩個(gè)函數(shù)在節(jié)點(diǎn)處的二階導(dǎo)數(shù)應(yīng)該相等。
5.假設(shè)端點(diǎn)處的二階導(dǎo)數(shù)為零:a1=0b1=0145無(wú)監(jiān)督學(xué)習(xí)—Clustering&AssociationRule能源系統(tǒng)人工智能方法
第三節(jié)能源系統(tǒng)運(yùn)行過(guò)程中會(huì)產(chǎn)生海量的數(shù)據(jù)數(shù)據(jù)特點(diǎn):變量種類多、數(shù)據(jù)體量大、價(jià)值密度低、數(shù)據(jù)標(biāo)簽稀缺背景如何從繁雜的數(shù)據(jù)中提取有用的信息?147數(shù)據(jù)挖掘技術(shù)被認(rèn)為是解決這一問(wèn)題的方法背景DataminingHVACsystemoperationdata高價(jià)值數(shù)據(jù)148背景無(wú)監(jiān)督學(xué)習(xí)算法是常用的數(shù)據(jù)挖掘方法:無(wú)監(jiān)督學(xué)習(xí):樣本的標(biāo)記信息未知,通過(guò)對(duì)樣本的學(xué)習(xí)來(lái)揭示數(shù)據(jù)的內(nèi)在性質(zhì)和規(guī)律的過(guò)程對(duì)數(shù)據(jù)做進(jìn)一步分析有價(jià)值知識(shí)149背景無(wú)監(jiān)督學(xué)習(xí)算法典型能源應(yīng)用場(chǎng)景:150背景無(wú)監(jiān)督學(xué)習(xí)的一般流程:數(shù)據(jù)預(yù)處理無(wú)監(jiān)督數(shù)據(jù)挖掘知識(shí)后挖掘151背景聚類定義與基本原理原型聚類(以k-means算法為代表)密度聚類(以DBSCAN為代表)層次聚類(以AGNES為代表)關(guān)聯(lián)規(guī)則挖掘定義與基本原理Apriori算法FP-growth算法應(yīng)用案例知識(shí)后挖掘聚類后挖掘關(guān)聯(lián)規(guī)則后挖掘提綱152聚類的定義數(shù)據(jù)聚類結(jié)果示意圖聚類結(jié)果:算法自動(dòng)生成簇的意義:由使用者定義聚類(Clustering):將數(shù)據(jù)集中的樣本劃分為若干個(gè)通常是不相交的子集,每個(gè)子集稱為一個(gè)“簇”(cluster)三個(gè)聚類簇153數(shù)學(xué)表達(dá)樣本集D:包含m個(gè)樣本每個(gè)樣本xi:為一個(gè)包含n個(gè)數(shù)的向量聚類過(guò)程:基于樣本間的相似程度將樣本集中的樣本劃分為k個(gè)子集(聚類簇)聚類目的:得到包含每個(gè)樣本歸屬于哪個(gè)簇的簇標(biāo)記向量
x聚類簇?cái)?shù)目k=2x1x3x2x4x5x6聚類算法1x2x3x4x5x6樣本集(樣本數(shù)m=6)聚類簇1聚類簇2x11x12含n=2個(gè)數(shù)154相似性度量相似性度量:用于定量估計(jì)樣本間的相似程度分類:幾何距離的性質(zhì):非負(fù)性:樣本之間的距離大于等于0同一性:相同樣本間的距離為0對(duì)稱性:樣本互相交換位置不改變結(jié)果直遞性:兩點(diǎn)之間直線距離最短155相似性度量-幾何距離-閔可夫斯基距離閔可夫斯基距離:范圍∈(0,∞),越大越不相似樣本和的距離計(jì)算公式:p值不同時(shí),具有不同的名稱以及計(jì)算公式:幾何距離:閔可夫斯基距離馬拉哈諾比斯距離余弦距離相關(guān)系數(shù):皮爾遜相關(guān)系數(shù)斯皮爾曼相關(guān)系數(shù)
p=∞:切比雪夫距離p=2:歐式距離p=1:曼哈頓距離156二維空間中的三種距離展示紅色點(diǎn)劃線:曼哈頓距離,溫濕度差值絕對(duì)值之和黃色直線:歐氏距離,兩點(diǎn)之間的直線距離藍(lán)色虛線:切比雪夫距離,溫濕度差值絕對(duì)值的最大值相似性度量-幾何距離-閔可夫斯基距離幾何距離:閔可夫斯基距離馬拉哈諾比斯距離余弦距離相關(guān)系數(shù):皮爾遜相關(guān)系數(shù)斯皮爾曼相關(guān)系數(shù)157馬拉哈諾比斯距離:適用于衡量量綱存在顯著差異的樣本間的相似度實(shí)例展示:相似性度量-幾何距離-馬拉哈諾比斯距離幾何距離:閔可夫斯基距離馬拉哈諾比斯距離余弦距離相關(guān)系數(shù):皮爾遜相關(guān)系數(shù)斯皮爾曼相關(guān)系數(shù)使用歐氏距離進(jìn)行聚類d1
將納入綠點(diǎn)使用馬拉哈諾比斯距離進(jìn)行聚類d2
將納入綠點(diǎn)d1d2d1d2d1<d2d1>d225~35℃40~90%40~90%可看作是歐氏距離的推廣取值差異過(guò)大158馬拉哈諾比斯距離計(jì)算示例:數(shù)據(jù)來(lái)源:7個(gè)房間同一天的室內(nèi)信息房間平均溫度(oC)平均相對(duì)濕度(%)房間123.969.0房間227.361.0房間325.170.1房間428.365.2房間526.267.0房間624.872.4房間727.766.5相似性度量-幾何距離-馬拉哈諾比斯距離幾何距離:閔可夫斯基距離馬拉哈諾比斯距離余弦距離相關(guān)系數(shù):皮爾遜相關(guān)系數(shù)斯皮爾曼相關(guān)系數(shù)計(jì)算公式:樣本向量樣本矩陣的協(xié)方差矩陣159馬拉哈諾比斯距離計(jì)算示例:將表中數(shù)據(jù)寫入一個(gè)7×2的矩陣計(jì)算Xt的協(xié)方差矩陣S以及它的逆S-1:計(jì)算xi和xj之間的馬拉哈諾比斯距離相似性度量-幾何距離-馬拉哈諾比斯距離幾何距離:閔可夫斯基距離馬拉哈諾比斯距離余弦距離相關(guān)系數(shù):皮爾遜相關(guān)系數(shù)斯皮爾曼相關(guān)系數(shù)160余弦距離:通過(guò)計(jì)算兩個(gè)樣本向量的夾角余弦值評(píng)估兩者相似度幾何距離:閔可夫斯基距離馬拉哈諾比斯距離余弦距離相關(guān)系數(shù):皮爾遜相關(guān)系數(shù)斯皮爾曼相關(guān)系數(shù)相似性度量-幾何距離-余弦距離三個(gè)樣本計(jì)算公式實(shí)例展示:角α<角β→cos(α)>cos(β)→distS(x1
,x2)<
distS(x1
,x3)→x1與x2更相似相似不相似161余弦距離計(jì)算示例:余弦距離的計(jì)算公式房間1的室內(nèi)環(huán)境向量:x1=
(23.9,69)
房間2的室內(nèi)環(huán)境向量:x2=(27.3,61)x1與x2的余弦距離:幾何距離:閔可夫斯基距離馬拉哈諾比斯距離余弦距離相關(guān)系數(shù):皮爾遜相關(guān)系數(shù)斯皮爾曼相關(guān)系數(shù)相似性度量-幾何距離-余弦距離162皮爾遜相關(guān)系數(shù):衡量?jī)蓚€(gè)樣本之間的線性相關(guān)性取值∈(-1,1)
正值表示正相關(guān),負(fù)值表示負(fù)相關(guān)相似性度量-相關(guān)系數(shù)-皮爾遜相關(guān)系數(shù)幾何距離:閔可夫斯基距離馬拉哈諾比斯距離余弦距離相關(guān)系數(shù):皮爾遜相關(guān)系數(shù)斯皮爾曼相關(guān)系數(shù)相關(guān)性強(qiáng)相關(guān)性弱163協(xié)方差Cov(Xi,Xj)標(biāo)準(zhǔn)差σXi*σXj皮爾遜相關(guān)系數(shù)計(jì)算示例:時(shí)間建筑1能耗(kW)建筑2能耗(kW)9:005.89.210:007.611.211:007.813.912:0010.414.813:008.915.614:005.911.515:004.19.2建筑1的能耗向量x1建筑1的能耗向量x2相似性度量-相關(guān)系數(shù)-皮爾遜相關(guān)系數(shù)相關(guān)系數(shù):164斯皮爾曼相關(guān)系數(shù):用途:衡量樣本之間的單調(diào)相關(guān)性幾何距離:閔可夫斯基距離馬拉哈諾比斯距離余弦距離相關(guān)系數(shù):皮爾遜相關(guān)系數(shù)斯皮爾曼相關(guān)系數(shù)單調(diào)性與線性的區(qū)別:計(jì)算示例:房間1溫度房間2溫度滿足點(diǎn)調(diào)性不滿足線性原始樣本元素轉(zhuǎn)化為降序位置作差相似性度量-相關(guān)系數(shù)-斯皮爾曼相關(guān)系數(shù)165斯皮爾曼相關(guān)系數(shù)計(jì)算示例:時(shí)間建筑1能耗(kW)建筑1能耗降序位次建筑2能耗(kW)建筑2能耗降序位次9:005.869.26.510:007.6411.2511:007.8313.9312:0010.4114.8213:008.9215.6114:005.9511.5415:004.179.26.5相似性度量-相關(guān)系數(shù)-斯皮爾曼相關(guān)系數(shù)建筑2原始能耗向量x2,位次向量x2’
建筑1原始能耗向量x1,位次向量x1’
計(jì)算式:166相似性度量-總結(jié)相似性度量總結(jié):距離度量閔可夫斯基距離:基礎(chǔ)的距離指標(biāo),p值不同計(jì)算公式不同曼哈頓距離:折線距離歐氏距離:直線距離切比雪夫距離:橫向距離馬拉哈諾比斯距離:在閔可夫斯基距離的基礎(chǔ)上,消除了由于變量取值范圍不同造成的影響余弦距離:兩個(gè)樣本向量的夾角,與位置無(wú)關(guān)相關(guān)系數(shù)度量皮爾遜相關(guān)系數(shù):衡量線性相關(guān)性斯皮爾曼相關(guān)系數(shù):衡量正負(fù)相關(guān)性(包括線性與非線性相關(guān))167三個(gè)聚類簇168聚類性能評(píng)價(jià)如何用數(shù)學(xué)公式(或者程序流程)來(lái)定義什么是好的聚類?聚類性能評(píng)價(jià):對(duì)聚類結(jié)果進(jìn)行評(píng)估內(nèi)部評(píng)價(jià)指標(biāo):根據(jù)聚類簇之間的相似度來(lái)評(píng)價(jià)聚類結(jié)果外部評(píng)價(jià)指標(biāo):根據(jù)聚類結(jié)果與真實(shí)結(jié)果進(jìn)行比較來(lái)評(píng)價(jià)聚類結(jié)果指標(biāo)分類:聚類性能評(píng)價(jià)169輪廓系數(shù)(SilhouetteCoefficient):對(duì)于一個(gè)樣本集合,它的輪廓系數(shù)是所有樣本輪廓系數(shù)的平均值。輪廓系數(shù)的取值范圍是[-1,1],同類別樣本距離越相近不同類別樣本距離越遠(yuǎn),分?jǐn)?shù)越高。聚類性能評(píng)價(jià)-內(nèi)部評(píng)價(jià)指標(biāo)-輪廓系數(shù)樣本i的輪廓系數(shù)計(jì)算式ai:樣本i與簇內(nèi)其他樣本的平均距離(圖中紅色線段長(zhǎng)度的均值)bi:樣本i與其他簇樣本的平均距離(圖中綠色線段長(zhǎng)度的均值)樣本i與其他簇樣本的距離i內(nèi)部評(píng)價(jià)指標(biāo):輪廓系數(shù)戴維森堡丁指數(shù)鄧恩指數(shù)外部評(píng)價(jià)指標(biāo)純度蘭德系數(shù)F值樣本i與簇內(nèi)其他樣本的距離170計(jì)算示例:使用輪廓系數(shù)評(píng)價(jià)聚類結(jié)果的好壞10個(gè)樣本的聚類結(jié)果如下評(píng)價(jià)指標(biāo)中樣本間距離計(jì)算均使用歐式距離房間平均溫度(oC)平均相對(duì)濕度(%)聚類簇房間137.868.61房間237.268.51房間336.769.91房間423.974.62房間522.876.12房間621.185.22房間720.081.72房間830.163.73房間928.367.13房間1027.865.23聚類性能評(píng)價(jià)-計(jì)算示例171輪廓系數(shù)計(jì)算示例:以聚類簇1中的樣本1為例:樣本1與同簇其他樣本的平均距離為:聚類性能評(píng)價(jià)-計(jì)算示例-輪廓系數(shù)與聚類簇2(C2)內(nèi)樣本的平均距離為:與聚類簇3(C3)內(nèi)樣本的平均距離為:與聚類簇2和3的平均距離的最小值為:樣本1的輪廓系數(shù):172所有樣本的輪廓系數(shù)計(jì)算結(jié)果樣本序號(hào)aibisi11.169.770.8821.059.180.8931.599.320.8346.9710.470.3355.7912.310.5367.9621.290.6376.0118.560.6883.308.920.6392.919.160.68102.3610.200.77聚類性能評(píng)價(jià)-計(jì)算示例-輪廓系數(shù)聚類結(jié)果的輪廓系數(shù)等于si列的平均值:173兩個(gè)聚類簇中心的距離:戴維森堡丁指數(shù)(Davies-bouldinIndex,DBI):該指標(biāo)用來(lái)衡量任意兩個(gè)簇的簇內(nèi)距離之后與簇間距離之比。該指標(biāo)越小表示簇內(nèi)距離越小,簇內(nèi)相似度越高,簇間距離越大,簇間相似度低。取值∈(0,∞),值越小聚類效果越好聚類性能評(píng)價(jià)-內(nèi)部評(píng)價(jià)指標(biāo)-戴維森堡丁指數(shù)簇內(nèi)樣本與簇中心距離,其均值:內(nèi)部評(píng)價(jià)指標(biāo):輪廓系數(shù)戴維森堡丁指數(shù)鄧恩指數(shù)外部評(píng)價(jià)指標(biāo)純度蘭德系數(shù)F值174計(jì)算示例:使用戴維森堡丁評(píng)價(jià)聚類結(jié)果的好壞10個(gè)樣本的聚類結(jié)果如下評(píng)價(jià)指標(biāo)中樣本間距離計(jì)算均使用歐式距離房間平均溫度(oC)平均相對(duì)濕度(%)聚類簇房間137.868.61房間237.268.51房間336.769.91房間423.974.62房間522.876.12房間621.185.22房間720.081.72房間830.163.73房間928.367.13房間1027.865.23聚類性能評(píng)價(jià)-計(jì)算示例175戴維森堡丁指數(shù)計(jì)算示例:各聚類簇的中心點(diǎn):聚類性能評(píng)價(jià)-計(jì)算示例-戴維森堡丁指數(shù)每個(gè)聚類簇內(nèi)各樣本到該簇中心點(diǎn)的平均距離:176各聚類簇中心點(diǎn)之間的距離:聚類性能評(píng)價(jià)-計(jì)算示例-戴維森堡丁指數(shù)該聚類結(jié)果的戴維森堡丁指數(shù):177簇內(nèi)的最遠(yuǎn)距離:鄧恩指數(shù):(DunnIndex)如果一個(gè)簇的質(zhì)心與該簇中的點(diǎn)之間的距離很小,則意味著這些點(diǎn)彼此靠近。取值∈(0,∞),值越大聚類效果越好聚類性能評(píng)價(jià)-內(nèi)部評(píng)價(jià)指標(biāo)-鄧恩指數(shù)簇間的最近距離:內(nèi)部評(píng)價(jià)指標(biāo):輪廓系數(shù)戴維森堡丁指數(shù)鄧恩指數(shù)外部評(píng)價(jià)指標(biāo)純度蘭德系數(shù)F值178計(jì)算示例:使用鄧恩指數(shù)評(píng)價(jià)聚類結(jié)果的好壞10個(gè)樣本的聚類結(jié)果如下評(píng)價(jià)指標(biāo)中樣本間距離計(jì)算均使用歐式距離房間平均溫度(oC)平均相對(duì)濕度(%)聚類簇房間137.868.61房間237.268.51房間336.769.91房間423.974.62房間522.876.12房間621.185.22房間720.081.72房間830.163.73房間928.367.13房間1027.865.23聚類性能評(píng)價(jià)-計(jì)算示例179鄧恩指數(shù)指數(shù)計(jì)算示例:計(jì)算兩兩聚類簇樣本間距離的最小值,以聚類簇1和聚類簇2為例聚類簇1樣本序號(hào)聚類簇2樣本序號(hào)4567115.1416.7723.5522.10214.6316.2823.2021.68313.6415.2221.8520.45聚類性能評(píng)價(jià)-計(jì)算示例-鄧恩指數(shù)最小值不同簇樣本間的最小值:各聚類簇內(nèi)樣本間的最遠(yuǎn)距離:聚類結(jié)果的鄧恩指數(shù):180基本原理——聚類性能聚類性能總結(jié):內(nèi)部評(píng)價(jià)指標(biāo):僅從聚類結(jié)果的角度評(píng)價(jià)聚類效果輪廓系數(shù):范圍∈(-1~1),值越大聚類效果越好戴維森堡丁指數(shù):范圍∈(0~∞),值越小聚類效果越好鄧恩指數(shù):范圍∈(0~∞),值越大聚類效果越好外部評(píng)價(jià)指標(biāo):需要有標(biāo)準(zhǔn)的分類結(jié)果作參考純度蘭德系數(shù)F值181在能源領(lǐng)域,聚類任務(wù)的性能基本不采用外部評(píng)價(jià)指標(biāo)進(jìn)行評(píng)估,因此不再詳細(xì)展開介紹背景聚類定義與基本原理原型聚類(以k-means算法為代表)密度聚類(以DBSCAN為代表)層次聚類(以AGNES為代表)關(guān)聯(lián)規(guī)則挖掘定義與基本原理Apriori算法FP-growth算法應(yīng)用案例知識(shí)后挖掘聚類后挖掘關(guān)聯(lián)規(guī)則后挖掘提綱182原型聚類原型:樣本空間中具有代表性的點(diǎn)簇中心的十字表示原型位置定義:原型聚類旨在找到一組能夠最大可能刻畫原始樣本分布的原型原理:隨機(jī)選取一組原型。然后對(duì)原型進(jìn)行迭代更新,直到得到一組穩(wěn)定的原型適用領(lǐng)域:不同類型的樣本間差異較大的任務(wù),如識(shí)別控制策略、區(qū)分運(yùn)行狀態(tài)、劃分系統(tǒng)用能水平、揭示不同的用能行為代表算法:k-means算法、學(xué)習(xí)向量量化、高斯混合聚類原型183原型聚類聚類目標(biāo):最小化各簇內(nèi)的點(diǎn)與其原型間的歐氏距離之和184示例分析:基于k-means的建筑用能模式識(shí)別數(shù)據(jù)來(lái)源:某辦公建筑30個(gè)樣本數(shù)據(jù),樣本由2個(gè)維度組成聚類目的:揭露建筑不同室外溫度下的建筑用能模式樣本序號(hào)室外溫度(oC)建筑冷負(fù)荷(kW)014.961201115.891224………2930.178318量綱差異過(guò)大,聚類前需先進(jìn)行歸一化樣本序號(hào)室外溫度建筑冷負(fù)荷00.060.0410.110.05………290.930.99185示例分析:基于k-means的建筑用能模式識(shí)別不同聚類簇?cái)?shù)量下聚類結(jié)果輪廓系數(shù)曲線基于k-means算法的建筑用能模式識(shí)別結(jié)果聚類數(shù)目∈(2,9)最佳輪廓系數(shù)三種常見的用能模式聚類步驟:確定聚類數(shù)量、分析聚類結(jié)果186背景聚類定義與基本原理原型聚類(以k-means算法為代表)密度聚類(以DBSCAN為代表)層次聚類(以AGNES為代表)關(guān)聯(lián)規(guī)則挖掘定義與基本原理Apriori算法FP-growth算法應(yīng)用案例知識(shí)后挖掘聚類后挖掘關(guān)聯(lián)規(guī)則后挖掘提綱187密度聚類定義:基于密度的聚類簡(jiǎn)稱密度聚類原型聚類結(jié)果與密度聚類結(jié)果的區(qū)別原理:根據(jù)樣本密度分布,將相鄰的樣本聚合到一起,形成多個(gè)聚類簇適用領(lǐng)域:密度聚類算法能夠發(fā)現(xiàn)任意形狀的聚類簇,具有更高的靈活性,常應(yīng)用于離群點(diǎn)異常檢測(cè)任務(wù)代表算法:DBSCAN、OPTICS、DENCLUE188密度聚類:DBSCAN算法基本概念:
ε鄰域:對(duì)某樣本點(diǎn),以其為圓心,半徑為ε的領(lǐng)域MinPts=3
x3由x2密度直達(dá)x3由x1密度可達(dá)x3與x4密度相連ε鄰域噪聲核心對(duì)象:ε鄰域內(nèi)包含的樣本點(diǎn)數(shù)量大于等于某一閾值(MinPts)的樣本密度直達(dá):若樣本p是核心對(duì)象,樣本q在其ε鄰域內(nèi),則稱q由p密度直達(dá)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年電力市場(chǎng)化交易合同3篇
- 2024年物業(yè)公共區(qū)域維修合同3篇
- 學(xué)生在校行為規(guī)范與管理計(jì)劃
- 2024橋梁吊裝施工合同范本:高空作業(yè)人員保險(xiǎn)合同3篇
- 家電行業(yè)安全生產(chǎn)工作總結(jié)
- 游戲產(chǎn)品推廣員
- 《粉塵與塵肺》課件
- 計(jì)算機(jī)行業(yè)技術(shù)培訓(xùn)
- 博物館服務(wù)員工作總結(jié)
- 數(shù)碼產(chǎn)品銷售工作總結(jié)
- 2023年海峽出版發(fā)行集團(tuán)有限責(zé)任公司招聘筆試題庫(kù)及答案解析
- 臺(tái)大公開課歐麗娟紅樓夢(mèng)講義
- 【合同范本】補(bǔ)充協(xié)議-面積差補(bǔ)款-預(yù)售版
- 鐵路工程-軌道工程施工工藝及方案
- 福建省福州市各縣區(qū)鄉(xiāng)鎮(zhèn)行政村村莊村名明細(xì)及行政區(qū)劃代碼
- 《高中語(yǔ)文文言斷句》一等獎(jiǎng)優(yōu)秀課件
- 上海市中小學(xué)生學(xué)籍信息管理系統(tǒng)
- (完整版)自動(dòng)感應(yīng)門施工方案
- 8站小車呼叫的plc控制
- _ 基本粒子與宏觀物體內(nèi)在聯(lián)系
- 象棋比賽積分編排表
評(píng)論
0/150
提交評(píng)論