




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
報告題目:AI大模型技術(shù)在電力系統(tǒng)中的應(yīng)用單位:香港中文大學(xué)(深圳)時間:2025年6月10日香港中文大學(xué)(深圳)TheChincseUnivcrsltyocHongKong.Sxnzhen01大語言模型與智能體技術(shù)簡介決策式Al決策+認(rèn)知+感知+學(xué)習(xí)+執(zhí)行+社會協(xié)作重大突破(1980s~2010年)習(xí)模型(2011年~2016年)啟“大模型時代“Sora推出(2017年~)“來源;艾瑞2023年AIGC場景應(yīng)用展望研究報告什么是語言模型你好。你也好。你也好。真實分布你也好。真實分布你也好。你好。V我50。給定相同前綴,語言模型是輸出能近似人類語給定相同前綴,語言模型是輸出能近似人類語言分布的模型?!鯇W(xué)習(xí)文字接龍(prefixLM),無需標(biāo)注,自監(jiān)督(self-supervised)書籍論文“書籍論文私有知識庫私有知識庫理)你好美LLM架構(gòu)與訓(xùn)練:預(yù)訓(xùn)練階段·大數(shù)據(jù):知識的來源,包含各種語言現(xiàn)象及語義知識,直接決定了模型的學(xué)習(xí)范圍容納大數(shù)據(jù)的載體,通常由深度神經(jīng)網(wǎng)絡(luò)構(gòu)成,學(xué)習(xí)大數(shù)據(jù)中的統(tǒng)計信息與抽象知識·大算力:處理大數(shù)據(jù)和大模型的并行計算集群,通常包含GPU、TPU等高性能運算設(shè)備大數(shù)據(jù)大模型大數(shù)據(jù)大模型直接全量參數(shù)微調(diào)問題:耗費GPU資源多,通常需要A100*8以上(百萬RMB)核心優(yōu)勢:訓(xùn)練參數(shù)量少,70億參數(shù)使用LoRA只微調(diào)效果好,LoRA效果不差于全參數(shù)微調(diào),優(yōu)于其他微調(diào)方式GPU要求低,3090*4即可微調(diào)7b模型十WW2.44±別GPT-2L(PreLayer)68.9±38.70+470.38.8570.4.8.89±m(xù)2454mTable3:GPT-2medium(M)andlarge(L)withdifferentalaptatChallenge.Forallnetrics,higherisbeorfewertrainableparameters.Confidenceintervalsareshownforexperimennumberspublishedinpri量化人類喜好,訓(xùn)練打分模型基于強化學(xué)習(xí),迭代最終模型加入代碼數(shù)據(jù),重新訓(xùn)練。量化人類喜好,訓(xùn)練打分模型基于強化學(xué)習(xí),迭代最終模型加入代碼數(shù)據(jù),重新訓(xùn)練。世界最高的山峰是?選擇問題重新選擇問題生成回答生成分?jǐn)?shù)總結(jié)下面文章文章的大意是。。。打分模型打分模型訓(xùn)練獎勵模型數(shù)據(jù)上,訓(xùn)練大語言模型自監(jiān)督學(xué)習(xí)監(jiān)督學(xué)習(xí)強化學(xué)習(xí)LLM架構(gòu)與訓(xùn)練:各個訓(xùn)練階段綜合來看..數(shù)干億單詞:圖書、百科、網(wǎng)頁等標(biāo)注用戶指令數(shù)萬用戶指令和對應(yīng)月級別訓(xùn)練時間SFT模型天級別訓(xùn)練時間強化學(xué)習(xí)十萬量級用戶指令天級別訓(xùn)練時間0所⑥0Agent(自主智能體)考古學(xué):通用定義典型實例能夠自動感知環(huán)境jumpforward/backstrafe常用工具:LLMAgent:關(guān)鍵能力一任務(wù)分解與試錯吧7mWag,uelG,GaudesC.CpakiaeDspmr.UaosnyMelrelgtededolngrdtaukplwdnkrobfeodagosopserdnrccen.Te4tfeiei0dgnMikbatndmokthatraakpardcthucnrbuatyacarpliTSiseratnikaiasdbtspmanphtieei.Thei子目標(biāo)子目標(biāo)子目標(biāo)子目標(biāo)Thought:...Action:..Obs:...Thought:...THETRAGEDYOFATHREE感覺訊息(祝/髦/嗅/味/髑)感覺訊息(祝/髦/嗅/味/髑)短期記己憶/工作記憶i*I'aplasnlngatHocpotQACoTMMLU1ee,Llama2)ToolsCorreettrajactarintTheught3-4-57-5-12AnyCThFe4ctfarmatForsi1-fxMeplEbpX★息④mLcLargeLanguageModeLM-friendlyenvironmentfeedbackAAFine-TuningandPromptOptimization:LLMAgent:新的模型能力獲取范式參數(shù)學(xué)習(xí)參數(shù)學(xué)習(xí)輸出輸入?yún)?shù)學(xué)習(xí)模型輸出將文本分類為中性、輸出我覺得食物還可以。提示詞能力參數(shù)學(xué)習(xí)參數(shù)學(xué)習(xí)智能體相關(guān)的提示詞6能力機制養(yǎng)香港中文大學(xué)(深圳)TheChincseUnivcrslyccHongKo02LLMAgents在電力系統(tǒng)研究中的應(yīng)用思考大模型的核心能力邏輯推理LLMAgent在新型電力系統(tǒng)中的應(yīng)用思考LLMAgent的潛在應(yīng)用領(lǐng)域:·機器代人(機巡、客服、公文寫作等)·工作流重構(gòu)(調(diào)度運行規(guī)劃)·多模態(tài)數(shù)據(jù)融合(數(shù)字化服務(wù))·電力系統(tǒng)機理研究(Al4S)薛禹勝,新型能源體系(CPSS-EEE)的多目標(biāo)協(xié)調(diào)規(guī)劃,/s/fodienZxB24j9MRX6qFa9w趙俊華,文福拴,黃建偉,等.基于大語言模型的電力系統(tǒng)通用人工智能展望:理論與應(yīng)用[J].電力系統(tǒng)自動化,2024,48(6);13-28.大模型/領(lǐng)域小模型·適用于誤決策代價比較小的簡單機器代人場景;文本數(shù)據(jù)業(yè)務(wù)數(shù)據(jù)圖像數(shù)據(jù)·適用于需要引入文本、視頻等多種模態(tài)數(shù)據(jù),且誤決策代價較小的場景;·不適用于需要對電力系統(tǒng)精確量化的場景;微調(diào)聯(lián)合推理訓(xùn)練·實現(xiàn)推理與計算的統(tǒng)一;·較好的模擬因果模型背后的物理機理;·神經(jīng)網(wǎng)絡(luò)架構(gòu)尚有待探索;·可解釋性不足;推理大模型文本數(shù)據(jù)業(yè)務(wù)數(shù)據(jù)符號數(shù)據(jù)微調(diào)/RL大語言模型PINN因果模型符號模型(SPT)知識表示快速數(shù)值因果分析/符號推理計算可靠數(shù)值計算·推理大模型作為“大腦”,主要負(fù)責(zé)問題的規(guī)劃、任務(wù)的分解與高層次推理;·因果模型可在部分必要場景下,保證決策結(jié)果的可靠性;推理大模型文本數(shù)據(jù)文本數(shù)據(jù)人機協(xié)同符號數(shù)據(jù)訓(xùn)練訓(xùn)練知識表示快速數(shù)值因果分析/符號推理計算可靠數(shù)值計算·必要的場景中,可以將人引入多智能體框架中;·人可以向智能體提供反饋,并作為最終決策者判定決策質(zhì)量;andmethods,IEEETran信息物理社會系統(tǒng)仿真·大模型的“智能涌現(xiàn)”現(xiàn)象,再次表明復(fù)雜系統(tǒng)的研究問題無法完全在還原論的框架下解決?!な苎τ韯僭菏康恼w還原論(WRT)方法論的啟發(fā),我們在思考如何將大模型應(yīng)用于解決復(fù)雜的信息物理社會系統(tǒng)(CPSSE)的仿真問題?!RT以CPSSE框架刻畫復(fù)雜系統(tǒng),以混合動態(tài)仿真來提取對象系統(tǒng)的高維仿真軌跡,基于軌跡動力學(xué)的時空保熵映射,將復(fù)雜系統(tǒng)的研究從線性的“局部還原”提升為非線性的“整體保熵還原”。·大語言模型可以基于仿真或?qū)崪y軌跡數(shù)據(jù),基于其內(nèi)化的理論常識,以一定概率在局部自主進(jìn)行邏輯推理,實現(xiàn)對復(fù)雜系統(tǒng)局部的可解釋性?!せ诖竽P蛢?nèi)化的理論常識,大模型也可以用作嚴(yán)格因果模型與近似模型的選擇器。·我們的初步研究表明,大語言模型已具有模仿人進(jìn)行系統(tǒng)性邏輯思維的能力。因此,可以在CPSSE仿真中,結(jié)合真人、因果模型和大語言模型,實現(xiàn)更精確的人機混合仿真。問題,目前尚無法完全解決?,F(xiàn)階段,“人機混合智能”可能是最符合電力系統(tǒng)實際的解決方案?!PSSE仿真問題解決后,通過CPSSE對實際系統(tǒng)進(jìn)行反饋,構(gòu)建大模型驅(qū)動的數(shù)字孿生,是研究的終極香港中文大學(xué)(深圳)TheChincseUnivcrslyccHongKo基于大語言模型實現(xiàn)高適應(yīng)性負(fù)荷預(yù)測(多模態(tài)數(shù)據(jù)融合)·傳統(tǒng)方法局限:1.難以應(yīng)對特殊事件發(fā)生時,短期電力負(fù)荷的快速變化或極端波動;2.不能適應(yīng)超出歷史數(shù)據(jù)涵蓋范圍的新場景;3.無法基于文本數(shù)據(jù)(新聞事件)進(jìn)行預(yù)測推理。量多源數(shù)據(jù),通過Agent篩選實時相關(guān)新聞并理解文本邏輯,顯著提升預(yù)測的適應(yīng)性和精確度。新新聞+地理+歷史負(fù)荷+氣象數(shù)據(jù)+典型天temperature,humidity,windpoier,andpressure);Output:{Tieseriesofactualloadinthepredictiondate},ITA-LF框架圖- 新聞事件相關(guān)的文本數(shù)據(jù)的引入,有效提升在特定事件發(fā)生時負(fù)荷預(yù)測精確度。NeNewsNews:LoadNews...increasingrasidenialelectricityus(kWh)higherpowerloaddharingpeakhours一·Agent對新聞事件的篩選,在提升大模型輸入token效率的同時增強預(yù)測精確度:LoadDemandPrediction(kW)LoadDemandPrediction(kW)2TextualPrompt·基于新聞和負(fù)荷數(shù)據(jù)的ITA-LF預(yù)測效果普遍優(yōu)于現(xiàn)有方法:6.71%93.92%6.09%94.70%5.42%95.06%·預(yù)測效果普遍優(yōu)于現(xiàn)有方法,在不同時間和地理維度的適應(yīng)性強,顯著提升預(yù)測的適應(yīng)性和精確度:NSIV48頁048頁0ITA-LF(Ours)4400ReformerInformerAutoformer444基于LLM的負(fù)荷預(yù)測顯著提升準(zhǔn)確性和可靠性,優(yōu)化對突發(fā)變化的應(yīng)對,突出了語言處理在整合非結(jié)構(gòu)化信息中的作用,標(biāo)志負(fù)荷預(yù)測及時序決策研究范式的轉(zhuǎn)變。調(diào)度大模型研究背景基于前期研究,我們發(fā)現(xiàn)可以將調(diào)度、市場行為以大語言模型的形式建模(語言模型化),解決傳統(tǒng)調(diào)度支撐體系中調(diào)度行為沒有有效建模工具的問題。我們希望實現(xiàn)調(diào)度行為數(shù)據(jù)(包含語音、拓?fù)浣Y(jié)構(gòu)、文本等多模態(tài)數(shù)據(jù))、調(diào)度規(guī)程及系統(tǒng)工況等數(shù)據(jù)的統(tǒng)一表示,基于大語言模型多智能體實現(xiàn)調(diào)度行為的理解、推理、操作序列生成、智能博弈策略生成、市場波動響應(yīng)及決策優(yōu)化等目標(biāo),提高調(diào)度安全性與效率。事故處置鋪助決策B人類調(diào)度與(日志、語音)建模6LL建模6LLM哪溶電話保信躬晚切壁屋那悅臺賬目標(biāo)事故處世鎮(zhèn)咖決策大腳型事故處世鎮(zhèn)咖決策大腳型“法4審恢括果事故處冒鋪mi決蓋太橫制/8進(jìn)被瘤星助五0目標(biāo)性能提升度決策推理與智能生成性能提升度決策推理與智能生成大模型訓(xùn)練數(shù)據(jù)集大模型訓(xùn)練數(shù)據(jù)集instruction";"Describethenainreasonforwindingfailuinrut":"cnoinput>°,output"!"Tnsulationdeterioration,oftencausedbynnisture,overheating,vibratian,vwoltage2instruction”:"ExplainthepotentialceusesoftapchangerfailuresintransForners.",output":"1apchangerfallurescanbecausedbyanalfunctionofthenechanicalswitchingresistancelaadcontacts,insulationtracking,pverheating,orcontaninationoftheinsulating{instruction:"Mhatarethepossiblereasonsfortraouitput:"Possiolereasonsfortransforxerbushingfalluresincludegenerinternalmoisture,lossofoil,vancalisn,andexteraltlashovercausedbyaninals."f"instruction";"Prowideanexanoleofaoutput”:"statisticsshowthatwinding+ailuresnostfrequentlycausetransforner"instruction!"5uggestsoBeneasursstoproutput”;"Topreventtmoisturelevels,avoidirgowerheatirg,minimizirgvibration,protectingagainstwoltagesur調(diào)度大模型交互頁面調(diào)度大模型交互頁面oqistionstodeteminetheoptmalgenerationschedulesandbusvoagemmineizthetotblcostofgcneratonwlemstcalnapeeentation.3.Sohdponlinarprerammingtechniqus,4.Censtraintsintmls,andtransmlsshonilineco,清除歷史對話業(yè)務(wù)場景支持:業(yè)務(wù)場景支持:穩(wěn)定性穩(wěn)定性穩(wěn)定性測試集評測體系:測試集評測體系:■評測圍繞調(diào)度大模型在事實性、邏輯性、穩(wěn)定性、公平性、安全性、表達(dá)能力六大類二十四個子維度展開評估。測試集題型設(shè)定:測試集題型設(shè)定:評測方法:評測方法:GeneralMeeting,2024(BestPaperSessio傳統(tǒng)經(jīng)濟學(xué)仿真面臨的困難傳統(tǒng)方法大多依賴于數(shù)學(xué)模型。當(dāng)仿真涉及多個參與者和復(fù)雜策略時,傳統(tǒng)方法往往難以應(yīng)用,因為計算和分析的復(fù)雜度極高。動態(tài)博弈求解難度大:在動態(tài)和不完全信息的博弈情境中,傳統(tǒng)方法很難求得收斂解。泛化性較差:對于那些需要快速適應(yīng)新信息和變化的實際應(yīng)用場景,傳統(tǒng)的數(shù)學(xué)方法缺乏靈活性。大模型經(jīng)濟學(xué)仿真的潛力推理能力:LLMs擁有處理復(fù)雜問題和理解復(fù)雜語境的能力,這使它們能夠理解和分析復(fù)雜的博弈策略。泛化能力:得益于LLM出色的zero-結(jié)合大量歷史案例,提高仿真的準(zhǔn)確性和效率。通過模擬市場中player行為或策略,為 市場外部擾動。交易決策外部干擾組織者規(guī)則設(shè)計機制設(shè)計市場信息公示·國際形勢經(jīng)濟形勢資本損益市場內(nèi)部交易者大模型決策技術(shù)擾動參數(shù)生成大模型生成交易前市場出清結(jié)果模型輸出交易影響x?背景回顧背景回顧提示詞工程和檢索增強生成技術(shù)擬電力交易員工作環(huán)境,給出機組工況、斷面阻塞、燃料成本、碳成本、系統(tǒng)運行情況度逐步推理;StandardPrompting市場相關(guān)論文、政策文件、國內(nèi)外市場研報、仿真模型數(shù)據(jù)、市場運行數(shù)據(jù)、系統(tǒng)工況數(shù)據(jù)等多場景多模態(tài)數(shù)據(jù),LLM無需增量訓(xùn)練即可初步理解應(yīng)用領(lǐng)域知識。提示詞工程記憶知識問答鏈結(jié)果用戶大語言模型向量存儲基于大語言模型的碳市場均衡分析viof(,Shenzhen均衡的重要性均衡的重要性現(xiàn)有研究局限性現(xiàn)有研究局限性泛化性較差:傳統(tǒng)方法在應(yīng)對新信息和變化時缺乏靈活性難以捕捉復(fù)雜市場動態(tài):隨著數(shù)據(jù)和復(fù)雜性增加,傳統(tǒng)方法難以全面、精確地大語言模型優(yōu)勢大語言模型優(yōu)勢精確理解與分析市場動態(tài):大語言模型在處理復(fù)雜數(shù)據(jù)和市場動態(tài)方面表現(xiàn)出強大的推理與適應(yīng)能力:大語言模型具備卓越的推理能力和泛化能力,能夠迅多主體策略模擬與優(yōu)化:將大語言模型與代理模型結(jié)合,能有效模擬多主體行工具工具模型模型碳市場均衡解是否十十定義:設(shè)計和優(yōu)化提示詞,引導(dǎo)大語言模型生成所需輸出應(yīng)用:構(gòu)建求解策略和判斷優(yōu)勢:提高模型響應(yīng)的準(zhǔn)確定義:動態(tài)調(diào)用外部工具或應(yīng)用:利用求解工具和判斷工具,特別是通過Python進(jìn)定義:由多個自主決策的代理組成,模擬市場參與者行為。終求解市場均衡。優(yōu)勢:提供更準(zhǔn)確的市場預(yù)測和均衡解??嘏牌髽I(yè)賣家一或賣出碳配額(決策變量) 賣家買家時,最大化交易收益與機會收益之和買家TheChineseUniversityofHongKong,Shenzhen碳市場QQP十P十1季度凈交易額加權(quán)價格企業(yè)仿真數(shù)據(jù)碳市場企業(yè)機組信息碳市場企業(yè)回歸分析、市場企業(yè)量,價格彈性)p值;0.8025152265417496948香港中文大學(xué)(深圳)The香港中文大學(xué)(深圳)TheChineseUniversityofHongKong,Shenzhen結(jié)果示例:工具調(diào)用結(jié)果示例:指令工程結(jié)果示例:工具調(diào)用結(jié)果示例:指令工程綜上,基于碳市場的設(shè)定,寫一下四個玩家的KKT方程并求解。為了求解四個玩家在碳市場中的KKT方程并找到最優(yōu)的b和b,4的表達(dá)式,我們需要聯(lián)立方程并求解。讓我們詳細(xì)推導(dǎo)并實現(xiàn)代碼。我們需要滿足以下KKT條件:1.Stationarity:拉格朗日函數(shù)對b的偏導(dǎo)數(shù)應(yīng)為零。2.PrimalFeasibility:約束條件應(yīng)滿足。3.DualFeasibility:拉格朗日乘子λ;≥0。定義變量和參數(shù)拉格朗日函數(shù)=3:#處理最后一解eq=sp.Eq(sp.d1ff(Lagrangians[eq=sp,Eq(sp.diff(Lagrangians[il,代碼示例:多代理模型代碼示例:多代理模型評估模型回應(yīng)生成質(zhì)量evaluation_promptevaluation_promptevaluation_prompt_gen(strategy,finaevaluation_output,evaluchatgpt_agent(evaluatscore_match=re.search(r"'sscore=score+fprint("Novalid評估模型生成解是否為均衡解defequilibrium_judge(game_setting,sr_resprompt=equilibriequilibrium_response=chatgpt_agent(proclean_markdown_code(equilibriumreturnexecute_python_code(cleaned_python_code)注:真實實驗中大語言模型均通過調(diào)用API實現(xiàn),為展示清晰用網(wǎng)頁端的效果代替。燃?xì)鈾C組燃?xì)鈾C組組組示例企業(yè)參數(shù)香港中文大學(xué)(深圳)0富余碳配額(萬噸)大國企中國企燃料類型煤炭煤炭天然氣煤炭富余配額(t)價格彈性系數(shù)注:以機會收益中的(1+預(yù)期上漲率)*(1-配額折算率)=0.8為例。基于大語言模型的碳市場均衡分析基于大語言模型的碳市場
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年水利工程師資格考試試卷及答案
- 2025年全國職業(yè)資格考試試卷及答案
- 2025年臨床醫(yī)學(xué)專業(yè)執(zhí)業(yè)考試試卷及解答
- 2025年交通運輸管理專業(yè)考試試題及答案
- 2025年航空工程技術(shù)考試試題及答案
- 2025年創(chuàng)新思維與團隊合作能力綜合考試試卷及答案
- 2025年互聯(lián)網(wǎng)金融的法律風(fēng)險與合規(guī)路徑的考試卷及答案
- 2025年法學(xué)專業(yè)學(xué)位研究生入學(xué)考試試題及答案
- 物資發(fā)放領(lǐng)用管理制度
- 物資采購流程管理制度
- 臨床試驗申辦方的職責(zé)
- 傳統(tǒng)文化與現(xiàn)代經(jīng)營管理(北京大學(xué))學(xué)習(xí)通測試及答案
- 2025年臨床醫(yī)師定期考核必考復(fù)習(xí)題庫及答案(900題)
- 醫(yī)保藥械管理制度內(nèi)容
- 新聞、記者采編人員崗位職業(yè)技能資格基礎(chǔ)知識考試題及答案
- 【MOOC】當(dāng)代社會中的科學(xué)與技術(shù)-南京大學(xué) 中國大學(xué)慕課MOOC答案
- 3D打印技術(shù)與應(yīng)用知到智慧樹期末考試答案題庫2024年秋西北工業(yè)大學(xué)
- 《常州紅梅公園》課件
- 軟件正版化工作培訓(xùn)
- 《限額以下小型工程施工安全管理辦法(試行)》知識培訓(xùn)
- 廣西申論真題2021年(B卷)
評論
0/150
提交評論