




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
華為盤古大模型:讓AI重塑千行百業(yè)請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容預(yù)訓(xùn)練大模型解決AI模型通用與泛化問題,避免傳統(tǒng)封閉作坊式AI開發(fā)面臨的“碎片化困境”。隨著工業(yè)生產(chǎn)智能化需求不斷上升,人工智能算法在落地的過程中,將會面對大量不同場景、不同需求的用戶,對算法的通用性提出很高要求;而由于龐大的業(yè)務(wù)數(shù)量和場景種類多樣性使得各行業(yè)各場景的云解決方案難度加大,單一的解決方案套路對于用戶定制化需求已不具備優(yōu)勢。傳統(tǒng)“小作坊模式”AI開發(fā)無法積累通用知識,特定的數(shù)據(jù)無法滿足AI快速落地行業(yè)的需求。因此,以模型預(yù)訓(xùn)練和微調(diào)相結(jié)合的預(yù)訓(xùn)練大模型能夠解決解決AI模型通用與泛化的問題,同時降低人工智能算法的開發(fā)成本,真正惠及細(xì)分行業(yè)。華為鴻蒙4操作系統(tǒng)接入盤古大模型,智能助手小藝基于大模型全面升級。2023年8月4日,華為發(fā)布鴻蒙4操作系統(tǒng),其更新點之一在于融入了華為盤古大模型的能力,變得更加智能。華為盤古大模型,包括自然語言大模型、視覺大模型、多模態(tài)大模型,將會助力鴻蒙操作系統(tǒng)和鴻蒙生態(tài)。HarmonyOS
4新版本中的華為智慧助手小藝已經(jīng)接入了盤古大模型,多模態(tài)交互以及個性化創(chuàng)作兩大能力全面提升,可以實現(xiàn)更自然流暢的對話交互,擁有信息檢索、摘要生成、多語種翻譯等能力。盤古大模型3.0是中國首個全棧自主的AI大模型,包括“5+N+X”三層架構(gòu)。2023年7月7日,面向行業(yè)的盤古大模型3.0發(fā)布,包含L0層基礎(chǔ)大模型、L1層行業(yè)大模型、L2層場景大模型三個層次。其中,基礎(chǔ)大模型包括盤古NLP大模型、盤古CV大模型、盤古多模態(tài)大模型、盤古預(yù)測大模型、盤古科學(xué)計算大模型等,提供滿足行業(yè)場景需要的上百種能力;行業(yè)大模型包括政務(wù)、金融、制造、藥物分子、礦山、鐵路、氣象等大模型;場景大模型為客戶提供的更多細(xì)化場景的場景大模型,如政務(wù)熱線、網(wǎng)點助手、供應(yīng)鏈物流、先導(dǎo)藥物篩選、臺風(fēng)路徑預(yù)測等。盤古大模型采用完全的分層解耦設(shè)計,可以快速適配、快速滿足行業(yè)的多變需求。華為盤古大模型:讓AI重塑千行百業(yè)請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容盤古大模型集成了華為云團(tuán)隊在AI領(lǐng)域數(shù)十項研究成果,與MindSpore(昇思)語言、ModelArts平臺深度結(jié)合。MindSpore(昇思)是華為開源自研AI框架,2023年MindSpore
2.0版本實現(xiàn)全新技術(shù)升級,成為支持科學(xué)計算的AI融合框架,在基礎(chǔ)能力上完成AI與HPC的融合,科學(xué)計算能力大幅提升。昇思MindSpore目前支持多種并行方式,可以原生實現(xiàn)大模型訓(xùn)練(類似于ChatGPT所使用的TensorFlow框架,其最大的核心優(yōu)點就是支持昇騰芯片)。ModelArts是面向開發(fā)者的一站式AI開發(fā)平臺,幫助用戶快速創(chuàng)建和部署模型,管理全周期AI工作流,助力千行百業(yè)智能升級。ModelArts支持應(yīng)用到圖像分類、物體檢測、視頻分析、語音識別、產(chǎn)品推薦、異常檢測等多種AI應(yīng)用場景,通過全面的AI工具和服務(wù),為業(yè)務(wù)智能快速創(chuàng)新賦能。產(chǎn)業(yè)鏈相關(guān)公司:【服務(wù)器】工業(yè)富聯(lián)、聞泰科技、環(huán)旭電子;【PCB】滬電股份、東山精密、鵬鼎控股;【算力】海光信息、寒武紀(jì)、全志科技;【存儲】北京君正、兆易創(chuàng)新、深科技、江波龍、國芯科技;【先進(jìn)封裝】長電科技、通富微電、芯原股份;【AI終端】晶晨股份、瑞芯微。風(fēng)險提示:宏觀AI推廣不及預(yù)期,AI投資規(guī)模低于預(yù)期,AI服務(wù)器滲透率提升低于預(yù)期
,AI監(jiān)管政策收緊等。盤古大模型簡介01L
0
基礎(chǔ)大模型02L
1
行業(yè)大模型與L
2
場景大模型03AI開發(fā)框架與開發(fā)平臺04目錄風(fēng)險提示05請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容2023年8月4日,在2023年華為開發(fā)者大會上,華為發(fā)布鴻蒙4操作系統(tǒng)(HarmonyOS
4)。華為常務(wù)董事、終端事業(yè)部CEO余承東在發(fā)布會上稱,華為盤古大模型,包括自然語言大模型、視覺大模型、多模態(tài)大模型,將會助力鴻蒙操作系統(tǒng)和鴻蒙生態(tài)。鴻蒙系統(tǒng)于2019年誕生,定位為解決各智能設(shè)備間互聯(lián)痛點的操作系統(tǒng)、滿足全場景需求的操作系統(tǒng)。自鴻蒙系統(tǒng)首發(fā)以來,其已搭載在電視、手機、汽車等諸多終端中。據(jù)華為數(shù)據(jù),截至2023年7月,進(jìn)入鴻蒙生態(tài)的設(shè)備數(shù)量已超過7億臺,已有220萬系統(tǒng)應(yīng)用開發(fā)者投入到鴻蒙生態(tài)的開發(fā)中。據(jù)Counterpoint數(shù)據(jù),鴻蒙系統(tǒng)在中國的市場份額已經(jīng)達(dá)到8
,成為Android、iOS之后的第三大手機操作系統(tǒng)。HarmonyOS
4更新點之一在于融入了華為盤古大模型的能力,變得更加智能。AI大模型技術(shù)的發(fā)展將會帶來下一代智能終端操作系統(tǒng)的智慧體驗。引言:華為鴻蒙4操作系統(tǒng)接入盤古大模型圖:鴻蒙生態(tài)設(shè)備數(shù)量已超過7億臺資料來源:2023華為開發(fā)者大會官網(wǎng),國信證券經(jīng)濟研究所整理圖:華為發(fā)布HarmonyOS4操作系統(tǒng)資料來源:2023華為開發(fā)者大會官網(wǎng),國信證券經(jīng)濟研究所整理請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容HarmonyOS
4新版本中的華為智慧助手小藝已經(jīng)接入了盤古大模型,主要體現(xiàn)在多模態(tài)交互以及個性化創(chuàng)作兩大能力。新升級的小藝可以實現(xiàn)更自然流暢的對話交互,擁有信息檢索、摘要生成、多語種翻譯等能力。在多模態(tài)交互層面,小藝的交互方式從原先的語音交互增加了文字、圖像以及文件等多種形式的輸入。小藝背后的大模型將會記住這些信息,由此用戶可以通過小藝與這些信息進(jìn)行“交流”,小藝會基于此幫用戶完成部分任務(wù)。在個性化創(chuàng)作層面,小藝背后的多模態(tài)大模型支持圖像生成(包括文生圖和圖生圖)、圖像編輯以及圖像理解三大能力。用戶可以通過與小藝問答交流來調(diào)用模型的AI能力生成與編輯各種風(fēng)格的照片。(根據(jù)官網(wǎng)進(jìn)度,小藝部分功能將在部分機型通過后續(xù)HOTA升級支持。)引言:智能助手小藝基于大模型全面升級圖:智能助手小藝能力全面提升資料來源:2023華為開發(fā)者大會官網(wǎng),國信證券經(jīng)濟研究所整理請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容一、盤古大模型簡介請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容。隨著工業(yè)生產(chǎn)智能化需求不斷上升,大量傳統(tǒng)行業(yè)開始積累領(lǐng)域數(shù)據(jù),并尋求人工智能算法以解決生產(chǎn)和研發(fā)過程中遇到的重復(fù)而冗雜的問題。人工智能算法在落地的過程中,將會面對大量不同場景、不同需求的用戶,對算法的通用性提出很高要求。近年來,隨著國內(nèi)云計算市場增速明顯,企業(yè)上云明顯提速,客戶的需求逐步從“資源型需求”轉(zhuǎn)向“智能型需求”及“業(yè)務(wù)型需求”龐大的業(yè)務(wù)數(shù)量和場景種類多樣性使得各行業(yè)各場景的云解決方案難度加大,單一的解決方案套路對于用戶定制化需求已不具備優(yōu)勢。傳統(tǒng)封閉作坊式AI開發(fā)面臨AI算法“碎片化困境”圖:AI進(jìn)入千行百業(yè)所面臨的挑戰(zhàn)資料來源:華為《預(yù)訓(xùn)練大模型白皮書》,國信證券經(jīng)濟研究所整理圖:封閉的作坊式AI開發(fā)局限于特定的場景資料來源:華為《預(yù)訓(xùn)練大模型白皮書》,國信證券經(jīng)濟研究所整理傳統(tǒng)“小作坊模式”:針對每個場景,獨立地完成模型選擇、數(shù)據(jù)處理、模型優(yōu)化、模型迭代等一系列開發(fā)環(huán)節(jié)。無法積累通用知識,面對不同領(lǐng)域的調(diào)試方法有所不同,開發(fā)模式比較低效。特定的數(shù)據(jù)無法滿足AI快速落地行業(yè)的需求。當(dāng)前人工智能領(lǐng)域存在大量專業(yè)水平不高的開發(fā)者,使得模型的精度、性能、可擴展性等指標(biāo)難以達(dá)到最優(yōu)。人工智能算法落地的“碎片化困境”。請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容預(yù)訓(xùn)練大模型:收集大量圖像、文本等數(shù)據(jù),利用無監(jiān)督或者自監(jiān)督學(xué)習(xí)方法將數(shù)據(jù)中蘊含的知識提取出來,存儲在具有大量參數(shù)的神經(jīng)網(wǎng)絡(luò)模型中。遇到特定任務(wù)時,只需調(diào)用一個通用的流程,就能夠?qū)⒅R釋放出來,并且與行業(yè)經(jīng)驗結(jié)合,解決實際問題。預(yù)訓(xùn)練大模型能夠解決在沒有基礎(chǔ)模型支撐的情況下,開發(fā)者們必須從頭開始完成收集數(shù)據(jù)、訓(xùn)練模型、調(diào)試模型、優(yōu)化部署等一系列操作的問題;同時降低人工智能算法的開發(fā)成本,真正惠及細(xì)分行業(yè),尤其是中小型企業(yè)。預(yù)訓(xùn)練大模型解決AI模型通用與泛化的問題資料來源:華為《預(yù)訓(xùn)練大模型白皮書》,國信證券經(jīng)濟研究所整理圖:預(yù)訓(xùn)練大模型的特征與優(yōu)勢上游(模型預(yù)訓(xùn)練)和下游(模型微調(diào))兩個階段:上游階段主要收集大量數(shù)據(jù),并且訓(xùn)練超大規(guī)模的神經(jīng)網(wǎng)絡(luò),從而高效地存儲和理解這些數(shù)據(jù)。下游階段則在不同場景中,利用相對較少的數(shù)據(jù)量和計算量,對模型進(jìn)行微調(diào),以達(dá)成特定的目的。請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容、華為云團(tuán)隊于2020年立項AI大模型,并于2021年4月首次以“盤古預(yù)訓(xùn)練大模型”(簡稱“盤古大模型”)的名稱對外發(fā)布。盤古大模型集成了華為云團(tuán)隊在AI領(lǐng)域數(shù)十項研究成果,并且受益于華為的全棧式AI解決方案,與昇騰(Ascend)芯片昇思(MindSpore)語言、ModelArts平臺深度結(jié)合。盤古大模型:中國首個全棧自主的AI大模型圖:盤古大模型3.0架構(gòu)圖資料來源:華為云官網(wǎng),國信證券經(jīng)濟研究所整理2023年7月7日,在2023華為開發(fā)者大會上,面向行業(yè)的盤古大模型3.0發(fā)布,是中國首個全棧自主的AI大模型,包括“5+N+X”三層架構(gòu),分別對應(yīng)L0層的5個基礎(chǔ)大模型、L1層的
N個行業(yè)通用大模型、以及L2層可以讓用戶自主訓(xùn)練的更多細(xì)化場景模型。其采用完全的分層解耦設(shè)計,企業(yè)用戶可以基于自己的業(yè)務(wù)需要選擇適合的大模型開發(fā)、升級或精調(diào),從而適配千行百業(yè)多變的需求。請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容盤古大模型在商業(yè)落地走在前列:盤古+工作流實現(xiàn)低算力、低門檻、邊學(xué)邊用的使用模式;結(jié)合ModelArts和智能體工作流能力,實現(xiàn)輕量化交付;借助華為已有行業(yè)基礎(chǔ),構(gòu)筑行業(yè)大模型。二、L0基礎(chǔ)大模型請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容盤古大模型3
.
0
的L
0
層由5個基礎(chǔ)大模型組成,包括盤古NLP(NaturalLanguage
Processing,自然語言處理)大模型、盤古CV(Computer
Vision,計算機視覺)大模型、盤古多模態(tài)大模型、盤古預(yù)測大模型、盤古科學(xué)計算大模型等。盤古大模型L0層賦予上百種能力,涵蓋問答、生成、理解、代碼、視覺、預(yù)測、科學(xué)計算、高階等方面,覆蓋廣泛應(yīng)用領(lǐng)域。盤古大模型3.0為客戶提供100億、380億、710億和1000億參數(shù)的系列化基礎(chǔ)大模型,能夠匹配客戶不同場景、不同時延、不同響應(yīng)速度的行業(yè)多樣化需求。盤古基礎(chǔ)大模型:提供滿足行業(yè)場景需要的上百種能力圖:盤古大模型3.0架構(gòu)圖資料來源:華為云官網(wǎng),國信證券經(jīng)濟研究所整理圖:盤古大模型L0層賦予上百種能力資料來源:華為云官網(wǎng),國信證券經(jīng)濟研究所整理請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容盤古NLP大模型是業(yè)界首個超千億參數(shù)的中文預(yù)訓(xùn)練大模型,利用大數(shù)據(jù)預(yù)訓(xùn)練、對多源豐富知識相結(jié)合,并通過持續(xù)學(xué)習(xí)吸收海量文本數(shù)據(jù),不斷提升模型的效果。在實現(xiàn)行業(yè)知識檢索回答、文案生成、閱讀理解等基礎(chǔ)功能的同時,具備代碼生成、插件調(diào)用、模型調(diào)用等高階特性,在智能客服、創(chuàng)意營銷、會議助手、代碼助手、企業(yè)信息搜索等多個典型場景,提供AI技術(shù)支撐。盤古NLP大模型:業(yè)界首個超千億參數(shù)的中文預(yù)訓(xùn)練大模型圖:盤古NLP大模型功能介紹智慧教育助手行業(yè)內(nèi)容生成行業(yè)知識理解智能協(xié)同辦公行業(yè)數(shù)據(jù)分析1.單輪問答:歷史、地理、科學(xué)、技術(shù)、1.文案生成:根據(jù)行業(yè)需求完成營銷文案、1.開卷問答:針對標(biāo)準(zhǔn)發(fā)文內(nèi)容進(jìn)行1、代碼生成:根據(jù)用戶描述或示例,對行業(yè)結(jié)構(gòu)化數(shù)據(jù)進(jìn)行多維文化等通用常識問答公關(guān)稿件、公文、股閱讀理解和問答自動生成相應(yīng)代碼度分析,通過2.多輪對話:根據(jù)用戶提供的上下文信息進(jìn)行邏輯推理和判斷,評等創(chuàng)作型任務(wù)2.要點生成:根據(jù)行業(yè)屬性自動搜索和分2.文本摘要:針對快訊、財經(jīng)新聞、會議內(nèi)容等生成簡2、代碼修改:根據(jù)用戶描述或示例,自動修改相應(yīng)的代數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)構(gòu)建進(jìn)行數(shù)理自然流暢對話析相關(guān)內(nèi)容,生成要明摘要碼,并對代碼進(jìn)行邏輯推算,輸3.角色扮演:以職位、著名IP、客服等口吻回答用戶問題點3.表格生成:根據(jù)行業(yè)需求將字段以圖表3.信息抽?。横槍r間、地點、人物等通用實體及工單檢查和優(yōu)化3、代碼理解:根據(jù)用戶給定代碼,出結(jié)果,深度挖掘數(shù)據(jù)規(guī)律和背后趨勢,4.數(shù)學(xué)能力:具備基礎(chǔ)的運算能力的形式返回呈現(xiàn)要素等信息抽取輸出代碼的用途和實現(xiàn)方案更好實現(xiàn)智能決策。圖:盤古NLP大模型應(yīng)用場景政企知識檢索基于政企知識進(jìn)行模型訓(xùn)練,通過對話交互,精準(zhǔn)獲取用戶需求的信息,提高知識獲取效率,帶來有溫度的人工智能服務(wù)體驗。資料來源:華為云官網(wǎng),國信證券經(jīng)濟研究所整理請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容資料來源:華為云官網(wǎng),國信證券經(jīng)濟研究所整理智能創(chuàng)意營銷輕松完成多種風(fēng)格類型的寫作,提供創(chuàng)意的商業(yè)文案,幫助產(chǎn)品吸引更多的潛在客戶,釋放無窮創(chuàng)作活力。行業(yè)研發(fā)助手基于業(yè)務(wù)編程需求生成、補全C++、Java、pytho等編程語言,及各種編程語言的轉(zhuǎn)換,幫助程序員大幅提升研發(fā)效率。具備海量數(shù)據(jù)集、推理能力優(yōu)、多任務(wù)促進(jìn)、多模型調(diào)優(yōu)、多插件補齊、全場景覆蓋等優(yōu)勢。海量數(shù)據(jù)集:通過對中文詞匯、語法、語義等特征的深度分析,持續(xù)優(yōu)化基礎(chǔ)模型,打造業(yè)界最強中文理解/生成能力。推理能力優(yōu):盤古NLP大模型采用文本+代碼融合訓(xùn)練的方式,不僅需要從文本中提取信息,還需要理解代碼的語義和邏輯及與文本之間的關(guān)系,提升思維鏈推理能力。多任務(wù)促進(jìn):不同任務(wù)間具備強大的遷移能力,它所掌握的知識和技能可以輕松地轉(zhuǎn)移到其他相關(guān)任務(wù)中,幫助模型更快地學(xué)習(xí)新任務(wù),循環(huán)促進(jìn)優(yōu)化。多模型調(diào)優(yōu):支持在不同領(lǐng)域任務(wù)中分別使用小模型進(jìn)行特定領(lǐng)域的訓(xùn)練和優(yōu)化,提高模型的使用效率和準(zhǔn)確性,優(yōu)質(zhì)完成多領(lǐng)域任務(wù)。多插件補齊:LLM成為連接應(yīng)用生態(tài)的中樞,支持如知識圖譜,搜索,符號引擎等,補足機制性缺陷,提高盤古NLP大模型整體性能。全場景覆蓋:支持行業(yè)知識問答,文案創(chuàng)作等多項能力,覆蓋政務(wù)、金融、電商、能源等領(lǐng)域,低使用門檻助力多場景AI應(yīng)用落地。數(shù)據(jù)收集:文本部分從互聯(lián)網(wǎng)公開爬取40TB原始網(wǎng)頁數(shù)據(jù),并且進(jìn)行解析和清洗,最終得到約647GB文本數(shù)據(jù)(百科知識約270GB、新聞博客約200GB、文學(xué)作品約106GB、社交媒體約71GB)。語音部分從互聯(lián)網(wǎng)公開爬取超過7萬小時普通話音頻數(shù)據(jù),并將其轉(zhuǎn)換為音頻文件,共計約11TB;視頻來源包括新聞播報、影視劇、綜藝節(jié)目、動畫等。盤古NLP大模型:語義模型在中文理解類榜單上獲得第一名圖:盤古NLP大模型多任務(wù)融合訓(xùn)練策略示意圖資料來源:華為《預(yù)訓(xùn)練大模型白皮書》,國信證券經(jīng)濟研究所整理圖:盤古NLP大模型典型自然語言理解任務(wù)示意圖資料來源:華為《預(yù)訓(xùn)練大模型白皮書》,國信證券經(jīng)濟研究所整理模型效果:語義模型作為業(yè)界首個千億中文大模型,發(fā)布時(2021年5月)在中文理解類榜單CLUE上獲得第一名;生成類任務(wù)在
NLPCC2018文本摘要任務(wù)上取得了業(yè)界最佳成績,超越第二名60。語音模型是當(dāng)前最大的中文語音模型之一,擁有超過4億參數(shù),在自有數(shù)據(jù)上相比于基線模型字符錯誤率相對降低10
。請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容預(yù)訓(xùn)練方法:語義部分使用基于Transformer結(jié)構(gòu)的編碼-解碼器模型神經(jīng)網(wǎng)絡(luò),編碼器負(fù)責(zé)文本理解,解碼器負(fù)責(zé)文本生成。語音部分用卷積與
Transformer結(jié)合的網(wǎng)絡(luò)結(jié)構(gòu),底層用卷積神經(jīng)網(wǎng)絡(luò)提取局部信息,上層用Transformer網(wǎng)絡(luò)提取全局信息。鵬程·盤古模型是以鵬城實驗室為首的聯(lián)合團(tuán)隊在基于昇騰910芯片的E級智能算力平臺(鵬城云腦II)上訓(xùn)練的全球首個全開源2000億參數(shù)的自回歸中文預(yù)訓(xùn)練語言大模型。鵬程·盤古模型基于1.1TB高質(zhì)量中文訓(xùn)練數(shù)據(jù),采用全場景人工智能計算框架MindSpore自動并行技術(shù)實現(xiàn)了五維并行訓(xùn)練策略,從而可將訓(xùn)練任務(wù)高效擴展到4096個處理器上。對比實驗表明,在少樣本或零樣本情況下,鵬程·盤古模型在多個中文自然語言理解或生成任務(wù)上都具有較優(yōu)的性能,例如鵬程·盤古2.6B模型在生成任務(wù)方面比CPM
2.6B模型平均高出6個百分點。同時,實驗表明更大規(guī)模的預(yù)訓(xùn)練模型的性能通常能在小樣本學(xué)習(xí)任務(wù)上取得提升,例如鵬程·盤古13B模型在16個下游任務(wù)中的表現(xiàn)比鵬程·盤古2.6B模型高出近3個百分點。在此基礎(chǔ)上,鵬程·盤古模型在大模型壓縮、提示微調(diào)學(xué)習(xí)、多任務(wù)學(xué)習(xí)以及持續(xù)學(xué)習(xí)等方面也取得了很好的應(yīng)用效果。補充:“鵬程·盤古”大規(guī)模自回歸中文預(yù)訓(xùn)練語言模型圖:鵬程·盤古模型結(jié)構(gòu)資料來源:曾煒,蘇騰,王暉,田永鴻,高文《鵬程·盤古:大規(guī)模自回歸中文預(yù)訓(xùn)練語言模型及應(yīng)用》,國信證券經(jīng)濟研究所整理圖:鵬程·盤古模型訓(xùn)練數(shù)據(jù)處理流程及1.1TB中文語料數(shù)據(jù)組成圖:鵬程·盤古模型參數(shù)規(guī)模及訓(xùn)練效果請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容盤古CV大模型基于海量圖像、視頻數(shù)據(jù)和盤古獨特技術(shù)構(gòu)筑的視覺基礎(chǔ)模型,賦能行業(yè)客戶利用少量場景數(shù)據(jù)對模型微調(diào)即可實現(xiàn)特定場景任務(wù)。在物體檢測、圖像分類、語義分割、萬物檢測、萬物分割等多個典型場景,提供AI技術(shù)支撐。盤古CV大模型:助力圖像視頻分類檢測等視覺場景圖:盤古CV大模型應(yīng)用場景圖:盤古CV大模型功能介紹基礎(chǔ)模型萬物檢測萬物分割支持圖像分類、物體檢測、實例分割、姿態(tài)估計等近10種微調(diào)任務(wù),覆蓋大部分視覺感知場景??筛鶕?jù)提示對圖片中的目標(biāo)進(jìn)行檢測,解決場景碎片化問題,無需提供訓(xùn)練數(shù)據(jù)??筛鶕?jù)提示對圖片中的目標(biāo)進(jìn)行分割,常在輔助標(biāo)注、AIGC等場景應(yīng)用。資料來源:華為云官網(wǎng),國信證券經(jīng)濟研究所整理資料來源:華為云官網(wǎng),國信證券經(jīng)濟研究所整理工業(yè)生產(chǎn)設(shè)備巡檢智慧城市匯聚行業(yè)數(shù)據(jù),使用基礎(chǔ)模型構(gòu)建行業(yè)大模型,解決場景碎片化問題,將“作坊式”AI開發(fā)轉(zhuǎn)變?yōu)椤肮I(yè)化”生產(chǎn)。使用基礎(chǔ)模型結(jié)合行業(yè)知識,解決設(shè)備巡檢場景訓(xùn)練樣本少、故障種類多、目標(biāo)尺度差異大等挑戰(zhàn)。利用萬物檢測、萬物分割滿足智慧城市海量長尾需求,通過語言交互方式高效發(fā)現(xiàn)城市事件。具備更高的準(zhǔn)確率、更好的泛化能力、更廣泛的應(yīng)用場景、“小樣本、高精度、高效率”等優(yōu)勢。更高的準(zhǔn)確率:視覺大模型可以通過大規(guī)模的數(shù)據(jù)訓(xùn)練,提高圖像識別的準(zhǔn)確率。更好的泛化能力:視覺大模型可以學(xué)習(xí)到更多的特征,從而提高對未知數(shù)據(jù)的泛化能力。更廣泛的應(yīng)用場景:開放域的檢測和萬物分割具備更加廣泛的應(yīng)用場景。小樣本、高精度、高效率:結(jié)合數(shù)據(jù)檢索及數(shù)據(jù)增廣技術(shù),相對傳統(tǒng)訓(xùn)練方式,數(shù)據(jù)需求減少80
以上;受益于更好的語義對齊效果,在小樣本學(xué)習(xí)上表現(xiàn)優(yōu)異,顯著超越對比方法;利用行業(yè)模型高效表征及數(shù)據(jù)篩選能力,數(shù)據(jù)處理效率提升5倍以上。請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容,數(shù)據(jù)收集:通過多種渠道收集圖像數(shù)據(jù),包括但不限于公共數(shù)據(jù)集合下載、自有數(shù)據(jù)集合擴充、各搜索引擎關(guān)鍵字爬取、以圖搜圖、視頻圖像抽幀等,并通過原始數(shù)據(jù)篩選,最終保留超過10億張高質(zhì)量圖像數(shù)據(jù)占據(jù)約40TB空間。預(yù)訓(xùn)練方法:計算機視覺領(lǐng)域最常見的卷積網(wǎng)絡(luò)和Transformer架構(gòu)。利用自動機器學(xué)習(xí)算法,能夠支持并調(diào)用不同大小的神經(jīng)網(wǎng)絡(luò),其中最大的計算模型具有接近30億參數(shù),最小的模型只有數(shù)十萬參數(shù),其大小相差超過1000倍,為適配不同的視覺任務(wù)提供了可能性。盤古CV大模型:性能表現(xiàn)優(yōu)異,具備良好的泛化能力圖:盤古CV大模型分類及檢測性能結(jié)果比較圖:盤古CV大模型預(yù)訓(xùn)練算法示意圖資料來源:華為《預(yù)訓(xùn)練大模型白皮書》,國信證券經(jīng)濟研究所整理資料來源:華為《預(yù)訓(xùn)練大模型白皮書》,國信證券經(jīng)濟研究所整理模型效果:盤古CV大模型在ImageNet數(shù)據(jù)集的線性分類評估上,首次達(dá)到了與全監(jiān)督相比擬的結(jié)果。在小樣本學(xué)習(xí)上表現(xiàn)優(yōu)異:使用ImageNet上1
和10
的標(biāo)簽訓(xùn)練,模型達(dá)到了66.7
和75.1
的分類精度,均顯著超越對比方法。以此方法為基礎(chǔ)設(shè)計了具有10億參數(shù)量的基礎(chǔ)模型,并在超過10億張無標(biāo)注圖像組成的數(shù)據(jù)集上進(jìn)行預(yù)訓(xùn)練,所得到的模型在ImageNet上達(dá)到了88.7
的分類精度,而1
標(biāo)簽的半監(jiān)督學(xué)習(xí)精度也達(dá)到83.0
。請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容盤古多模態(tài)大模型融合語言和視覺跨模態(tài)信息,實現(xiàn)圖像生成、圖像理解、3D生成和視頻生成等應(yīng)用,面向產(chǎn)業(yè)智能化轉(zhuǎn)型提供跨模態(tài)能力底座。在以文生圖、以圖生圖、圖像理解、圖像編輯、以文生3D、以圖生3D等多個典型場景,提供AI技術(shù)支撐。盤古多模態(tài)大模型:提供跨模態(tài)圖文理解與生成能力圖:盤古多模態(tài)大模型應(yīng)用場景圖:盤古多模態(tài)大模型功能介紹圖像生成圖像理解3D生成視頻生成利用大數(shù)據(jù)和深度學(xué)習(xí),將靈感轉(zhuǎn)化為高質(zhì)量圖片,重塑視覺藝術(shù)形態(tài)。深度解構(gòu)圖像色彩、形狀和紋理等,解讀圖像中隱藏的意義和情感??焖贅?gòu)建三維模型,打破平面的束縛,開創(chuàng)立體的視界。加速視頻創(chuàng)作,豐富感官體驗,搭建創(chuàng)意的平臺和跨越時空的旅行。資料來源:華為云官網(wǎng),國信證券經(jīng)濟研究所整理影視制作電商營銷平面設(shè)計面向行業(yè)提供廣告設(shè)計、產(chǎn)品設(shè)計、電商/模特圖、頭像設(shè)計、插畫設(shè)計等技術(shù)。游戲開發(fā)面向行業(yè)提供角色創(chuàng)作、原畫設(shè)計、3D素材生成、手辦創(chuàng)作、風(fēng)格轉(zhuǎn)換等技術(shù)。面向行業(yè)提供分鏡創(chuàng)作、IP角色設(shè)計、短視頻生成、場景生成、視頻編輯等技術(shù)。面向行業(yè)提供產(chǎn)品設(shè)計、品類包裝、要素識別、素材生成、廣告營銷等技術(shù)。具備原生支持中文、精準(zhǔn)語義理解、更具自然美感、更強泛化性、全棧自主可控、支持二次訓(xùn)練等優(yōu)勢。原生支持中文:億級中文圖文對,百萬中文關(guān)鍵詞,更好的中文理解能力。精準(zhǔn)語義理解:精準(zhǔn)圖文描述,對齊語義理解,智能語境識別。更具自然美感:多模態(tài)多尺度訓(xùn)練,逼近自然美感,更驚艷的生成內(nèi)容。更強泛化性:強大泛化能力,適應(yīng)各種復(fù)雜的應(yīng)用場景和用戶需求。全棧自主可控:全棧自主可控,基于昇騰云服務(wù),技術(shù)完全自主可控。支持二次訓(xùn)練:支持行業(yè)客戶二次訓(xùn)練專屬模型,打造大模型體驗。資料來源:華為云官網(wǎng),國信證券經(jīng)濟研究所整理請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容數(shù)據(jù)收集:從互聯(lián)網(wǎng)中爬取大量數(shù)據(jù)并進(jìn)行過濾處理,最終得到約3.5億高質(zhì)量的圖文配對數(shù)據(jù),占據(jù)約60TB存儲空間。預(yù)訓(xùn)練方法:主流的多模態(tài)大模型架構(gòu)主要分為單塔架構(gòu)和雙塔架構(gòu),模型采用雙塔結(jié)構(gòu),利用不同的神經(jīng)網(wǎng)絡(luò)完成不同模態(tài)的信息抽取,僅在最后一層做信息交互和融合,屬于信息后融合方案。盤古多模態(tài)大模型:各項下游任務(wù)取得業(yè)界領(lǐng)先水平圖:盤古多模態(tài)大模型算法示意圖資料來源:華為《預(yù)訓(xùn)練大模型白皮書》,國信證券經(jīng)濟研究所整理圖:盤古多模態(tài)大模型開放域物體檢測和視覺定位任務(wù)效果圖模型效果:模型在多模態(tài)的各項下游任務(wù),如跨模態(tài)檢索、圖像描述自動生成、視覺定位等任務(wù)上均取得了業(yè)界領(lǐng)先水平。采用LOUPE算法預(yù)訓(xùn)練所得的模型,在跨模態(tài)檢索數(shù)據(jù)集Flicker30k以及MS-COCO上取得了當(dāng)前業(yè)界最佳的圖文檢索精度,其中在MS-COCO的以文搜圖任務(wù)上超過業(yè)界標(biāo)桿算法CLIP達(dá)12.3
。資料來源:華為《預(yù)訓(xùn)練大模型白皮書》,國信證券經(jīng)濟研究所整理請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容盤古預(yù)測大模型是面向結(jié)構(gòu)化類數(shù)據(jù),基于10類2000個基模型空間,通過模型推薦、融合兩步優(yōu)化策略,構(gòu)建圖網(wǎng)絡(luò)架構(gòu)AI模型。在回歸預(yù)測、分類、異常檢測、時序預(yù)測、融合神經(jīng)網(wǎng)絡(luò)模型等多個典型場景,提供AI技術(shù)支撐。盤古預(yù)測大模型:統(tǒng)一大模型在通用數(shù)據(jù)域上的構(gòu)造方案圖:盤古預(yù)測大模型應(yīng)用場景圖:盤古預(yù)測大模型功能介紹回歸預(yù)測分類預(yù)測時間序列預(yù)測異常檢測用于連續(xù)值預(yù)測,可自動進(jìn)行任務(wù)理解,分析選擇最適合的回歸模型集合,并融合多個模型來提升回歸預(yù)測精度。基于基模型選取+融合架構(gòu),集成多種數(shù)據(jù)預(yù)處理方式。用于離散值的預(yù)測,如:不同類別或標(biāo)簽;基于任務(wù)理解和模型選擇推薦能力,可自動選擇多個分類模型并基于動態(tài)圖算法進(jìn)行融合,來提升預(yù)測性能。通過Transformer推薦模塊選取合適的分類基模型的集合提升精度。利用過去數(shù)據(jù)預(yù)測未來趨勢;可基于時間維度進(jìn)行自動任務(wù)理解和輔助特征工程,來提升時間序列類任務(wù)的精度。結(jié)合純時序方法和窗口方法的輸出結(jié)果,支持多步輸入/輸出。用于預(yù)測數(shù)據(jù)集中的異常數(shù)據(jù)點;可通過學(xué)習(xí)正常數(shù)據(jù)的特征分布規(guī)律來建立基準(zhǔn)模型,可融合多個基準(zhǔn)模型提升預(yù)測精度并減少誤報和漏報的情況。工藝指標(biāo)預(yù)測資料來源:華為云官網(wǎng),國信證券經(jīng)濟研究所整理請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容資料來源:華為云官網(wǎng),國信證券經(jīng)濟研究所整理銷售預(yù)測財務(wù)異常檢測工業(yè)生產(chǎn)過程工藝指標(biāo)的預(yù)測,例如水泥回轉(zhuǎn)窯質(zhì)量預(yù)測、煤礦洗選煤精煤灰分預(yù)測。結(jié)合歷史銷量、商品信息、時間特征等進(jìn)行商品級別的銷量預(yù)測;支持不同門店,多種商品的銷量實時預(yù)測。根據(jù)企業(yè)的財務(wù)數(shù)據(jù)和相關(guān)信息進(jìn)行分析,挖掘潛在的財務(wù)風(fēng)險。具備大規(guī)模數(shù)據(jù)預(yù)訓(xùn)練、融合智能決策、基于數(shù)據(jù)元特征的任務(wù)理解、自適應(yīng)基模型搜索推薦、動態(tài)圖驅(qū)動的模型融合等優(yōu)勢。大規(guī)模數(shù)據(jù)預(yù)訓(xùn)練:自動化通用數(shù)據(jù)預(yù)處理、并行基模型性能矩陣構(gòu)建、元特征構(gòu)架、高速計算梯度等技術(shù),自動匹配最優(yōu)基模型,優(yōu)化模型組合與推薦。融合智能決策:基于預(yù)測模型及其結(jié)果,聯(lián)合天籌求解優(yōu)化算法,構(gòu)建預(yù)測+決策解決方案,實現(xiàn)生產(chǎn)工藝優(yōu)化、供應(yīng)鏈調(diào)度優(yōu)化等場景的最優(yōu)參數(shù)控制。基于數(shù)據(jù)元特征的任務(wù)理解:通過對數(shù)據(jù)元特征進(jìn)行建模,得到更準(zhǔn)確和全面的數(shù)據(jù)信息,進(jìn)一步優(yōu)化解決方案,提高模型能力。自適應(yīng)基模型搜索推薦:基于下游任務(wù)數(shù)據(jù)集的元特征,可通過預(yù)訓(xùn)練的搜索推薦模型,得到更適配的預(yù)處理方式和基模型集合。動態(tài)圖驅(qū)動的模型融合:通過動態(tài)圖對選擇的基模型輸出結(jié)果進(jìn)行融合,得到基模型的最佳融合方式,進(jìn)一步提升任務(wù)性能。盤古科學(xué)計算大模型是面向氣象、醫(yī)藥、水務(wù)、機械、航天航空等領(lǐng)域,采用AI數(shù)據(jù)建模和AI方程求解的方法;從海量的數(shù)據(jù)中提取出數(shù)理規(guī)律,使用神經(jīng)網(wǎng)絡(luò)編碼微分方程;使用AI模型更快更準(zhǔn)的解決科學(xué)計算問題。在氣象預(yù)測、藥物分子等多個典型場景,提供AI技術(shù)支撐。盤古科學(xué)計算大模型:以嵌入科學(xué)方程的深度神經(jīng)網(wǎng)絡(luò)解決科學(xué)問題圖:盤古科學(xué)計算大模型應(yīng)用場景圖:盤古科學(xué)計算大模型功能介紹盤古氣象大模型盤古藥物分子大模型首個精度超過傳統(tǒng)數(shù)值預(yù)報方法的AI方法,1小時-7天預(yù)測精度均高于傳統(tǒng)數(shù)值方法(歐洲氣象中心的operational
IFS)。預(yù)測包括位勢、濕度、風(fēng)速、溫度等;水平空間分辨率達(dá)到0.25°X0.25°,時間分辨率為1小時,覆蓋13層垂直高度,可以精準(zhǔn)賦能藥物研發(fā)的全鏈條任務(wù),旨在幫助醫(yī)藥企業(yè)機構(gòu)顯著提升藥物研發(fā)的效率。囊括了大規(guī)模藥物虛擬篩選、分子動力學(xué)模擬等傳統(tǒng)CADD藥物研發(fā)軟件;基于AIDD的蛋白質(zhì)結(jié)構(gòu)預(yù)測、分子屬性預(yù)測等服務(wù)。助力新靶標(biāo)藥物的發(fā)現(xiàn),讓地預(yù)測細(xì)粒度氣象特征。醫(yī)藥公司搭乘AI輔助藥物研發(fā)的“快車”。中長期天氣預(yù)報資料來源:華為云官網(wǎng),國信證券經(jīng)濟研究所整理請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容資料來源:華為云官網(wǎng),國信證券經(jīng)濟研究所整理海浪預(yù)測基于AI的藥物分子生成盤古氣象大模型具備3D高分辨率AI氣象預(yù)報的優(yōu)勢。3D高分辨率AI氣象預(yù)報:使用3D
Earth-Specific
Transformer為基本框架,對輸入的13×1440×721×5的高空變量和1440×721×4的地表變量進(jìn)行關(guān)聯(lián)訓(xùn)練,精準(zhǔn)識別大氣中不同高度的氣象特征和相互作用關(guān)系。盤古藥物分子大模型具備基于大模型的藥物分子生成優(yōu)化、高精度秒級藥物分子屬性預(yù)測等優(yōu)勢?;诖竽P偷乃幬锓肿由蓛?yōu)化:基于盤古藥物分子大模型,以參考化合物為起點,支持80+種屬性限制約束,從參考化合物到改造化合物的類藥性質(zhì)一覽無余,更方便地迭代優(yōu)化,得到性質(zhì)更優(yōu)、結(jié)構(gòu)新穎的化合物。高精度秒級藥物分子屬性預(yù)測:基于盤古藥物分子大模型,在秒級內(nèi)完成化合物的ADMET相關(guān)的80多種成藥性質(zhì)的預(yù)測以及藥物可合成性的分?jǐn)?shù)評估,以雷達(dá)圖的方式直觀展示,更好地輔助藥物分子設(shè)計。盤古科學(xué)計算大模型:海浪預(yù)測任務(wù)預(yù)測平均誤差小于5cm圖:海浪預(yù)測問題使用的偏微分方程及嵌入偏微分方程的神經(jīng)網(wǎng)絡(luò)示意圖資料來源:華為《預(yù)訓(xùn)練大模型白皮書》,國信證券經(jīng)濟研究所整理圖:海浪預(yù)測模型預(yù)測結(jié)果示意圖資料來源:華為《預(yù)訓(xùn)練大模型白皮書》,國信證券經(jīng)濟研究所整理模型效果:以海浪預(yù)測任務(wù)為例,通過爬取全球近10年的實時海浪高度數(shù)據(jù)進(jìn)行訓(xùn)練,模型在驗證集上預(yù)測的平均誤差小于5cm,與傳統(tǒng)預(yù)測方法相當(dāng),可以滿足實際應(yīng)用需求。同時,AI算法的預(yù)測時間較傳統(tǒng)方法大幅減少,在單張華為昇騰芯片上,1s之內(nèi)即可得到全球海浪高度預(yù)測,1分鐘內(nèi)能夠完成超過100次海浪預(yù)測任務(wù),推理效率較傳統(tǒng)方法提升了4-5個數(shù)量級。數(shù)據(jù)收集:分為觀測數(shù)據(jù)和仿真數(shù)據(jù)兩類。觀測數(shù)據(jù)由觀測工具(如游標(biāo)卡尺、雷達(dá)、傳感器等)產(chǎn)生,仿真數(shù)據(jù)由仿真算法(對應(yīng)人類知識)產(chǎn)生,這兩類數(shù)據(jù)及其融合數(shù)據(jù)和機理知識均可以作為AI模型的學(xué)習(xí)對象。模型構(gòu)建:以海浪預(yù)測任務(wù)為例,其目標(biāo)為預(yù)測全球范圍內(nèi)海平面的實時浪高,輸入和輸出數(shù)據(jù)均為帶有時間戳的二維球面數(shù)據(jù),因此適合使用二維網(wǎng)絡(luò)模型。以進(jìn)行全球范圍內(nèi)的氣象預(yù)測為例,輸入和輸出均為帶有時間戳的三維數(shù)據(jù)(包括高度),因此適合使用三維網(wǎng)絡(luò)模型。二維網(wǎng)絡(luò)和三維網(wǎng)絡(luò)均可使用卷積神經(jīng)網(wǎng)絡(luò)或者視覺Transformer作為骨干架構(gòu),配合大數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練。請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容三、L1行業(yè)大模型與L2場景大模型請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容盤古大模型3.0的L1層由N個行業(yè)大模型組成,包括政務(wù)、金融、制造、藥物分子、礦山、鐵路、氣象等大模型。除提供以上使用行業(yè)公開數(shù)據(jù)訓(xùn)練的行業(yè)通用大模型外,還可以基于客戶自有數(shù)據(jù),在L0和L1層上訓(xùn)練專有大模型。L2層是為客戶提供的更多細(xì)化場景的場景大模型,如政務(wù)熱線、網(wǎng)點助手、供應(yīng)鏈物流、先導(dǎo)藥物篩選、臺風(fēng)路徑預(yù)測等,為客戶提供“開箱即用”的模型服務(wù)。盤古大模型采用完全的分層解耦設(shè)計,可以快速適配、快速滿足行業(yè)的多變需求。根據(jù)客戶不同的數(shù)據(jù)安全與合規(guī)訴求,盤古大模型還提供了公用云、大模型云專區(qū)、混合云多樣化的部署形態(tài)。盤古行業(yè)大模型與場景大模型:提供專屬行業(yè)與場景的大模型圖:盤古大模型3.0架構(gòu)圖資料來源:華為云官網(wǎng),國信證券經(jīng)濟研究所整理請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容2023年7月6日,國際頂級學(xué)術(shù)期刊《自然》(Nature)雜志正刊發(fā)表了華為云盤古大模型研發(fā)團(tuán)隊研究成果—
—
《三維神經(jīng)網(wǎng)絡(luò)用于精準(zhǔn)中期全球天氣預(yù)報》(Accuratemedium-rangeglobalweatherforecastingwith3Dneuralnetworks),是近年來中國科技公司首篇作為唯一署名單位發(fā)表的《自然》正刊論文。論文提出了適應(yīng)地球坐標(biāo)系統(tǒng)的三維神經(jīng)網(wǎng)絡(luò)(3D
Earth-Specific
Transformer)來處理復(fù)雜的不均勻3D氣象數(shù)據(jù),并且使用層次化時域聚合策略來減少預(yù)報迭代次數(shù),從而減少迭代誤差。華為云盤古氣象大模型是首個精度超過傳統(tǒng)數(shù)值預(yù)報方法的AI模型,速度相比傳統(tǒng)數(shù)值預(yù)報提速10000倍以上。通過在43年的全球天氣數(shù)據(jù)上訓(xùn)練深度神經(jīng)網(wǎng)絡(luò),盤古氣象大模型在精度和速度方面均超越傳統(tǒng)數(shù)值預(yù)測方法。盤古氣象大模型:Nature發(fā)文,精度與速度超越傳統(tǒng)數(shù)值預(yù)報圖:盤古氣象大模型研究成果在《Nature》正刊發(fā)表資料來源:華為云官網(wǎng),國信證券經(jīng)濟研究所整理圖:盤古氣象大模型性能效果盤古氣象大模型能夠提供全球氣象秒級預(yù)報,其氣象預(yù)測結(jié)果包括位勢、濕度、風(fēng)速、溫度、海平面氣壓等,可以直接應(yīng)用于多個氣象研究細(xì)分場景,在歐洲中期預(yù)報中心和中央氣象臺等實測中均表現(xiàn)了其預(yù)測的優(yōu)越性。資料來源:華為云官網(wǎng),國信證券經(jīng)濟研究所整理請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容2021年9月23日,華為在全聯(lián)接大會2021上發(fā)布了華為云盤古藥物分子大模型。該模型由華為云深度聯(lián)合中國科學(xué)院上海藥物研究所共同訓(xùn)練,是專門面向藥物研發(fā)領(lǐng)域推出的預(yù)訓(xùn)練大模型,旨在幫助醫(yī)藥公司開啟AI輔助藥物研發(fā)的新模式。盤古藥物分子大模型:開啟AI藥物研發(fā)新模式圖:盤古藥物分子大模型樣例資料來源:華為云官網(wǎng),國信證券經(jīng)濟研究所整理圖:盤古藥物分子大模型特征盤古藥物分子大模型首次采用“圖-序列不對稱條件變分自編碼器”架構(gòu),能夠自動找出化合物關(guān)鍵的分子特征指紋,極大地提升了下游任務(wù)的準(zhǔn)確性。模型學(xué)習(xí)了市面上真實存在的17億個已知的藥物分子的化學(xué)結(jié)構(gòu)進(jìn)行預(yù)訓(xùn)練,在化學(xué)無監(jiān)督學(xué)習(xí)模式下,實現(xiàn)結(jié)構(gòu)重構(gòu)率、合法性、唯一性等指標(biāo)全面優(yōu)于現(xiàn)有方法。盤古藥物分子大模型提出了針對化合物表征學(xué)習(xí)的全新深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu),支持蛋白質(zhì)與化合物相互作用預(yù)測、86種分子屬性預(yù)測、分子生成、分子優(yōu)化等功能,生成了1億全新的小分子化合物數(shù)據(jù)庫,結(jié)構(gòu)新穎性達(dá)到了99.68
,并且可以有效地生成理化性質(zhì)相似的新化合物,為發(fā)現(xiàn)新藥創(chuàng)造可能性。資料來源:華為云官網(wǎng),國信證券經(jīng)濟研究所整理請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容2023年9月20日,華為在全聯(lián)接大會2023上發(fā)起“華為盤古政務(wù)大模型聯(lián)合創(chuàng)新行動”,以“賦能政務(wù)和城市數(shù)字化向智能化升級”為共同目標(biāo),重點推進(jìn)大模型在政務(wù)服務(wù)、政務(wù)辦公、城市治理等場景的聯(lián)合創(chuàng)新方案開發(fā),并推進(jìn)各級地方政府的“十四五”規(guī)劃和數(shù)字政府、數(shù)字經(jīng)濟、數(shù)字社會建設(shè)規(guī)劃等實踐與落地。盤古政務(wù)大模型致力于打造城市AI算力基礎(chǔ)設(shè)施,賦能城市智能化升級,帶動數(shù)字經(jīng)濟快速增長,實現(xiàn)高效政務(wù)辦公,便捷政務(wù)服務(wù),精準(zhǔn)城市治理。盤古政務(wù)大模型:賦能政務(wù)和城市數(shù)字化向智能化升級圖:華為盤古政務(wù)大模型聯(lián)合創(chuàng)新行動發(fā)布資料來源:華為官網(wǎng),國信證券經(jīng)濟研究所整理圖:盤古政務(wù)大模型應(yīng)用于福田政務(wù)助手小福示例華為聯(lián)合深圳市福田區(qū)政務(wù)局上線了基于盤古政務(wù)大模型的福田政務(wù)智慧助手小福。依托大模型建設(shè)輔助辦文、智能校對、自動生成摘要、輔助批示、智慧督辦等應(yīng)用,助力政務(wù)數(shù)字化轉(zhuǎn)型;在城市數(shù)字化領(lǐng)域,利用視覺(CV)大模型提供城市事件智能發(fā)現(xiàn)能力,全面覆蓋城市治理自動化事件上報場景,精準(zhǔn)識別事件并智能上報、自動工單分派。資料來源:華為云官網(wǎng),國信證券經(jīng)濟研究所整理請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容2023年7月18日,山東能源集團(tuán)、華為、云鼎科技聯(lián)手發(fā)布全球首個商用于能源行業(yè)的AI大模型——盤古礦山大模型。盤古礦山大模型致力于解決人工智能在礦山領(lǐng)域落地難的問題,引領(lǐng)礦山AI開發(fā)模式從作坊式向工廠式轉(zhuǎn)變,為AI大規(guī)模進(jìn)入礦山打下堅實基礎(chǔ)。盤古礦山大模型致力于讓更多煤礦工人在地面上作業(yè),在增加其工作環(huán)境舒適度的同時,可以極大程度減少安全事故。盤古礦山大模型基于ModelArts構(gòu)建,提供端到端AI生產(chǎn)線能力和高性能AI算力,大模型推理效率提升30
+,讓每個煤礦每年平均多產(chǎn)出2000噸精煤。盤古礦山大模型:提升煤礦工程效率,極大減少安全事故圖:礦山大模型應(yīng)用實例資料來源:新浪VR,國信證券經(jīng)濟研究所整理圖:盤古礦山大模型性能效果據(jù)華為數(shù)據(jù),盤古礦山大模型已開發(fā)了21個場景化應(yīng)用,覆蓋了7大業(yè)務(wù)系統(tǒng);已在全國8個礦井里規(guī)模使用,覆蓋了煤礦的綜采、掘進(jìn)、機電、運輸、通風(fēng)、洗選等流程下的1000多個細(xì)分場景。此外,通過引入AI大模型視覺識別能力,能夠?qū)π秹恒@孔施工質(zhì)量進(jìn)行智能分析,輔助防沖部門進(jìn)行防沖卸壓工程規(guī)范性驗證,降低了82的人工審核工作量,并將原本需要3天的防沖卸壓施工監(jiān)管流程縮短至10分鐘,實現(xiàn)了防沖工程100
驗收率。資料來源:華為云官網(wǎng),國信證券經(jīng)濟研究所整理請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容貨車故障軌邊圖像檢測系統(tǒng)(TFDS)能夠?qū)㈦娮友鄹咚倥臄z、動態(tài)采集到的貨車車底配件和車體側(cè)部狀態(tài)等4800余張圖像實時傳輸?shù)絼討B(tài)檢車室。傳統(tǒng)的TFDS系統(tǒng)需要動態(tài)檢車員及時分析每一張圖片,發(fā)現(xiàn)車輛故障隱患,并將故障部位圖片反饋至一線檢車員。盤古鐵路大模型:“AI檢車”故障識別準(zhǔn)確率提升至99.89圖:TFDS貨車故障檢測系統(tǒng)場景演示示意圖資料來源:華為云官網(wǎng),國信證券經(jīng)濟研究所整理圖:基于盤古行業(yè)預(yù)訓(xùn)練模型的鐵路TFDS開發(fā)方案資料來源:華為《預(yù)訓(xùn)練大模型白皮書》,國信證券經(jīng)濟研究所整理2022年12月,“AI檢車”系統(tǒng)投入試用。經(jīng)華為盤古大模型“AI訓(xùn)練”后的TFDS系統(tǒng),能夠?qū)崟r分析采集的圖像,自動識別各種不同類型的鐵路貨車故障。通過“AI檢車”結(jié)合人工復(fù)核方式能夠?qū)⒆鳂I(yè)時長由平均17分鐘減少至14分鐘,作業(yè)人數(shù)由4-5人減少至2-3人,故障識別準(zhǔn)確率由98.26
提高至99.89
。據(jù)華為數(shù)據(jù),請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容盤古鐵路大模型可以對鐵路上67
種貨車的430多種故障進(jìn)行檢測,
故障檢測漏檢率為0,檢測效率提升20倍。2023年9月21日,華為云在華為全聯(lián)接大會2023上正式發(fā)布盤古汽車大模型,覆蓋汽車設(shè)計、生產(chǎn)、營銷、研發(fā)等業(yè)務(wù)場景,致力于為汽車企業(yè)的員工提供專屬的智能助手,以提高工作效率和輕松度。盤古汽車大模型可在數(shù)字孿生空間生成復(fù)雜場景樣本,為乘用車自動駕駛遍歷各種復(fù)雜場景,讓自動駕駛學(xué)習(xí)訓(xùn)練周期從2周以上縮短到2天內(nèi);同時能讓無人駕駛重卡在復(fù)雜環(huán)境下安全高效工作,通過模擬礦區(qū)環(huán)境揚塵飛揚、上下長坡、大區(qū)率轉(zhuǎn)彎等場景,配合樣本的自動標(biāo)注,4個月即適配新的重卡車型,大大提升無人重卡的落地效率。新疆疆納和內(nèi)蒙古伊敏露天煤礦使用了華為商專車自動駕駛云服務(wù),可實現(xiàn)60噸的重卡橫向誤差小于0.2米、精準(zhǔn)??空`差小于0.1米。盤古汽車大模型:全面加速車企智能化升級圖:盤古汽車大模型賦能汽車行業(yè)資料來源:華為云官網(wǎng),國信證券經(jīng)濟研究所整理請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容四、AI開發(fā)框架與開發(fā)平臺請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容MindSpore(昇思
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 建立高效團(tuán)隊合作的前臺策略計劃
- 規(guī)劃個人品牌傳播的渠道計劃
- 生物實驗材料采購計劃
- 課程改革與新模式探索計劃
- 防觸電產(chǎn)品的市場現(xiàn)狀與發(fā)展趨勢
- 傳統(tǒng)與現(xiàn)代教育結(jié)合的探討計劃
- 超市貨架布局與安全優(yōu)化策略
- 八上名著《昆蟲記》片段展示及賞析(另附《昆蟲記》資料匯編)
- 高校宿舍的安全知識教育與監(jiān)管策略
- 跨地域文化交流在老年教育中的重要性
- Q∕SY 06505.13-2016 煉油化工工程儀表自動化設(shè)計規(guī)范 第13部分:儀表防爆及防護(hù)
- 跨境電商行業(yè)深度研究報告
- 油漆使用登記記錄表
- 【知識點提綱】新教材-人教版高中化學(xué)必修第一冊全冊各章節(jié)知識點考點重點難點提煉匯總
- 高中語文基礎(chǔ)知識手冊薛金星
- 輪轂電機驅(qū)動電動車懸架和轉(zhuǎn)向系統(tǒng)設(shè)計與性能匹配
- 二年級第二學(xué)期體育知識結(jié)構(gòu)圖
- CASS勘測定界操作指導(dǎo)方案
- 中國商品條碼系統(tǒng)注冊登記表規(guī)范填寫
- 湘科教版小學(xué)信息技術(shù)四年級下冊全冊教案.doc
- JJG 840-1993 函數(shù)信號發(fā)生器檢定規(guī)程
評論
0/150
提交評論