大模型技術(shù)與應用產(chǎn)業(yè)人才崗位能力要求_第1頁
大模型技術(shù)與應用產(chǎn)業(yè)人才崗位能力要求_第2頁
大模型技術(shù)與應用產(chǎn)業(yè)人才崗位能力要求_第3頁
大模型技術(shù)與應用產(chǎn)業(yè)人才崗位能力要求_第4頁
大模型技術(shù)與應用產(chǎn)業(yè)人才崗位能力要求_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

Industrialtalentscompetencyframeworkoflargemodeltechnologyandapplications工業(yè)和信息化部人才交流中心發(fā)布IT/MIITEC023-2024 2術(shù)語和定義 3大模型技術(shù)與應用產(chǎn)業(yè)人才崗位方向及職責 4大模型技術(shù)與應用產(chǎn)業(yè)人才崗位能力要素 5大模型技術(shù)與應用產(chǎn)業(yè)人才崗位能力要求 5.1架構(gòu)方向 35.2算法方向 45.3數(shù)據(jù)方向 55.4評測方向 55.5應用方向 6附錄A(資料性附錄)大模型技術(shù)與應用產(chǎn)業(yè)人才崗位能力提升 附錄B(資料性附錄)大模型技術(shù)與應用產(chǎn)業(yè)人才崗位能力評價 1T/MIITEC023-2024本文件按照GB/T1.1-2020《標準化工作導則第1部分:標準化文件的結(jié)構(gòu)和起草規(guī)則》的規(guī)定起本文件由工業(yè)和信息化部人才交流中心提出并歸口。本文件起草單位:工業(yè)和信息化部人才交流中心、深度學習技術(shù)及應用國家工程研究中心、北京百度網(wǎng)訊科技有限公司、華晨寶馬汽車有限公司、興業(yè)銀行金融科技研究院、南方電網(wǎng)人工智能科技有限公司、國網(wǎng)遼寧省電力有限公司電力科學研究院。本文件主要起草人:李學林、色云峰、李利利、李廷茹、施佳文、高鐵柱、費曉旭、錢芳、張?zhí)俜健⒐?、何平、盧志良、張彬。本文件為首次制定。2T/MIITEC023-2024大模型技術(shù)與應用產(chǎn)業(yè)人才崗位能力要求本文件規(guī)定了大模型技術(shù)與應用領(lǐng)域主要方向崗位能力要求。本文件適用于指導各單位開展大模型技術(shù)與應用產(chǎn)業(yè)人才培養(yǎng)、人才評價(人才認證)、人才招聘、人才引進等工作。2術(shù)語和定義2.1大模型largemodel具有大規(guī)模參數(shù)和復雜計算結(jié)構(gòu)的機器學習模型。2.2機器學習machinelearning通過計算技術(shù)優(yōu)化模型參數(shù)的過程,使模型的行為反映數(shù)據(jù)或經(jīng)驗。[來源:GB/T41867-2022信息技術(shù)人工智能術(shù)語,定義3.2.10]3大模型技術(shù)與應用產(chǎn)業(yè)人才崗位方向及職責大模型技術(shù)與應用產(chǎn)業(yè)人才崗位包括架構(gòu)、算法、數(shù)據(jù)、評測、應用5個方向,主要涉及以下8個崗位,具體如表1所示。表1大模型技術(shù)與應用產(chǎn)業(yè)人才主要崗位及職責123456783T/MIITEC023-20244大模型技術(shù)與應用產(chǎn)業(yè)人才崗位能力要素大模型技術(shù)與應用產(chǎn)業(yè)人才崗位能力要素包括專業(yè)知識、技術(shù)技能、工程實踐三個維度。具體如表2所示。表2崗位能力要素列表指相應崗位人才應掌握的通用知識,主要包括基本理論、相關(guān)標準與規(guī)范知識以及有關(guān)法律指相應崗位人才完成工作任務所必備的知識,主要指與具體崗位要求相適應的理論知識、技指相應崗位人才為完成工作任務所應具備的對基礎(chǔ)知識指相應崗位人才為完成工作任務所應具備的對專業(yè)知識應用的水平以及對特殊工具使用的掌握5大模型技術(shù)與應用產(chǎn)業(yè)人才崗位能力要求5.1架構(gòu)方向5.1.1大模型集群研發(fā)和運維工程師a)專業(yè)知識——深入了解Linux系統(tǒng)操作和管理,對Linux內(nèi)核、文件系統(tǒng)、網(wǎng)絡(luò)配置有充分的認識;——熟悉容器化技術(shù)及其原理,了解Docker、Kubernetes等容器管理工具;——了解GPU集群工作原理和架構(gòu),了解NVIDIAGPU、昆侖、昇騰等主流GPU的架構(gòu)特性、優(yōu)化方法、組網(wǎng)與高并發(fā)處理等;——掌握基本的系統(tǒng)監(jiān)控和性能調(diào)優(yōu)知識,能夠分析系統(tǒng)瓶頸并提出優(yōu)化建議。b)技術(shù)技能——熟練掌握Linux命令行操作,能夠高效地進行系統(tǒng)管理和故障排除;——熟悉網(wǎng)絡(luò)配置和故障排查,能夠處理復雜的網(wǎng)絡(luò)問題;——熟練使用至少一種腳本語言(如Shell、Python),能夠編寫自動化運維腳本,提高運維效——熟悉主流監(jiān)控工具(如Prometheus、Grafana等),能夠配置和使用這些工具進行系統(tǒng)監(jiān)控和預警;——了解深度學習框架和GPU的使用和優(yōu)化,能夠為研發(fā)團隊提供有效的技術(shù)支持。c)工程實踐——具備豐富的GPU集群運維經(jīng)驗,能夠獨立完成集群的部署、管理和優(yōu)化工作;——熟悉各種系統(tǒng)故障的處理流程和方法,能夠快速響應并處理各種突發(fā)情況,確保系統(tǒng)的穩(wěn)定性和可用性;——具備與研發(fā)團隊緊密配合的經(jīng)驗,能夠根據(jù)業(yè)務需求設(shè)計和實施高效的集群資源管理和調(diào)度策略;4T/MIITEC023-2024——具備編寫技術(shù)文檔的能力,包括操作手冊、故障處理流程和系統(tǒng)優(yōu)化報告等;——具備新技術(shù)和產(chǎn)品動態(tài)學習能力,能夠評估并引入新的集群性能提升技術(shù)。5.1.2深度學習框架研發(fā)工程師a)專業(yè)知識——掌握深度學習框架,如飛槳PaddlePaddle、PyTorch等,了解其內(nèi)部工作原理和優(yōu)化方法;——精通計算機體系結(jié)構(gòu),對CPU、GPU、FPGA、ASIC等多元化計算架構(gòu)有深入的理解;——熟悉分布式計算的基本原理,了解同步、異步等通信策略在深度學習中的應用。b)技術(shù)技能——熟練掌握C++、Python等編程語言,能夠高效地進行深度學習框架的開發(fā)和優(yōu)化;——熟練使用CPU、GPU、FPGA、ASIC等多元化計算架構(gòu)的編譯系統(tǒng)開發(fā)、編譯優(yōu)化和算法加速;——熟悉使用常見的深度學習框架性能分析工具,能夠定位和解決性能瓶頸;——具備對深度學習算法進行算子級優(yōu)化的能力,熟悉各種底層算子的實現(xiàn)和優(yōu)化方法。c)工程實踐——具備豐富的深度學習框架研發(fā)經(jīng)驗,能夠獨立完成深度學習引擎和底層算子的開發(fā)與優(yōu)化;——熟悉分布式深度學習系統(tǒng)的設(shè)計和實現(xiàn),能夠解決大規(guī)模深度學習訓練中的通信和同步問題;——能夠與算法研發(fā)團隊緊密配合,建立高效的深度學習計算加速解決方案;——深入了解深度學習框架的性能,能夠通過分析和優(yōu)化,顯著提高深度學習任務的執(zhí)行效率。5.2算法方向5.2.1大模型算法工程師a)專業(yè)知識——熟悉機器學習、深度學習基礎(chǔ)理論和算法,熟悉基于Transformer模型和架構(gòu);——熟悉機器學習中的優(yōu)化算法,如梯度下降、Adam優(yōu)化器等;——熟悉微積分、線性代數(shù)、概率論與統(tǒng)計學原理、優(yōu)化理論與數(shù)值計算等基礎(chǔ)知識;——了解軟件工程的代碼復用、模塊化設(shè)計、單元測試等;——熟悉模型的可解釋性和公平性問題,能夠評估和改進模型性能;——熟悉云平臺服務,如AWS、GoogleCloud、Azure等,能夠進行模型的云上部署和擴展;——了解容器化技術(shù),如Docker和Kubernetes,能夠進行服務的容器化部署;——了解計算機體系結(jié)構(gòu)、操作系統(tǒng)、網(wǎng)絡(luò)通信等底層知識,能夠?qū)δP瓦M行針對性優(yōu)化。b)技術(shù)技能——精通至少一種編程語言,如Python、C++,具備良好的算法實現(xiàn)能力;——掌握自然語言處理、計算機視覺、語音識別等領(lǐng)域的高級技術(shù)和應用;——熟練使用深度學習框架,如飛槳PaddlePaddle、PyTorch等進行模型構(gòu)建和訓練;——掌握數(shù)據(jù)處理和分析技能,能夠使用NumPy、Pandas等庫進行數(shù)據(jù)預處理;——熟悉使用GPU進行并行計算,了解CUDA編程基礎(chǔ);——能夠使用數(shù)據(jù)可視化工具,如Matplotlib、Seaborn等進行分析結(jié)果展示;——熟悉版本控制系統(tǒng),如Git,以及代碼托管平臺,如GitHub或GitLab。c)工程實踐——具備獨立完成整個大模型項目流程的經(jīng)驗,包括數(shù)據(jù)收集、預處理、模型設(shè)計、訓練、評估和部署;T/MIITEC023-2024——具備模型調(diào)優(yōu)和超參數(shù)優(yōu)化的經(jīng)驗,能夠使用網(wǎng)格搜索、隨機搜索等方法進行參數(shù)選擇;——具備項目管理能力,包括項目計劃制定、項目進度監(jiān)控和項目資源協(xié)調(diào);——具有持續(xù)學習能力,能將最新的理論與方法運用到實際工程實踐當中。5.2.2大模型策略研發(fā)工程師a)專業(yè)知識——深入了解大模型技術(shù)原理和應用場景,熟悉自然語言處理和深度學習領(lǐng)域的知識;——掌握大模型策略研發(fā)的基本流程和方法論。b)技術(shù)技能——熟練掌握C++、Python等編程語言,具備扎實的編程基礎(chǔ);——熟悉常用的機器學習算法框架,如飛槳PaddlePaddle、PyTorch等;——具備優(yōu)秀的數(shù)據(jù)結(jié)構(gòu)和算法設(shè)計能力,能夠針對復雜問題進行數(shù)學建模和優(yōu)化;——能夠運用自然語言處理技術(shù)和機器學習算法,研發(fā)出高效、穩(wěn)定的大模型策略;——能夠根據(jù)產(chǎn)品策略需求,對模型進行優(yōu)化和改進,提高模型性能和準確率。c)工程實踐——能夠獨立完成大模型策略的研發(fā)和優(yōu)化;——具備大模型相關(guān)項目實踐經(jīng)驗;——能夠與團隊成員緊密合作,協(xié)同完成項目任務,確保項目的質(zhì)量和進度;——具備業(yè)務需求評估經(jīng)驗,能夠設(shè)計和優(yōu)化業(yè)務解決方案。5.3數(shù)據(jù)方向5.3.1大模型數(shù)據(jù)工程師a)專業(yè)知識——熟悉大模型的工作原理和訓練方法,對大模型訓練環(huán)節(jié)的數(shù)據(jù)樣式以及數(shù)據(jù)采集、存儲、清洗的原理和方法有深入了解;——熟悉數(shù)據(jù)標注、分析和管理的流程及規(guī)范,了解不同類型的標注方法和工具;——熟悉數(shù)據(jù)治理和數(shù)據(jù)安全基本知識。b)技術(shù)技能——熟練掌握數(shù)據(jù)庫操作,能夠進行高效的數(shù)據(jù)查詢、存儲和管理;——熟練使用數(shù)據(jù)清洗和預處理的工具,如Pandas、Numpy等;——能夠結(jié)合業(yè)務數(shù)據(jù)內(nèi)容,分析數(shù)據(jù)特征,優(yōu)化數(shù)據(jù)清洗規(guī)則,提升數(shù)據(jù)輸出質(zhì)量;——掌握通過分析、模擬、逆向工程等手段獲取互聯(lián)網(wǎng)公開數(shù)據(jù)的方法,并通過技術(shù)手段提高數(shù)據(jù)采集的質(zhì)量和數(shù)量;——具備一定的編程基礎(chǔ),能夠使用Python等語言編寫自動化腳本處理和分析數(shù)據(jù)。c)工程實踐——具備豐富的數(shù)據(jù)處理和標注經(jīng)驗,能夠獨立完成數(shù)據(jù)采集、清洗、標注和分析工作;——具備數(shù)據(jù)治理和數(shù)據(jù)安全的相關(guān)項目經(jīng)驗,能夠確保數(shù)據(jù)的質(zhì)量和安全;——能夠與大模型研發(fā)團隊緊密配合,理解大模型數(shù)據(jù)需求,建立自動化數(shù)據(jù)處理流程,提高數(shù)據(jù)處理效率;——具備項目管理能力,能夠合理安排工作進度,確保項目的順利實施。5.4評測方向5.4.1大模型評測工程師56T/MIITEC023-2024a)專業(yè)知識——掌握大模型的工作原理、訓練方法及評估標準,包括但不限于模型架構(gòu)、優(yōu)化算法等;——熟悉對話大模型(如類ChatGPT)的算法原理,了解Transformer架構(gòu)、自注意力機制等知——熟練掌握自動評測技術(shù),如BLEU、ROUGE、PERPLEXITY等評價指標,了解它們的優(yōu)缺點,并能夠根據(jù)實際情況選擇合適的評價指標;——了解性能測試、功能測試和指標測試的基本原理和方法,能夠根據(jù)測試需求設(shè)計合理的測試方案。b)技術(shù)技能——具備優(yōu)秀的測試策略設(shè)計能力,能夠根據(jù)項目的具體需求和目標,獨立制定全面、細致的評測計劃和策略;——具備優(yōu)秀的數(shù)據(jù)分析能力,能夠運用統(tǒng)計學和數(shù)據(jù)挖掘技術(shù)對測試結(jié)果進行深入分析,準確識別出模型的性能瓶頸和改進點;——熟練掌握Python、Java等編程語言,能夠編寫自動化測試腳本,實現(xiàn)測試流程的自動化和高效化,提高評測工作的效率和質(zhì)量;——熟悉使用測試工具和框架,能夠高效地執(zhí)行測試用例,收集并分析測試數(shù)據(jù),提供準確的測試報告。c)工程實踐——具備豐富的模型評測經(jīng)驗,對大模型在理解、推理、agent等全方面的能力有深入的了解和準確的評估能力,能夠發(fā)現(xiàn)模型在不同場景下的優(yōu)勢和不足;——能夠根據(jù)評測結(jié)果提供有針對性的改進建議,包括優(yōu)化模型結(jié)構(gòu)、調(diào)整訓練策略、改進數(shù)據(jù)質(zhì)量等方面,以助力研發(fā)團隊提升模型性能;——具備優(yōu)秀的團隊協(xié)作和溝通能力。5.5應用方向5.5.1大模型提示詞工程師a)專業(yè)知識——了解大模型的工作原理和訓練方法;——掌握各種類型的提示詞策略,包括但不限于Zero-shotPrompting、Few-shotPrompting和InstructionPrompting等方法。b)技術(shù)技能——具備優(yōu)秀的文本分析和處理能力,能夠從大量文本數(shù)據(jù)中提取關(guān)鍵信息并轉(zhuǎn)化為提示詞;——熟悉業(yè)務需求分析,能夠準確捕捉業(yè)務需求并將其轉(zhuǎn)化為有效的提示詞設(shè)計;——熟悉使用至少一種大模型工具,如GPT、文心一言等,能夠調(diào)用模型進行提示詞測試和優(yōu)化。c)工程實踐——具備豐富的提示詞設(shè)計和優(yōu)化經(jīng)驗,能夠針對不同類型的業(yè)務需求設(shè)計有效的提示詞策略;——能夠根據(jù)用戶查詢和模型回答結(jié)果進行分析,提供模型結(jié)果反饋和改進建議,不斷優(yōu)化提示詞;——具備與研發(fā)團隊和產(chǎn)品團隊緊密合作的能力,確保提示詞的有效性和一致性。5.5.2大模型應用開發(fā)工程師a)專業(yè)知識7T/MIITEC023-2024——能夠深入理解大模型應用開發(fā)的整體流程,包括需求分析、數(shù)據(jù)準備、模型選擇、訓練調(diào)試、評估優(yōu)化等環(huán)節(jié);——熟練掌握大模型微調(diào)的相關(guān)知識,如SFT、RLHF、Lora等技術(shù),能夠在特定業(yè)務場景下進行模型調(diào)整;——掌握Agent和RAG技術(shù),了解大模型應用開發(fā)向量庫原理以及使用方法,能夠結(jié)合具體業(yè)務場景,解決實際問題;——具備扎實的機器學習與深度學習理論基礎(chǔ),了解各類算法原理和應用場景,能夠靈活運用大小模型結(jié)合的方式進行應用開發(fā)。b)技術(shù)技能——熟悉常見開源大模型及其API,如Llama、文心大模型等,能夠基于業(yè)務需求選擇合適的大模型;——具備數(shù)據(jù)工程能力,能夠進行數(shù)據(jù)清洗、轉(zhuǎn)換、標注等工作,以滿足大模型訓練的需要;——掌握增量訓練技術(shù),能夠在原有模型基礎(chǔ)上,通過持續(xù)學習不斷提升模型性能;——熟練掌握各類深度學習框架,如飛槳PaddlePaddle、PyTorch等,能夠高效實現(xiàn)模型的訓練、微調(diào)和優(yōu)化;——熟練掌握大模型開發(fā)過程中常用到的工具,如Langchain、Gradio等;——了解數(shù)據(jù)安全相關(guān)知識,能夠在應用開發(fā)過程中確保數(shù)據(jù)安全。c)工程實踐——具備豐富的大模型應用開發(fā)經(jīng)驗,能夠獨立完成從需求分析到模型部署的全過程;——具備根據(jù)實際業(yè)務需求設(shè)計合理的大模型應用方案的經(jīng)驗;——具備出色的團隊協(xié)作能力,能夠與其他團隊成員有效溝通,共同推進項目的進展;——具備創(chuàng)新精神,能夠不斷探索新技術(shù)、新方法,提升大模型應用的效果和效率。T/MIITEC023-2024(資料性附錄)大模型技術(shù)與應用產(chǎn)業(yè)人才崗位能力提升A.1大模型技術(shù)與應用產(chǎn)業(yè)人才崗位能力提升內(nèi)容崗位能力提升內(nèi)容應包括:a)基礎(chǔ)知識、專業(yè)知識等相關(guān)知識提升;b)基本技能、專業(yè)技能等相關(guān)技術(shù)技能提升;c)基于項目經(jīng)驗的工程實踐能力提升。A.2大模型技術(shù)與應用產(chǎn)業(yè)人才崗位能力提升階段和方式大模型技術(shù)與應用產(chǎn)業(yè)人才崗位能力提升分為崗前提升和在崗提升兩個階段,構(gòu)成大模型技術(shù)與應用相關(guān)崗位從業(yè)人員不同階段和能力水平的終身教育體系。a)崗前提升方式,包括:1)理論教學;2)理論與實踐一體化教學;3)項目實訓、企業(yè)實習等方式。b)在崗提升方式,包括:1)內(nèi)部在崗培訓;2)外部脫崗培訓;3)項目實踐或?qū)熭o導等。A.3大模型技術(shù)與應用產(chǎn)業(yè)人才崗位能力提升活動供給類別大模型技術(shù)與應用產(chǎn)業(yè)人才崗位能力提升活動供給包括:a)教育、培訓機構(gòu)培養(yǎng):符合要求的各級教育機構(gòu)(普通高校、中等和高等職業(yè)院校等)及培訓機構(gòu)應根據(jù)大模型技術(shù)與應用領(lǐng)域各崗位能力要求,制定人才能力提升方案,為大模型技術(shù)與應用領(lǐng)域及企業(yè)培養(yǎng)合格的從業(yè)人員,滿足個人發(fā)展需要;b)企業(yè)培養(yǎng):企業(yè)結(jié)合業(yè)務發(fā)展需要,應根據(jù)大模型技術(shù)與應用領(lǐng)域各崗位能力要求有針對性、有計劃地實施崗位能力提升計劃,滿足個人發(fā)展需要,增強企業(yè)競爭力;c)個人培養(yǎng):從業(yè)人員根據(jù)個人發(fā)展計劃,做好職業(yè)規(guī)劃與崗位定位,對標大模型技術(shù)與應用產(chǎn)業(yè)人才崗位能力要求,不斷提升專業(yè)知識、技術(shù)技能水平,豐富工程實踐經(jīng)驗。89T/MIITEC023-2024大模型技術(shù)與應用產(chǎn)業(yè)人才崗位能力提升路徑見圖A.1。圖A.1大模型技術(shù)與應用產(chǎn)業(yè)人才崗位能力提升路徑大模型技術(shù)與應用產(chǎn)業(yè)人才崗位能力水平

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論