![2024開源大模型應用指南1.0(風險治理篇)-云計算開源產業(yè)聯(lián)盟_第1頁](http://file4.renrendoc.com/view9/M03/33/33/wKhkGWdiWoOAONWpAAH96w1UPUA278.jpg)
![2024開源大模型應用指南1.0(風險治理篇)-云計算開源產業(yè)聯(lián)盟_第2頁](http://file4.renrendoc.com/view9/M03/33/33/wKhkGWdiWoOAONWpAAH96w1UPUA2782.jpg)
![2024開源大模型應用指南1.0(風險治理篇)-云計算開源產業(yè)聯(lián)盟_第3頁](http://file4.renrendoc.com/view9/M03/33/33/wKhkGWdiWoOAONWpAAH96w1UPUA2783.jpg)
![2024開源大模型應用指南1.0(風險治理篇)-云計算開源產業(yè)聯(lián)盟_第4頁](http://file4.renrendoc.com/view9/M03/33/33/wKhkGWdiWoOAONWpAAH96w1UPUA2784.jpg)
![2024開源大模型應用指南1.0(風險治理篇)-云計算開源產業(yè)聯(lián)盟_第5頁](http://file4.renrendoc.com/view9/M03/33/33/wKhkGWdiWoOAONWpAAH96w1UPUA2785.jpg)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1.0(風險治理篇)目 錄一、開源大模型發(fā)展態(tài)勢 1(一)從軟件到大模型,開源的變”與不變” 1(二)從壟斷到開放,開源重塑AI生態(tài) 3(三)從個人到國家,開源釋放AI效能 6二、開源大模型創(chuàng)新趨勢 8(一)開源語言大模型開啟百家爭鳴新紀元 8(二)開源多模態(tài)大模型注入AI生態(tài)新活力 11(三)開源AGENT引領人工智能發(fā)展新方向 14三、開源大模型風險挑戰(zhàn) 16(一)開源大模型應用或導致安全風險升級 17(二)開源大模型應用或面臨多重規(guī)制要求 20(三)開源模式或加劇大模型技術濫用風險 28四、開源大模型治理全球動態(tài) 29(一)國際組織高度重視開源大模型發(fā)展,積極探索全球人工智能治理方案..............................................................30(二)歐盟立法謀求人工智能監(jiān)管主導權,開源大模型得有條件義務豁免................................................................31(三)美國人工智能監(jiān)管增強化趨勢明顯,國防領域率先探索開源大模型影響............................................................33(四)............................................................34五、企業(yè)應用開源大模型風險治理實操要點 46(一)開源大模型治理體系構建 47(二)開源大模型風險防控建議 49六、國內開源大模型應用生態(tài)完善方向 77圖 目 錄圖1大模型的開放訪問等級 3圖2人工智能大模型許可協(xié)議合規(guī)流程 53圖3HuggingFaceModel格式Markdown截圖 71圖4HuggingFaceLLaMA-3.1README.md截圖 72圖5LLaMA-3.1CycloneDX模型組件轉換信息截圖 73圖6CycloneDXLLaMA-3.1模型卡片信息截圖 74圖7CycloneDXLLaMA-3.1數(shù)據(jù)集信息演示截圖 74圖8LLaMA-3.1CycloneDX文件子組件表示信息截圖 76表 目 錄表1經(jīng)典開源語言大模型解析 9表2經(jīng)典開源多模態(tài)大模型解析 12表3經(jīng)典開源Agent解析 15表4國內外典型大模型許可協(xié)議類型表 21表5地方政府開源人工智能相關規(guī)范文件 35表6常見人工智能開源許可協(xié)議合規(guī)要點解讀 54表7AI/MLBOM示例 70一、開源大模型發(fā)展態(tài)勢(一)從軟件到大模型,開源的“變”與“不變”開源思想興起于軟件開發(fā)領域,軟件開源核心在于源代碼開放。開源(OpnSouc概念根植于上世紀五十年代以來自由開放的計算機文化,并隨著開源軟件促進會(OpenSourceInitiative96%77%源軟件。12024https:///zh-cn/software-integrity/resources/analyst-reports/open-source-security-risk-analysis.html,最后訪問日期:202410日。但單一元素的公開和可獲取可能并不足以支持使用者復現(xiàn)模型效果,實現(xiàn)開源授之以漁”的根本目的。發(fā)者假借開源之名,行限制技術共享之實,OSIAIAI模型是否開源的概3開源大模型可開放的內容包TheOpenSourceAIDefinition1.0,網(wǎng)絡地址:/ai/open-source-ai-definition,最后訪問日期:202413日。3M.A.PetersandP.Roberts,Virtuesofopenness:Education,science,andscholarshipinthedigitalage.OSI組織的相關定義4OSI認證的許可協(xié)議或條款下向公眾公開適重和參數(shù),訓練和運行AI系統(tǒng)的全部源代碼,以及有關訓練數(shù)據(jù)的研究中心發(fā)布的AI多種開放選項(見圖1和革新。
圖1大模型的開放訪問等級5(二)從壟斷到開放,開源重塑AI生態(tài)4TheOpenSourceAIDefinition-1.0,網(wǎng)絡地址:/ai/open-source-ai-definition,最后訪問日期:2024年11月13日。5RishiBommasanietal.,“ConsiderationsforGoverningOpenFoundationModels”,網(wǎng)絡地址:/issue-brief-considerations-governing-open-foundation-models,最后訪問日期:2024年開源是打破AI技術壟斷的破破船”。智能技術廠商利用先發(fā)優(yōu)勢封閉技術、壟斷市場。如Meta開源大模型LLaMA2,有力打破了大語言模型長期被OpenAI、谷歌開源大模型是AI應用觸達的破加速器。開源開放顯著降低了大LLaMA的行業(yè)模QiZhenGPTChatMedBenTsao,法律領域的Qwen1.5開源是AI科技創(chuàng)新的破催化劑。圍繞成熟的開源大模型項目,8月29日。大模型的產品體驗。6開源社區(qū)不僅有益于積累技術經(jīng)驗和推進模型Transformer算法在索RNN算法的優(yōu)化和改進方向,以期在該領域實現(xiàn)技術突破。開源是AI開源大模型的開放性和靈活性基本形成了開源和閉源相結合的商業(yè)模式。其中,Meta、百川智能、360等企業(yè)傾向于借助開源社區(qū)以提升模型質量并快速打造自己的產OpenAI、百度、華為等具有先發(fā)優(yōu)勢的企業(yè)雖采取閉昇求的增加,開源大模型研發(fā)企業(yè)逐漸從以產品”為賣點轉向以服企業(yè)可吸引第三方開發(fā)者和企業(yè)圍繞其開源產品構建應用程序和服2021年第2期,第84-102頁。https:///insight/article/3ky83uwLO5JS,最后訪問日期:2024年8月30日。出售相關培訓等方式拓展盈利渠道。開源是AIClearviewAI從互聯(lián)網(wǎng)上收集了數(shù)十億AI系統(tǒng),后該公司便因未經(jīng)同意收集和使用個員和開發(fā)者可對代碼進行充分審查以識別其潛在安全漏洞和算法瑕尊重不同文化群體的需求和價值觀。(三)從個人到國家,開源釋放AI效能88極客公園:《開源大模型領域最重要的玩家們,在關心/擔心什么》,網(wǎng)絡地址:/article/1845767.html,最后訪問日期:2024年8月30日。大模型實現(xiàn)高度個性化的AI應用,以作為個人自我表達的延伸。例如,藝術家和設計師可將個人作品作為輸入,對開源模型如StableDiffusion開源降低AI大模型技術效果的實現(xiàn)高度依賴海量數(shù)據(jù)和充足的算力資AI開源大模型形成的成熟商業(yè)模式也將反哺開源大模型社區(qū)和技術的演進,全面提升國家在前沿科技和智能產業(yè)方面的競爭力。二、開源大模型創(chuàng)新趨勢Agent且開源模式也在持續(xù)推動大模型技術的迭代創(chuàng)新和應用落地。(一)開源語言大模型開啟百家爭鳴新紀元能強大的語言大模型僅能通過付費API言大模型包括GPT-NeoX-20B、開源預訓練語言模型以及BLOOMLLaMA等高質量開源預訓練語言大模型的發(fā)布OpenAIGPT、MistralAIMixtral、MicrosoftPhi、GoogleLaMDAGemini、DeepMindGopher、xAIGrok、Meta的LLaMAAIGLM、阿里巴巴的通義千問、科大訊飛的星火、零一萬物的Yi等得到快速發(fā)展和廣泛應用。表1經(jīng)典開源語言大模型解析專欄1經(jīng)典開源語言大模型解析1.通義千問Qwen模型簡介QwenQwenQWenLMHeadModel模型架構研發(fā)的大語言模型和大型多模態(tài)模型系列,目前已升級至Qwen2.5關鍵技術原理通義千問的模型架構基于增強的TransformerRMSNormFlashAttentionSwiGLU激活函數(shù)以提高模型的性能。軟硬件依賴LinuxMacOSWindows操作系統(tǒng),運行前需安裝transformers(4.40.0+)、Python(3.8+)、PyTorch(2.2+)OLLaMA等模型部署框架快速在本地安裝。(當前以中文和英文為主tokenQwen2-0.5B、Qwen2-1.5B、Qwen2-7B16GB顯存的GPUV100P100T4等,對于更大規(guī)模的模型如Qwen2-72B,則需要使用具有80GB顯存以上的A100GPU。2.LLaMA模型簡介LanguageModelMetaMetaAI發(fā)布的開7B13B33B億)四種版本。LLaMA系列開源大模型的訓練數(shù)據(jù)集皆來源于公開數(shù)LLaMA3.1版本。關鍵技術原理LLaMA3Decoder-onlyTransformer架構,與LLaMA2類似,但進行了一些改進,如使用RoPE(旋轉嵌入)作為位置編碼方案,以及分組查詢注意力(GroupedQueryAttention,GQA)機制來提高推理速度。軟硬件依賴軟件:LLaMA3Linux、MacOS、WindowsOLLaMA等模型部署框架快速在本地安裝,運行前需安裝transformers(4.40.0+)、Python(3.7+)、PyTorch(2.2+)等必要關聯(lián)組件。8CPU進行高效后端操70BGPUCUDA架構的NvidiaGPU,如30008B16GBRAM,70B32GB或更多才能滿足基本運行需求。70BTB級的SSD(二)開源多模態(tài)大模型注入AI生態(tài)新活力Transformer開源模型大力推動多模態(tài)模型發(fā)展,開源多模態(tài)大模型漸成生態(tài)。多模態(tài)模型,也稱作跨模態(tài)模型,21開源模型顯著推動了多模態(tài)模型的快極大地促進了AITransformer為基礎,該框架通過自注意力機制(SfAtnonMhnm、多頭注意力(Multi-HeadAttention)等技術實現(xiàn)了對于全局信息的高效捕獲,顯2019好地理解和處理與圖像、視頻等其他模態(tài)相關的文本信息。同時,CLIPDALL-EFlamingoVLMo、Ernie-ViLGmPLUG表2經(jīng)典開源多模態(tài)大模型解析專欄2經(jīng)典開源多模態(tài)大模型解析1.CLIP(ContrastiveLanguage-ImagePretraining)?模型簡介CLIPOpenAI推出的一款多模態(tài)大模型,可理解和關聯(lián)圖CLIP生成高效的圖像和文本表示,用于多種下游任務。9上堵吟:《探索多模態(tài)大語言模型》,網(wǎng)絡地址:/s/hc6iYR0PSKmPXEfeFfPnYQ,最后訪問日期:2024年10月6日。關鍵技術原理對比學習:CLIP通過增強正確圖像-文本配對之間的相似度并降低錯誤配對之間的相似度,實現(xiàn)了精準的語義匹配。Transformer架構CLIPTransformer模型,ResNet換將兩者的輸出映射至同一空間。軟硬件依賴軟件依賴CLIP基于框架,兼容大多數(shù)深度學習庫和工具。硬件依賴CLIPGPU支持,尤其是在大規(guī)模數(shù)據(jù)集上進行訓練時,建議使用高性能GPU(如NVDAA1002.Flamingo模型簡介Flamingo是由DeepMind發(fā)布的多模態(tài)模型,能夠處理文本、理,并具有強大的視頻處理能力。關鍵技術原理:Transformer架構:FlamingoTransformer編碼器處理Transformer實現(xiàn)。多模態(tài)聯(lián)合學習:Flamingo通過聯(lián)合訓練不同模態(tài)的數(shù)據(jù),使其在不同模態(tài)之間共享表示其在不同模態(tài)之間共享表示,進行跨模態(tài)推理。? 軟硬件依賴軟件依賴Flamingo基于TensorFlow或JAX硬件依賴:FlamingoGPUTPU的依賴較大,特別是在視頻處理任務中。(三)開源Agent引領人工智能發(fā)展新方向AgentAgent創(chuàng)新應用。智能體Agent的發(fā)展歷經(jīng)符號規(guī)則、統(tǒng)計學習、深度Agent的進的自然語言理解技術賦予了AgentAgent10與其他人工智能領域技術相似,開源模式同樣在極大程102024Igent行業(yè)報告》——大模型時代的“絡地址:ttp:/mp.eixin.qqcom//nv5C-xvIgt_qWL0g2024106度上促進了Agent技術的創(chuàng)新發(fā)展和應用觸達,LangChain、TaskMatrix.AICogViewAutoGPTOpenAssistant等開源Agent相Agent的研究和應用門檻,推動其發(fā)展和應用。表3經(jīng)典開源Agent解析專欄3經(jīng)典開源Agent解析1.LangChain簡介LangChain是一個用于構建可編程Agent的開源框架,LangChain的架構設計高度模塊化,開發(fā)者可以根據(jù)需求靈活選擇和組合不同組件。此外,LangChain還支持與多個開源語言模型的Agent的理想選擇。LangChain的核心動化。此外,LangChain開源項目十分活躍,有大量插件和擴展可供使用。關鍵技術原理語言模型與工具集成LangChain通過結合大型語言模型(如等(Agent的多功能化。任務規(guī)劃與執(zhí)行:Agent能夠根據(jù)用戶輸入進行任務規(guī)劃,調用適當?shù)墓ぞ咄瓿扇蝿?。軟硬件依賴軟件依賴軟件依賴LangChainPython,兼容大多數(shù)深度學習框架和工具。硬件依賴:LangChain對硬件要求不高,常用于輕量級任務的自動化執(zhí)行。2.TaskMatrix.AITaskMatrix.AI是由微軟亞洲研究院推出的一個多模態(tài)任務關鍵技術原理多模態(tài)融合:TaskMatrix.AI強化學習:TaskMatrix.AI通過強化學習,可在多步任務中不斷優(yōu)化決策,提高任務執(zhí)行的效率和準確性。軟硬件依賴軟件依賴:TaskMatrix.AI基于微軟的深度學習框架,集成了多種API和工具。硬件依賴:TaskMatrix.AI需要較高性能的GPU支持,特別是在多模態(tài)任務中。三、開源大模型風險挑戰(zhàn)的可得性還可能加劇人工智能技術的濫用風險。(一)開源大模型應用或導致安全風險升級算法缺陷所誘發(fā)的新型安全風險。型,閉源大模型的保密性限制了外部審查,AI系統(tǒng)安全漏洞難以被二是開源大模型系統(tǒng)安全問題處理面臨兼容性和社區(qū)支持等不源社區(qū)缺乏足夠的開發(fā)維護人員,開源大模型項目將在較長時間內保持脆弱狀態(tài),存在嚴重安全隱患。360TensorFlow、PyTorch等11,如此可能導致輸出結果難以預測和確切歸因,如有異常難以快速修正和溯源追責。FlagEval11/p/687649249,最后訪問時間2024年10月6日。性評測和格式擾動魯棒性評測中,開源大模型LLaMA-2-7B的擾動后總平均準確率不到40%。攻擊者可通一方12。此外,當12參見張玉宏,秦志光,肖樂:《大數(shù)據(jù)算法歧視的本質》,載《自然辯證法研究》,2017年第33卷第5期,第81-86頁。反饋循環(huán)被不斷復制和放大,進而加劇現(xiàn)有的社會歧視13。根據(jù)聯(lián)合LLaMA2生成的內容中,4(二)開源大模型應用或面臨多重規(guī)制要求開HuggingFace知識共享許可協(xié)議、新型人工智能許可協(xié)議。1)寬松型開源軟件許可協(xié)議如Apache-2.0MIT13新傳碩博芝士站:《算法偏見(AlgorithmicBias)》,網(wǎng)絡地址:/p/668254492,最后訪問日期:2024年10月6日。(或源代碼和二進制代碼的開源大模型項目可能存在一定風險問題。2)知識共享系列許可協(xié)大模型或潛藏較高專利風險。3)新型人工智能許可協(xié)議主要包括RAIL(ResponsibleAIPubsLicenses)系列許可協(xié)議及Meta的LLAMA2StabilityAIOSI的經(jīng)能略有差異。
表4國內外典型大模型許可協(xié)議類型表序號名稱模型類型大模型許可協(xié)議備注1阿里云通義千問預訓練以Qwen/Qwen2-72B為代表TongyiQianwenLICENSEAGREEMENTTongyiQianwenReleaseDate:August3,2023MetaLLaMA協(xié)議有相似之處2阿里云通義千問對話以Qwen/Qwen2-72B-Instruct為代表3零壹萬物預訓練以01-ai/Yi-1.5-34B-32K為代表Apache2.0Apache2.0許可協(xié)議是Apache基金會制序號名稱模型類型大模型許可協(xié)議備注4零壹萬物對話01-ai/Yi-為代表定的被廣泛采用的開源許可協(xié)議5幻方/深度求索預訓練以deepseek-ai/deepseek-llm-7b-base為代表DEEPSEEKLICENSEAGREEMENTVersion1.0,23October2023自定義許可協(xié)議,與OpenRAIL可協(xié)議有相似之處6幻方/深度求索對話以DeepSeek-V2-Chat代表7上海AI實驗室/書生浦語預訓練internlm2_5-20bApache2.0Apache2.0許可協(xié)議是Apache基金會制定的被廣泛采用的開源許可協(xié)議8上海AI實驗室/書生浦語對話internlm2_5-20b-chat9騰訊預訓練LLaMA-Pro-8BLLAMA2LICENSEAGREEMENTMetaLLaMA協(xié)議10騰訊對話LLaMA-Pro-8B-Instruct11百川預訓練Baichuan2-13B-BaseBaichuan2模型社區(qū)許可協(xié)議自定義許可協(xié)議12百川對話Baichuan2-13B-Chat13Meta/LLaMA預訓練meta-70BMETALLAMA3COMMUNITYLICENSEAGREEMENT自定義許可協(xié)議。要求遵循貿易管制法律法規(guī)14Meta/LLaMA對話meta-70B-Instruct序號名稱模型類型大模型許可協(xié)議備注15MistralAI_預訓練mistralai/Mixtral-8x22B-v0.1Apache2.0Apache2.0許可協(xié)議是Apache基金會制定的被廣泛采用的開源許可協(xié)議16谷歌預訓練google/gemma-2-9bGemmaTermsofUse未特別定義貿易管制條款17谷歌對話google/gemma-2-9b-itGemmaTermsofUse未特別定義貿易管制條款18微軟預訓練microsoft/phi-2MIT被廣泛采用的寬松開源許可協(xié)議19微軟對話microsoft/Phi-3-medium-4k-instructMIT被廣泛采用的寬松開源許可協(xié)議20Stability預訓練stabilityai/stablelm-2-12bSTABILITYAICOMMUNITYLICENSEAGREEMENT自定義許可協(xié)議。要求遵循貿易管制法律法規(guī)21Stability對話stabilityai/stablelm-2-12b-chatSTABILITYAICOMMUNITYLICENSEAGREEMENT自定義許可協(xié)議。要求遵循貿易管制法律法規(guī)22TII預訓練tiiuae/falcon-40BTermsandConditionsFalcon211BTIILicenseVersion1.0基于Apache2.0許可協(xié)議的自定義許可協(xié)議23TII對話tiiuae/falcon-40B-instruct24OpenAI-Community預訓練openai-community/gpt2MIT被廣泛采用的寬松開源許可協(xié)議25Princeton普林斯頓預訓練princeton-nlp/Sheared-Apache2.0Apache2.0許可協(xié)議是Apache基金會制定的被廣泛采用的開源許可協(xié)議序號名稱模型類型大模型許可協(xié)議備注26Facebook預訓練facebook/opt-30bOPT-175BLICENSEAGREEMENT自定義許可協(xié)議。未對貿易管制法律法規(guī)的遵從做出特別規(guī)定27BigScience預訓練bigscience/bloom-3bbigscience-bloom-rail-1.0自定義許可協(xié)議。未對貿易管制法律法規(guī)的遵從做出特別規(guī)定LLaMA3.12明確活躍用戶達到閾值需另行申請商業(yè)許可、LLaMA2許可協(xié)議包含用于訓練其他大模型的限制、LLaMA3.1明確了衍生大模型命名的限制、RAILLLaMA3.1可GPL-3.014因此,使用開閉源大模型訓據(jù)來源合法。1)對于開放數(shù)據(jù)集而言,使用開放數(shù)據(jù)集不僅需遵循其開源許可協(xié)議義務要求,還需考察其許可協(xié)議的傳染性和兼容性,LLaMABooks3中包含大量未授權書籍,在部分國家訓練和應用可能引發(fā)侵權糾紛。2)自采(robot協(xié)議14參見辜凌云:《以許可協(xié)議為核心的開源社區(qū)治理邏輯》,載《知識產權》2024年第6期,第57-58頁。爭等法律問題,情節(jié)嚴重者還可能觸犯刑法。3)商采數(shù)據(jù)需謹慎關注數(shù)據(jù)來源合法性以及數(shù)據(jù)可交易性,以避免發(fā)生合規(guī)風險。4)應可能導致對于使用者知識產權、商業(yè)秘密以及個人隱私的侵犯。5)LLaMA2許若訓練數(shù)據(jù)中包含個人訓練數(shù)據(jù)本身或在帶來法律及倫理上的風險。生成物在數(shù)15內容輸出階段主要涉及三方面侵(學學報》2024327頁。將可能侵犯著作權人的信息網(wǎng)絡傳播權。16此外,大模型生成物還可ScarlettJohansson對OpenAI提出指控,控訴OpenAI人工智能編碼工具Copilot的用戶面臨的侵權索賠進行賠償。而開源AI202432-5頁。生成物侵權責任承擔方,因此相關風險發(fā)生時,可能面臨責任歸屬不明的情況。(三)開源模式或加劇大模型技術濫用風險開源大模型不當應用或加深信息繭房、固化認知偏見。早在20桑斯坦便基于對互聯(lián)網(wǎng)信息傳播的考察提出表性不足的“小眾”全面認知。GPS導航和智能手機讓人類更容易遺忘地址和電話號碼,ChatGPT能技術及服務的過度應用還可能逐漸改變人類的交流方式和情感體開源加速人工智能如基于開源語言大模型構建,并去除安全和道德限制的非法大模型FraudGPT支持自動化編寫欺騙性短信、釣魚郵件和釣魚網(wǎng)站代碼,F(xiàn)raudGPT的用戶數(shù)在短短數(shù)月內便超過了先進的國家網(wǎng)絡戰(zhàn)部隊黑客數(shù)量。17四、開源大模型治理全球動態(tài)為避免人工智能技術發(fā)展陷入科林格里奇困境18,平衡風險治理17REEBraudThttps:///news/375547.html,最后訪問時間2024年10月6日。18注:科林格里奇困境(Collingridge'sDilemma)是英國技術哲學家大衛(wèi)·(1980)中指出,一項技術如果因為擔心不良后果而過早實施控制,那么技術很可能就難以爆發(fā)。反之(一)國際組織高度重視開源大模型發(fā)展,積極探索全球人工智能治理方案聯(lián)合國政策助力凝聚開源大模型發(fā)展共識。20206月,聯(lián)合國秘書長安東尼斯193個會員國一該建議書結合人工智能系統(tǒng)全生命周期倫理影響和各會員國發(fā)展差年92024710建多元化AI生態(tài)系統(tǒng)。經(jīng)合組織呼吁構建負責任人工智能系統(tǒng)。經(jīng)20195月通過全球首個人工智能主題政府間20245月進行了修訂。該修訂版以創(chuàng)新、可信和人權企業(yè)的人工智能發(fā)展環(huán)境。20239月,77國集團和中國發(fā)布《關于當前發(fā)展挑戰(zhàn):科學、接入和使用。(二)歐盟立法謀求人工智能監(jiān)管主導權,開源大模型得有條件義務豁免歐盟建立全球首部人工智能監(jiān)管立法,平衡AI創(chuàng)新保護。202481中免費或用于科學研究和開發(fā)目的而投入使用的開源AI系統(tǒng)可豁免部分合規(guī)義務。19同時,該法案對于開源大模型的定義門檻較低,在要求注明來源并遵循類似分發(fā)條款的前提下開放共享模型代碼及相192AI組件I系統(tǒng)或是第二編(I)或第四編()I3(3AI。場,以最大程度保護開源創(chuàng)新與研究。(三)美國人工智能監(jiān)管增強化趨勢明顯,國防領域率先探索開源大模型影響2019AI研發(fā)及相關領域主要依靠區(qū)域性監(jiān)管和行業(yè)自律等方式開展人工智能治理工作布局。20202310月,拜登政府簽署行政令《安全、可靠和可信開發(fā)和使202431個地方政府通過相關決議20248月,加利福尼亞州通過了《前沿人工智能模型202024457頁。(四)中國人工智能治理規(guī)則由“軟”及“硬”,開源大模型或得包容性監(jiān)管人2017新保護。自2022年底至今,各地方政府陸續(xù)出臺開源與大模型、開2024510日,國務院公布2024(學者建議稿》和《人工智能示范法專家建議稿提供者的責任減免規(guī)則。表5地方政府開源人工智能相關規(guī)范文件名稱地方發(fā)布日期實施日期發(fā)布機構條款《廣東省新一代人工智能創(chuàng)新發(fā)展行動計劃(年》廣東省2022.12.222022.12.22廣東省科學技術廳,廣東省工業(yè)和信息化廳3.加強人工智能操作系統(tǒng)有自主知識產權的通用人端人工智能操作系統(tǒng)和源基礎軟件加強人工智能領域開源軟件生態(tài)建設實人工智能發(fā)展的軟件基礎。整合全球人訓練和終端執(zhí)行的開發(fā)框放技術網(wǎng)絡和開源社區(qū)建開源軟件生態(tài)。研究機器視覺、語音識別、機器翻譯、智能交互、知識處理、控制決策等人工智能基礎解決方案,支持面向無人駕駛、智能機器人、無人機等人工智能應用領域構建基于開源開放技術的公共數(shù)據(jù)資源庫、標準測試數(shù)據(jù)庫、云服務平臺等各類通用開源軟件和開放技術平臺??藷o人系統(tǒng)核心智能芯片業(yè)鏈上下游企業(yè)開放核心IP以及關鍵傳感器的新型傳感器數(shù)據(jù)集開源共生態(tài)。業(yè)共性平臺技術和醫(yī)療共享資源庫,推動上下游企業(yè)、科研院所、行業(yè)協(xié)會、推動醫(yī)療數(shù)據(jù)資源和平臺開源共享。持人工智能優(yōu)勢企業(yè)和科研院所建設面向行業(yè)共性自主核心軟硬件開源開放共享源開放與保護政策體系和進重點領域數(shù)據(jù)信息依法業(yè)健康可持續(xù)發(fā)展。推動人工智能龍頭企業(yè)基于人工智能操作系統(tǒng)、芯片、傳感器等自主核心軟硬件提供開源開放共享服務業(yè)聯(lián)盟聯(lián)合研發(fā)基于國產開源學習框架自主建設技術開源和開放的共享平臺立人工智能安全性測試模同,建設綜合測試驗證環(huán)境?!赌暇﹪胰斯ぶ悄軇?chuàng)新應用先導區(qū)建設實施方案》寧政發(fā)(2022)133號南京2022.12.122022.12.12南京市人民政府18自主可控人工智能計算中練平臺,在科研大模型研試的過程中為人工智能企企業(yè)建設線上數(shù)據(jù)集交易平臺,實現(xiàn)數(shù)據(jù)安全匯聚,逐步形成高質量的行業(yè)公共開放數(shù)據(jù)集。通過算法開源和數(shù)據(jù)開放,打造創(chuàng)新型開發(fā)者社區(qū),匯聚海量算法、模型、產品、應用與服務?!侗本┦型ㄓ萌斯ぶ悄墚a業(yè)創(chuàng)新伙伴計劃》北京2023.05.192023.05.19北京市經(jīng)濟和信息化局,北京市科學技術委員會,北京市發(fā)展和改革委員會(七)培育軟件開發(fā)新范AI重以開源聚合創(chuàng)加強工業(yè)軟件與大模型融模型互聯(lián)網(wǎng)新軟件新服務?!侗本┦屑涌旖ㄔO具有全球影響力的人工智能創(chuàng)新策源(2023-2025》京政發(fā)〔2023〕14號北京2023.05.212023.05.21北京市人民政府2.引領人工智能關鍵核心技術創(chuàng)新。支持創(chuàng)新主體重點突破分布式高效深度學習框架、大模型新型基礎架構、深度超大規(guī)模圖計算、超大規(guī)模模擬計算等基礎平臺技術。支持數(shù)據(jù)與知識深度聯(lián)合學習、高維空間多模態(tài)語義對齊、大規(guī)模認知與推理、可控內容生成、高效低成本訓練與推理等關鍵算法研發(fā),著力推動大模型相關技術創(chuàng)新。鼓勵相關技術和算法開源開放。5.加強自主開源深度學習框架研發(fā)攻關。針對分布式計算需求,研發(fā)動靜統(tǒng)一編程、多維自動并行技術,提升深度學習框架在超大規(guī)模模型訓練和多端多平臺推理部署等方面的核心能力,研發(fā)多類型模型開發(fā)、訓練、壓縮、推理全流程工具,支持自主深度學習框架與人工智能芯片開展廣泛適配和融合優(yōu)化,實現(xiàn)人工智能國產軟硬件技術的深度協(xié)同。8.構建高效協(xié)同的大模型技術產業(yè)生態(tài)。建設大模型算法及工具開源開放平臺,構建完整大模型技術創(chuàng)新體系,積極爭取成為國家人工智能開放生態(tài)技術創(chuàng)新中心。組建全棧國產化人工智能創(chuàng)新聯(lián)合體,搭建基于國產軟硬件的人工智能訓練和服務基礎設施,研發(fā)全棧國產化的生成式大模型,逐步形成自主可控的人工智能技術體系和產業(yè)生態(tài)?!侗本┦写龠M通用人工智能創(chuàng)新發(fā)展的若干措施》京政辦202315北京2023.05.232023.05.23北京市人民政府辦公廳圍繞模型構建、訓練、調優(yōu)對齊、推理部署等環(huán)節(jié),積極探索基礎模型架構創(chuàng)新,研究大模型高效并行訓練技術和認知推理、指令學習、人類意圖對齊等調優(yōu)方法,研發(fā)支持百億參數(shù)模型推理的高效壓縮和端側部署技術,形成完整高效的技術體系,鼓勵開源技術生態(tài)建設。《深圳市加快推動人工智能高質量發(fā)展高水平應用行動方案(2024年》深圳2023.05.312023.05.31中共深圳市委員會辦公廳,深圳市人民政府辦公廳(四)器人、智能網(wǎng)聯(lián)汽車等領造基于國內外芯片和算法的開源通用大模型點企業(yè)持續(xù)研發(fā)和迭代商具身智能機器人的研發(fā)和與企業(yè)共建5家以上人工廣東省人形機器人制造業(yè)創(chuàng)新中心?!逗贾菔腥嗣裾k公廳關于加快推進人工智能產業(yè)創(chuàng)新發(fā)展的實施〔2023〕55號杭州2023.07.242023.08.25杭州市人民政府辦公廳(二構建高效協(xié)同模型創(chuàng)新生態(tài)。推進MaaS新模態(tài)通用大模型關鍵技術攻術和算法開源開放,形成“1+N+X”(二)展多模態(tài)通用大模型研發(fā)并向中小企業(yè)開放模型應權威第三方評測機構評測性能達到國內領先的通用5000萬元。支持10個性能先進并在杭成功落地的優(yōu)秀專用模型,按照不超過研發(fā)成本30%的標準給予牽頭研發(fā)500高校院所和第三方機構圍繞模型開發(fā)搭建開源開放平臺(社區(qū),構建基于開數(shù)據(jù)、應用協(xié)同的產業(yè)生態(tài)市級開源開放示范平臺共數(shù)據(jù)集支持?!洞龠M人工智能創(chuàng)新發(fā)展政寧夏2023.08.132023.09.15寧夏回族自治區(qū)人(七)鼓勵模型創(chuàng)新。支持落地企業(yè)開展大模型訓練,20238號民政府辦公廳極探索基礎模型架構創(chuàng)新,研究大模型高效并行訓練技術和認知推理、指令學推理的高效壓縮技術和端生態(tài)建設給予不超過項目總研發(fā)投30%1000金支持。(八支持放、協(xié)同共享的人工智能數(shù)據(jù)歸集放及檢驗檢測的創(chuàng)新服務平臺,參考平臺軟硬件投入、人工智能企業(yè)用戶數(shù)、服務成果等方面,擇優(yōu)給予綜合貢獻度較高的開放平500《武漢市人民政府辦公廳關于印發(fā)武漢建武漢2023.08.302023.08.30武漢市人民政府動頭部企業(yè)聯(lián)合多模態(tài)人工智能產業(yè)聯(lián)盟組建創(chuàng)新設國家人工智聯(lián)合體,創(chuàng)建人工智能方向能創(chuàng)新應用先導區(qū)實施方案(2023-2025年2023號開展大模型創(chuàng)新算法開發(fā)與開源開放“紫東太初”多模態(tài)大模型訓練模型架構設計與優(yōu)化模態(tài)大模型通用人工智能企業(yè)在漢布局垂直領域模具有影響力的垂直行業(yè)模10個以上,培育一批垂直行業(yè)模型解決方案服務智能產業(yè)實現(xiàn)應用?!渡虾J写龠M智能機器人產業(yè)高質量創(chuàng)新發(fā)展行動方案(2023-2025年》滬經(jīng)信制〔2023〕915號上海2023.10.192023.10.19上海市經(jīng)濟和信息化委員會,上海市發(fā)展和改革委員會,上海市科學技術委員會,上海市財政局,上海市統(tǒng)計局4、重點攻關具身智能等先化學習訓練構建機器人運知識庫和數(shù)據(jù)采集平臺的器人運行環(huán)境與機器人感現(xiàn)人形機器人面向場景應能等前沿技術與機器人融平?!渡虾J型苿尤斯ぶ悄艽竽P蛣?chuàng)新發(fā)展若干措施(2023-2025年2023號上海2023.10.202023.10.20上海市經(jīng)濟和信息化委員會,上海市發(fā)展和改革委員會上海市科學技術委員會中共上9.推進大模型應用生態(tài)建型開源社區(qū)和協(xié)作平臺建設開放協(xié)同產業(yè)生態(tài)。海市委網(wǎng)絡安全和信息化委員會辦公室,上海市財政局《推動區(qū)塊鏈、上2023.10.252023.10.25上海市經(jīng)結合支持生產性互聯(lián)網(wǎng)服大模型技術賦能生產性互聯(lián)網(wǎng)服務平臺發(fā)海濟和信息化委員會,上海市商鏈城市數(shù)字基礎設施體系開源大模型行業(yè)應用展實施方案》滬經(jīng)信生〔2023〕936號務委員會創(chuàng)新生態(tài)空間等重點工作,推動區(qū)塊鏈、大模型賦能各類平臺發(fā)展。3.夯實通用大模型基礎能具有國際競爭力的通用大施建設。推動大模型語料數(shù)據(jù)聯(lián)盟持續(xù)開源高質量數(shù)據(jù)集大模型產業(yè)健康發(fā)展。(三)強化政策保障。通過市促進產業(yè)高質量發(fā)展、商務高質量發(fā)展等專項資金,對標桿性企業(yè)、應用場景進建設開源大模型行業(yè)應用創(chuàng)新生態(tài)空對入駐的企業(yè)和團隊給網(wǎng)服務平臺領域的大模型相關應用及解決方案納入符合條件的專業(yè)人才予以套支持政策?!墩憬∪嗣裾?023.12.072023.12.07浙江省人(二推動大模型技術開源政府辦公廳關于加快人工智江省民政府辦公廳型領域自主可控開源社區(qū)能產業(yè)發(fā)展的和開放創(chuàng)新平臺建設,打造2023號模型即服務(MaaS)新范支持自主開源深度學習框架研發(fā)攻關和代碼托管鏡像平臺建設制定推廣開源領域相關標準和協(xié)議進人工智能領域開源軟件的國際規(guī)則互認。研發(fā)多類者群體,繁榮開源生態(tài)。AI服務機器人產業(yè)集群高質量發(fā)展行動計劃(2023—2027年》渝經(jīng)信通202310重慶2023.12.152023.12.15重慶市經(jīng)濟和信息化委員會研院所前瞻布局人形機器人通用原型機研發(fā)、AI通靈巧臂—手建模和控制技深導航技術等領域,推動人形機器人技能提升和智能AI大AI大模型評測體系和生態(tài),AI和人形機器人融合發(fā)展?!吨袊ㄉ虾#┳杂少Q易試驗區(qū)臨港新片區(qū)上海2024.03.042024.09.01中國(上海)2.支持建設人工智能開源平臺集聚發(fā)展人工區(qū)臨港新鼓勵構建高效協(xié)同的大模智能產業(yè)若干2024號片區(qū)管理委員會打造開源通用大模型生成式人工智能產業(yè),重點支持分布式高效深度學習開發(fā)搭建自主可控的人工智能開源平臺億參數(shù)以上且落地三個及以上實際應用場景的深度研發(fā)費用的10%-30%比例10%比例給予支持,年度支持金額不超過100萬元,資助周期不超過3年?!秾幭幕刈遄灾螀^(qū)工業(yè)和信息化廳寧夏回族自治區(qū)財政廳關于征集2024年大數(shù)據(jù)產業(yè)試點示范項目的通知》寧夏2024.03.042024.03.04寧夏回族自治區(qū)工業(yè)和信息化廳,寧夏回族自治區(qū)財政廳2.智能通用大模型和行業(yè)應設人工智能大模型領域自主可控開源社區(qū)和創(chuàng)新平臺署、語料數(shù)據(jù)等大模型服務?!妒吧絽^(qū)促進人工智能大模型產業(yè)發(fā)展行動計劃(2024—2025年》石政辦發(fā)〔2024〕4號北京2024.03.262024.03.26北京市石景山區(qū)人民政府辦公室7.整合資源協(xié)同發(fā)展。發(fā)揮科研院所等技術資源優(yōu)勢,聯(lián)合頭部企業(yè)開展大模型研發(fā)應用,鼓勵相關技術和算法開源開放,提升大模型產品研發(fā)水平和行業(yè)賦能能力。建設人工智能大模型產業(yè)標桿型孵化器,梯次培育一批人工智能大模型垂直行業(yè)代表企業(yè)?!侗本┙?jīng)濟技術開發(fā)區(qū)關于加快打造AI原生產業(yè)創(chuàng)新高地的若干政策》京技管發(fā)〔2024〕10號北京2024.03.282024.03.28北京經(jīng)濟技術開發(fā)區(qū)管理委員會13.打造人工智能公共服務硬件協(xié)同創(chuàng)新與適配驗證能軟硬件行業(yè)解決方案測建設人工智能開源開放平臺鼓勵大模型領域自主可控開源社區(qū)發(fā)展支持自主開源深度學習框架研發(fā)攻關和代碼托管鏡像平臺建開源社區(qū)注冊用戶活躍度業(yè)最高500萬元補貼?!稄V東省人民政府辦公廳印發(fā)廣東省關于人工智能賦能千行百業(yè)若干措施的通知》粵辦函〔2024〕88號廣東省2024.05.262024.05.26廣東省人民政府辦公廳7.建設大模型開源社區(qū)。建設原創(chuàng)性基礎大模型資源池支持大模型及其衍生2027年,示人工智能的開源服務體系?!侗本┦型苿印叭斯ぶ悄?”行動計劃(2024-2025》京發(fā)改〔20241081號北京2024.07.182024.07.18北京市發(fā)展和改革委員會,北京市經(jīng)濟和信息化局,北京市科學技術委員會,中關村科技園區(qū)管理委員會建設運營北京算力互聯(lián)互開放并匯聚高價值行業(yè)數(shù)大模型訓練提供算力、數(shù)資源持基礎大模型在各行業(yè)領控的基礎大模型為底座加速訓練細分行業(yè)垂類大模型,完善大模型應用工具控基礎大模型型和數(shù)據(jù)集托管云服務平臺,促進開發(fā)者分享和協(xié)作。五、企業(yè)應用開源大模型風險治理實操要點統(tǒng)籌開展開源大模型風險防控工作。(一)開源大模型治理體系構建治理委員會負責制定開源大模型的調整企業(yè)的合規(guī)策略。相關角色將在各自的領域內為開源大模型的治理和應用提供支持。企業(yè)面向開源大模型的治理機制明確了開源大模型治理的規(guī)則企業(yè)應制定明確的開且不違反相關法律法規(guī)和企業(yè)內部規(guī)定。二是構建風險管理機制。在安全風險管理方面,企業(yè)需對開源大業(yè)應實施CI/CD并根據(jù)實際情況進行優(yōu)化調整。(二)開源大模型風險防控建議的更新頻率和社區(qū)活躍度是評估其生命力和持續(xù)發(fā)展能力的重要指開源大模型項目的成功很大企業(yè)可從開源大模型應用全生命周期進行開源大模型安全風險防控。企業(yè)在開源大模型引入階段應做好安全準備源大模型選型時,企業(yè)應評估項目是否存在已知的安全隱患和漏洞,——模型部署/21在算法優(yōu)化——模型再發(fā)布/對外提供服務階段:企業(yè)在利用開源大模型提在許可協(xié)議合規(guī)方面,企業(yè)使用開源大模型的合規(guī)流程一般包含212024/s/ucJDZf03jru7IB5maCi5zg20246日。以下環(huán)節(jié)。
圖2人工智能大模型許可協(xié)議合規(guī)流程結合未來使用方式和使用場景判斷擬引入開源大模型是否滿足公司——模型部署/優(yōu)化階段:企業(yè)開放人員應在專業(yè)合規(guī)人員的協(xié)用方式和使用場景綜合確定待履行義務,并準備義務履行材料?!P驮侔l(fā)布/對外提供服務階段:企業(yè)應根據(jù)許可協(xié)議要求履行對應聲明義務和/或衍生作品再開源義務,并進行義務符合性審查,以確保完全符合大模型許可協(xié)議的相關要求。表6常見人工智能開源許可協(xié)議合規(guī)要點解讀專欄4常見人工智能許可協(xié)議合規(guī)要點解讀1.AIPUBSRAIL系列許可協(xié)議合規(guī)要點AIPUBSRAILLICENSES系列許可協(xié)議的制定參考了開源Apache2.0的內容,二者存在類似條款,因此參照Apache許可協(xié)議合規(guī)實務,可提出如下開源大模型AIPUBSRAILLICENSES系列許可協(xié)議合規(guī)要點:AIPUBSRAILLICENSES許可協(xié)議具體版本大模型許可協(xié)議合規(guī)項目工作的第一步是判斷大模型適用許(即模型所適用(即源代碼而根據(jù)相應的許可協(xié)議內容確定大模型許可協(xié)議合規(guī)工作的具體依據(jù)。評估大模型的應用風險AIPUBSRAILLICENSES系列許可協(xié)議附有明確的免責聲明和責任限制條款,此類條款對于保護大模型的開源貢獻者至關重盡可能選用知名公司發(fā)布的或業(yè)內廣泛使用的開源大模型的參數(shù)市場檢驗,侵權風險較小。而冷門、小眾的開源大模型的參數(shù)文件和代碼文件相對較大,需審慎評估后決定是否使用。AIPUBSLICENSES系列許可協(xié)議大模型后續(xù)應用和開發(fā)的開源閉源選擇對于AIPubsOpenRAIL-MAIPubsOpenRAIL-SApache2.0,屬于寬否繼續(xù)開放其衍生作品。對于AIPubsResearch-UseRAIL-M和AIPubsResearch-UseRAIL-S兩個研究用途許可協(xié)議,許可協(xié)議內容中刪除了下游和其他用戶可以自由訪問該被許可的模型/源代碼的條款,考慮到其只能用于研究和學術用途,原則上應僅在研究范圍內允許訪問和使用。AIPUBSRAILLICENSES系列許可協(xié)議的具體版本,嚴格履行許可協(xié)議項下規(guī)定的義務(例如軟件即服務,通過任何媒體復制和分發(fā)模型/源代碼,按照AIPUBSRAILLICENSES系列許可協(xié)議規(guī)定履行相關許可協(xié)議義務。許可協(xié)議義務主要包括兩方面:Apache2.0的義務,向模型或專利、商標和歸屬聲明。第二方面是AIPUBSRAILLICENSES系列許可協(xié)議特有的用AIPUBSRAILLICENSES系列許可協(xié)議附件AAIPUBSLICENSES5A限制作為可執(zhí)行的條款包含在管轄模型/源代碼的使用和/或分發(fā)的任何類型的法律協(xié)議5AIPubsResearch-UseRAIL-M和AIPubsResearch-UseRAIL-S兩個研究用途許可協(xié)議,還要求源代碼的任何第三方接收者必須遵守僅被允許的學術和研究用途,不得商用。BigScienceOpenRAIL-MLicense許可協(xié)議或BigScienceRAILLicensev1.0許可協(xié)議合規(guī)要點商業(yè)公司在合規(guī)使用和分發(fā)適用BigScienceOpenRAIL-MLicenseBigScienceRAILLicensev1.0許可協(xié)議的大模型時應當關注如下問題:BigScienceOpenRAIL-MLicense許可協(xié)議和RAILLicensev1.0許可協(xié)議的專利和版權授權范圍包括模型、模型衍生作品和補充材料(即代碼文件及其文檔)商業(yè)公司在部署、使用和分發(fā)適用BigScienceOpenRAIL-MLicenseBigScienceRAILLicensev1.0許可協(xié)議的大模BigScienceOpenRAIL-MLicense、BigScienceRAILLicensev1.0許可協(xié)議的版權和專利的許可范圍包括模型、模型衍(即代碼文件及其文檔(即代碼文件及其文檔BigScienceOpenRAIL-MLicense許可協(xié)議BigScienceRAILLicensev1.02、3條進行許可,但BigScienceOpenRAIL-MLicense許可協(xié)議和BigScienceRAILLicensev1.04條規(guī)定的被許可人需要滿足的對應條件足5條及附件A的使用限制BigScienceOpenRAIL-MLicense許可協(xié)BigScienceRAILLicensev1.0許可協(xié)議對被許可人的授權范圍包括版權和專利權,但不包括商標和商號權BigScienceOpenRAIL-MLicense和BigScienceRAILLicensev1.02型的衍生作品。BigScienceOpenRAIL-MLicense許可協(xié)議和BigScienceRAILLicensev1.03條明確授予被許可人永久的、全球性的、(許可協(xié)議另有規(guī)定除外)售、進口和以其他方式轉移模型和補充材料。BigScienceOpenRAIL-MLicense許可協(xié)議和BigScienceRAILLicensev1.08條規(guī)定,不允許被許可人使用許可人的商標、商號、標識或以其他方式錯誤陳述雙方之間的關系。特別關注BigScienceOpenRAIL-MLicense許可協(xié)議BigScienceRAILLicensev1.07可人還應盡合理努力使用最新版本的模型”的要求商業(yè)公司在合規(guī)使用和分發(fā)適用BigScienceOpenRAIL-MLicenseBigScienceRAILLicensev1.0許可協(xié)議的大模BigScienceOpenRAIL-MLicense許可協(xié)議和BigScienceRAILLicensev1.07條規(guī)定的“被許可人還應盡合理努力使用最新版本的模型”的要求。該要求被公眾詬病,因為若商業(yè)公司在適用BigScienceOpenRAIL-MLicense許可協(xié)議或BigScienceRAILLicensev1.0許可協(xié)議后續(xù)模型,并再次投入成本對后續(xù)模型進行微調存在爭議。被許可人對適用BigScienceOpenRAIL-MLicense許可BigScienceRAILLicensev1.0許可協(xié)議的大模型修改形成的衍生作品無強制開源義務BigScienceOpenRAIL-MLicense和BigScienceRAILLicensev1.0456條規(guī)(例如軟件即服務模型進行修改得到的派生作品繼續(xù)進行開源/BigScienceOpenRAIL-MLicenseBigScienceRAILLicensev1.0許可協(xié)議的開源大模型獲得的衍生模型作品,有權決定是否繼續(xù)開源。(無論是否修改BigScienceOpenRAIL-MLicense許可協(xié)議和BigScienceRAILLicensev1.05A的使用限制型的衍生作品的副本(無論是否修改,需遵守BgSineOpnRAIL-MLicense許可協(xié)議或BigScienceRAILLicensev1.05條和附件A的使用限制。BigScienceOpenRAIL-MLicense許可協(xié)議或BigScienceRAILLicensev1.0的附件A13OpenRAILLLaMA2LLaMA3許可協(xié)議合規(guī)要點商業(yè)公司在合規(guī)訪問、使用和分發(fā)大模型LLaMA2/3時應當關注如下問題。LLaMA2/3LLaMA2/3模型參數(shù)、代碼文件及其文檔LLaMA2/3許可協(xié)議許可的內容是“LLaMA材料,而“LLaMA材料包括MetaLLaMA2/3和其文檔?!癓LaMA2/3”是指基礎大語言模型及軟件和算法,包括機器學調代碼以及Meta文檔Meta分LLaMA2/3隨附的規(guī)格、手冊和文檔。LLaMA2/3的模型權重參數(shù)文件和開源代碼文件統(tǒng)一適用LLaMA2/3許可協(xié)議MetaLLaMA2/3的模型權重參數(shù)文件和開源代碼文是統(tǒng)一適用其定制的LLaMA2/3社區(qū)許可協(xié)議(LLAMA2/3CommunityLicense)LLaMA2/3可接受使用政策(LLaMA2/3AcpbleUePoyMeta對被許可人授予的使用關于LLaMA2/3的知識產權應當包括版權和專利權,但不包括商標和商號權LLaMA2/3LLaMAMeta還是被許可方均不得使用對方或其任何關聯(lián)公司擁有或與之相關的任何名稱或標記,除非為了描述和再分發(fā)LLaMA材料而合理和慣常使用。LLaMA2/3及其輸出用于改進其他大語言模型LLaMA2/3LLaMA材料或任何輸出或LLaMA(LLaMA2/3或其派生作品LLaMA2/3的使用者特別關注。如果被許可人及其關聯(lián)公司提供的產品或服務的月訪問7億,需要另行申請單獨的商業(yè)許可LLaMA2/3(LLAMA2/3CommunityLLaMA官網(wǎng)的介紹就是一個定制的商業(yè)許可,被許可人可將LLaMA用于商業(yè)或非商業(yè)用途。但LLaMA2/3(LLAMA2/3CommunityLicense)LLaMA2/3的關聯(lián)公司提供的產品或服務的每月活躍用戶數(shù)在上一個日歷月7Meta申請單獨的商業(yè)許可協(xié)議。Meta可以自行決定是否授予該權利。開源軟件許可協(xié)議一般沒有此類規(guī)定,該規(guī)定事實上要求大型互聯(lián)網(wǎng)公司單獨申請商業(yè)許可,排除在LLaMA2/3(LLAMA2/3Community適用的被許可人范圍之外。被許可人擁有LLaMA2/3無強制開源義務LLaMA2/3MetaLLaMA材LLaMA材料的任Meta來都是此類派生作品和修改的擁有者。LLaMA2/3Apache2.0LLaMA2/3獲得的衍生作品,有權決定是否繼續(xù)開源。LLaMA2/3可接受使用政策(LLaMA2/3AcpabeUsePoiy,不得違反使用限制LLaMA2/3LLaMA23(LLA2AcpbleUsePoiyLLMA23用于四類禁止用途:第1類違反法律或侵犯他人權利的方式利用LLaMA2/32類參與、促進、煽動、便利或協(xié)助計劃或開展對3第4類是未能適當?shù)叵蜃罱K用戶披露人工智能系統(tǒng)的任何已知危險3AIOpenRAIL許可協(xié)議相4類是LLaMA2/3許可協(xié)議另外增加的限制。LLaMA3特殊要求LLaMA材料(或其任何衍生作品)或使用了LLA3(包括其他AI模型,LLaMA顯示“BuiltwithMetaLLaMA3”。LLaMAAI任何此類AI模型名稱的開頭加入“LLaMA3”Meta僅在此種情況下授予被許可者使用“LLaMA3”標記的許可,被許可者需要遵Meta發(fā)布在其官網(wǎng)上的品牌指南,且被許可者因使用“LLaMA3”Meta。通義千問許可協(xié)議(Qianwen LICENSEAGREEMENT)合規(guī)要點商業(yè)公司在合規(guī)使用和分發(fā)適用通義千問許可協(xié)議的開源大模型時應當關注如下問題:(檔)的使用、分發(fā)和修改的許可通義千問許可協(xié)議授予許可的材料主要包括模型、代碼和文(利)范圍為材料(即模型、代碼和文檔。通義千問許可協(xié)議未授予商標和商號權通義千問許可協(xié)議第2條規(guī)定,基于阿里云的知識產權或阿里云擁有的在材料中體現(xiàn)的其他權利,授予被許可人對材料非獨占復制、創(chuàng)建衍生作品及對材料進行修改。通義千問許可協(xié)議第6用阿里云的商號、商標、服務標志或產品名稱的商標許可。特別關注通義千問許可協(xié)議對模型商業(yè)使用的限制條件商業(yè)公司在合規(guī)使用和分發(fā)通義千問人工智能開源大模型時時應當特別關注通義千問許可協(xié)議第4條規(guī)定“如果被許可人商業(yè)1使用則沒有被許可人的產品或服務擁有不超過1限制。被許可人對適用通義千問許可協(xié)議的人工智能開源大模改形成的衍生作品無強制開源義務通義千問許可協(xié)議第3(即后續(xù)的模型使用分發(fā)者源大模型修改得到的衍生作品是否繼續(xù)開源有決定權。通義千問許可協(xié)議第5條規(guī)定了兩點使用規(guī)則(1(模(包括通義千問或其衍生作品。由此可見通義千問許可協(xié)議概括性的要求使用通義千問模型或其任何輸出來改進任何其他大型語言模型?適用中國法律,杭州法院具司法管轄權通義千問許可協(xié)議第9(QwenLICENSEAGREEMENT)合規(guī)要點(QwenLICENSEAGREEMENT)在通義千問許(TongyiQianwenLICENSE基礎上進行了微“再分發(fā)和第五條用規(guī)則。對第三條“再分發(fā)”的修訂主要為:通義千問許可協(xié)議(TongyiQianwenLICENSEAGREEMENT)規(guī)定,再制造和分發(fā)材料或其衍生作品的副本,無論是否進行了修改,以源碼或目標碼形式,需要滿足第三條第二款規(guī)定中的abcd四個條件。千問許可協(xié)議(QwenLICENSE第三條第二款規(guī)定中的abcd四個條件。對第五條使用規(guī)則(TongyiQianwenLICENSE(不包括通義千問或其衍生作品(QwenLICENSEAGREEMENT)以使用材料AI模型,但需要在相關產品文檔中應當突出顯示使用Qwen構建或使用Qwen改進”的內容。就具體應用場景而言,企業(yè)應根據(jù)各場景下開源大模型應用特點采取相應措施,以確保訓練數(shù)據(jù)的合規(guī)應用。(Fnunng大模型微調是指在預訓練大規(guī)模模型的源語料時,應確保語料來源有合法的開源授權協(xié)議或相關授權文件,——量化(Quniaon:大模型量化是指將大型深度學習模型(通常是32位浮點數(shù),即FP32)(如16位浮點數(shù)FP168INT8等(Dslaon大模型蒸餾是指通過訓練一個較小的模(稱為學生模型(稱為教師模型”)的輸出。蒸餾的目的是在保持性能的同時,減少模型的大——檢索增強生成(RAG,RrvalAugmntdGneaon:檢索增強生成技術的核心思想在于將預訓練大規(guī)模生成模型與檢索模塊(BM25、DenseRetriever等)結合使用。檢索模塊可從大型文(如問題或上下文相關性最高的文檔或信息富的回答或內容。檢索模塊雖不直接參與模型訓練以影響模型參數(shù),企業(yè)應評估由模型、檢索器和外部文檔庫構成的整體應用的安全性,確保經(jīng)過檢索增強后的大模型仍然滿足相關數(shù)據(jù)合規(guī)要求。4.物料清單構建建議人工智能/機器學習物料清單(ArtificialIntelligence/MachineLnngBllofMtras,ALBOM,即用于記錄和管理人工智算法、模型和相關元數(shù)據(jù)。AI/MLBOM使AI/ML開發(fā)過程透明化,開源大模型應用企業(yè)可借助AI/MLBOM更好地了解開源大模型系統(tǒng)AI/M
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- PDIC-NN-生命科學試劑-MCE-4874
- ent-Corey-PG-lactone-diol-生命科學試劑-MCE-9112
- 10-Chloroestra-1-4-diene-3-17-dione-10-CIEsra-生命科學試劑-MCE-1585
- 2025年度級建造師資格證書注冊與建筑產業(yè)互聯(lián)網(wǎng)服務合同
- 二零二五年度花店知識產權保護合作協(xié)議
- 二零二五年度智能化小區(qū)物業(yè)保潔人員勞動合同
- 科技教育與學生實踐基地的未來發(fā)展
- 提高電動工具使用效率保障員工操作安全
- 提高商業(yè)學校實驗室安全管理的措施與方法
- 三人合作經(jīng)營企業(yè)合同協(xié)議書2025
- 商業(yè)銀行的風險審計與內部控制
- 2025年新能源汽車銷售傭金返點合同范本6篇
- 2025-2030年中國配電變壓器市場未來發(fā)展趨勢及前景調研分析報告
- GB/T 45120-2024道路車輛48 V供電電壓電氣要求及試驗
- GB/T 2518-2019連續(xù)熱鍍鋅和鋅合金鍍層鋼板及鋼帶
- 企業(yè)合規(guī)管理-課件
- 火電廠安全工作規(guī)程
- GB∕T 33047.1-2016 塑料 聚合物熱重法(TG) 第1部分:通則
- 電力業(yè)務許可證豁免證明
- 特發(fā)性肺纖維化IPF
- FIDIC國際合同條款中英文對照.doc
評論
0/150
提交評論