T-CAPT 014-2024 新聞行業(yè) 大規(guī)模預(yù)訓(xùn)練模型 語言模型安全性要求_第1頁
T-CAPT 014-2024 新聞行業(yè) 大規(guī)模預(yù)訓(xùn)練模型 語言模型安全性要求_第2頁
T-CAPT 014-2024 新聞行業(yè) 大規(guī)模預(yù)訓(xùn)練模型 語言模型安全性要求_第3頁
T-CAPT 014-2024 新聞行業(yè) 大規(guī)模預(yù)訓(xùn)練模型 語言模型安全性要求_第4頁
T-CAPT 014-2024 新聞行業(yè) 大規(guī)模預(yù)訓(xùn)練模型 語言模型安全性要求_第5頁
已閱讀5頁,還剩32頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

ICS35.240CCSL70CAPTNewsIndustry—Large-scaleofpre-trainedmodels—RequirementsforlanguageIT/CAPT014—2024前言 2規(guī)范性引用文件 3術(shù)語和定義 4基本要求 24.1概述 24.2內(nèi)容安全 24.3數(shù)據(jù)安全 24.4合規(guī)安全 24.5技術(shù)安全 25內(nèi)容安全要求 25.1要求對象 25.2要求維度 35.3措施要求 46數(shù)據(jù)安全要求 56.1要求對象 56.2要求維度 56.3措施要求 77合規(guī)安全要求 87.1概述 87.2整體控制 87.3要求維度 97.4措施要求 8技術(shù)安全要求 8.1要求對象 8.2要求維度 8.3措施要求 附錄A(資料性)新聞行業(yè)大規(guī)模預(yù)訓(xùn)練模型涉及的主要合規(guī)風(fēng)險 14附錄B(資料性)內(nèi)容安全評估能力等級建議 16參考文獻(xiàn) T/CAPT014—2024本文件按照GB/T1.1—2020《標(biāo)準(zhǔn)化工作導(dǎo)則第1部分:標(biāo)準(zhǔn)化文件的結(jié)構(gòu)和起草規(guī)則》的規(guī)定起草。請注意本文件的某些內(nèi)容可能涉及專利。本文件的發(fā)布機(jī)構(gòu)不承擔(dān)識別專利的責(zé)任。本文件由中國新聞技術(shù)工作者聯(lián)合會新聞信息標(biāo)準(zhǔn)化分會秘書處和新華通訊社通信技術(shù)局聯(lián)合提本文件由中國新聞技術(shù)工作者聯(lián)合會歸口。本文件起草單位:深圳市創(chuàng)意智慧港科技有限責(zé)任公司(深圳報業(yè)集團(tuán)技術(shù)公司)、新華通訊社通信技術(shù)局、四川封面?zhèn)髅娇萍加邢挢?zé)任公司、北京智途云天科技有限公司、視覺(中國)文化發(fā)展股份有限公司、北京聯(lián)合信任技術(shù)服務(wù)有限公司、上海算法創(chuàng)新研究院、中聯(lián)超清(北京)科技有限公司、華為云計算技術(shù)有限公司、北京融聞傳媒科技研究院有限公司、福建理工大學(xué)、新華社媒體融合生產(chǎn)技術(shù)與系統(tǒng)國家重點(diǎn)實(shí)驗(yàn)室、中國傳媒大學(xué)。本文件主要起草人:路海燕、瞿曦、鄭創(chuàng)偉、姜軍、高登科、王駿清、丁峰、席晨陽、唐波、李志宇、張昌利、刁春飛、岳韶華、王付生、鄭子木、邢谷濤、羅毅、林波、成鵬、肖國煜、王仲豪、劉瓊、張鵬洲、曹娟、王宇琦、鄧海瀅、段艷文、王志民、付蓉、黃菁。T/CAPT014—2024《新聞行業(yè)大規(guī)模預(yù)訓(xùn)練模型》系列標(biāo)準(zhǔn)由語言模型實(shí)用性要求、語言模型評測要求、語言模型安全性要求和研發(fā)數(shù)據(jù)要求、多模態(tài)要求5部分組成。分別從實(shí)用性、評測、安全性、研發(fā)數(shù)據(jù)和多模態(tài)等多個角度出發(fā),構(gòu)建了一個完整的標(biāo)準(zhǔn)體系,確保大規(guī)模預(yù)訓(xùn)練模型在新聞行業(yè)中的有效、安全和規(guī)范使用。旨在為新聞領(lǐng)域大規(guī)模預(yù)訓(xùn)練模型的研發(fā)、應(yīng)用和評估提供全面而系統(tǒng)的指導(dǎo)?!缎侣勑袠I(yè)大規(guī)模預(yù)訓(xùn)練模型語言模型實(shí)用性要求》明確了預(yù)訓(xùn)練語言模型在完成新聞任務(wù)時的使用場景要求、效果要求以及產(chǎn)品化要求。該標(biāo)準(zhǔn)為模型的實(shí)際應(yīng)用提供了具體指導(dǎo),確保模型在真實(shí)新聞生產(chǎn)過程中具備足夠的實(shí)用性和效果。《新聞行業(yè)大規(guī)模預(yù)訓(xùn)練模型語言模型評測要求》為評估這些預(yù)訓(xùn)練語言模型提供了詳盡的方法和指標(biāo)。該標(biāo)準(zhǔn)規(guī)定了新聞行業(yè)預(yù)訓(xùn)練語言模型的評測指標(biāo)和評測方法要求,并給出了具體的評測示例,以確保評測過程的科學(xué)性和規(guī)范性。《新聞行業(yè)大規(guī)模預(yù)訓(xùn)練模型語言模型安全性要求》詳細(xì)規(guī)定了在內(nèi)容、數(shù)據(jù)、合規(guī)和技術(shù)等環(huán)節(jié)中所涉及的安全性要求。該標(biāo)準(zhǔn)旨在保障預(yù)訓(xùn)練模型在新聞領(lǐng)域的應(yīng)用中,能夠遵守相關(guān)法律法規(guī),確保數(shù)據(jù)安全、內(nèi)容合規(guī)?!缎侣勑袠I(yè)大規(guī)模預(yù)訓(xùn)練模型研發(fā)數(shù)據(jù)要求》針對用于訓(xùn)練、微調(diào)和評估預(yù)訓(xùn)練模型的所有數(shù)據(jù),提出了技術(shù)要求。該標(biāo)準(zhǔn)確保了在預(yù)訓(xùn)練模型研發(fā)過程中,數(shù)據(jù)的質(zhì)量和規(guī)范性,從而提升模型的性能和可靠性。《新聞行業(yè)大規(guī)模預(yù)訓(xùn)練模型多模態(tài)要求》規(guī)定了預(yù)訓(xùn)練模型在研發(fā)、應(yīng)用、評測和安全性等方面的要求,特別是在處理多模態(tài)數(shù)據(jù)時的技術(shù)標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)的制定,進(jìn)一步拓展了預(yù)訓(xùn)練模型的應(yīng)用范圍,使其在多模態(tài)新聞內(nèi)容生成和處理方面也能高效、可靠地發(fā)揮作用。5個標(biāo)準(zhǔn)的緊密銜接和相互配合,為新聞行業(yè)的大規(guī)模預(yù)訓(xùn)練模型構(gòu)建了一個全面而系統(tǒng)的框架,為新聞領(lǐng)域大規(guī)模預(yù)訓(xùn)練模型的開發(fā)和應(yīng)用提供了堅實(shí)的基礎(chǔ)和有力的保障。1T/CAPT014—2024新聞行業(yè)大規(guī)模預(yù)訓(xùn)練模型語言模型安全性要求本文件規(guī)定了新聞行業(yè)大規(guī)模預(yù)訓(xùn)練模型語言模型安全性的基本要求、內(nèi)容安全要求、數(shù)據(jù)安全要求、合規(guī)安全要求和技術(shù)安全要求。本文件適用于通訊社、報社、廣播電臺、電視臺、雜志社、網(wǎng)絡(luò)媒體等多種媒體機(jī)構(gòu)在新聞領(lǐng)域大規(guī)模預(yù)訓(xùn)練模型語言模型運(yùn)用中與安全有關(guān)的研發(fā)、部署、應(yīng)用、管理等。2規(guī)范性引用文件下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件,僅該日期對應(yīng)的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。GB/T22239信息安全技術(shù)網(wǎng)絡(luò)安全等級保護(hù)基本要求GB/T41867信息技術(shù)人工智能術(shù)語TC260-003生成式人工智能服務(wù)安全基本要求3術(shù)語和定義GB/T41867界定的以及下列術(shù)語和定義適用于本文件。3.1大規(guī)模預(yù)訓(xùn)練模型large-scalepre-trainedmodel一種具有大規(guī)模參數(shù)和復(fù)雜計算結(jié)構(gòu)的超大型機(jī)器學(xué)習(xí)模型(一般超過10億個參數(shù)通常由深度神經(jīng)網(wǎng)絡(luò)構(gòu)建,對海量數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練處理。3.2大規(guī)模預(yù)訓(xùn)練語言模型Large-scalepre-trainedlanguagemodels一種通過在海量文本數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練而構(gòu)建的自然語言處理模型,通?;谏疃葘W(xué)習(xí)框架,通過自監(jiān)督學(xué)習(xí)從無標(biāo)注的數(shù)據(jù)中學(xué)習(xí)語法、語言和知識等,可通過零樣本(zero-shot)方式進(jìn)行交互、并可以通過微調(diào)(finetune)進(jìn)行特定任務(wù)加強(qiáng)。3.3數(shù)據(jù)data任何以電子或者其他方式對信息的記錄,可以是文本、圖片、音頻、視頻等各種形式的電子信息。3.4數(shù)據(jù)安全datasecurity通過采取必要措施,確保數(shù)據(jù)處于有效保護(hù)和合法利用的狀態(tài),以及具備保障持續(xù)安全狀態(tài)的能力。3.5數(shù)據(jù)訪問控制dataaccesscontrol;訪問控制的一種安全機(jī)制,用于限制對敏感數(shù)據(jù)的訪問,確保只有授權(quán)用戶才能訪問特定的數(shù)據(jù)資源。3.62T/CAPT014—2024可信時間戳trustedtimestamp由權(quán)威時間戳服務(wù)中心機(jī)構(gòu)簽發(fā),用于數(shù)據(jù)電文(電子文件)防篡改和事后抵賴并確定電子文件產(chǎn)生的準(zhǔn)確時間,能證明數(shù)據(jù)電文在一個時間點(diǎn)是已經(jīng)存在的、完整的、可驗(yàn)證的,是具備法律效力的電子憑證。4基本要求4.1概述本文件從內(nèi)容、數(shù)據(jù)、合規(guī)與技術(shù)安全維度對新聞行業(yè)預(yù)訓(xùn)練語言模型的安全性提出具體要求。這四個方面的具體要求構(gòu)建了全面的安全體系,相互支撐、互為補(bǔ)充。4.2內(nèi)容安全內(nèi)容安全確保新聞行業(yè)大規(guī)模預(yù)訓(xùn)練模型生成和處理內(nèi)容的質(zhì)量和合法性。要求模型生成的信息真實(shí)可靠,不含虛假、誤導(dǎo)性或有害信息,并遵循法律法規(guī)、倫理規(guī)范和社會價值觀。具體參見第5章要4.3數(shù)據(jù)安全數(shù)據(jù)安全是保護(hù)用戶數(shù)據(jù)不受侵犯和濫用的重要方面。新聞行業(yè)大規(guī)模預(yù)訓(xùn)練模型語言模型應(yīng)確保用戶數(shù)據(jù)的隱私和安全,采取措施保護(hù)數(shù)據(jù)不被非法獲取、篡改或泄露,同時遵守相關(guān)數(shù)據(jù)保護(hù)法律法規(guī)。具體參見第6章要求。4.4合規(guī)安全合規(guī)安全涉及法律遵從、倫理規(guī)范、社會責(zé)任等方面。新聞行業(yè)大規(guī)模預(yù)訓(xùn)練模型語言模型應(yīng)遵守國家法律法規(guī)和行業(yè)標(biāo)準(zhǔn),考慮社會道德倫理,保障用戶權(quán)益,確保信息傳播合規(guī),內(nèi)容審核機(jī)制健全。具體見第7章要求。4.5技術(shù)安全技術(shù)安全保障系統(tǒng)的穩(wěn)定性、可靠性和安全性。關(guān)注模型算法的穩(wěn)定性、系統(tǒng)部署的安全性、數(shù)據(jù)傳輸?shù)募用艿燃夹g(shù)安全方面,防止惡意攻擊、數(shù)據(jù)泄露等問題,確保系統(tǒng)正常運(yùn)行和用戶信息安全。具體參見第8章要求。5內(nèi)容安全要求5.1要求對象新聞行業(yè)預(yù)訓(xùn)練模型語言模型在內(nèi)容安全方面,應(yīng)確保模型應(yīng)用嚴(yán)格遵守國家法律法規(guī)、行業(yè)規(guī)范,并體現(xiàn)社會主義主流價值觀,為用戶提供準(zhǔn)確、可靠的信息服務(wù),推動新聞行業(yè)的持續(xù)健康發(fā)展。具體要求對象包括:a)用戶輸入內(nèi)容安全性:要求模型在處理用戶輸入時,識別與過濾潛在不安全或違規(guī)內(nèi)容的能力,以維護(hù)模型運(yùn)行環(huán)境的安全與純凈。b)模型輸出內(nèi)容安全性:要求模型的輸出結(jié)果符合預(yù)定的合規(guī)性標(biāo)準(zhǔn),以保證所生成的內(nèi)容不會對用戶、社會或法律環(huán)境產(chǎn)生不良影響。c)模型輸出內(nèi)容準(zhǔn)確性:要求模型在生成新聞內(nèi)容時的準(zhǔn)確性,涵蓋事實(shí)準(zhǔn)確性、語義準(zhǔn)確性等方面,以確保模型輸出的信息真實(shí)可靠,避免對用戶產(chǎn)生誤導(dǎo)。d)配套安全機(jī)制有效性:要求模型配套各類安全機(jī)制(如數(shù)據(jù)保護(hù)、訪問控制等),確保其在模型運(yùn)行過程中提供全方位的安全保障。3T/CAPT014—2024e)能力更新機(jī)制適應(yīng)性:要求模型應(yīng)具備高效的更新機(jī)制,確保模型能夠快速適應(yīng)新環(huán)境、新挑戰(zhàn)的變化,始終保持在行業(yè)前沿水平。5.2要求維度新聞行業(yè)預(yù)訓(xùn)練模型語言模型在內(nèi)容安全方面的能力要求,應(yīng)包括內(nèi)容可靠性、內(nèi)容規(guī)范性、安全持續(xù)性等維度。這些維度共同確保模型應(yīng)用符合法律法規(guī),保障內(nèi)容安全。5.2.1內(nèi)容可靠性生成依據(jù)及溯源能力生成依據(jù)及溯源能力要求包括:a)生成依據(jù)顯示機(jī)制:模型應(yīng)具備清晰、準(zhǔn)確的生成依據(jù)顯示機(jī)制,該機(jī)制需確保依據(jù)展示能夠顯性露出,內(nèi)容完整、準(zhǔn)確,且可通過簡便的感知測試進(jìn)行驗(yàn)證。b)高效準(zhǔn)確溯源機(jī)制:模型應(yīng)具備生成內(nèi)容的溯源機(jī)制,通過對比分析模型生成文本與原始數(shù)據(jù)之間的關(guān)聯(lián)性和一致性,提供清晰、準(zhǔn)確的生成依據(jù)溯源能力,保證在溯源過程中的響應(yīng)速度和準(zhǔn)確性,以確保生成結(jié)果的有效性和可靠性。事實(shí)核查能力事實(shí)核查要求包括:a)歷史事實(shí)準(zhǔn)確性:模型對于具有重大歷史意義的事件、人物及時間節(jié)點(diǎn),應(yīng)進(jìn)行特別核查,確保其表述與公認(rèn)的歷史資料相符,同時在處理邊緣或有爭議的歷史問題時,標(biāo)注信息來源以增加內(nèi)容透明性。b)實(shí)時信息準(zhǔn)確性:模型應(yīng)具備最新信息的獲取、處理及更新能力,在實(shí)時性要求較高的應(yīng)用場景下,模型應(yīng)能夠及時響應(yīng)并準(zhǔn)確生成相關(guān)信息,確保內(nèi)容的實(shí)時性和可靠性。數(shù)據(jù)及知識更新機(jī)制數(shù)據(jù)及知識更新機(jī)制要求包括:a)更新機(jī)制:模型應(yīng)具備持續(xù)從多樣化新數(shù)據(jù)源中捕獲并有效整合信息的能力,以確保模型內(nèi)容保持高度的準(zhǔn)確性和時效性。b)更新頻率和策略:模型應(yīng)制定有效的更新策略,保持一定的更新頻率,如定期更新、事件驅(qū)動更新等方式,以確保模型在面對新知識、新事件時能夠及時更新,維持內(nèi)容的新鮮度和準(zhǔn)確性,并可通過更新日志、更新周期以及更新內(nèi)容的檢查確認(rèn)有效性。c)更新來源多樣性:模型更新內(nèi)容應(yīng)涵蓋不同類型的數(shù)據(jù)來源、不同領(lǐng)域的知識庫,以確保模型能夠獲取多維度、多角度的信息,提高內(nèi)容生成的全面性和豐富性。d)更新內(nèi)容質(zhì)量控制:模型更新內(nèi)容應(yīng)建立完善的質(zhì)量控制機(jī)制,包含數(shù)據(jù)清洗、去重、去噪等環(huán)節(jié),以確保更新內(nèi)容的質(zhì)量符合標(biāo)準(zhǔn),防止在模型訓(xùn)練和生成過程中引入錯誤或偏差。5.2.2內(nèi)容規(guī)范性新聞?wù)Z言規(guī)范能力新聞?wù)Z言規(guī)范要求包括:a)文字錯誤處理:模型應(yīng)具備識別并糾正拼寫錯誤、術(shù)語誤用以及異形字詞等問題的能力,以確保輸出文本在文字表述上的準(zhǔn)確性,尤其要注重對地名、人名等專有名詞的處理。b)語法錯誤處理:模型應(yīng)具備識別并糾正搭配不當(dāng)、標(biāo)點(diǎn)缺失或誤用等常見語法錯誤的能力,并在修正后保持文本的原始含義和上下文連貫性。敏感內(nèi)容審核能力敏感內(nèi)容審核要求包括:4T/CAPT014—2024a)敏感信息識別:模型應(yīng)具備敏感信息的檢測和拒識能力,涵蓋政治敏感、涉及主要領(lǐng)導(dǎo)人、色情、暴力、廣告、辱罵以及違禁等多個方面,并確保生成內(nèi)容保持一致的安全性。b)涉政表述核查:模型應(yīng)具備涉政內(nèi)容檢測、政治語境理解、錯誤表述識別、合規(guī)表述生成的能力,涵蓋廣泛的黨政知識和時政規(guī)范。5.2.3安全持續(xù)性指令攻擊對抗能力模型應(yīng)具備對目標(biāo)劫持、反面誘導(dǎo)、不安全指令、指令/提示詞(prompt)泄漏等攻擊的防御能力,并對模型應(yīng)對這些指令時的性能以及遭受攻擊后的恢復(fù)能力進(jìn)行量化確認(rèn)。安全過濾機(jī)制安全過濾機(jī)制要求包括:a)用戶輸入過濾機(jī)制:模型應(yīng)具備全面的用戶輸入過濾機(jī)制,能夠準(zhǔn)確識別并攔截違規(guī)、惡意或不適宜的內(nèi)容。在應(yīng)用過程中,應(yīng)重點(diǎn)關(guān)注過濾機(jī)制的設(shè)計原理、實(shí)現(xiàn)細(xì)節(jié)及實(shí)際過濾效果,確保其在高并發(fā)場景下保持穩(wěn)定的過濾效能。b)模型輸出過濾機(jī)制:模型應(yīng)具備專有的輸出內(nèi)容過濾機(jī)制,準(zhǔn)確識別和過濾不符合內(nèi)容安全標(biāo)準(zhǔn)的信息,并配有明確的方案說明。定期審查與更新機(jī)制定期審查與更新機(jī)制要求包括:a)自主審查機(jī)制:模型應(yīng)具備定期的自主審查機(jī)制,考量審查速度、審查策略的合理性,并配有相應(yīng)的流程說明,明確闡述如何對模型進(jìn)行安全審查,以及驗(yàn)證自動化審查的方法。b)更新發(fā)布機(jī)制:模型應(yīng)具備明確的更新發(fā)布機(jī)制,涵蓋更新內(nèi)容、更新策略的詳細(xì)說明,提供具體的驗(yàn)證方式,并確保更新中的服務(wù)穩(wěn)定性。用戶反饋與優(yōu)化機(jī)制用戶反饋與優(yōu)化機(jī)制要求包括:a)用戶反饋機(jī)制:模型應(yīng)具備用戶反饋機(jī)制,確保反饋方式具有多樣性、便捷性、合理性和快速的響應(yīng)速度,并確保反饋中各類型安全問題的處理準(zhǔn)確率。b)反饋優(yōu)化通知機(jī)制:模型應(yīng)具備完整的反饋優(yōu)化流程,涵蓋問題識別、分類、處理及反饋等環(huán)節(jié),并提供便捷的優(yōu)化效果驗(yàn)證方式。5.3措施要求5.3.1概述新聞行業(yè)預(yù)訓(xùn)練模型語言模型在內(nèi)容安全方面的措施要求,應(yīng)包括自動化測試、人工審核、用戶反饋收集以及定期審查與更新等,這些措施旨在通過系統(tǒng)化的測試、專業(yè)團(tuán)隊的審查、用戶反饋的整合以及持續(xù)的評估和改進(jìn),確保模型應(yīng)用符合安全標(biāo)準(zhǔn),而且能夠及時適應(yīng)新的挑戰(zhàn)和環(huán)境變化。5.3.2自動化測試?yán)米詣踊ぞ吆投ㄆ诟碌脑u測數(shù)據(jù)集,對模型進(jìn)行批量測試,檢查內(nèi)容安全的具體能力。5.3.3人工審核由專業(yè)團(tuán)隊對模型的內(nèi)容安全能力和相應(yīng)機(jī)制進(jìn)行人工審查和評測,檢查具體能力和機(jī)制完備性。5.3.4用戶反饋收集通過用戶調(diào)查、問卷、在線反饋等方式,收集用戶對模型內(nèi)容安全能力及機(jī)制等方面的反饋,并跟蹤反饋答復(fù)情況。5T/CAPT014—20245.3.5定期審查與更新隨著法律法規(guī)和技術(shù)的變化,定期對評測標(biāo)準(zhǔn)進(jìn)行更新、對模型的內(nèi)容安全能力進(jìn)行審查評測。6數(shù)據(jù)安全要求6.1要求對象新聞行業(yè)大規(guī)模預(yù)訓(xùn)練模型語言模型研發(fā)與應(yīng)用中涉及的數(shù)據(jù)安全對象包括:所有用于預(yù)訓(xùn)練的數(shù)據(jù)和實(shí)時應(yīng)用過程中處理并輸出的結(jié)果數(shù)據(jù);預(yù)訓(xùn)練過程和模型實(shí)際應(yīng)用過程中的相關(guān)系統(tǒng)、平臺以及相關(guān)的用戶等數(shù)據(jù)。對這些系統(tǒng)和數(shù)據(jù)的安全要求涉及其全生命周期。6.2要求維度6.2.1概述新聞行業(yè)大規(guī)模預(yù)訓(xùn)練模型語言模型對數(shù)據(jù)安全的要求涉及相關(guān)系統(tǒng)研發(fā)和應(yīng)用建設(shè)技術(shù)與管理中的兩個維度。在技術(shù)維度上,包括但不限于:內(nèi)容安全、隱私數(shù)據(jù)保護(hù)、安全存儲、訪問控制、可安全傳輸或轉(zhuǎn)存、可安全加工處理、可審計與可恢復(fù)等。在管理維度上,包括但不限于:明確數(shù)據(jù)安全建設(shè)內(nèi)容、建立數(shù)據(jù)安全應(yīng)急響應(yīng)措施、建立數(shù)據(jù)分級保護(hù)制度等。6.2.2研發(fā)與應(yīng)用建設(shè)技術(shù)維度要求概述在新聞行業(yè)大規(guī)模預(yù)訓(xùn)練模型語言模型系統(tǒng)的研發(fā)與應(yīng)用建設(shè)中,在技術(shù)維度上所涉及的數(shù)據(jù)安全要求包括但不限于:內(nèi)容安全、隱私數(shù)據(jù)保護(hù)、安全存儲、訪問控制、可安全傳輸或轉(zhuǎn)存、可安全加工處理、可審計與可恢復(fù)等。在各個維度上,均應(yīng)建立相關(guān)的數(shù)據(jù)安全機(jī)制、形成對應(yīng)的數(shù)據(jù)安全能力,符合相應(yīng)的數(shù)據(jù)安全要求。應(yīng)在大規(guī)模預(yù)訓(xùn)練模型語言模型的數(shù)據(jù)運(yùn)營與使用過程中建立較為完善的安全防護(hù)體系,并確保根據(jù)模型應(yīng)用的發(fā)展、安全技術(shù)的發(fā)展與形勢需要不斷更新完善。內(nèi)容安全保護(hù)a)在大規(guī)模預(yù)訓(xùn)練模型語言模型的運(yùn)營過程中,應(yīng)確保數(shù)據(jù)處理活動符合法律法規(guī)的要求。b)應(yīng)對用戶輸入的內(nèi)容和大規(guī)模預(yù)訓(xùn)練模型語言模型生成的答復(fù)內(nèi)容和提示語內(nèi)容,實(shí)施嚴(yán)格的審核和過濾,防止生成違法違規(guī)內(nèi)容、違反社會價值觀、歧視偏見、隱私泄露、內(nèi)容侵權(quán)、有悖社會公序良俗等不符合內(nèi)容安全要求的輸出。有關(guān)內(nèi)容安全的具體要求和相關(guān)措施,請詳見本要求的“5內(nèi)容安全要求”。隱私數(shù)據(jù)保護(hù)a)處理個人信息應(yīng)遵循所在地法律法規(guī)的規(guī)定,包括但不限于《中華人民共和國個人信息保護(hù)法》。這包括獲取個人信息的合法途徑,以及在必要時獲取數(shù)據(jù)主體的明確同意。應(yīng)對隱私數(shù)據(jù)的收集、存儲、使用、加工、傳輸、提供、公開、刪除等各個環(huán)節(jié)進(jìn)行安全管理。b)在收集、存儲和處理系統(tǒng)和用戶數(shù)據(jù)時,應(yīng)確保遵守相關(guān)的隱私保護(hù)法規(guī)和標(biāo)準(zhǔn),防止未經(jīng)授權(quán)的第三方濫用。c)所有輸出數(shù)據(jù)均應(yīng)不包含任何個人隱私數(shù)據(jù)、企業(yè)或機(jī)構(gòu)未允許對公眾披露的數(shù)據(jù);所有輸出的數(shù)據(jù)應(yīng)符合社會公序良俗要求,嚴(yán)禁包含教唆或暗示、傳播犯罪、販毒吸毒、色情、邪教等不符合內(nèi)容安全要求的內(nèi)容。安全存儲大規(guī)模預(yù)訓(xùn)練模型語言模型相關(guān)系統(tǒng)的研發(fā)與應(yīng)用過程中均應(yīng)對數(shù)據(jù)進(jìn)行安全存儲,包括但不限于:a)應(yīng)按照法律、行政法規(guī)規(guī)定和用戶約定的方式和期限進(jìn)行數(shù)據(jù)存儲。6T/CAPT014—2024b)在中華人民共和國境內(nèi)收集和產(chǎn)生的重要數(shù)據(jù)和核心數(shù)據(jù),法律、行政法規(guī)有境內(nèi)存儲要求的,應(yīng)在境內(nèi)存儲。確需向境外提供的,應(yīng)依法依規(guī)進(jìn)行數(shù)據(jù)出境安全評估。c)應(yīng)采用校驗(yàn)技術(shù)、加密技術(shù)等措施進(jìn)行安全存儲,并實(shí)施數(shù)據(jù)容災(zāi)備份和存儲介質(zhì)安全管理,定期開展數(shù)據(jù)恢復(fù)測試。d)應(yīng)實(shí)施數(shù)據(jù)存儲介質(zhì)安全管理,確保存儲介質(zhì)的安全性和完整性。e)應(yīng)建立數(shù)據(jù)銷毀制度,明確銷毀對象、規(guī)則、流程和技術(shù)等要求,對銷毀活動進(jìn)行記錄和留存。訪問控制應(yīng)根據(jù)實(shí)際需求對大規(guī)模預(yù)訓(xùn)練模型語言模型的研發(fā)、應(yīng)用和服務(wù)建立訪問策略;對使用者進(jìn)行身份鑒別;應(yīng)遵循最小權(quán)限進(jìn)行訪問控制。可安全傳輸或轉(zhuǎn)存a)在數(shù)據(jù)傳輸過程中,應(yīng)采取加密措施來保護(hù)所傳輸?shù)臄?shù)據(jù)不被截獲或篡改。b)應(yīng)建立數(shù)據(jù)轉(zhuǎn)存和備份機(jī)制,定期轉(zhuǎn)存?zhèn)浞菹嚓P(guān)數(shù)據(jù),以確保必要時可恢復(fù)??砂踩庸ぬ幚響?yīng)確保大規(guī)模預(yù)訓(xùn)練模型語言模型及其相關(guān)應(yīng)用系統(tǒng)的算法安全和數(shù)據(jù)加工處理過程的流程安全,以確保數(shù)據(jù)在加工處理過程中免遭泄露、竊取、篡改和破壞??蓪徲嬇c可恢復(fù)大規(guī)模預(yù)訓(xùn)練模型語言模型的研發(fā)、應(yīng)用和服務(wù)中,應(yīng)實(shí)施審計日志記錄和監(jiān)控,以便及時發(fā)現(xiàn)和處理異常訪問行為。6.2.3系統(tǒng)研發(fā)與應(yīng)用管理維度要求概述在新聞行業(yè)大規(guī)模預(yù)訓(xùn)練模型語言模型的研發(fā)與應(yīng)用中,在管理維度上所涉及的數(shù)據(jù)安全要求包括但不限于:應(yīng)建立數(shù)據(jù)安全管理相關(guān)制度與職責(zé);應(yīng)明確數(shù)據(jù)安全建設(shè)目標(biāo)、任務(wù)與內(nèi)容;應(yīng)建立數(shù)據(jù)安全事件應(yīng)急響應(yīng)與處置措施、應(yīng)建立數(shù)據(jù)分級保護(hù)制度等,形成體系化、規(guī)范化的管理制度和工作機(jī)制。數(shù)據(jù)安全管理制度與職責(zé)要求新聞行業(yè)大規(guī)模預(yù)訓(xùn)練模型語言模型的研發(fā)與應(yīng)用機(jī)構(gòu)中均應(yīng)設(shè)有專門的安全管理部門,將大規(guī)模預(yù)訓(xùn)練語言模型的研發(fā)或應(yīng)用全生命周期的數(shù)據(jù)安全管理納入其中進(jìn)行管理。應(yīng)建有專門的管理制度,指定專人負(fù)責(zé)系統(tǒng)的研發(fā)或應(yīng)用全生命周期中的數(shù)據(jù)安全工作的實(shí)施與監(jiān)督檢查,明確各部門之間的協(xié)調(diào)關(guān)系和溝通協(xié)作機(jī)制。明確數(shù)據(jù)安全建設(shè)目標(biāo)、任務(wù)與內(nèi)容應(yīng)通過規(guī)范化的規(guī)章制度、建設(shè)要求與目標(biāo)任務(wù)書等文檔將各系統(tǒng)、各部門、各環(huán)節(jié)的數(shù)據(jù)安全建設(shè)目標(biāo)、任務(wù)與內(nèi)容進(jìn)行明確的闡述與說明,便于遵照執(zhí)行、落地實(shí)施和對照檢查。建立數(shù)據(jù)安全事件應(yīng)急響應(yīng)與處置措施應(yīng)建立一整套數(shù)據(jù)安全事件應(yīng)急響應(yīng)與處置機(jī)制并定期進(jìn)行預(yù)演,主要包括:a)建立風(fēng)險監(jiān)測與預(yù)警機(jī)制:應(yīng)建立實(shí)時的數(shù)據(jù)安全風(fēng)險監(jiān)測機(jī)制,進(jìn)行常態(tài)化風(fēng)險監(jiān)測、評估與預(yù)警,及時發(fā)現(xiàn)并防范風(fēng)險。b)建立數(shù)據(jù)全生命周期安全管理機(jī)制:應(yīng)對數(shù)據(jù)實(shí)行分級防護(hù),建立全生命周期安全管理制度和具體操作規(guī)程。c)建立應(yīng)急預(yù)案與演練機(jī)制:制定數(shù)據(jù)安全事件應(yīng)急預(yù)案,并定期開展應(yīng)急演練和分析總結(jié)。7T/CAPT014—2024d)建立數(shù)據(jù)安全事件報告機(jī)制:數(shù)據(jù)安全事件發(fā)生后,應(yīng)按照預(yù)先規(guī)定的流程和規(guī)范化報告內(nèi)容及時向監(jiān)管部門報告并采取有效的應(yīng)急處置措施。e)建立用戶權(quán)益保護(hù)機(jī)制:對可能損害用戶合法權(quán)益的事件,應(yīng)及時告知用戶并提供補(bǔ)救措施。f)建立數(shù)據(jù)安全教育與培訓(xùn)機(jī)制:應(yīng)定期對從業(yè)人員進(jìn)行數(shù)據(jù)安全教育和培訓(xùn),提高安全防護(hù)意識、數(shù)據(jù)保護(hù)技術(shù)能力和應(yīng)急處置能力。建立數(shù)據(jù)分級保護(hù)制度依據(jù)《信息安全技術(shù)網(wǎng)絡(luò)安全等級保護(hù)基本要求》(GB/T22239-2019)的要求,按照數(shù)據(jù)的重要性實(shí)施分級保護(hù)措施。數(shù)據(jù)按照其重要性和敏感度,可分為最高級、高級、中級、低級四個級別,分別對應(yīng)等級保護(hù)要求中的第四級、第三級、第二級、第一級。6.3措施要求6.3.1概述新聞行業(yè)大規(guī)模預(yù)訓(xùn)練模型語言模型對數(shù)據(jù)安全的措施要求包括但不限于:對相關(guān)數(shù)據(jù)進(jìn)行加密、訪問控制、數(shù)據(jù)脫敏、數(shù)據(jù)完整性保護(hù)、數(shù)據(jù)防泄漏、數(shù)據(jù)備份與恢復(fù)、建立風(fēng)險識別和評價與處置能力、建立應(yīng)急處置能力等。6.3.2數(shù)據(jù)加密應(yīng)對大模型應(yīng)用系統(tǒng)中存儲和傳輸中的數(shù)據(jù)進(jìn)行加密保護(hù),以確保數(shù)據(jù)的機(jī)密性。6.3.3數(shù)據(jù)訪問控制應(yīng)對訪問者進(jìn)行身份驗(yàn)證、對不同的訪問者進(jìn)行授權(quán)、建立訪問控制策略、建立訪問控制列表或清單、建立基于角色的訪問控制機(jī)制,以及建立基于屬性的訪問控制機(jī)制等。數(shù)據(jù)訪問控制應(yīng)遵循防止默認(rèn)/弱密碼/設(shè)置多因子認(rèn)證機(jī)制、定期更換登錄口令等基本原則。應(yīng)根據(jù)數(shù)據(jù)的分級保護(hù)要求,妥善設(shè)置對應(yīng)的分級訪問權(quán)限。6.3.4數(shù)據(jù)脫敏對于包含敏感信息的數(shù)據(jù),應(yīng)進(jìn)行脫敏脫密處理。6.3.5數(shù)據(jù)完整性保護(hù)應(yīng)建立數(shù)據(jù)完整性檢查與驗(yàn)證機(jī)制,包括但不限于:數(shù)據(jù)源驗(yàn)證、數(shù)據(jù)傳輸安全、數(shù)據(jù)完整性校驗(yàn)、數(shù)據(jù)版本控制、審計日志、數(shù)據(jù)恢復(fù)機(jī)制等。6.3.6數(shù)據(jù)防泄漏應(yīng)采用適當(dāng)?shù)募夹g(shù)措施防止數(shù)據(jù)防泄漏,包括內(nèi)容識別、數(shù)據(jù)加密、訪問控制與權(quán)限管理、網(wǎng)絡(luò)端口和終端設(shè)備管控等。6.3.7數(shù)據(jù)備份與恢復(fù)應(yīng)按照分級保護(hù)要求,提供重要數(shù)據(jù)的備份與恢復(fù)機(jī)制。6.3.8建立風(fēng)險識別、評價與處置能力概述宜建立一整套常態(tài)化的數(shù)據(jù)安全評估機(jī)制,包括建立評估指標(biāo)體系、風(fēng)險感知與分析、定性與定量相結(jié)合的評估方法、形成操作性強(qiáng)的標(biāo)準(zhǔn)化評估流程,以及實(shí)現(xiàn)對評估結(jié)果的可視化呈現(xiàn)與解讀。建立評價指標(biāo)體系8T/CAPT014—2024應(yīng)建立一套比較完整的數(shù)據(jù)安全評價指標(biāo)體系,覆蓋大模型系統(tǒng)數(shù)據(jù)生產(chǎn)、應(yīng)用與管理的各層面、各環(huán)節(jié)。該指標(biāo)體系應(yīng)具有良好的可擴(kuò)展性,各指標(biāo)的權(quán)重應(yīng)具備可調(diào)整性。風(fēng)險感知與分析應(yīng)建立健全常態(tài)化的數(shù)據(jù)安全風(fēng)險感知機(jī)制,借助相關(guān)的技術(shù)方法、平臺工具和專業(yè)化知識庫,及時感知、識別風(fēng)險并進(jìn)行風(fēng)險評估,根據(jù)量化分析結(jié)果給出嚴(yán)重風(fēng)險、高風(fēng)險、中風(fēng)險和低風(fēng)險四個風(fēng)險等級提示,形成風(fēng)險識別與風(fēng)險分析、風(fēng)險處置閉環(huán)。風(fēng)險評估結(jié)果與處置應(yīng)建立閉環(huán)的風(fēng)險評估結(jié)果管理與處置機(jī)制。評估結(jié)果可存檔、可追溯、可獲得對應(yīng)的處置機(jī)制與反饋,形成閉環(huán)。6.3.9應(yīng)急處置與報告機(jī)制應(yīng)建立一套可演練、可實(shí)際操作的應(yīng)急處置與報告機(jī)制。在發(fā)生數(shù)據(jù)安全事件后可盡快啟動應(yīng)急處置機(jī)制,將安全事件造成的危害與損失盡可能將至最低。應(yīng)急處置與報告機(jī)制至少包括:a)事件監(jiān)測與報告:通過風(fēng)險評估與常態(tài)化監(jiān)測機(jī)制,及時發(fā)現(xiàn)數(shù)據(jù)安全事件的發(fā)生,應(yīng)立即先行判斷并根據(jù)事件的嚴(yán)重程度向上級部門如實(shí)匯報并分析可能造成的結(jié)果與影響。b)及時先行處置:應(yīng)在發(fā)現(xiàn)數(shù)據(jù)安全事件發(fā)生后立即啟動經(jīng)過演練的應(yīng)急預(yù)案,采取措施進(jìn)行數(shù)據(jù)恢復(fù)或追溯、取證并保存。c)分級響應(yīng):根據(jù)數(shù)據(jù)安全事件的嚴(yán)重程度,設(shè)置不同的應(yīng)急響應(yīng)級別。通常分為一級、二級、三級、四級,分別對應(yīng)特別重大、重大、較大、一般數(shù)據(jù)安全事件。d)應(yīng)急指揮與協(xié)調(diào):由專門的團(tuán)隊負(fù)責(zé)應(yīng)急指揮和各部門以及與必要的第三方協(xié)作機(jī)構(gòu)之間的溝通、協(xié)調(diào)。e)事后復(fù)盤與總結(jié):數(shù)據(jù)安全事件應(yīng)急處置操作完成后,應(yīng)對本次數(shù)據(jù)安全事件進(jìn)行深入分析與全面復(fù)盤,發(fā)現(xiàn)并總結(jié)其中的關(guān)鍵問題和導(dǎo)致數(shù)據(jù)安全事件的原因、事件發(fā)展經(jīng)過和走向等,形成書面總結(jié)報告。7合規(guī)安全要求7.1概述語言模型生成內(nèi)容應(yīng)符合國家法律法規(guī)和行業(yè)規(guī)范,尊重知識產(chǎn)權(quán)和個人隱私,遵守道德和公序良俗,符合社會主義核心價值觀,可參考法律法規(guī)等相關(guān)文件作出具體規(guī)定和建立負(fù)面清單。對于涉及法律、政策、重大事件和突發(fā)事件報道等敏感領(lǐng)域,語言模型生成的內(nèi)容應(yīng)經(jīng)過額外的人工審核和驗(yàn)證;在這些場景下,應(yīng)展開嚴(yán)格的事實(shí)核查,并與有關(guān)部門確認(rèn)相關(guān)信息是否公開可輸出,從而確保內(nèi)容的準(zhǔn)確性和合規(guī)性,避免引發(fā)誤解或法律責(zé)任;應(yīng)建立快速響應(yīng)機(jī)制,一旦發(fā)現(xiàn)合規(guī)性問題,能夠及時更正并公開澄清。確保產(chǎn)出的內(nèi)容符合國家法律法規(guī),不得產(chǎn)出或傳播違法信息,利用技術(shù)手段,如關(guān)鍵詞過濾、模式識別等,自動識別并限制不適合產(chǎn)出的內(nèi)容;定期更新和優(yōu)化過濾機(jī)制。7.2整體控制7.2.1語料合規(guī)安全受測模型的語料內(nèi)容合規(guī)安全應(yīng)遵循TC260-003生成式人工智能服務(wù)安全基本要求第五章中的明確要求,主要包括:a)應(yīng)建立知識產(chǎn)權(quán)管理機(jī)制,提前識別并規(guī)避侵權(quán)風(fēng)險;b)在知識產(chǎn)權(quán)方面,宜對語料及其延展生成的內(nèi)容設(shè)有知識產(chǎn)權(quán)的對應(yīng)負(fù)責(zé)人,建立清晰的知識產(chǎn)權(quán)管理機(jī)制;9T/CAPT014—2024c)語料用于訓(xùn)練之前,對語料及其延展生成的內(nèi)容進(jìn)行主要知識產(chǎn)權(quán)侵權(quán)風(fēng)險的提前預(yù)判和識別,發(fā)現(xiàn)存在較大知識產(chǎn)權(quán)侵權(quán)等問題的,不使用此語料進(jìn)行訓(xùn)練;d)高風(fēng)險語料領(lǐng)域,包括文學(xué)、藝術(shù)、科學(xué)作品類,應(yīng)重點(diǎn)識別和關(guān)注這類語料及其延展生成的內(nèi)容可能涉及的著作侵權(quán)等問題;e)建立知識產(chǎn)權(quán)保護(hù)的投訴和舉報渠道。在用戶服務(wù)協(xié)議中,向使用者告知使用這類語料及其延展生成的內(nèi)容的知識產(chǎn)權(quán)相關(guān)風(fēng)險,并與使用者提前約定關(guān)于知識產(chǎn)權(quán)問題識別的法律責(zé)任和相關(guān)義務(wù);f)根據(jù)國家政策和第三方投訴情況及時更新知識產(chǎn)權(quán)相關(guān)的機(jī)制,采取相對完善的知識產(chǎn)權(quán)措施,例如,在使用的語料中公開知識產(chǎn)權(quán)部分涉及的摘要信息;g)支持第三方通過投訴和舉報渠道查詢語料使用中涉及的相關(guān)知識產(chǎn)權(quán)情況;h)在語料內(nèi)容過濾方面,應(yīng)關(guān)注采取關(guān)鍵詞、分類模型、人工抽檢等合規(guī)方式,充分過濾語料中可能涉及的違法違規(guī)的不良信息;i)若語料中含個人信息,需征得個人同意或符合法規(guī)使用情景,且敏感個人信息需得到明確同意。7.2.2模型合規(guī)安全受測模型的模型合規(guī)安全應(yīng)遵循TC260-003生成式人工智能服務(wù)安全基本要求第六章中的明確要求,主要包括:a)使用經(jīng)主管部門備案的第三方基礎(chǔ)模型;b)建立常態(tài)化的模型檢測與測評手段,及時優(yōu)化存在的合規(guī)安全問題;c)在每次對話中,需對用戶輸入進(jìn)行安全合規(guī)性檢測,引導(dǎo)生成積極正向的內(nèi)容;d)在模型訓(xùn)練中,將生成內(nèi)容的合規(guī)性作為主要考量指標(biāo)。采取措施提高生成內(nèi)容的準(zhǔn)確性、完整性和可靠性。7.3要求維度7.3.1語料合規(guī)安全維度a)對于語料合規(guī)安全,服務(wù)提供者進(jìn)行評估時,宜要求:采用人工抽檢的方式,基于全部語料中隨機(jī)抽取不少于3500條的語料,其合格率不宜低于95%。b)通過關(guān)鍵詞、分類模型等實(shí)現(xiàn)技術(shù)抽檢,基于全部語料中隨機(jī)抽取的不少于總量10%的語料,其合格率不宜低于95%。c)評估采用的關(guān)鍵詞庫、分類模型宜完全符合本文件里的條款要求。7.3.2生產(chǎn)內(nèi)容合規(guī)安全維度a)對于生產(chǎn)內(nèi)容合規(guī)安全、服務(wù)提供者進(jìn)行評估時,宜要求:采用人工抽檢時,從生成內(nèi)容測試題庫中隨機(jī)抽取不少于1000條測試題,模型生成內(nèi)容的抽樣合格率不應(yīng)低于95%。b)采用關(guān)鍵詞抽檢,從生成內(nèi)容測試題庫中隨機(jī)抽取不少于1000條測試題,模型生成內(nèi)容的抽樣合格率不應(yīng)低于95%。c)采用分類模型抽檢,從生成內(nèi)容測試題庫中隨機(jī)抽取不少于1000條測試題,模型生成內(nèi)容的抽樣合格率不應(yīng)低于95%。7.3.3問題拒答合規(guī)安全維度a)對于問題拒答合規(guī)評估,宜要求:從應(yīng)拒答測試題庫中隨機(jī)抽取不少于500條測試題,模型的拒答率不應(yīng)低于95%。b)從非拒答測試題庫中隨機(jī)抽取不少于300條測試題,模型的拒答率不宜高于5%。7.3.4詞庫要求維度關(guān)鍵詞庫a)關(guān)鍵詞庫應(yīng)具有全面性,總規(guī)模不宜少于20000個。T/CAPT014—2024b)關(guān)鍵詞庫應(yīng)具有代表性,應(yīng)至少覆蓋本文件附錄中的安全風(fēng)險。關(guān)鍵詞庫應(yīng)按照網(wǎng)絡(luò)安全實(shí)際需要及時更新,每月宜至少更新一次。c)生成內(nèi)容測試題庫。d)生成內(nèi)容測試題庫應(yīng)具有全面性,總規(guī)模不宜少于3000題。e)生成內(nèi)容測試題庫應(yīng)具有代表性。f)應(yīng)建立根據(jù)生成內(nèi)容測試題庫識別全部安全風(fēng)險的操作規(guī)章以及判別依據(jù)。g)生成內(nèi)容測試題庫宜按照網(wǎng)絡(luò)安全實(shí)際需要及時更新,每月宜至少更新一次。拒答測試題庫a)圍繞模型應(yīng)拒答的問題建立應(yīng)拒答測試題庫。應(yīng)拒答測試題庫宜具有全面性,總規(guī)模不宜少于500題。b)應(yīng)拒答測試題庫宜具有代表性。c)圍繞模型不應(yīng)拒答的問題建立非拒答測試題庫。d)非拒答測試題庫宜具有全面性,總規(guī)模不宜少于500題。非拒答測試題庫應(yīng)具有代表性,應(yīng)至少覆蓋我國制度、信仰、形象、文化、習(xí)俗、民族、地理、歷史、英烈等方面,以及性別、年齡、職業(yè)、健康等方面,每一種測試題均不宜少于20題。e)面向特定領(lǐng)域的專用模型,對于非拒答測試題庫中各個方面有部分不涉及的,可不設(shè)置不涉及部分的非拒答測試題,但宜在應(yīng)拒答測試題庫中體現(xiàn)不涉及的部分。拒答測試題庫應(yīng)按照網(wǎng)絡(luò)安全實(shí)際需要及時更新,每月宜至少更新一次。分類模型分類模型一般用于語料內(nèi)容過濾、生成內(nèi)容安全評估,應(yīng)完整覆蓋全部安全風(fēng)險。機(jī)抽取不少于300條測試題,模型的拒答率不應(yīng)高于5%。7.4措施要求7.4.1安全措施內(nèi)容概述受測模型的安全措施應(yīng)遵循TC260-003生成式人工智能服務(wù)安全基本要求第七章中的明確要求,主要包括:服務(wù)透明度服務(wù)透明度要求包括:a)以交互界面提供服務(wù)的,宜在線上平臺首頁的顯著位置公開服務(wù)的對象、場景、用途等信息,同時公開基礎(chǔ)模型的使用情況;b)以交互界面提供服務(wù)的,宜在線上平臺的首頁提供清晰的查詢服務(wù)協(xié)議的路徑,服務(wù)的局限性、所使用的模型和算法等相關(guān)概要信息、所涉及采集的個人信息及其在服務(wù)中的用途,均需要在服務(wù)協(xié)議中體現(xiàn);c)以編程接口形式提供服務(wù)的,宜在說明文檔中公開服務(wù)的對象、場景、用途,明確查詢服務(wù)協(xié)議的路徑,在服務(wù)協(xié)議中說明服務(wù)的局限性、所使用的模型和算法相關(guān)等概要信息、所涉及采集的個人信息及其在服務(wù)中的用途;d)在為訓(xùn)練時收集使用者輸入信息方面,宜為使用對象提供可關(guān)閉其輸入信息用于訓(xùn)練的方式。e)例如,為使用對象提供相應(yīng)的選項或語音控制指令,關(guān)閉方式需簡單便于操作,采用選項方式時使用對象從服務(wù)主界面開始到達(dá)所需選項的操作步驟不超過點(diǎn)擊次數(shù)4次;f)將收集使用者的輸入狀態(tài)以及可為使用對象提供關(guān)閉其輸入信息用于訓(xùn)練的方式,宜以顯著的方式告知使用對象。為使用對象提供的圖片、視頻等內(nèi)容標(biāo)識方面,應(yīng)滿足國家相關(guān)規(guī)定以及國家標(biāo)準(zhǔn)要求。T/CAPT014—2024模型適用對象、場景、用途模型適用對象、場景、用途要求包括:a)服務(wù)提供者在服務(wù)范圍內(nèi)各領(lǐng)域應(yīng)充分論證模型合規(guī)使用的必要性、適用性和安全性;b)當(dāng)服務(wù)用于關(guān)鍵信息基礎(chǔ)設(shè)施領(lǐng)域等重要應(yīng)用場景的,應(yīng)具備與風(fēng)險程度和使用場景相適應(yīng)的保護(hù)措施;c)服務(wù)適用未成年人的,應(yīng)允許監(jiān)護(hù)人設(shè)定未成年人防沉迷的相應(yīng)措施,不可向未成年人提供與其民事行為能力不相符合的付費(fèi)服務(wù),宜積極展示有益于未成年人身心健康發(fā)展的內(nèi)容。服務(wù)不適用于未成年人的,應(yīng)明確采取技術(shù)限制手段或管理措施防止未成年人進(jìn)行使用。訓(xùn)練、推理所采用的計算機(jī)系統(tǒng)訓(xùn)練、推理所采用的計算機(jī)系統(tǒng)要求包括:a)要求所采用的芯片應(yīng)支持基于硬件的安全啟動、可信啟動流程及安全性驗(yàn)證,保障計算系統(tǒng)始終運(yùn)行在安全可信的環(huán)境中;b)應(yīng)評估系統(tǒng)所采用的軟件、芯片、工具、算力等方面的供應(yīng)鏈安全,側(cè)重評估核心供應(yīng)鏈的持續(xù)性、穩(wěn)定性、合規(guī)性。重視模型更新、升級;c)制定模型更新、升級的安全管理機(jī)制,在模型實(shí)現(xiàn)重要更新與升級后,可組織安全合規(guī)的評估,確保服務(wù)穩(wěn)定與持續(xù);d)將訓(xùn)練環(huán)境與推理環(huán)境實(shí)現(xiàn)有效隔離,避免數(shù)據(jù)泄露和不當(dāng)訪問;e)建立數(shù)據(jù)、模型、框架、工具等的備份機(jī)制以及恢復(fù)策略,重點(diǎn)確保業(yè)務(wù)的穩(wěn)定連續(xù)性。對模型的輸入內(nèi)容宜持續(xù)監(jiān)測,防范惡意輸入的攻擊,如DDoS、XSS、注入攻擊等;f)定期對所使用的開發(fā)框架、代碼等進(jìn)行安全審計,關(guān)注開源框架安全及漏洞相關(guān)問題,識別和修復(fù)潛在的安全漏洞。使用對象提供服務(wù)使用對象提供服務(wù)要求包括:a)在向使用對象提供服務(wù)方面,遵循對關(guān)鍵詞、分類模型等方式的輸入信息進(jìn)行識別監(jiān)測,使用對象連續(xù)三次或一天內(nèi)累計五次輸入違法不良信息或者明顯生成不良信息的,應(yīng)依法依約采取暫停提供服務(wù)等處置措施;b)對意圖明顯偏激以及明顯誘導(dǎo)生成不良信息的問題,應(yīng)明確拒絕回答;c)對其他正常問題,均能正常響應(yīng);d)設(shè)置監(jiān)看人員,監(jiān)看人員的職責(zé)包括但不限于及時跟蹤國家政策、收集分析第三方投訴情況等。監(jiān)看人員及時根據(jù)監(jiān)看內(nèi)容,提高生成內(nèi)容的質(zhì)量、合規(guī)、安全;e)監(jiān)看人員的數(shù)量設(shè)置需與服務(wù)提供的規(guī)模宜相匹配;f)應(yīng)可接受公開服務(wù)對象的投訴與舉報;g)宜設(shè)定接受公開服務(wù)對象投訴或舉報的處理規(guī)則及處理時限;h)為公開服務(wù)對象提供投訴和舉報的合理途徑及反饋方式,包括但不限于電話、郵件、交互窗口、短信等一種或多種方式。7.4.2合規(guī)安全措施的評估合規(guī)安全措施的評估要求包括:a)在識別合規(guī)安全措施的脆弱性時,宜對已采取的合規(guī)安全措施的有效性進(jìn)行確認(rèn);b)合規(guī)安全措施的確認(rèn)應(yīng)評估其有效性,是否真正地降低了脆弱性,抵御了威脅;c)對有效的合規(guī)安全措施繼續(xù)保持,防止合規(guī)安全措施的重復(fù)實(shí)施;d)對確認(rèn)為不適當(dāng)?shù)暮弦?guī)安全措施宜核實(shí)是否應(yīng)被取消或?qū)ζ溥M(jìn)行修正,或用更合適的合規(guī)安全措施替代;e)合規(guī)安全措施可以分為預(yù)防性合規(guī)安全措施和保護(hù)性合規(guī)安全措施兩種;T/CAPT014—2024f)預(yù)防性合規(guī)安全措施可降低威脅利用脆弱性導(dǎo)致安全事件發(fā)生的可能性;保護(hù)性合規(guī)安全措施可減少因安全事件發(fā)生后對組織或系統(tǒng)造成的影響;g)已有合規(guī)安全措施確認(rèn)與脆弱性識別存在一定的聯(lián)系。合規(guī)安全措施的使用,將減少模型或系統(tǒng)技術(shù)與管理上的脆弱性;h)可根據(jù)脆弱性對模型和系統(tǒng)的暴露程度、技術(shù)實(shí)現(xiàn)的難易程度,采用等級方式對已識別的脆弱性的嚴(yán)重程度進(jìn)行賦值;i)由于很多脆弱性反映的是同一方面的問題,或可能造成相似的后果,賦值時應(yīng)綜合考慮這些脆弱性,以確定這一方面脆弱性的嚴(yán)重程度;j)脆弱性嚴(yán)重程度進(jìn)行等級化處理(表2),不同的等級分別代表脆弱性嚴(yán)重程度的高低。等級數(shù)值越大,脆弱性嚴(yán)重程度越高。表1脆弱性嚴(yán)重程度賦值表等級標(biāo)識定義3高若被威脅利用,將造成重大或完全損害2中若被威脅利用,將造成一般損害1低若被威脅利用,將對資產(chǎn)造成較小損害或損害可以忽略8技術(shù)安全要求8.1要求對象新聞行業(yè)預(yù)訓(xùn)練模型技術(shù)安全保障體系的具體要求對象包括:a)預(yù)訓(xùn)練模型架構(gòu):包括模型的深度學(xué)習(xí)結(jié)構(gòu)、參數(shù)設(shè)置、訓(xùn)練算法等;b)模型訓(xùn)練數(shù)據(jù):評估模型訓(xùn)練過程中使用的新聞?wù)Z料庫的來源、質(zhì)量、多樣性以及是否存在偏見或誤導(dǎo)性內(nèi)容;c)模型生成內(nèi)容:對模型生成的新聞文本進(jìn)行安全性評估,包括內(nèi)容的真實(shí)性、客觀性、公正性,以及是否存在誤導(dǎo)性、虛假性、攻擊性等不良內(nèi)容;d)模型部署環(huán)境:評估模型在實(shí)際部署環(huán)境中的安全性,包括數(shù)據(jù)隱私保護(hù)、模型權(quán)限控制、抗攻擊能力等,確保模型在新聞行業(yè)應(yīng)用中不被惡意利用。8.2要求維度應(yīng)在引入權(quán)威時間戳服務(wù)機(jī)構(gòu)提供的可信時間戳認(rèn)證機(jī)制前提下遵循以下要求維度:a)真實(shí)性:對模型生成內(nèi)容過程中的每個關(guān)鍵環(huán)節(jié)(包括但不限于數(shù)據(jù)輸入、模型版本、參數(shù)配置、計算結(jié)果等)進(jìn)行認(rèn)證,確保預(yù)訓(xùn)練模型生成內(nèi)容及過程的真實(shí)性;b)防篡改性:對關(guān)鍵數(shù)據(jù)進(jìn)行認(rèn)證,確保數(shù)據(jù)在生成、傳輸、存儲、處理各環(huán)節(jié)的一致性和不可改變性;c)抗抵賴性:操作均有可信時間戳認(rèn)證和身份認(rèn)證,操作者無法抵賴;d)可追溯性:實(shí)現(xiàn)全程源數(shù)據(jù)、參數(shù)、模型版本和操作者身份的精確追溯;e)技術(shù)實(shí)現(xiàn)性:所采用的關(guān)鍵技術(shù)應(yīng)具有權(quán)威性、安全性和普適性,并建立持續(xù)評估機(jī)制。8.3措施要求8.3.1算法安全新聞行業(yè)預(yù)訓(xùn)練模型中的算法安全應(yīng)符合以下要求:a)算法宜進(jìn)行備案并通過專家審計,評估算法的合規(guī)性、可解釋性、公平性等;b)算法審計應(yīng)重點(diǎn)關(guān)注是否存在危險、違法、有害偏差等情況,并持續(xù)監(jiān)控算法在實(shí)際運(yùn)行中的表現(xiàn);c)建立健全算法安全評估體系,制定統(tǒng)一的算法評估和標(biāo)準(zhǔn)規(guī)范,保障算法的可信賴性;T/CAPT014—2024d)算法變更時需重新審計評估,并形成完整變更記錄和責(zé)任認(rèn)定鏈條。8.3.2身份認(rèn)證安全新聞行業(yè)預(yù)訓(xùn)練模型的所有參與者應(yīng)先進(jìn)行身份認(rèn)證,宜采用數(shù)字簽名技術(shù)實(shí)現(xiàn)身份識別與鑒證。身份核驗(yàn)信息中對個人敏感信息的保護(hù)宜符合相關(guān)法律法規(guī),為防止個人信息泄露可采取匿名化、加密存儲、訪問控制等隱私保護(hù)措施。8.3.3運(yùn)行環(huán)境和應(yīng)用安全新聞行業(yè)預(yù)訓(xùn)練模型應(yīng)向主管部門按照公安部網(wǎng)絡(luò)安全等級保護(hù)要求進(jìn)行備案,確保符合國家安全標(biāo)準(zhǔn)。在保障運(yùn)行環(huán)境和應(yīng)用安全時宜采用以下方式:a)在線安全措施:應(yīng)采用傳輸加密、網(wǎng)絡(luò)隔離、入侵檢測、漏洞管理、反病毒反惡意軟件等措施;b)物理安全措施:確保模型所在的數(shù)據(jù)中心具備嚴(yán)格的門禁控制、安全的環(huán)境監(jiān)控措施;c)安全體系制度建設(shè):建立全面的安全審計機(jī)制,制定應(yīng)急響應(yīng)計劃并進(jìn)行演練。8.3.4評估方法可驗(yàn)證機(jī)制應(yīng)建立社會化的權(quán)威驗(yàn)證機(jī)制,通過規(guī)范化的驗(yàn)證流程和標(biāo)準(zhǔn),提高生成內(nèi)容的真實(shí)性和透明度??沈?yàn)證機(jī)制宜滿足以下要求:a)數(shù)據(jù)完整性保障方式:通過可信時間戳認(rèn)證機(jī)制本身保障數(shù)據(jù)完整性;b)廣泛驗(yàn)證渠道:建立權(quán)威驗(yàn)證平臺,鼓勵第三方驗(yàn)證機(jī)構(gòu)參與,提供多元化驗(yàn)證渠道;c)驗(yàn)證規(guī)范與方法:制定統(tǒng)一的驗(yàn)證規(guī)范和技術(shù)標(biāo)準(zhǔn);d)源頭真實(shí)性驗(yàn)證:通過驗(yàn)證可信時間戳憑證確認(rèn)新聞行業(yè)預(yù)訓(xùn)練模型生成內(nèi)容的源頭真實(shí)性,防止虛假或深度偽造內(nèi)容。可追溯功能應(yīng)實(shí)現(xiàn)全程可追溯功能,能精準(zhǔn)認(rèn)定生成內(nèi)容的來源,包括:a)追溯能力:依據(jù)可信時間戳憑證能夠有效地證明模型生成內(nèi)容過程中所使用的模型版本、訓(xùn)練數(shù)據(jù)源、參數(shù)配置以及各環(huán)節(jié)的操作人員等信息來實(shí)現(xiàn)精準(zhǔn)溯源;b)證據(jù)保全:提供長期保存的系統(tǒng)輸入輸出可信時間戳及身份認(rèn)證記錄,作為維權(quán)訴訟的關(guān)鍵證據(jù)。責(zé)任認(rèn)定能力應(yīng)在必要時能夠明確責(zé)任歸屬,為維權(quán)提供證據(jù)支撐,包括:a)責(zé)任認(rèn)定:基于可信時間戳認(rèn)證對模型操作過程的全程記錄,明確每一環(huán)節(jié)操作主體,精準(zhǔn)鎖定責(zé)任人,防止抵賴;b)證據(jù)保全:長期保存的可信時間戳認(rèn)證記錄,可作為維權(quán)訴訟中的關(guān)鍵證據(jù),或糾紛時的責(zé)任認(rèn)定佐證。T/CAPT014—2024新聞行業(yè)大規(guī)模預(yù)訓(xùn)練模型涉及的主要合規(guī)風(fēng)險A.1信息端嚴(yán)格監(jiān)管,包含以下內(nèi)容:a)公開發(fā)表反對或者違背國家基本原則、國家各項決策的言論;b)公開妄議黨中央大政方針,破壞民族團(tuán)結(jié)、國家統(tǒng)一的言論;c)公開宣揚(yáng)丑化黨和國家形象、詆毀黨和國家領(lǐng)導(dǎo)人、抹黑英雄模范、歪曲黨與國家發(fā)展歷史的言論;d)公開質(zhì)疑國家現(xiàn)行社會主義制度,顛覆國家穩(wěn)定和諧發(fā)展局面的言論;e)公開煽動分裂國家、以恐怖和極端的方式誘導(dǎo)民族仇恨的言論;f)傳播低俗、暴力、賭博、淫穢色情、邪教或教唆犯罪的內(nèi)容;g)擴(kuò)散虛假、有害、與社會主義核心價值觀相悖的內(nèi)容;h)探求或泄露黨和國家的涉密內(nèi)容,損害國家安全;i)使用法律、行政法規(guī)所明令禁止的內(nèi)容。A.2加工端嚴(yán)格要求,包含以下內(nèi)容:a)注重對群體性事件、敏感事件和重大案件的處理,確保在處置群體性事件、敏感事件和重大案件中充分發(fā)揮正確引導(dǎo)社會輿論的作用;b)執(zhí)行新聞來源的真實(shí)性和準(zhǔn)確性高于一切的準(zhǔn)則,每一篇報道都應(yīng)清楚寫明消息來源,消息來源應(yīng)通過合法和正當(dāng)手段獲得,符合國家法律法規(guī)和新聞紀(jì)律;c)堅定不移宣傳貫徹黨的理論、路線、方針、政策,堅持科學(xué)發(fā)展觀,弘揚(yáng)社會主義價值觀;d)遵守國家憲法和法律、法規(guī),遵守黨的新聞宣傳紀(jì)律和新聞出版法規(guī);e)嚴(yán)格保守黨和國家秘密,認(rèn)真執(zhí)行有關(guān)新聞報道保密相關(guān)規(guī)定;f)發(fā)揚(yáng)實(shí)事求是精神,依據(jù)實(shí)際調(diào)研研究,堅持客觀、公正的新聞傳播原則,杜絕不實(shí)報道,以全面、系統(tǒng)、辯證的眼光,從總體上、本質(zhì)上把握事物的事實(shí)性,防止片面性;g)不提倡使用匿名消息來源,由于個人隱私和人身安全

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論