AI多媒體技術(shù)在內(nèi)容審核場(chǎng)景實(shí)踐探索-2024.07-33正式版_第1頁(yè)
AI多媒體技術(shù)在內(nèi)容審核場(chǎng)景實(shí)踐探索-2024.07-33正式版_第2頁(yè)
AI多媒體技術(shù)在內(nèi)容審核場(chǎng)景實(shí)踐探索-2024.07-33正式版_第3頁(yè)
AI多媒體技術(shù)在內(nèi)容審核場(chǎng)景實(shí)踐探索-2024.07-33正式版_第4頁(yè)
AI多媒體技術(shù)在內(nèi)容審核場(chǎng)景實(shí)踐探索-2024.07-33正式版_第5頁(yè)
已閱讀5頁(yè),還剩28頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

馬金龍趣丸科技(TT語(yǔ)音)個(gè)人介紹馬金龍多年媒體算法開(kāi)發(fā)經(jīng)驗(yàn),涉及音視頻圖像文本,負(fù)責(zé)過(guò)音頻前后端處理,弱網(wǎng)優(yōu)化,音視頻質(zhì)量提升,智能內(nèi)容安全審核“T網(wǎng)”,內(nèi)容理解“T悟”等大型項(xiàng)目。曾作為“靈聲訊”創(chuàng)始人,參與智能媒體技術(shù)自媒體運(yùn)營(yíng)和推廣。內(nèi)容審核目前現(xiàn)狀與挑戰(zhàn)AI多媒體技術(shù)實(shí)踐之路智能內(nèi)容審核平臺(tái)案例AIGC內(nèi)容風(fēng)控實(shí)踐未來(lái)展望1.內(nèi)容審核目前現(xiàn)狀與挑戰(zhàn)現(xiàn)狀?政府監(jiān)管越來(lái)越嚴(yán)?用戶內(nèi)容層出不窮?違規(guī)種類繁雜?AIGC內(nèi)容不可控挑戰(zhàn)?【實(shí)時(shí)性】需要緊跟政府管控要求?【準(zhǔn)確性】對(duì)花樣變體不漏殺不誤殺?【多樣性】違規(guī)種類需不同算法解決?【未知性】AIGC生成內(nèi)容不確定且存在知識(shí)“幻覺(jué)”2.AI多媒體技術(shù)實(shí)踐之路自建OR第三方?2.AI多媒體技術(shù)實(shí)踐之路自建優(yōu)勢(shì):可管可控極速響應(yīng)生態(tài)保障高效定制具備數(shù)據(jù)血源追蹤、問(wèn)題實(shí)時(shí)監(jiān)控、技術(shù)輔助運(yùn)營(yíng)等風(fēng)控能力針對(duì)安全,時(shí)效等方面推出高響應(yīng)審核,讓內(nèi)容審核安全高效通過(guò)機(jī)審結(jié)果多樣化處置、賬號(hào)違規(guī)處置等多種手段,保障平臺(tái)生態(tài)安全推出特殊時(shí)期/突發(fā)事件的相關(guān)定制化,快速響應(yīng)國(guó)家政府的緊急要求2.AI多媒體技術(shù)實(shí)踐之路T網(wǎng)是一個(gè)通過(guò)人工智能的算法打造一站式內(nèi)2.1語(yǔ)音識(shí)別2.2NLP文本審核容安全機(jī)器審核的平臺(tái),幫助公司審核團(tuán)隊(duì)實(shí)現(xiàn)語(yǔ)音,文本,圖像,小視頻等風(fēng)險(xiǎn)管控的能力。2.3多模態(tài)識(shí)別對(duì)于此項(xiàng)目的目的可總結(jié)如下:2.4音頻事件檢測(cè)?貫徹國(guó)家網(wǎng)信辦有關(guān)網(wǎng)絡(luò)內(nèi)容安全的各項(xiàng)規(guī)2.5小語(yǔ)種識(shí)別定2.6歌曲識(shí)別2.7聲紋識(shí)別?低成本高效率的加強(qiáng)內(nèi)容風(fēng)險(xiǎn)管控?構(gòu)建智能審核技術(shù)護(hù)城河,為公司內(nèi)容生態(tài)保駕護(hù)航2.8違規(guī)圖像識(shí)別?探索內(nèi)容審核新方法,踐行公司的社會(huì)責(zé)任ASR-技術(shù)方案技術(shù)目標(biāo)用戶產(chǎn)生的語(yǔ)音數(shù)據(jù)輸入模型,模型輸出該語(yǔ)音的文字內(nèi)容,以供下一環(huán)節(jié)NLP檢查是否包含違規(guī)詞,或違規(guī)內(nèi)容。模型總體邏輯使用深度學(xué)習(xí)模型Transformer/Conformer(如圖中SharedEncoder)提取輸入音頻中的特征使用解碼得到若干候選文本。圖1.網(wǎng)-ASR端對(duì)端方案2.1ASR架構(gòu)EfficientConformer?Convolutionneuralnetworks和transformersmodels組合?EfficientConformer設(shè)計(jì)?結(jié)合量化剪枝和蒸餾技術(shù),壓縮模型大小?提供和,支持高吞吐量識(shí)別圖2.網(wǎng)-ASR支持的功能圖3.ASR中Efficientconformer技術(shù)方案2.1ASR-效果圖4網(wǎng)-ASR優(yōu)化后的推理速度圖5.ASR測(cè)試報(bào)告(CER)和模型大小2.2NLP算法總體框架NLP算法模型:?Bert算法?算法?Fasttext算法?AIGC語(yǔ)料生成算法?文本表情復(fù)雜表示的多模態(tài)識(shí)別算法?關(guān)鍵詞挖掘算法圖6.T網(wǎng)總體框架2.2NLP內(nèi)容審核的困難與挑戰(zhàn)純文本審核面臨的問(wèn)題與挑戰(zhàn):我們的成功案例:?變體關(guān)鍵詞的多樣化?構(gòu)建變體關(guān)鍵詞挖掘系統(tǒng)?文字與表情包的結(jié)合的復(fù)雜表達(dá)?構(gòu)建文本表情字母多模態(tài)識(shí)別系統(tǒng)?文字與字母或字母縮寫(xiě)結(jié)合的復(fù)雜表達(dá)?特定場(chǎng)景語(yǔ)料不足與稀疏性?AIGC語(yǔ)料生成系統(tǒng)?特定關(guān)鍵詞詞的隱晦表達(dá)?異常關(guān)鍵詞大數(shù)據(jù)監(jiān)測(cè)系統(tǒng)?正常詞與關(guān)鍵詞相同,但不同上下文上語(yǔ)義不同?多層次語(yǔ)義分析系統(tǒng)2.2NLP內(nèi)容審核效果呈現(xiàn)違規(guī)標(biāo)簽精確率辱罵94.45%色情95.03%涉政91.31%廣告90.96%違禁92.98%圖7.關(guān)鍵詞挖掘示意圖圖8.文本審核效果2.2文本未成年人識(shí)別關(guān)鍵詞匹配分析框架,支持多種匹配方式、多種過(guò)濾條件,并支持自定義特殊標(biāo)記,及支持特定動(dòng)作行為,將未成年人識(shí)別實(shí)現(xiàn)模組化的流程分析。未成年識(shí)別精確率99%+;圖9.網(wǎng)文本未成年人審核技術(shù)框架多模態(tài)算法原理項(xiàng)目背景?單模態(tài)審核特征不全面,多模態(tài)結(jié)合語(yǔ)氣和語(yǔ)義信息可提高處罰有效率。?人工審核量級(jí)大,需要對(duì)不同類型的違規(guī)進(jìn)行靈活處置。建模算法?Transformer跨模態(tài)多頭注意力機(jī)制;?隨機(jī)森林;模態(tài)α模態(tài)β圖10.Transformer跨模態(tài)多頭注意力機(jī)制圖11.隨機(jī)森林多模態(tài)高準(zhǔn)召回模型指標(biāo)?多模態(tài)算法上線處罰有效率為99%+;?如右圖,每日占總機(jī)審違規(guī)樣本約17%;模型價(jià)值?提高對(duì)違規(guī)樣本的召回,減少單模態(tài)的漏召;?提供高準(zhǔn)標(biāo)簽運(yùn)用在靈活處置:a.提高處罰響應(yīng)速度;b.提升人工審核效率;圖12.多模態(tài)辱罵命中數(shù)量及占比聲音事件檢測(cè)(SoundEventDetection)檢測(cè)的聲音事件:?審核類?嬌喘,炸房,怒罵?普通標(biāo)簽BRaSS?背景音樂(lè)(BGM,B)?說(shuō)唱(Rap,Ra)?說(shuō)話(Speech,S)?唱歌(Sing,S)模型價(jià)值?完善對(duì)聲音類違規(guī)的審核能力。圖13.聲音事件檢測(cè)?音頻類型分流,降低后續(xù)模型成本。?語(yǔ)音直播趨勢(shì)分析。語(yǔ)種識(shí)別項(xiàng)目背景:線上特定語(yǔ)種管控方案流程:利用音頻預(yù)訓(xùn)練hubert模型的特征解析功能,結(jié)合TT語(yǔ)音線上直播數(shù)據(jù)和部分開(kāi)源數(shù)據(jù)集進(jìn)行模型fine-tune,從而針對(duì)特定語(yǔ)種等進(jìn)行識(shí)別。模型效果:針對(duì)特定語(yǔ)種的測(cè)試精準(zhǔn)率為97.58%。圖14.語(yǔ)種識(shí)別歌曲識(shí)別項(xiàng)目背景:線上歌曲(如劣跡藝人作品等)管控方案流程:將原始劣跡歌曲處理得到的指紋信息存儲(chǔ)于歌曲指紋庫(kù),用于進(jìn)行輸入歌曲片段的相似度比對(duì),并增添音頻文件分析接口用于分析完整歌曲。模型效果:針對(duì)劣跡藝人歌曲的識(shí)別精準(zhǔn)度為94.16%;圖15.歌曲識(shí)別聲紋識(shí)別項(xiàng)目背景:人物聲紋識(shí)別,針對(duì)特定的人物可以做具體管控方案流程:?VAD?ResNet34作為主干網(wǎng)絡(luò),利用線上業(yè)務(wù)數(shù)據(jù)和部分?模型效果和應(yīng)用:;圖16.聲紋識(shí)別涉黃圖像識(shí)別項(xiàng)目背景模型效果和應(yīng)用線上色情、性感類涉黃圖像識(shí)別?在TT語(yǔ)音下,機(jī)審攔截內(nèi)容識(shí)別準(zhǔn)確率為93.15%;?應(yīng)用于TT語(yǔ)音和AIGC圖片場(chǎng)景;方案流程?基于經(jīng)典ResNet50預(yù)訓(xùn)練模型結(jié)構(gòu),利用線上分支任務(wù)1違規(guī)粗粒度標(biāo)簽業(yè)務(wù)數(shù)據(jù)和部分開(kāi)源數(shù)據(jù)進(jìn)行微調(diào)訓(xùn)練;輸入圖片主干模型?同時(shí)考慮到標(biāo)注成本和線上標(biāo)簽數(shù)據(jù)形態(tài),結(jié)合多任務(wù)圖像識(shí)別算法更改模型結(jié)構(gòu)進(jìn)行學(xué)分支任務(wù)2違規(guī)細(xì)粒度標(biāo)簽習(xí),從而實(shí)現(xiàn)較為精準(zhǔn)地識(shí)別涉黃圖像;圖17.涉黃圖像識(shí)別3.智能內(nèi)容審核平臺(tái)案例架構(gòu)圖圖18.T網(wǎng)架構(gòu)圖智能內(nèi)容審核平臺(tái)案例流程圖圖19.T網(wǎng)審核流程圖智能內(nèi)容審核平臺(tái)微服務(wù)架構(gòu)entrancertpasrnlptranscode...共x種T網(wǎng)系統(tǒng)可靠性T網(wǎng)架構(gòu)處理能力?自研任務(wù)編排系統(tǒng)(AI中臺(tái)一部分),統(tǒng)一算力管理和容災(zāi)?拆分算法服務(wù),細(xì)粒度的算力伸縮和統(tǒng)一調(diào)度?支持多可用區(qū)部署?最大并發(fā)語(yǔ)音流可線性擴(kuò)展?Pod個(gè)數(shù)?微服務(wù)圖20.T網(wǎng)微服務(wù)架構(gòu)智能內(nèi)容審核平臺(tái)-多任務(wù)調(diào)度方案目的:實(shí)現(xiàn)可動(dòng)態(tài)配置的媒體算法加工流水線,滿足任意租戶的不同審核需求TTA-streamingsedasrnlp拉流算法層sedtranscode唱鴨B-streaming調(diào)度層asrBRassasrnlp...transcodenlp圖21.T網(wǎng)多任務(wù)調(diào)度方案智能內(nèi)容審核平臺(tái)T網(wǎng)管理后臺(tái)圖22.T網(wǎng)審核后臺(tái)智能內(nèi)容審核平臺(tái)-BI報(bào)表圖23.T網(wǎng)-BI報(bào)表展示AIGC內(nèi)容風(fēng)控實(shí)踐圖24.AIGC平臺(tái)AIGC內(nèi)容風(fēng)控實(shí)踐文生文攔截針對(duì)文生文場(chǎng)景,利用關(guān)鍵詞語(yǔ)義理解審核技術(shù),對(duì)輸入和輸出進(jìn)行審核圖25.AIGC-文生文審核AIGC內(nèi)容風(fēng)控實(shí)踐文生圖審核針對(duì)文生圖場(chǎng)景,利用AI圖像涉政&涉黃審核技術(shù),降低風(fēng)控風(fēng)險(xiǎn)??不合規(guī)

圖片?圖26.AIGC文生圖審核5.未來(lái)展望?利用LLM能力強(qiáng)化語(yǔ)義理解,提升審核準(zhǔn)確率和數(shù)據(jù)收集速度?用戶對(duì)抗下的精細(xì)化算法模型,強(qiáng)化多模態(tài)復(fù)雜任務(wù)決策?審核平臺(tái)的langchain+LLM工作流介入,打通輿情監(jiān)控到內(nèi)審決策全鏈路?AIGC內(nèi)容用傳統(tǒng)算法+AIGC方法做審核企業(yè)介紹趣丸科技成立于年,是一家集

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論