




已閱讀5頁,還剩10頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
知識水壩(豆丁網(wǎng) pologoogle)為您傾心整理(下載 后雙擊刪除) 百度一下 知識水壩 研發(fā)項(xiàng)目結(jié)題報告 (上報集團(tuán)版) 項(xiàng)目 名稱 及編號 增值業(yè)務(wù)內(nèi)容監(jiān)測 2010_LH_38 主要研究單位及負(fù)責(zé)人(聯(lián)系方式) 其他研究單位及負(fù)責(zé)人(聯(lián)系方式) 是否集團(tuán)重點(diǎn) (是 /否 ) 否 是否聯(lián)合項(xiàng)目(是 /否) 是 項(xiàng)目經(jīng)費(fèi)(萬元) 200 萬 項(xiàng)目起止時間 2010年 1 月 2010 年 12 月 專業(yè)類別 數(shù)據(jù)業(yè)務(wù) 研究類別 其他 關(guān)鍵詞索引( 3 5個) 增值業(yè)務(wù) 文本監(jiān)測 圖片監(jiān)測 視頻監(jiān)測 該項(xiàng)目在研究單位內(nèi)部的評審結(jié)果 優(yōu)秀 該項(xiàng)目在 研究單位內(nèi)部的評審意見: 描述評審專家組對該項(xiàng)目在技術(shù)先進(jìn)性,創(chuàng)新性,取得的總體效益,可推廣性等方面的評價。 該 項(xiàng)目所研究的 增值業(yè)務(wù)內(nèi)容監(jiān)測 技術(shù) 能實(shí)現(xiàn)對增值業(yè)務(wù) 中 內(nèi)容 的 自動監(jiān)測 ,具有較高的識別準(zhǔn)確率, 研究成果在國內(nèi)處于領(lǐng)先水平; 其研究成果可應(yīng)用于 不同 的 增值業(yè)務(wù) 中(夢網(wǎng)短信、彩信、手機(jī)視頻等), 具體可 結(jié)合各 業(yè)務(wù) 的 處理邏輯及業(yè)務(wù)流程,形成不同的業(yè)務(wù)內(nèi)容 監(jiān)測與管理 方案, 保證業(yè)務(wù)內(nèi)容安全 ,并且 有利于提升內(nèi)容審核效 率以及節(jié)約人力成本 。 該項(xiàng)目的 研究成果屬于基礎(chǔ)性成果,可 推廣到許多增值業(yè)務(wù)中, 具有較好的可推廣性 。 項(xiàng)目的 簡介: 簡要描述該項(xiàng)目的目的和意義,解決的問題,取得的社會和經(jīng)濟(jì)效益等。 目的: 中國移動通信集團(tuán)已在現(xiàn)網(wǎng)上開展了眾多的自有 及合作類 數(shù)據(jù)增值業(yè)務(wù),包括短信、彩信、手機(jī)視頻等,該類業(yè)務(wù)中目前已經(jīng)出現(xiàn)了一些色情、反動等內(nèi)容,這些違規(guī)內(nèi)容既有個人用戶的行為,也有 SP為了商業(yè)利益的行為,違規(guī)內(nèi)容引起了用戶投訴以及相關(guān)監(jiān)管部門的高度關(guān)注,嚴(yán)重?fù)p害公司形象,因此需要對短信、彩信、視頻信息中的不良內(nèi)容進(jìn)行監(jiān)管。 目前尚沒有實(shí)際有效的增值業(yè)務(wù)內(nèi)容監(jiān)管技術(shù)手段,因此迫切需要重點(diǎn)研究增值業(yè)務(wù)內(nèi)容監(jiān)測技術(shù),對移動自有增值業(yè)務(wù)及夢 網(wǎng)業(yè)務(wù)的業(yè)務(wù)內(nèi)容進(jìn)行有效監(jiān)測,維護(hù)增值業(yè)務(wù)產(chǎn)業(yè)的健康發(fā)展。 意義: 知識水壩(豆丁網(wǎng) pologoogle)為您傾心整理(下載 后雙擊刪除) 百度一下 知識水壩 本項(xiàng)目研究成果的應(yīng)用,可達(dá)到對增值業(yè)務(wù)內(nèi)容的監(jiān)管,攔截色情、反動等不良內(nèi)容,有效的凈化移動增值業(yè)務(wù)的業(yè)務(wù)環(huán)境,減少社會不良影響。 本項(xiàng)目可為未來公司建設(shè)移動 增值業(yè)務(wù) 內(nèi)容監(jiān)管系統(tǒng)形成核心技術(shù)支撐,并為進(jìn)一步的新型網(wǎng)絡(luò)媒體內(nèi)容監(jiān)管體系的建設(shè)完成必要的技術(shù)探索與積累。 解決問題: 展開對于移動環(huán)境下的 短文本、低分辨小圖像、手機(jī)視頻等對象的特征分析、主題提取以及內(nèi)容分類技術(shù)的研究,從而突破移動環(huán)境下 增值業(yè)務(wù) 內(nèi)容的主題提取與內(nèi)容分類技術(shù),有效提 高其識別正確率并降低 誤判率,能初步滿足移動增值 業(yè)務(wù)的內(nèi)容監(jiān)管需求。 本項(xiàng)目研究針對 增值業(yè)務(wù) 的 內(nèi)容監(jiān)測技術(shù) ,具體包括文本、圖像及視頻內(nèi)容監(jiān)測技術(shù),項(xiàng)目 研究成果 能對 增值業(yè)務(wù)內(nèi)容 實(shí)施有效 監(jiān)管,攔截色情、反動等不良內(nèi)容, 具體可 應(yīng)用于夢網(wǎng)短信、彩信、手機(jī)視頻等業(yè)務(wù), 并 能根據(jù)不同增值業(yè)務(wù)的業(yè)務(wù)處理邏輯及業(yè)務(wù)流程,形成不同的業(yè)務(wù)內(nèi)容控制方案,確保各個增值業(yè)務(wù)的 內(nèi)容安全 。 社會和經(jīng)濟(jì)效益: 本研究成果 的應(yīng)用,能實(shí)現(xiàn)“綠色”移動 增值 服務(wù),促進(jìn)移動 增值 業(yè)務(wù)的健康快速發(fā)展,從而在維護(hù)社會穩(wěn)定、保護(hù)用戶身心健康、協(xié)助政府監(jiān)管方 面發(fā)揮巨大的作用。 本研究 成果能推廣到許多 增值 業(yè)務(wù)中,實(shí)現(xiàn)對不良 增值業(yè)務(wù) 內(nèi)容的自動監(jiān)測,能大大減少這些移動 增值業(yè)務(wù) 運(yùn)營人員的工作量,為企業(yè)節(jié)約人力資源投入,從而帶來較高的間接經(jīng)濟(jì)效益。針對不良內(nèi)容的審核工作 ,應(yīng)用本 成果后,可以省去 70%左右的人工審核工作量,相當(dāng)于節(jié)約 70%左右的審核時間,有利于節(jié)約人工成本,并保證內(nèi)容的快速發(fā)布。 對現(xiàn)有企業(yè)標(biāo)準(zhǔn)規(guī)范的符合度: 列舉該項(xiàng)目使用并符合的中國移動統(tǒng)一發(fā)布的企業(yè)標(biāo)準(zhǔn)的名稱和編號,描述該項(xiàng)目成果在現(xiàn)有的企業(yè)標(biāo)準(zhǔn)基礎(chǔ)上所需新增的功能要求(如業(yè)務(wù)流程的改變、設(shè)備 新增的功能要求等)。 中國移動通信互聯(lián)網(wǎng)短信網(wǎng)關(guān)接口協(xié)議 多媒體信息業(yè)務(wù) MMS總體技術(shù)要求 流媒體及音視頻下載業(yè)務(wù)平臺總體技術(shù)要求 該項(xiàng)目的專利情況: 沒有的話填“無”,有的話填寫專利名稱及申請?zhí)柣蚴跈?quán)號。 專利“一種不良視頻檢測的系統(tǒng)和方法”,正在申請中。 該項(xiàng)目研發(fā)存在的主要問題及今后的設(shè)想: 知識水壩(豆丁網(wǎng) pologoogle)為您傾心整理(下載 后雙擊刪除) 百度一下 知識水壩 主要問題: 目前,增值業(yè)務(wù)內(nèi)容監(jiān)測各子系統(tǒng)的處理性能還有待提高,另外對外接口還不夠豐富,將影響到對外部增值業(yè)務(wù)系統(tǒng)的接入及內(nèi)容監(jiān)測; 樣本庫數(shù)目較少,特別是缺少反動、暴力等內(nèi)容樣本。 今后設(shè)想: 進(jìn)一步開展 對于增值業(yè)務(wù)中文本、圖像及視頻內(nèi)容監(jiān)測算法的研究,提高識別正確率,降低誤判率; 進(jìn)一步擴(kuò)充樣本庫; 增加系統(tǒng)并行處理能力,從而提高系統(tǒng)的處理效率; 提供更為豐富的對外接口,增強(qiáng)系統(tǒng)的可擴(kuò)展性,可支持更多外部系統(tǒng)的接入。 項(xiàng)目研究成果的主體內(nèi)容( 3000 字以上 ,可附在表格后): 項(xiàng)目背景: 隨著現(xiàn)代移動通信技術(shù)快速發(fā)展,移動 增值 業(yè)務(wù)正廣泛的進(jìn)入人們?nèi)粘I钪小1姸嘁苿佣嗝襟w信息業(yè)務(wù)如短信、彩信、手機(jī)視頻等不斷的被開發(fā)和應(yīng)用于人們的工作和生活中,這些業(yè)務(wù)的應(yīng)用直接改善了人們的生活,促進(jìn)了社會的進(jìn)步。并且隨著 移動互聯(lián)網(wǎng)的崛起,在未來幾年內(nèi)移動 增值 業(yè)務(wù)的使用普及率和業(yè)務(wù)量都將出現(xiàn)跨越式的增長,但是一些不法分子也開始利用移動 增值 業(yè)務(wù)發(fā)布不良信息,其中色情信息、反動信息等危害極大。并且由于移動互聯(lián)網(wǎng)和互聯(lián)網(wǎng)具有媒體特征,和傳統(tǒng)媒體相比,它更具有開放性、廣泛性、滲透性、互動性、主動性,這些特征導(dǎo)致了在移動互聯(lián)網(wǎng)下色情、反動、違法等不良信息具有傳播快,范圍廣、危害大、可控性差等特點(diǎn)。 不良信息的存在給用戶與運(yùn)營商均帶來了不少的煩惱:不良信息被犯罪分子利用來進(jìn)行違法活動,破壞安定團(tuán)結(jié)的政治局面;用戶被不良信息恐嚇、騷擾、欺 詐;運(yùn)營商由于用戶錯誤的界定不良信息的來源而受到 用戶投訴,給運(yùn)營商辛苦建立的良好聲譽(yù)造成嚴(yán)重的影響。同時,不良 消息的傳播也危害了社會的和諧,對社會主義精神文明建設(shè)產(chǎn)生了很大沖擊。 傳統(tǒng)互聯(lián)網(wǎng)多媒體內(nèi)容監(jiān)管領(lǐng)域已有較好的技術(shù)及經(jīng)驗(yàn)積累。但由于移動多媒體內(nèi)容的一些特殊性,例如文本具有高離散型、圖像屬于低分辨率小尺寸圖像,視頻具有低碼率、高壓縮等特點(diǎn),要對這樣的 增值業(yè)務(wù) 內(nèi)容進(jìn)行分類和識別具有特殊性,在現(xiàn)實(shí)中尚缺少有效的移動 增值業(yè)務(wù) 內(nèi)容監(jiān)管技術(shù)和體系。因此 為控制不良信息的泛濫,迫切需要移動增值業(yè)務(wù) 內(nèi)容監(jiān)管技術(shù) ,用于 快速的監(jiān)控和攔截移動增值業(yè)務(wù)中存在的不良內(nèi)容 。 實(shí)現(xiàn)方案: 本項(xiàng)目 針對目前增值業(yè)務(wù)的主要內(nèi)容類型:文本、圖片、視頻進(jìn)行內(nèi)容監(jiān)測方法的基礎(chǔ)研究,形成在移動增值業(yè)務(wù)環(huán)境下有效的內(nèi)容監(jiān)測技術(shù)方案;探索將增值業(yè)務(wù)內(nèi)容監(jiān)測技術(shù)應(yīng)用于夢網(wǎng)短信、彩信、手知識水壩(豆丁網(wǎng) pologoogle)為您傾心整理(下載 后雙擊刪除) 百度一下 知識水壩 機(jī)視頻等業(yè)務(wù),能根據(jù)不同增值業(yè)務(wù)的業(yè)務(wù)處理邏輯及業(yè)務(wù)流程,形成不同的業(yè)務(wù)內(nèi)容控制方案,確保各個增值業(yè)務(wù)的 業(yè)務(wù)內(nèi)容安全 。 具體實(shí)現(xiàn)方案如下: 1、 文本內(nèi)容監(jiān)測 文本內(nèi)容監(jiān)測技術(shù)研究 文本表示及特征提取 文本的表示及其特征項(xiàng)的選取是文本識別的關(guān)鍵問題。通過將文本中選取出的特征詞進(jìn) 行量化來表示文本信息。將它們從一個無結(jié)構(gòu)的原始文本轉(zhuǎn)化為結(jié)構(gòu)化的計算機(jī)可以識別處理的信息,即對文本進(jìn)行科學(xué)的抽象,建立它的數(shù)學(xué)模型,用以描述和代替文本。使計算機(jī)能夠通過對這種模型的計算和操作來實(shí)現(xiàn)對文本的識別。 由于文本是非結(jié)構(gòu)化的數(shù)據(jù) ,要想從大量的文本中挖掘有用的信息就必須首先將文本轉(zhuǎn)化為可處理的結(jié)構(gòu)化形式。短信文本分類處理流程如下圖: ( 1) 預(yù)處理:將原始語料格式化為同一格式,便于后續(xù)的統(tǒng)一處理; ( 2) 索引:將文檔分解為基本處理單元,同時降低后續(xù)處理的開銷; ( 3) 統(tǒng)計:詞頻統(tǒng)計,項(xiàng)(單 詞、概念)與分類的相關(guān)概率; ( 4) 特征選?。簭奈臋n中抽取出反映文檔主題的特征; ( 5) 分類器:分類器的訓(xùn)練; ( 6) 評價:分類器的測試結(jié)果分析。 短信文本分類 研究 統(tǒng)計學(xué)習(xí)方法已經(jīng)成為了文本分類領(lǐng)域絕對的主流 ,同時實(shí)際表現(xiàn)良好。因此本項(xiàng)目選擇統(tǒng)計學(xué)習(xí)法中樸素貝葉斯算法進(jìn)行短信業(yè)務(wù)內(nèi)容的輔助識別。 貝葉斯算法關(guān)注的是文檔屬于某類別概率。文檔屬于某個類別的概率等于文檔中每個詞屬于該類別的概率的綜合表達(dá)式。而每個詞屬于該類別的概率又在一定程度 上 可以用這個詞在該類別訓(xùn)練文檔中出現(xiàn)的次數(shù)(詞頻信息 )來粗略估計,因而使得整個計算過程成為可行的。使用樸素貝葉斯算法時,在訓(xùn)練階段的主要任務(wù)就是估計這些值。 樸素貝葉斯算法公式: 設(shè)每個數(shù)據(jù)樣本用一個 n維特征向量來描述 n個屬性的值,即: X=x1, x2, xn,假定有 m個類,分別用 C1, C2,, Cm表示。給定一個未知的數(shù)據(jù)樣本 X(即沒有類標(biāo)號),若樸素貝葉斯分類法將未知的樣本 X分配給類 Ci,則一定是 P(Ci|X)P(Cj|X) 1 j m, j i 根據(jù)貝葉斯定理,由于 P(X)對于所有類為常數(shù),最大化后驗(yàn)概率 P(Ci|X)可轉(zhuǎn)化為最大化 先驗(yàn)概率P(X|Ci)P(Ci)。如果訓(xùn)練數(shù)據(jù)集有許多屬性和元組,計算 P(X|Ci)的開銷可能非常大,為此,通常假設(shè)各屬性的取值互相獨(dú)立,這樣 知識水壩(豆丁網(wǎng) pologoogle)為您傾心整理(下載 后雙擊刪除) 百度一下 知識水壩 先驗(yàn)概率 P(x1|Ci), P(x2|Ci), P(xn|Ci)可以從訓(xùn)練數(shù)據(jù)集求得。 根據(jù)此方法,對一個未知類別的樣本 X,可以先分別計算出 X屬于每一個類別 Ci的概率 P(X|Ci)P(Ci),然后選擇其中概率最大的類別作為其類別。 樸素貝葉斯算法成立的前提是各屬性之間互相獨(dú)立。當(dāng)數(shù)據(jù)集滿足這種獨(dú)立性假設(shè)時 ,分類的準(zhǔn)確度較高,否則可能較低。另外,該算法沒有分類規(guī) 則輸出。 夢網(wǎng)短信業(yè)務(wù)內(nèi)容監(jiān)測系統(tǒng) 技術(shù)框架 針對夢網(wǎng)短信內(nèi)容的監(jiān)測,主要分為內(nèi)容測試層、邏輯判斷層、結(jié)果輸出層三部分。 內(nèi)容測試層主要實(shí)現(xiàn)對自動撥測物理設(shè)備的管控,完成夢網(wǎng)短信業(yè)務(wù)內(nèi)容的測試。 邏輯判斷層根據(jù)以上研究的文本內(nèi)容監(jiān)測技術(shù)以及知識庫及判斷規(guī)則,篩選 出可能的違規(guī)業(yè)務(wù)。 結(jié)果輸出層主要實(shí)現(xiàn)測試結(jié)果的輸出及預(yù)警。 內(nèi)容測試層 夢網(wǎng)短信業(yè)務(wù)的撥測核心需要解決兩個問題:一是實(shí)現(xiàn)點(diǎn)播、訂購流程的匹配正確輸出測試結(jié)果,二是解決同一 SP 的業(yè)務(wù)測試結(jié)果相互干擾的問題。具 體處理流程如下: 1、業(yè)務(wù)撥測調(diào)度邏輯 撥測設(shè)備在測試同一 SP 的業(yè)務(wù)時,由于返回的短信端口號相同,因此很難進(jìn)行業(yè)務(wù)內(nèi)容的區(qū)分。為保證發(fā)送的指令和反饋的內(nèi)容一致,需要設(shè)計較長的保護(hù)時間。這樣不僅會影響撥測速度,而且容易產(chǎn)生同一 SP 間業(yè)務(wù)的交叉干擾。為解決此問題可采用如下測試方法:如撥測設(shè)備的端口數(shù)為 N,則按順序先測試第 1 家 SP 的第 1-第 N 項(xiàng)業(yè)務(wù),然后再測試第 2 家 SP 的第 1-第 N 項(xiàng)業(yè)務(wù),以此類推。確保同一端口測試同一 SP間的業(yè)務(wù)間隔時間最大化。下圖是以 4 端口設(shè)備的業(yè)務(wù)調(diào)度示意 : 知識水壩(豆丁網(wǎng) pologoogle)為您傾心整理(下載 后雙擊刪除) 百度一下 知識水壩 2、業(yè)務(wù)測試邏輯 根據(jù)從 SIMS系統(tǒng)導(dǎo)入的數(shù)據(jù),實(shí)現(xiàn)業(yè)務(wù)信息的關(guān)鍵信息判斷,確定最終的業(yè)務(wù)測試流程。 邏輯判斷層 由于合作伙伴內(nèi)容違規(guī)主要有以下四類,通過收集合法與非法業(yè)務(wù)內(nèi)容,建立訓(xùn)練集和違規(guī)規(guī)則知識庫,提高違規(guī)輔助識別的準(zhǔn)確率。 違規(guī)類型 違規(guī)原因 違規(guī)內(nèi)容判定特征 訓(xùn)練集 知識水壩(豆丁網(wǎng) pologoogle)為您傾心整理(下載 后雙擊刪除) 百度一下 知識水壩 業(yè)務(wù)內(nèi)容與申報不符 SP違規(guī)開展業(yè)務(wù) 下發(fā)內(nèi)容與申報內(nèi)容差異過大 分類合法業(yè)務(wù)訓(xùn)練集 進(jìn)行內(nèi)容違規(guī)誘導(dǎo) SP 通過誘導(dǎo)用戶多次點(diǎn)播和訂購業(yè)務(wù) 包含讓用戶回復(fù)數(shù)字、字母等 垃圾短信訓(xùn)練集 業(yè)務(wù)內(nèi)容更新不及時 SP 未按約定及時進(jìn)行內(nèi)容采編 SP 下發(fā)內(nèi)容 長時間為同一內(nèi)容 與上次測試特征相符 未及時提供服務(wù) SP服務(wù)系統(tǒng)故障 業(yè)務(wù)訂購 /點(diǎn)播后, SP未及時下發(fā)內(nèi)容信息 無下發(fā)消息 非法內(nèi)容 SP發(fā)送黃色、廣告信息等違法內(nèi)容 含有違規(guī)詞匯 垃圾短信訓(xùn)練集 結(jié)果輸出層 為確定違規(guī)內(nèi)容的及時處理,采用 WEB 的方式輸出異常的測結(jié)果,并通過短信方式進(jìn)行提醒。方便管理人員及時登錄系統(tǒng),對疑似違規(guī)行為進(jìn)行判定,暫停業(yè)務(wù)并通知 SP整改。 SP整改后,由系統(tǒng)再次進(jìn)行自動驗(yàn)證,經(jīng)管理人員核實(shí)后,完成違規(guī)處理。 2、 圖像 內(nèi)容監(jiān)測 對圖像內(nèi)容分析采取兩種檢測技術(shù)來進(jìn)行, 既色情 圖像 檢測技術(shù)和樣例檢測技術(shù)。通過以上這兩種技術(shù)可以對不良圖片進(jìn)行有效檢測。 色情 圖像 檢測技術(shù) 色情內(nèi)容檢測技術(shù)就是對待檢測的圖像提取其顏色空間模型與預(yù)先訓(xùn)練好的色情內(nèi)容模型進(jìn)行比對,以發(fā)現(xiàn)色情內(nèi)容。色情內(nèi)容檢測歸屬于圖像目標(biāo)識別問題,它的難點(diǎn)主要在于: 圖片拍攝時候不同的光照條件對檢測帶來不同程度的影響。 圖像分辨率及質(zhì)量對檢測有很大影響。 人體姿態(tài)的多樣性,人體部分被衣物等遮擋以及圖像可能只包含部分人體給檢測帶來難度。 在不同的顏色空間中,膚色范圍與其他物體顏色范圍的重疊性給膚色檢測增添難度。 針對 以上問題,我們采用如下技術(shù)進(jìn)行色情檢測: 改進(jìn)多膚色模型 色情檢測是建立在圖像中膚色域檢測的基礎(chǔ)上的,但是目前僅僅利用通用的膚色模型進(jìn)行膚色檢測并不能保證檢測的準(zhǔn)確性,我們提出了膚色模型的改進(jìn)方法,以提高膚色檢測的準(zhǔn)確性。 首先通過大量樣本統(tǒng)計建立非參數(shù)化膚色直方圖模型,然后通過高斯混合模型( GMM)建立參數(shù)化膚色模型。為了使膚色模型適應(yīng)光照條件的變化,我們采用二階 Markov 模型預(yù)測膚色直方圖的變化,并通過將原模型參數(shù)和預(yù)測的參數(shù)進(jìn)行線形組合實(shí)現(xiàn)均值向量和協(xié)方差矩陣的自適應(yīng),從而改進(jìn) GMM模型。 知識水壩(豆丁網(wǎng) pologoogle)為您傾心整理(下載 后雙擊刪除) 百度一下 知識水壩 進(jìn)行區(qū)域級膚色檢測 當(dāng)膚色域與背景顏色相近的時候,僅通過顏色信息很難將膚色域與背景分割開。因此,在孤立的膚色點(diǎn)檢測的基礎(chǔ)上,可以利用膚色點(diǎn)的位置信息進(jìn)一步改進(jìn)膚色檢測的結(jié)果。 通過提取如下低層特征并通過支持向量機(jī)分類器( SVM)建立色情圖像模型,包括整幅圖象的平均膚色概率;膚色域內(nèi)外的平均膚色概率;最大膚色域面積;最大膚色域的中心坐標(biāo);最大膚色域的二階行距,二階列矩和混合矩;擬和最大膚色域的橢圓的長軸,短軸,角度和面積。 同時擬建立基于特定身體部位的模型:為了進(jìn)一步區(qū)別人體部分裸露圖像和色情圖像,對人體關(guān)鍵 部位通過視覺關(guān)鍵詞技術(shù)建立模型,從而避免人體部分裸露圖像被大量誤檢為色情圖像。 分級檢測機(jī)制 分級檢測機(jī)制主要是為了提高色情圖像檢測的速度,擬按照如下分級方案檢測色情圖像: 1.通過膚色點(diǎn)占整幅圖像的比例做預(yù)過濾,這樣可以過濾掉大量易檢測的非色情圖像。 2.通過基于膚色域的色情圖像模型檢測 1中被懷疑為色情的圖像,進(jìn)一步過濾非色情圖像。 3.通過基于特定身體部位的模型進(jìn)一步檢測經(jīng)過步驟 2后被懷疑為色情圖像,作為最終判斷。 其 樣例檢測技術(shù) 圖像樣例檢測最終歸結(jié)為圖像特征匹配的問題,為了抵抗各種針對圖像畫面的 攻擊,我們提出基于視覺不變量特征的樣例檢測技術(shù)。 視覺不變量特征提取 SIFT 特征是目前最有代表性的視覺不變量特征,是一種圖像局部特征描述算子。 SIFT 特征對于圖像的尺度變化、仿射變化、光照變化、圖旋轉(zhuǎn)、噪聲等都表現(xiàn)出較好的魯棒性,因而能對發(fā)生幾何形變、退化、受噪聲干擾的圖像局部特征進(jìn)行準(zhǔn)確的匹配。 目前 SIFT算法對每幅圖像會檢測成百上千的特征點(diǎn),這嚴(yán)重影響了 SIFT特征提取與匹配的速度;而且許多特征點(diǎn)來自背景區(qū)域,容易帶來噪聲信息,影響匹配精度,實(shí)際有用的 SIFT 特征點(diǎn)一般來自前景區(qū)域。 為了解決上述問 題,我們采用注意力模型對 SIFT 特征點(diǎn)進(jìn)行過濾,有效去除背景特征點(diǎn),提高圖像匹配的精度和速度?;谧⒁饬δP偷?SIFT特征點(diǎn)過濾方法的流程是:首先采用 SIFT 算法得到全部特征點(diǎn),然后采用注意力模型得到顯著區(qū)域,最后基于顯著區(qū)域信息進(jìn)行特征點(diǎn)過濾。 建立高維數(shù)據(jù)索引 為了提高 SIFT視覺不變量特征的匹配速度,我們采用 R*樹高維索引結(jié)構(gòu)來表示 SIFT 視覺不變量特征。 在這種高維索引結(jié)構(gòu)的支持了,能夠?qū)崿F(xiàn)大容量樣例的快速匹配。 分級匹配策略 為了進(jìn)一步提高圖像特征的匹配速度,在保證準(zhǔn)確度的前提下,我們采用分級匹配 策略:第一級用全局的顏色特征進(jìn)行粗匹配,第二級采用 SIFT視覺不變量特征進(jìn)行精細(xì)匹配。 利用分級匹配策略,可以顯著加快匹配速度,并且可以容忍各種常見的畫面攻擊方式。 知識水壩(豆丁網(wǎng) pologoogle)為您傾心整理(下載 后雙擊刪除) 百度一下 知識水壩 圖像監(jiān)測流程 已知圖像監(jiān)測流程 1. 系統(tǒng)在進(jìn)行初始化時,先產(chǎn)生特征值比對結(jié)構(gòu); 2. 系統(tǒng)不斷的讀取已知圖像庫中的圖像,根據(jù)特征值提取算法,將圖像的特征值提取出來; 3. 在提取出特征值后,將特征值存入特征值比對結(jié)構(gòu)中; 4. 當(dāng)系統(tǒng)接收到待監(jiān)控的圖像時,采用同樣的特征值提取算法,將待監(jiān)控圖像的特征值提取出來; 5. 系統(tǒng)將此特征值送入特征值比對結(jié)構(gòu)中進(jìn)行比對; 6. 如 命中特征值,就會得知此圖像是否為垃圾圖像,如果該圖像具有垃圾屬性則被監(jiān)管,否則將準(zhǔn)確認(rèn)定其為正常圖像; 未知圖像監(jiān)測流程 知識水壩(豆丁網(wǎng) pologoogle)為您傾心整理(下載 后雙擊刪除) 百度一下 知識水壩 1. 系統(tǒng)在進(jìn)行初始化時,先產(chǎn)生圖像識別結(jié)構(gòu); 2. 系統(tǒng)不斷的讀取訓(xùn)練樣本庫中的圖像,根據(jù)智能分析算法,將訓(xùn)練結(jié)果存入圖像識別結(jié)構(gòu)中; 3. 在進(jìn)行圖像識別時,只需將圖像送入圖像識別結(jié)構(gòu)中,即可提出此圖像的可疑度,可根據(jù)配置,將可疑度超過指定門限的圖像加入到疑似庫中; 4. 在進(jìn)行人工仲裁時,首先由管理員將指定疑似圖像查詢出來,然后進(jìn)行人工仲裁,以確定 此圖像最終的類別; 5. 當(dāng)判斷為垃圾圖像后,可將此圖像加入到已知圖像庫垃圾圖像中; 6. 經(jīng)仲裁后,無論是非法圖像還是正常圖像,都可以將此圖像加入到訓(xùn)練樣本庫中,然后使其進(jìn)行反饋學(xué)習(xí),從而不斷提高智能分析的準(zhǔn)確度。 不良彩信監(jiān)控系統(tǒng) 基于本項(xiàng)目研究的圖像監(jiān)測技術(shù),實(shí)現(xiàn)了一套不良彩信監(jiān)控系統(tǒng),它能夠?qū)崿F(xiàn)自動接收下發(fā)的審計策略,對 彩信 數(shù)據(jù)進(jìn)行實(shí)時審計,對有害彩信進(jìn)行智能分類,上報審計日志。管理服務(wù)器負(fù)責(zé)審計策略下發(fā)、數(shù)據(jù)收集與查詢,同時對收集的數(shù)據(jù)進(jìn)行統(tǒng)計與分析。不良彩信監(jiān)控系統(tǒng)詳細(xì)的功能描述如下: 知識水壩(豆丁網(wǎng) pologoogle)為您傾心整理(下載 后雙擊刪除) 百度一下 知識水壩 3、 視頻 內(nèi)容 監(jiān)測 基于圖像的視頻內(nèi)容監(jiān)測技術(shù) 基于圖像的視頻內(nèi)容監(jiān)測技術(shù)是基于色情圖像監(jiān)測 算法 ( 根據(jù)對色情圖片的分析, 包括 皮膚區(qū)域的暴露程度、 人臉識別、特征 區(qū)域 及 形狀 作為 重要的判定信息 ) ,結(jié)合視頻的 時域 特征進(jìn)行設(shè)計的。首先,在離線的狀態(tài)下,對已有視頻庫中的視頻進(jìn)行結(jié)構(gòu)化分析,拆分提取視頻關(guān)鍵幀,通過關(guān)鍵幀的幀間信息分析從而完成對鏡頭的分割。根據(jù)對鏡頭間的關(guān)聯(lián)性分析,特別是背景的相似性分析,獲得對視頻場景的分割,最終通過結(jié)構(gòu)化分析匯總得到視頻結(jié)構(gòu)樹信息。在每一層分析時,完成對該層的建模,為分析決策提供依據(jù)。 在實(shí)時檢測時 ,同樣對輸入視頻進(jìn)行拆幀、鏡頭分割、場景提取和結(jié)構(gòu)化操作,并將獲得的結(jié)果分別與相應(yīng)層的模型進(jìn)行分析決策,并按照結(jié)構(gòu)粒度從小到大的優(yōu)先順序提交決策結(jié)果,從而保證決策的精度和實(shí)時性。 知識水壩(豆丁網(wǎng) pologoogle)為您傾心整理(下載 后雙擊刪除) 百度一下 知識水壩 不 良 視 頻視 頻 幀鏡 頭場 景拆 幀鏡 頭 分 割場 景 提 取視 頻 結(jié) 構(gòu) 樹結(jié) 構(gòu) 化模 型模 型模 型模 型分 析 決 策分 析 決 策分 析 決 策分 析 決 策視 頻 幀實(shí) 時 視 頻鏡 頭場 景拆 幀鏡 頭 分 割場 景 提 取視 頻 結(jié) 構(gòu) 樹結(jié) 構(gòu) 化判 定 輸 出離 線 數(shù) 據(jù) 庫視頻拷貝檢測技術(shù) 對于反動、暴力類視頻采用視頻拷貝檢測算法, 基于內(nèi)容的視頻拷貝檢測是根據(jù)視頻自身的內(nèi)容信息,通過測量從參考視頻和測試視頻中提取的唯一標(biāo)識視頻內(nèi)容的特征序列之間的距離值來判斷測試視頻是否是參考視頻的一個拷貝, 容許適度的信號特征畸 變,例如圖像尺寸與清晰度變化,幀率變化等。 一般來說,基于內(nèi)容的視頻拷貝檢測主要包括三個過程:鏡頭分割、關(guān)鍵幀提取、特征值比較。 該技術(shù)需要建立不良視頻特征庫,其過程如下: 視頻關(guān)鍵幀的抽取。對視頻每隔單位時間進(jìn)行一次關(guān)鍵幀的抽取,并記錄下相應(yīng)的時間軸信息。 關(guān)鍵幀的特征向量形成。將每一關(guān)鍵幀等分成 4*4塊,對每一塊分別計算其平均亮度特征,然后計算相鄰塊之間的灰度排序特征。通過結(jié)合關(guān)鍵幀的時間軸信息,就能得到每一關(guān)鍵幀的十七維特征向量信息。 不良視頻庫到不良特征庫的映射。對每個不良視頻,通過哈希映射,將其所有 的關(guān)鍵幀的特征信息寫入到一個對應(yīng)的 .feature 文件中,這樣就形成了從不良視頻庫到不良特征庫的一一映射。 視頻內(nèi)容監(jiān)測基本流程 知識水壩(豆丁網(wǎng) pologoogle)為您傾心整理(下載 后雙擊刪除) 百度一下 知識水壩 ( 1)建立不良內(nèi)容視頻庫,根據(jù)內(nèi)容不同分類為色情視頻庫,反動視頻庫,暴力視頻庫。 ( 2)對需要識別的視頻先進(jìn)行拷貝檢測,看不良視頻庫中是否有和該視頻相似的副本。若有則直接返回該不良視頻庫的類別,作為待識別視頻的識別結(jié)果。 ( 3)若拷貝檢測沒有發(fā)現(xiàn)待識別視頻的副本,則再根據(jù)色情視頻識別算法對該視頻進(jìn)行識別。最終得出最后識別結(jié)果。 由以上介紹的方法得出的判定結(jié)果較之于傳統(tǒng)方法而言 ,存在兩大優(yōu)勢:準(zhǔn)確率高。以往的識別技術(shù)對色情視頻一方面單純用膚色檢測來判定視頻的色情程度,語義性較差,分割出的結(jié)果誤差大。另一方面對整個不良視頻識別上,此方法的擴(kuò)展性很強(qiáng),針對于新出現(xiàn)的不良視頻(包括暴力,反動)或色情視頻識別算法漏檢的視頻,可以把其加入到不良視頻庫中去,使得整個算法的準(zhǔn)確性不斷提高。 手機(jī)視頻內(nèi)容離線監(jiān)測系統(tǒng) 基于本項(xiàng)目研究的視頻監(jiān)測技術(shù),實(shí)現(xiàn)了一套手機(jī)視頻內(nèi)容離線監(jiān)控系統(tǒng),通過接入?yún)?shù)配置方式,它能夠訪問手機(jī)視頻內(nèi)容庫,實(shí)現(xiàn)對內(nèi)容庫中的內(nèi)容進(jìn)行自動監(jiān)測,并對不良視頻內(nèi)容進(jìn)行分類,提供 監(jiān)測信息統(tǒng)計及告警功能。另外,還提供視頻分類訓(xùn)練功能,用于建立不良視頻特征庫。 解決的問題: 文本監(jiān)測技術(shù) 重點(diǎn)研究文本表示及其特征 選取 、 基于 樸素貝葉斯算法 的分類,能有效提高對于短信息類的文本內(nèi)容的監(jiān)測準(zhǔn)確率 。 圖像監(jiān)測技術(shù)采用色情檢測技術(shù)和樣例檢測技術(shù),包括改進(jìn)多膚色模型,區(qū)域級膚色檢測, 分級檢測 機(jī)制以及 視覺不變量特征 ,分級匹配策略等,能 在圖像尺寸與清晰度變化 的 情況下, 仍能保證 圖像監(jiān)測準(zhǔn)確率 。 視頻監(jiān)測技術(shù) 在充分考慮傳統(tǒng)的基于圖像內(nèi)容識別的視頻內(nèi)容識別方法的基礎(chǔ)上,引入了不良視頻拷貝檢測技術(shù)。通過綜合兩方 面檢測結(jié)果,不僅可改善視頻內(nèi)容識別系統(tǒng)的檢測性能,同時提高了系統(tǒng)的檢測準(zhǔn)確性。 基于 本項(xiàng)目所研究 技術(shù)實(shí)現(xiàn)的 夢網(wǎng)短信業(yè)務(wù)內(nèi)容監(jiān)測系統(tǒng)、 不良彩信監(jiān)控系統(tǒng)以及 手機(jī)視頻內(nèi)容離線 監(jiān)控系統(tǒng),能有效的實(shí)現(xiàn)對于文本、圖像以及視頻內(nèi)容的監(jiān)測,本項(xiàng)目研究成果還能應(yīng)用到其他各個增值業(yè)務(wù)的內(nèi)容監(jiān)測中 。 知識水壩(豆丁網(wǎng) pologoogle)為您傾心整理(下載 后雙擊刪除) 百度一下 知識水壩 社會和經(jīng)濟(jì)效益: 增值業(yè)務(wù) 內(nèi)容監(jiān)管技術(shù)的應(yīng)用,能實(shí)現(xiàn)“綠色”移動多媒體服務(wù),促進(jìn)移動 增值 業(yè)務(wù)的健康快速發(fā)展,從而在維護(hù)社會穩(wěn)定、保護(hù)用戶身心健康、協(xié)助政府監(jiān)管方面發(fā)揮巨大的作用。 本研究成果能推廣到許多增值業(yè)務(wù)中,實(shí)現(xiàn)對不良增值 業(yè)務(wù)內(nèi)容的自動監(jiān)測,能大大減少這些移動增值業(yè)務(wù)運(yùn)營人員的工作量,為企業(yè)節(jié)約人力資源投入,從而帶來較高的間接經(jīng)濟(jì)效益。針對不良內(nèi)容的審核工作,應(yīng)用本成果后,可以省去 70%左右的人工審核工作量,相當(dāng)于節(jié)約 70%左右的審核時間,有利于節(jié)約人工成本,并保證內(nèi)容的快速發(fā)布。 具體應(yīng)用 效果: 四川公司 建設(shè)夢網(wǎng)業(yè)務(wù)內(nèi)容監(jiān)測系統(tǒng)后,使得夢網(wǎng)短信業(yè)務(wù)的撥測速度達(dá)到每小時 500項(xiàng)。同時,大大降低需要人工審核的任務(wù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 信息能力提升2.0教育管理教師研修計劃
- 八年級(上冊)英語小組合作學(xué)習(xí)計劃
- 河南省鄭州一中汝州實(shí)驗(yàn)中學(xué)2024年八上物理期末質(zhì)量跟蹤監(jiān)視試題含解析
- 西安電子科技大學(xué)長安學(xué)院《茶的制作與審評》2023-2024學(xué)年第一學(xué)期期末試卷
- 鹽城師范學(xué)院《運(yùn)動療法學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 國際品牌管理工作流程及他
- 黑龍江大慶市三站中學(xué)2024-2025學(xué)年八上數(shù)學(xué)期末復(fù)習(xí)檢測模擬試題含解析
- 江蘇省鹽城市東臺市七校2024年化學(xué)九上期末綜合測試試題含解析
- 婁底職業(yè)技術(shù)學(xué)院《臨床檢驗(yàn)設(shè)備與技術(shù)》2023-2024學(xué)年第一學(xué)期期末試卷
- 南通職業(yè)大學(xué)《視聽文化》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025年高考真題-英語(全國一卷) 含答案
- 頁巖氣儲層表征評價技術(shù)進(jìn)展及其未來發(fā)展趨勢分析
- 統(tǒng)編版高中政治必修三《政治與法治》期末復(fù)習(xí):選擇題刷題練習(xí)題(含答案解析)
- 2025-2030年中國線纜設(shè)備行業(yè)市場現(xiàn)狀供需分析及投資評估規(guī)劃分析研究報告
- 兒童情商課件
- 2025年湖北荊門市交通旅游投資集團(tuán)有限公司招聘筆試參考題庫含答案解析
- 食品產(chǎn)品溯源管理制度
- 2024年遼陽職業(yè)技術(shù)學(xué)院單招職業(yè)傾向性測試題庫附答案
- 護(hù)士思想政治教育
- 陜投集團(tuán)招聘真題2024
- 國家開放大學(xué)漢語言文學(xué)本科《古代詩歌散文專題》期末紙質(zhì)考試第三大題簡答題庫2025春期版
評論
0/150
提交評論