DB3302T 1163-2024 基層智治公共數(shù)據(jù)整合規(guī)范_第1頁
DB3302T 1163-2024 基層智治公共數(shù)據(jù)整合規(guī)范_第2頁
DB3302T 1163-2024 基層智治公共數(shù)據(jù)整合規(guī)范_第3頁
DB3302T 1163-2024 基層智治公共數(shù)據(jù)整合規(guī)范_第4頁
DB3302T 1163-2024 基層智治公共數(shù)據(jù)整合規(guī)范_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

3302Specificationforpublicdataintegrationofgrass-rootsintelligentgovernanceI本文件按照GB/T1.1—2020《標(biāo)準(zhǔn)化工作導(dǎo)則第1部分:標(biāo)準(zhǔn)化文件的結(jié)構(gòu)和起草規(guī)則》的規(guī)定1基層智治公共數(shù)據(jù)整合規(guī)范DB33/T2487公共數(shù)據(jù)安全體系建設(shè)DB3302/T1126—2021公4整合原則b)準(zhǔn)確性:通過動(dòng)態(tài)更新和錯(cuò)誤識別,使數(shù)據(jù)信息符合實(shí)際;d)一致性:整合前后數(shù)據(jù)信息內(nèi)容、含義無歧義;e)關(guān)聯(lián)性:多源數(shù)據(jù)之間建立對應(yīng)關(guān)系,相互關(guān)聯(lián)的數(shù)據(jù)信息內(nèi)容無矛盾。2包括數(shù)據(jù)歸集、數(shù)據(jù)處理、質(zhì)量控制、成果形成四個(gè)流程環(huán)節(jié)(人工采集數(shù)據(jù)加工數(shù)據(jù)回流數(shù)據(jù)人工采集數(shù)據(jù)加工數(shù)據(jù)數(shù)據(jù)歸集數(shù)據(jù)清洗數(shù)據(jù)完善物聯(lián)感知數(shù)據(jù)數(shù)據(jù)清洗數(shù)據(jù)完善數(shù)據(jù)處理數(shù)據(jù)關(guān)聯(lián)數(shù)據(jù)分類質(zhì)量控制成果形成3通過影像采集、AI識別、智能感知等設(shè)備終7.2.1.2人工采集數(shù)據(jù)應(yīng)以村(社區(qū))為單位進(jìn)行7.2.1.3對數(shù)據(jù)進(jìn)行排序算法,按照預(yù)定義的重復(fù)標(biāo)識規(guī)則進(jìn)行檢測和去重,對刪除數(shù)據(jù)進(jìn)行單獨(dú)備7.2.1.4對數(shù)據(jù)按照重要性等級進(jìn)行判斷,根據(jù)判斷結(jié)果和缺失比例制定規(guī)則進(jìn)行刪除或填充,對刪7.2.1.5用統(tǒng)計(jì)分析方法、簡單規(guī)則庫或不同屬性間的約束、外部數(shù)據(jù)進(jìn)行檢測、識別,修正錯(cuò)誤值7.2.1.6對多源數(shù)據(jù)進(jìn)行關(guān)聯(lián)性驗(yàn)證,調(diào)整、去除關(guān)聯(lián)數(shù)據(jù)間的矛盾內(nèi)容,并通過分析檢測,使數(shù)據(jù)7.2.1.7對包括但不限于時(shí)間、日期、數(shù)值等錯(cuò)誤顯示的格式進(jìn)行7.2.2.2應(yīng)對錯(cuò)項(xiàng)、空項(xiàng)數(shù)據(jù)進(jìn)行核7.2.2.3根據(jù)產(chǎn)權(quán)部門、更新時(shí)間、數(shù)據(jù)質(zhì)量等屬性,建立數(shù)據(jù)更新機(jī)制和多源數(shù)據(jù)的優(yōu)先為基本數(shù)據(jù),其他字段按照數(shù)源單位最新的更新時(shí)間為準(zhǔn),針對一數(shù)多源情況(如),對數(shù)據(jù)設(shè)置標(biāo)簽(見附錄A),并建立人房數(shù)據(jù)關(guān)聯(lián)、人地?cái)?shù)據(jù)關(guān)聯(lián)、人企數(shù)據(jù)關(guān)聯(lián)、房地?cái)?shù)據(jù)關(guān)47.3.1數(shù)據(jù)質(zhì)量應(yīng)按DB33027.3.2應(yīng)對數(shù)據(jù)實(shí)行動(dòng)態(tài)管理,實(shí)現(xiàn)回流、共享數(shù)據(jù)自動(dòng)更新。人工采集數(shù)據(jù)經(jīng)核實(shí)后手動(dòng)更新,并7.4.1應(yīng)形成數(shù)據(jù)庫及相應(yīng)數(shù)據(jù)元,整合過程相關(guān)記錄、文檔等整7.4.2數(shù)據(jù)元應(yīng)具備數(shù)據(jù)建模的可用7.4.3不同來源的相同數(shù)據(jù)元應(yīng)保持一致,并建立對應(yīng)關(guān)系(見附錄C)。51234567896h)08:共青團(tuán)工作,握到某個(gè)標(biāo)簽對應(yīng)樣本的本質(zhì)特征,從而達(dá)到分類的7a)分類定義:通過公司業(yè)務(wù)專家與技術(shù)專家積累的經(jīng)驗(yàn),將事件歸類;b)樣本打標(biāo):將十萬綜合治理線上數(shù)據(jù)打上對應(yīng)的分c)算法訓(xùn)練:對事先標(biāo)注好的樣本,逐條進(jìn)行hanlp分詞處理,并基于訓(xùn)練好的詞向量庫、自生成的one-hot等來表征每條樣本的特征張量。采用深度學(xué)習(xí)環(huán)神經(jīng)網(wǎng)絡(luò)建模,批量輸入樣本特征集,利用梯度下降法,不斷調(diào)整模型輸出的樣本預(yù)測分類的概率分布,期望模型預(yù)測分類的概率分布和樣本實(shí)際標(biāo)注分類的概率分布越相似越好,e)接口對接:將標(biāo)準(zhǔn)的算法接口授權(quán)給業(yè)務(wù)系統(tǒng),業(yè)務(wù)系統(tǒng)通過簡單對接后,即可調(diào)用,接口a)抽取數(shù)據(jù):以每月評估每個(gè)模型一次為例,每月初,隨機(jī)抽取上月的部分?jǐn)?shù)據(jù)。原則上每個(gè)b)實(shí)施人工標(biāo)注:針對每個(gè)模型的數(shù)據(jù)進(jìn)行專業(yè)實(shí)施打標(biāo),打標(biāo)過程中存在爭議的數(shù)據(jù),參考線上用戶標(biāo)注結(jié)果,由三個(gè)或三個(gè)以上實(shí)施人d

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論