信息技術 生物特征樣本質量 第1部分:框架(征求意見稿)_第1頁
信息技術 生物特征樣本質量 第1部分:框架(征求意見稿)_第2頁
信息技術 生物特征樣本質量 第1部分:框架(征求意見稿)_第3頁
信息技術 生物特征樣本質量 第1部分:框架(征求意見稿)_第4頁
信息技術 生物特征樣本質量 第1部分:框架(征求意見稿)_第5頁
已閱讀5頁,還剩49頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

ICCSL71中華人民共和國國家標準GB/T33767.1—20XX/ISO/IEC29代替GB/T33767.1—2017在提交反饋意見時,請將您知道的相關專利連同支持性文件一并附上。布發(fā)布發(fā) 2規(guī)范性引用文件 3術語和定義 4縮略語 5符合性 6生物特征樣本質量準則 6.1參考模型 6.2質量層面:特性、保真度、效用 6.3質量度量數(shù)據(jù)的用例 7數(shù)據(jù)交換格式字段定義 7.1抽象描述 7.2XML編碼 107.3已標記二進制編碼 8質量評估算法結果的標準化交換 9規(guī)范化 10成對質量 11.1概述 11.2誤不匹配與丟棄方法 11.3誤匹配與丟棄方法 11.4DET與丟棄方法 1411.5樣本接受率或丟棄率 附錄A(資料性)生物特征質量記錄編碼示例 16附錄B(資料性)質量評估算法結果的標準化交換示例 17附錄C(資料性)基于效用的樣本系統(tǒng)質量得分的聚合過程 20附錄D(資料性)計算效用預測性能指標的示例代碼 22參考文獻 IGB/T33767.1—20XX/ISO/IECFDIS29794-1:2023本文件按照GB/T1.1—2020《標準化工作導則第1部分:標準化文件的結構和起草規(guī)則》的規(guī)定起草。本文件為GB/T33767《信息技術生物特征樣本質量》的第1部分。GB/T33767已經(jīng)發(fā)布了以下部分:——第1部分:框架;——第4部分:指紋圖像數(shù)據(jù);——第5部分:人臉圖像數(shù)據(jù);——第6部分:虹膜圖像數(shù)據(jù)。本文件代替GB/T33767.1—2017《信息技術生物特征樣本質量第1部分:框架》,與GB/T33767.1—2017相比,除結構調整和編輯性改動外,主要技術變化如下:a)在“范圍”的規(guī)定中增加了“質量得分的聚合方法”和“質量評估算法效率的評價方法”,并刪除了“規(guī)定了生物特征數(shù)據(jù)交換格式中質量數(shù)據(jù)字段的格式和位置”(見第1章,2017年版的第1章);b)在“規(guī)范性引用文件”中,增加了ISO/IEC2382-37和ISO/IEC39794-1,刪除了ISO/IEC19794-1:2006(見第2章,2017年版的第3章);c)增加了術語和定義“生物特征關聯(lián)特性”、“生物特征效用”、“誤不匹配與丟棄特性”、“誤匹配與丟棄特性”、“原生質量度量”、“質量評估算法”、“質量分量”、“質量度量”);d)刪除了術語和定義“生物特征登錄失敗”、“生物特征登錄失敗率”、“特征”、“非固有的”、“固有的”、“獲取失敗率”、“操作員”、“樣本”、“源”、“效用”(見2017年版的第4章);e)術語和定義“質量分數(shù)”更改為“質量得分”(見第3章,2017年版的第4章);f)增加了縮略語CDF、DET、FMR、QVID(見第4章g)刪除了縮略語BIR、XML(見2017年版的第5章h)刪除了“通用生物特征識別系統(tǒng)”(見2017年版的第6章);i)增加了質量度量數(shù)據(jù)的用例“以質量為導向的融合”(見6.3.8)、“通過質量得分減少工作量”(見6.3.10)、“從一系列生物特征樣本中選擇最佳樣本”(見6.3.11);j)“數(shù)據(jù)交換格式字段定義”中增加了“抽象描述”(見7.1),便于對“質量塊的結構”(見7.1.1)、“質量評估算法標識符塊”(見7.1.2)和“質量度量”(見7.1.3)的定義及表述;k)增加了“質量評估算法結果的規(guī)范化交換”(見第8章)、“成對質量”(見第10章)、“評估”(見第11章);l)增加了“生物特征質量記錄編碼示例”,替換“構建質量分數(shù)正則化數(shù)據(jù)集的過程”(見附錄A,2017年版的附錄A);m)增加了“計算效用預測性能指標的示例代碼”(見附錄D)。本文件等同采用ISO/IEC29794-1:20XX《信息技術生物特征樣本質量第1部分:框架》。本文件做了下列最小限度的編輯性改動:——增加了附加信息“注4:如果算法供應商在國內(nèi)生物特征識別注冊機構注冊,則使用GB/T28826.2分配質量評估算法相關的標識符”(見7.1.2)。本文件由全國信息技術標準化技術委員會(SAC/TC28)提出并歸口。GB/T33767.1—20XX/ISO/IECFDIS29794-1:2023本文件起草單位:。本文件主要起草人:。本文件及其所替代文件的歷次版本發(fā)布情況為:——2017年首次發(fā)布為GB/T33767.1—2017;——本次為第一次修訂。GB/T33767.1—20XX/ISO/IECFDIS29794-1:2023生物特征識別中的質量度量標準具有重要價值。本文件旨在為生物特征識別領域提供一個樣本質量度量框架,定義了質量得分的表達、解釋和交換方法,為生物特征樣本質量評估和評分提供了客觀和定量的依據(jù)。本文件為ISO/IEC19794系列、ISO/IEC39794系列和ISO/IEC19784-1等標準中生物特征樣本的質量塊數(shù)據(jù)表示和交換提供了規(guī)范和指導。GB/T33767《信息技術生物特征樣本質量》擬由15個部分構成:——第1部分:框架。目的在于確立生物特征樣本質量準則、質量度量的表達、解釋和交換,以及質量評估算法性能的評價方法;——第4部分:指紋圖像數(shù)據(jù)。目的在于規(guī)定指紋圖像質量指標定義及要求、質量分析方法和質量度量方法;——第5部分:人臉圖像數(shù)據(jù)。目的在于規(guī)定人臉圖像質量指標定義及要求、質量分析方法和質量度量方法;——第6部分:虹膜圖像數(shù)據(jù)。目的在于規(guī)定虹膜圖像質量指標定義和量化計算方法、虹膜圖像采集質量要求,以及質量數(shù)據(jù)記錄編碼形式;——第7部分:簽名/簽字時間序列數(shù)據(jù)。目的在于規(guī)定簽名/簽字時間序列數(shù)據(jù)質量指標定義及要求、質量分析方法和質量度量方法;——第8部分:指紋骨架數(shù)據(jù)。目的在于規(guī)定指紋骨架數(shù)據(jù)質量指標定義及要求、質量分析方法和質量度量方法;——第9部分:血管圖像數(shù)據(jù)。目的在于規(guī)定血管圖像質量指標定義及要求、質量分析方法和質量度量方法;——第10部分:手形輪廓數(shù)據(jù)。目的在于規(guī)定手形輪廓圖像質量指標定義及要求、質量分析方法和質量度量方法;——第11部分:簽名/簽字處理的動態(tài)數(shù)據(jù)。目的在于規(guī)定處理后的簽名/簽字的動態(tài)數(shù)據(jù)質量指標定義及要求、質量分析方法和質量度量方法;——第12部分:臉型特性數(shù)據(jù)。目的在于規(guī)定臉型特性數(shù)據(jù)質量指標定義及要求、質量分析方法和質量度量方法;——第13部分:聲紋數(shù)據(jù)。目的在于規(guī)定聲紋數(shù)據(jù)質量指標定義及要求、質量分析方法和質量度量方法;——第14部分:DNA數(shù)據(jù)。目的在于規(guī)定高通量測序產(chǎn)生的各種DNA數(shù)據(jù)質量指標定義及要求、質量分析方法和質量度量方法;——第15部分:掌紋圖像數(shù)據(jù)。目的在于規(guī)定掌紋圖像數(shù)據(jù)質量指標定義及要求、質量分析方法和質量度量方法;——第16部分:全身圖像數(shù)據(jù)。目的在于規(guī)定全身圖像數(shù)據(jù)質量指標定義及要求、質量分析方法和質量度量方法;——第17部分:步態(tài)圖像序列數(shù)據(jù)。目的在于規(guī)定步態(tài)圖像序列數(shù)據(jù)質量指標定義及要求、質量分析方法和質量度量方法。本文件還建立了一個評估框架,旨在促進評分工具的使用,這些工具不僅能夠鼓勵技術創(chuàng)新,還有助于增強生物特征識別系統(tǒng)的整體效能。雖然GB/T33767系列提出的質量評估和評分工具通常是可GB/T33767.1—20XX/ISO/IECFDIS29794-1:2023選的,但在特定應用配置或實現(xiàn)中可能被確定為必選。這一靈活性確保了標準的廣泛適用性,同時允許針對ISO/IEC19794系列和ISO/IEC39794系列規(guī)定的不同生物特征模式進行適當?shù)恼{整。本文件強調了質量度量與生物特征樣本之間的關聯(lián),這是質量度量標準化的重要組成部分。第7章中規(guī)定的質量字段被納入生物特征數(shù)據(jù)交換格式中,而CBEFF(公用生物特征識別交換格式框架)數(shù)據(jù)頭的使用則進一步豐富了質量度量的表現(xiàn)形式,即通過CBEFF_BDB_quality表示質量度量。生物特征樣本質量度量的使用益處較多。例如,在注冊階段提供實時質量反饋可以提高生物特征識別系統(tǒng)的運行效率。此外,質量度量還可以在比對過程中與其他樣本或參考數(shù)據(jù)結合,實現(xiàn)數(shù)據(jù)融合,以及在面對低質量樣本或呈現(xiàn)攻擊時增強系統(tǒng)的防御能力。通過本文件的應用,生物特征識別系統(tǒng)的設計者和使用者將能夠更有效地利用質量度量,從而對系統(tǒng)進行有效分析,識別潛在的問題,并發(fā)現(xiàn)改進性能的機會。1GB/T33767.1—20XX/ISO/IECFDIS29794-1:2023信息技術生物特征樣本質量第1部分:框架本文件根據(jù)需要為任一或所有生物特征樣本類型確立了以下內(nèi)容:a)在質量度量的規(guī)范和使用中用到的術語和定義;b)生物特征質量得分的目的和解釋;c)以質量評分規(guī)范化為目的而推進開發(fā)生物特征樣本數(shù)據(jù)集的動力;d)質量評估算法結果的交換格式;e)質量得分的聚合方法;f)質量評估算法效率的評價方法。本文件不包括以下內(nèi)容:a)規(guī)定樣本、模塊或系統(tǒng)質量得分的最低要求;b)質量評估算法的規(guī)范化;c)用于人工檢查的生物特征樣本或參考的效用評估。本文件適用于生物特征樣本質量度量的表達、解釋和交換,以及質量評估算法效率的評價和質量評估算法結果的交換,為各種生物特征樣本質量的規(guī)范化提供指導。2規(guī)范性引用文件下列文件中的內(nèi)容通過文中的規(guī)范性引用而構成本文件必不可少的條款。其中,注日期的引用文件,僅該日期對應的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。ISO/IEC2382-37信息技術詞匯第37部分:生物特征識別(Informationtechnology—Vocabulary—Part37:Biometrics)注:GB/T5271.37—2021信息技術詞匯第37部分:ISO/IEC19785-2信息技術公用生物特征識別交換格式框架第2部分:生物特征識別注冊機構(Informationtechnology—CommonBiometricExchangeFormatsFramework—Part2:Biometricregistrationauthority)ISO/IEC39794-1信息技術可擴展的生物特征識別數(shù)據(jù)交換格式第1部分:框架(Informationtechnology—Extensiblebiometricdatainterchangeformats—Part1:Framework)3術語和定義ISO/IEC2382-37、ISO/IEC39794-1界定的以及下列術語和定義適用于本文件。3.1獲取保真度acquisitionfidelity2GB/T33767.1—20XX/ISO/IECFDIS29794-1:2023在獲取過程中得到的生物特征樣本的保真度(3.8)。3.2生物特征關聯(lián)特性biometriccharacter與生物特征獲取過程中不受控的生物特征特性關聯(lián)的屬性。[來源:ISO/IEC2382-37:2022,37.09.15,有修改,刪除了注]3.3生物特征效用biometricutility生物特征樣本支持生物特征識別性能(3.11)的程度。注1:樣本來源的特性、經(jīng)過處理的生物特征樣本的保真度(3.8)以及生物特征樣本呈現(xiàn)的符合性,有助于生物[來源:ISO/IEC2382-37:2022,37.09.16]3.4環(huán)境environment采集生物特征發(fā)生的物理場景和條件。3.5誤不匹配與丟棄特性falsenon-matcherrorversusdiscardcharacteristicFNM-EDC通過量化丟棄低質量得分(3.16)樣本在改進(即降低)誤不匹配率方面的效率來評價質量評估算法(3.13)有效性的方法。注:誤不匹配與丟棄特性是質量評估算法性能(3.11)的圖形表示,其繪制了在固定比對決策閾值下誤不匹配率3.6誤匹配與丟棄特性falsematcherrorversusdiscardcharacteristicFM-EDC通過量化丟棄低質量得分(3.16)樣本在改進(即降低)誤匹配率方面的效率來評價質量評估算法(3.13)有效性的方法。注:誤匹配與丟棄特性是質量評估算法性能(3.11)的圖形表示,其繪制了在固定比對決策閾值下誤匹配率與丟3.7提取保真度extractionfidelity在生物特征項提取過程中得到的樣本的那部分保真度(3.8)。3.8保真度fidelity生物特征樣本所能表現(xiàn)其源生物特征特性的程度。3GB/T33767.1—20XX/ISO/IECFDIS29794-1:2023注:樣本的保真度包括多個組成部分,這些組成部分來源于一個或多個處理步驟:3.9解釋interpretation與其他數(shù)據(jù)一起分析質量得分(3.16)的過程,以給出該得分的上下文及相關含義。3.10原生質量度量nativequalitymeasure不受數(shù)據(jù)格式和/或值范圍限制的質量評估算法(3.13)的輸出。3.11性能performance對生物特征識別系統(tǒng)的誤匹配率、誤不匹配率、注冊失敗率、獲取失敗率、處理時間或吞吐率的評估結果。3.12質量quality生物特征樣本滿足其目標應用的指定要求的程度。[來源:ISO/IEC2382-37:2022,37.09.14]3.13質量評估算法qualityassessmentalgorithm質量算法qualityalgorithm計算質量度量(3.15)的算法。3.14質量分量qualitycomponent對可能有助于計算統(tǒng)一質量得分(3.16)的生物特征樣本的度量。注:表達質量分量的特征在ISO/IEC29794系列的具3.15質量度量qualitymeasure質量得分(3.16)或質量分量(3.14)。3.16質量得分qualityscore用以完成或實現(xiàn)比對決策的生物特征樣本的適應度值。[來源:ISO/IEC2382-37:2022,37.09.13]3.17質量得分規(guī)范化qualityscorenormalization為提高尺度和解釋(3.9)的一致性,對質量得分(3.16)的重新調節(jié)。4GB/T33767.1—20XX/ISO/IECFDIS29794-1:20233.18質量得分規(guī)范化數(shù)據(jù)集qualityscorenormalizationdatasetQSND以質量得分(3.16)標注的、用于質量得分規(guī)范化(3.17)的生物特征樣本的數(shù)據(jù)集。注:目標質量得分可能是基于使用相關樣本產(chǎn)生的性能(3.11)結果來分配,或者基于數(shù)據(jù)集獲取過程中記錄的3.19質量得分百分位數(shù)qualityscorepercentilerankQSPR在已標識的控制數(shù)據(jù)集中,低于指定質量得分的生物特征樣本質量得分(3.16)的百分位數(shù)。3.20原始質量得分rawqualityscore未被質量得分(3.16)創(chuàng)建者或接收者解釋(3.9)過的并且本質上不能單獨提供上下文信息的質量得分。4縮略語下列縮略語適用于本文件。BDB:生物特征數(shù)據(jù)塊(BiometricDataBlock)CBEFF:公用生物特征識別交換格式框架(CommonBiometricExchangeFormatsFramework)CDF:累計分布函數(shù)(CumulativeDistributionFunction)DET:檢測錯誤權衡(DetectionErrorTrade-off)FERET:面部圖像數(shù)據(jù)庫(FacialImageDatabasedevelopedbytheU.S.governmentinthe1990s)FMR:誤匹配率(FalseMatchRate)FNMR:誤不匹配率(FalseNon-MatchRate)QAID:質量評估算法標識符(QualityAssessmentAlgorithmIdentifier)QSND:質量得分規(guī)范化數(shù)據(jù)集(QualityScoreNormalizationDataset)QSPR:質量得分百分位數(shù)(QualityScorePercentileRank)QVID:質量評估算法供應商標識符(QualityAssessmentAlgorithmVendorIdentifier)5符合性如果生物特征樣本質量塊的結構和數(shù)據(jù)值符合第7章的格式要求,則應認為其符合本文件。語義符合性測試將在ISO/IEC29794系列的具體模態(tài)部分中處理,其中給出了符合性測試集(一組代表從差到好的各種質量的生物特征樣本)和通過參考實現(xiàn)獲得的相關質量得分。6生物特征樣本質量準則6.1參考模型5GB/T33767.1—20XX/ISO/IECFDIS29794-1:2023在生物特征識別中,術語“質量”用于描述生物特征樣本的幾個不同層面,這些層面有助于生物特征識別系統(tǒng)的整體性能。為了規(guī)范化,本文件定義了用于區(qū)分質量的不同層面的術語、定義和參考模型,見圖1。生物特征樣本的質量取決于其品質和保真度。質量(品質、保真度和效用)與系統(tǒng)性能之間的關系,見圖2。生物特征樣本的效用反映了該樣本對生物特征識別性能的影響。圖1質量參考模型圖解圖2質量和系統(tǒng)性能之間的關系6.2質量層面:品質、保真度、效用目前,根據(jù)上下文的不同,生物特征識別領域使用的術語“質量”有不同的含義。三種主要用法主觀上表達了以下含義:a)樣本的品質:基于樣本生物特征特性的固有屬性的質量表達。例如,磨損的摩擦脊品質較差,眼瞼下垂(眼皮下垂)導致虹膜品質較差;b)樣本對其生物特征特性的保真度:基于保真度的質量表達反映了樣本代表其生物特征特性的準確程度。樣本保真度是由在不同處理過程中起作用的保真度組成的;c)生物特征識別系統(tǒng)中樣本的效用:基于效用的質量表達反映了個體樣本對生物特征識別系統(tǒng)6GB/T33767.1—20XX/ISO/IECFDIS29794-1:2023整體性能預測的正面或負面影響。基于效用的質量取決于樣本或參考的品質和保真度,以及正在評估其性能的具體生物特征識別系統(tǒng)的細節(jié)。這意味著效用不一定是樣本在所有系統(tǒng)中具有一致的通用屬性。與僅基于品質或保真度的質量度量相比,基于效用的質量旨在更能預測系統(tǒng)性能(例如,在誤匹配率、誤不匹配率、注冊失敗率和獲取失敗率方面),見表1。術語“質量”并不僅僅取決于采集設備的特性,如采樣率、傳遞函數(shù)、方向性、靈敏度、動態(tài)范圍和位深、圖像分辨率、像素密度、像素尺寸或灰度/彩色位深,盡管這些因素會影響樣本效用并可能影響整體質量得分。所獲取樣本的品質和效用取決于特征項提取子系統(tǒng)生成的特征項。例如,同一指紋圖像的品質和效用可能在細節(jié)點識別方面很低(因為細節(jié)點太少),但在光譜模式識別方面卻很高。由于避免不同人群所表現(xiàn)的人口統(tǒng)計學差異對生物特征識別的所有應用至關重要,質量度量不宜基于與年齡、人種、性別、性特征、宗教或公認殘疾相關的表現(xiàn)進行衡量。出于這個原因,宜盡可能地描述質量度量,以便能夠識別具有潛在人口統(tǒng)計學差異的指標。表1對保真度、效用和品質之間關系的說明低高低保真度低且品質低導致效用較低。重新采集能提高效用。若條件允許,建議使用其他生物保真度高且品質低導致效用較低。重新采集不能提高效用。建議使用其他高品質高而保真度低的樣本通常效用不高。通過重新采集或信具有高品質和高保真度的樣本表明采集到了有用的樣本。預計這種樣本效6.3質量度量數(shù)據(jù)的用例6.3.1概述本文件將“效用”的定義限定為基于生物學特性和行為特性識別個體的自動化系統(tǒng)性能。用于人工檢查或法醫(yī)應用的生物特征樣本和參考的效用評估超出了本文件的范圍。6.3.2實時質量評估操作員、自動化系統(tǒng)或生物特征數(shù)據(jù)主體能使用生物特征樣本的實時質量評估和由此產(chǎn)生的質量度量,以幫助提高所采集的生物特征樣本的平均質量。這種反饋能用于手動或自動決策,以確定是否需要再次嘗試采集,或者確定接受樣本還是丟棄樣本,而不用于注冊或比對。在決定是否接受(或保留)樣本、丟棄樣本、重新嘗試采集或宣布獲取失敗或注冊失敗的情況下,通過協(xié)助操作員或增加自動質量控制系統(tǒng)為整體系統(tǒng)性能的改進提供了機會。質量度量數(shù)據(jù)能夠被保留,待以后使用,例如,用于確定在采集下一個樣本時是否宜替換注冊樣本。6.3.3在不同的應用中使用所獲取的生物特征樣本能夠用于包含幾種不同特征項提取和比對算法的多個應用中。在樣本獲取并評估其質量時,這些應用程序和算法可能是未知的。樣本的質量評估宜盡可能廣泛地預測各種用途和生物特征識別系統(tǒng)算法的效用。建立通用質量標準的第一個挑戰(zhàn)是定義一種度量,該度量要具有足夠的適應性,以便在具有不同效用指標的應用中與不同的比對算法配合使用。因此,一種質量評估算法可能只會對有限數(shù)量的生物特征識別系統(tǒng)產(chǎn)生預測效用的度量。計算和應用多個質量得分能提高對各種故障模式的可預測性。第二個挑戰(zhàn)是,比對算法從探針與參考的比對中產(chǎn)生得分,并受到每個探針和參考質量的影響。如果參考以聚合樣本或平均樣本的形式存在,或者是一個模型,則可能不一定為參考分配質量得分。7GB/T33767.1—20XX/ISO/IECFDIS29794-1:2023第三個挑戰(zhàn)是,參考數(shù)據(jù)庫通常是在各種策略驅動的約束(隱式或顯式)下策劃或創(chuàng)建的。例如,空白的指紋圖像或空白的細節(jié)點文件通常會從指紋數(shù)據(jù)庫中刪除。作為參考的面部圖像僅限于符合ISO/IEC39794-5:2019D.1要求的面部圖像。聲紋識別模型能夠使用特定的音頻采集通道開發(fā)。探針與參考比對的相似度得分會受到探針收集模仿參考收集的程度和管理策略的影響。因此,在開發(fā)質量評估算法時,有必要盡可能完整、清晰地闡明參考創(chuàng)建和管理過程的前提。例如,一種人臉圖像質量評估算法適用于符合ISO/IEC39794-5:2019D.1的全正面參考人臉圖像,而另一種人臉圖像質量評估算法適用于戶外人臉圖像。在產(chǎn)生原始生物特征樣本的采集設備和應用的背景下,算法特定的質量得分的可解釋性是有用的。在生成和應用質量得分的上下文中對其進行解釋的能力對于設置比對決策閾值(或識別閾值)尤為重要。6.3.4作為測量統(tǒng)計使用質量得分能用于監(jiān)控操作條件和過程。示例2:如果產(chǎn)生質量得分的生物特征樣本是從多個地點或不示例3:如果人臉圖像質量是在車輛管理部門的發(fā)證服務別質量低于平均水平的服務臺,或者在數(shù)周或6.3.5相關統(tǒng)計數(shù)據(jù)的積累可靠的質量得分能用于測評用戶和交易以積累統(tǒng)計數(shù)據(jù),這些統(tǒng)計數(shù)據(jù)給出諸如“給定手指A質量為X的樣本,從手指A(或手指B)得到質量為Y的樣本的可能性是多少”的條件概率。這將通知系統(tǒng)和/或操作員,如果嘗試再次采集,是否有可能獲得更高質量的樣本。6.3.6基于樣本的參考數(shù)據(jù)庫改進將質量度量與將進入?yún)⒖紨?shù)據(jù)庫的樣本關聯(lián)起來,對于維護和改進參考數(shù)據(jù)庫的效用是很重要的。對樣本質量度量的跟蹤可能發(fā)現(xiàn)操作者表現(xiàn)、環(huán)境條件或生物特征樣本采集設備性能變差。樣本質量度量的跟蹤宜作為生物特征識別系統(tǒng)操作規(guī)程的重要組成部分。通過替換或擴充來改進樣本參考數(shù)據(jù)庫,以使用最高質量的生物特征樣本。通常,替換決策與處理數(shù)據(jù)系統(tǒng)的比對器性能相關。6.3.7基于質量的條件處理生物特征樣本能夠根據(jù)質量度量進行不同的處理。特別是低質量的生物特征樣本會使用不同于高質量生物特征樣本的算法或閾值來處理。質量得分不宜用于呈現(xiàn)攻擊的檢測。對信號的操縱(例如,通過添加噪聲)可能會在生成威脅向量時影響質量。6.3.8以質量為導向的融合當應用多模態(tài)或多樣本生物特征融合時,樣本的相對質量能夠用于指導或增強融合過程。在多實例系統(tǒng)中,每個貢獻通道的權重能夠根據(jù)生物特征樣本的質量來確定。例如,在十指指紋識別系統(tǒng)中,預計小指的權重會更小。6.3.9不同系統(tǒng)質量度量的交換在不同系統(tǒng)之間進行規(guī)范化的質量度量交換,對于保持本地或遠程系統(tǒng)硬件和軟件組件的模塊化互換性,以及在發(fā)生這種交換時質量度量的完整性是有用的。8GB/T33767.1—20XX/ISO/IECFDIS29794-1:2023例如,通過使用規(guī)范化的質量度量交換,若更換某個組件,則該組件的質量度量使用者只需進行最低限度的修改即可。6.3.10通過質量得分減少工作量在大規(guī)模生物特征識別系統(tǒng)中,基于最近質量得分的智能搜索能減少生物特征辨識的計算量,從而減少交易時間。更準確地說,不同生物特征類型(人臉、虹膜和指紋)上表現(xiàn)出的質量得分的可變性能夠轉化為快速索引的優(yōu)勢。根據(jù)數(shù)據(jù)庫的大小和屬性,根據(jù)樣本質量的變化,能夠顯著減少每個生物特征特性的搜索空間?;谫|量的處理將提高效率,但由于所使用的質量評估算法可能失效,可能對整體識別精度產(chǎn)生不利影響。6.3.11從一系列生物特征樣本中選擇最佳樣本對于給定數(shù)據(jù)主體的一系列生物特征樣本,質量得分能用于選擇最佳樣本。當接收系統(tǒng)只需要一個樣本,而發(fā)送系統(tǒng)需要從幾個采集的樣本中決定傳輸哪個樣本時,這個操作是有用的。7數(shù)據(jù)交換格式字段定義7.1抽象描述7.1.1概述質量塊的結構見圖3。數(shù)據(jù)結構是為交換質量度量值而設計的。ISO/IEC29794系列的其他部分能夠使用該數(shù)據(jù)結構來編碼特定模式的質量分量(例如,指紋圖像中的細節(jié)點數(shù)量、所采集人臉的姿態(tài)角)。如果未嘗試進行質量評分,則不應存在質量塊。如果生物特征樣本有一個以上的質量度量,則應采用質量塊序列。圖3質量塊的結構7.1.2質量評估算法標識符塊抽象值:從1到65535的兩個整數(shù)的序列;9GB/T33767.1—20XX/ISO/IECFDIS29794-1:2023內(nèi)容:該數(shù)據(jù)元素應標識所使用的質量評估算法。應由兩個要素組成:——質量評估算法供應商標識符(QVID——質量評估算法標識符(QAID)。QVID應為根據(jù)ISO/IEC19785-2注冊的生物特征識別組織標識符之一。QAID應為與給定QVID相關聯(lián)的質量評估算法標識符之一。產(chǎn)生不同結果的質量評估算法的不同版本應分配不同的QAID,以允許唯一標識。注1:ISO/IEC19785-1:2020的7.1.6規(guī)定生物特征識別產(chǎn)品注2:使生物特征數(shù)據(jù)的接收者能夠區(qū)分由不同質量評估算法生成的質量度量,并且,如有必要,則在處理或分析過程中調整期間的差異。QVID和QAID的組合是一種能夠快速實施的解決方案,但只能實現(xiàn)部分質量得分規(guī)范化的目標。這種方法并不排除,而是補充了進一步標準化通用質量評分方法的工作(即本質上包含某種程度注3:ISO/IEC29794系列的其他部分規(guī)定了ISO/IEC29794序列該部分中定義的質注4:如果算法供應商在國內(nèi)生物特征識別注冊機構注冊,則使用GB/T28826.2分配質7.1.3質量度量(質量得分或質量分量)或差錯抽象值:0到100的整數(shù)或failureToAssess(評估失?。粌?nèi)容:質量度量應以0到100之間的整數(shù)嵌入質量塊中。如果質量評估算法的輸出是浮點數(shù)或在0到100的范圍之外,則應將其轉換(即縮放)到[0,100],并四舍五入到最接近的整數(shù),以便嵌入質量塊中。抽象值failureToAssess應表明質量評估算法失敗。質量得分可區(qū)分不同的性能水平。當與根據(jù)規(guī)定的收集策略形成的參考進行比對時,質量得分應預測性能指標,如誤匹配率和誤不匹配率。質量得分將質量分量統(tǒng)一為一個值,以整體的方式表示整個生物特征樣本的質量。質量得分值越高意味著生物特征效用越高。對于質量分量,此條件不一定適用。示例1:特定的人臉圖像質量評估算法能生成質量得分,以預測符合ISO/IEC39794-5:2019D.1的全正面人臉圖像質量得分可以是幾個質量分量的組合。例如,指紋圖像的質量得分能夠反映指紋的清晰度或摩擦脊均勻性,或者正確標識的細節(jié)點數(shù)量,以及其他分量。與較高的質量得分值不同,較高的質量分量值并不一定意味著較高的生物特征效用。為了預測性能,質量得分可對生物特征比對器和圖像或信號處理算法的已知故障模式/敏感度進行建模。為了實現(xiàn)某種通用性,質量得分宜基于一類系統(tǒng)(例如,基于細節(jié)點數(shù)據(jù)的指紋比對算法)共同的敏感度集。如果生物特征識別系統(tǒng)使用來自多個供應商的組件,則質量得分宜反映出對所使用的每種算法都很重要的性能方面。注1:由于很難找到一個通用的、不特定于供應商的、但又能充分表明性能的質量度量,因此應用多個質量評估算每當生物特征樣本經(jīng)過轉換時(例如,下采樣或進一步壓縮),宜重新評估轉換樣本的質量,并將其與轉換樣本相關聯(lián)。示例2:在整個身份管理系統(tǒng)中,生物特征樣本能夠按照多種格式存儲(例如,集中存儲的高分辨率手指圖像和存原生質量度量可按照公式(1)進行轉換。Qs,i=minmax0,100,100)……(1)式中:Qs,i——生物特征樣本i的經(jīng)過轉換的質量度量;Qn,i——生物特征樣本i的原生質量度量;GB/T33767.1—20XX/ISO/IECFDIS29794-1:2023min(Qn)——原生質量度量的最小值;max(Qn)——原生質量度量的最大值。minQn和maxQn可根據(jù)經(jīng)驗計算。注2:極大極小函數(shù)的線性性質[見公式(1)]允許準確估另一種將原生質量度量轉換到[0,100]的方法是Sigmoid函數(shù),如公式(2)所示:Qs,i=………………式中:Qs,i——生物特征樣本i的經(jīng)過轉換的質量度量;Qn,i——生物特征樣本i的原生質量度量;Qn,0——表示拐點;w——Sigmoid函數(shù)的斜率。參數(shù)Qn,0和w應由質量評估算法的開發(fā)人員或生物特征識別系統(tǒng)操作員選擇。Sigmoid函數(shù)輸出值(Qs,i)與原生質量度量值Qn,i的關系見圖4。注3:Sigmoid函數(shù)用于連續(xù)特征的非線性歸一化。與使用線性歸一化相比,非線性歸一化允許關注那些質量值,圖4Sigmoid函數(shù)7.2XML編碼ISO/IEC39794-1定義了質量塊的XML編碼。相關示例見附錄A。7.3已標記二進制編碼ISO/IEC39794-1定義了ASN.1中質量塊的抽象語法。生物特征數(shù)據(jù)塊的已標記二進制編碼依據(jù)ASN.1非典型編碼規(guī)則(ISO/IEC8825-1)進行編碼,并應用于描述數(shù)據(jù)塊的ASN.1模塊。相關示例見附錄A。8質量評估算法結果的規(guī)范化交換GB/T33767.1—20XX/ISO/IECFDIS29794-1:2023質量評估算法供應商宜能夠以規(guī)范化的方式向生物特征識別行業(yè)提供其質量評估算法的結果。另一方面,ISO/IEC19794系列和ISO/IEC39794系列生物特征數(shù)據(jù)塊的使用者能有效地檢索和處理這些信息,以便評價該質量評估算法的輸出對其實現(xiàn)的價值。這種方法有以下好處:a)質量評估算法供應商和使用者都能從技術改進中受益,這在廣泛使用質量得分的開始階段是必要的;b)在一些應用中,如果有必要的基礎設施,則可以自動檢索更新;c)使用者與集成商可以將QAID的評價結果返回給質量評估算法供應商(進行評價);d)隨著時間的推移,規(guī)范化測試集將不斷發(fā)展,原因如下:1)公布測試集符合質量評估算法供應商的利益,這對很多使用者也是有益的;2)隨著時間的推移,對新測試集的需求將減少,生物特征識別行業(yè)將對新測試集的使用進行嚴格檢查。e)測試集的不斷完善將促進QSND的發(fā)展。為便于交換,應提供以下內(nèi)容:a)質量評估算法供應商ID;b)質量評估算法ID;c)算法輸出值理論上的最大和最小值;d)所用測試集的唯一名稱(例如,人臉識別中的“FERET-Grayscale”數(shù)據(jù)庫);e)已經(jīng)處理的樣本列表(例如,人臉識別中的FERET數(shù)據(jù)庫的子庫“Duplicate1”)。任何人都可以發(fā)布新的測試集(生物特征樣本和命名規(guī)則)。宜使用類似XML的自描述語言描述數(shù)據(jù)集及評估結果。評估結果有可能由注冊中心或供應商網(wǎng)站(通過注冊中心的鏈接訪問)維護。使用XML實現(xiàn)的示例見附錄B。9規(guī)范化質量得分數(shù)據(jù)的規(guī)范化是指質量得分數(shù)據(jù)的接收者對其進行處理,以給出其本地的上下文和含義的過程,例如,使來自不同算法的質量得分具有相似的含義。通過特定的質量評估算法將原始質量得分分配給生物特征樣本。為了解釋原始得分,得分的接受者應掌握一些上下文信息。能夠提供以下信息:a)非固有的元數(shù)據(jù)或離線數(shù)據(jù)(例如,標準)。這些數(shù)據(jù)用來指導接收者解釋得分。由于質量得分伴隨著用于生成相關樣本的質量得分的算法標識(即QAID),因此能使用供應商提供的數(shù)據(jù)(例如,推薦閾值)來配置接收軟件,以最佳地處理樣本。該算法還能用于執(zhí)行分析,以充分優(yōu)化給定本地應用和數(shù)據(jù)得分的解釋。通過不同的算法標識,能區(qū)分由不同算法創(chuàng)建的得分,例如,根據(jù)質量得分的不同來源可使用不同的閾值。b)固有的規(guī)范化質量得分的形式。質量得分數(shù)據(jù)的規(guī)范化提供了關于得分的上下文信息。QAID支持供應商自定義的測量尺度,使得這些尺度可與0~100尺度相關聯(lián)。例如,接收者可對質量得分與其比對器在處理樣本時得到的誤匹配率和誤不匹配率之間的關系做分析。例如,該分析結果可用于規(guī)定樣本獲取或丟棄的操作質量閾值。這種方法為接受者提供了必要的信息,以一種與自身的環(huán)境和應用相關的方式來解釋得分,并允許在單個系統(tǒng)中使用不同算法或算法的不同版本。質量得分規(guī)范化數(shù)據(jù)集(QSND)的目的是通過規(guī)范化質量得分或質量得分百分位數(shù)(QSPR)提供質量得分的一致性解釋。QSPR實現(xiàn)了定量的樣本質量得分的通用表達和解釋,即質量評估算法“X”認為與QSN(質量得分規(guī)范化)語料庫中的數(shù)據(jù)相比,生物特征樣本“Y”具有質量百分位數(shù)“Z”。通過在規(guī)范化的樣本語料庫上運行指定的質量評估算法,并將所有可能的原始得分結果與百分位數(shù)對應,可以實現(xiàn)原始質量得分到百分位數(shù)的轉換。GB/T33767.1—20XX/ISO/IECFDIS29794-1:202310成對質量比對得分來自探針與參考樣本的比對,兩者都可能附有質量得分。在某些應用中,沒有關于探針或參考(符合任何收集的最佳實踐或要求)的符合性假設。如6.2所述,效用被分配給作為結果的比對得分,不宜僅將其視為探針或參考是否符合任何收集要求的函數(shù)。宜解決分配單個質量得分的問題,該得分可以預測性能,并能反映參與比對的兩個生物特征樣本所計算的比對得分。成對質量的分配對于使用動態(tài)識別閾值、比對分數(shù)級融合或評價質量評估算法的應用是有用的,詳見第11章。假設來自數(shù)據(jù)主體i的探針樣本(qi1)和來自數(shù)據(jù)主體j的參考樣本(qj2)是來自相同生物特征和模式的表示。如果i和j是不同的數(shù)據(jù)主體,并且樣本代表相同的生物特征實例(例如,同樣的食指),則比對是“不配對的”。如果i和j是相同的數(shù)據(jù)主體,并且樣本代表相同的生物特征實例(例如,同樣的食指),則比對是“配對的”。探針樣本的質量為qi1,參考樣本的質量為qj2。將探針樣本與參考樣本進行比對得到比對得分sij,該得分必須與單個質量度量QSij相關聯(lián)。用于分配單個質量度量的函數(shù)將被稱為F,適用于公式(3):QSij≌Fqi1,qj2))………(3)成對質量函數(shù)F的選擇取決于質量度量的特性及其建議的用途。根據(jù)模態(tài)選擇合適的F,可包括探針和參考質量度量的最小值、平均值、差值或其他關系。這些將在ISO/IEC29794系列的其他部分中進行討論。每個探針和參考的比較只產(chǎn)生一個比對得分,不過,數(shù)據(jù)主體i和j可能有多個探針和參考,因此,每個i和j可能有多個sij值。為了簡化,在本文件中對每個i和j僅考慮一個比對得分的情況。11評估11.1概述本章列出了用于評估生物特征樣本質量評估算法性能的幾種方法,即通過評估質量得分如何預測生物特征識別子系統(tǒng)的性能。無論生物特征參考是否滿足目標應用的指定要求,都可以應用這些方法。在11.2至11.5的計算方法中,如果質量評估不適用于參考樣本,則只會用于探針樣本的質量評估。11.2誤不匹配與丟棄方法用于比較評估生物特征樣本質量評估算法的一個度量項是誤不匹配與丟棄特性的曲線,在參考文獻[10]中作為誤不匹配與拒絕曲線引入。目的是表明如何有效地丟棄具有低質量得分的樣本,從而改進(即降低)誤不匹配率。假設一個應用,其中來自同一數(shù)據(jù)主體的相同生物特征模態(tài)i具有質量得分qi1和qi2)的一對樣本(上標為1和2),經(jīng)比對后產(chǎn)生相似度得分sii,其中存在N對這樣的樣本。由于統(tǒng)一的質量得分預計會隨著質量的提高而提高,因此引入質量閾值u來定義可接受的質量水平,并定義低質量記錄的集合D(u),如公式(4)所示:DU=ii:Fqi1,qi2)<U}…………………(4)其中,會選擇最適合操作需要和約束的函數(shù)作為成對質量函數(shù)F。很多情況下,質量得分可使用Fqi1,qi2))=minqi1,qi2)來合并,因為較低質量的樣本會導致較低的相似度得分,或者,如果在評GB/T33767.1—20XX/ISO/IECFDIS29794-1:2023估或操作中已有意將參考樣本qi1設置為具有高質量的樣本,則簡單地使用Fqi1,qi2=qi2。然后,對于不在集合D(u)中的樣本對,將誤不匹配率計算為低于某個臨界識別閾值t的配對相似度得分(例如,來自同一主體的同一手指的比對得分)的分數(shù)(即誤不匹配數(shù)量占全部配對的比對數(shù)量的比例)。識別閾值t是固定的,而質量閾值u在特定于算法的質量得分域中變化,以顯示在所選識別閾值下誤不匹配率對質量閾值的依賴關系。相關示例腳本,參見附錄D。對于識別閾值t,誤不匹配率的值作為丟棄樣本百分比的函數(shù)[取決于質量閾值u,參見公式(4)]能用圖形表示。如果質量得分與配對的相似度得分完全相關,則設置識別閾值t以給出總體誤不匹配率x,然后丟棄具有最低質量得分的x%的樣本,將導致誤不匹配率為零。對于一個好的質量評估算法,誤不匹配率宜隨著小部分的丟棄而迅速下降。能夠從兩個或多個樣本中計算比對得分?;诙鄠€樣本的比對得分計算誤不匹配與丟棄特性不在本文件的范圍內(nèi)。圖5給出了兩個識別閾值的誤不匹配與丟棄特性的示例,這兩個閾值分別對應0.1%和0.01%的誤匹配率,這是由NFIQ2[6]、開源指紋細節(jié)點比對軟件[7]、[8]與指紋數(shù)據(jù)庫計算的質量得分,其中,指紋數(shù)據(jù)庫的樣本由光學指紋采集設備采集[9]。圖5在對應于0.1%和0.01%的初始FMR的兩個不同識別閾值下,誤不匹配與丟棄特性示例11.3誤匹配與丟棄方法在某些應用中誤匹配是常見的和重要的,或者當特定的識別算法在低質量樣本上導致不配對的高相似度得分時,評價質量評估算法是否能預測哪些樣本將導致錯誤匹配是有價值的。此外,為了檢驗丟棄低質量樣本對性能的全面影響,宜同時考慮誤不匹配與丟棄特性的關系以及誤匹配與丟棄特性的關系。類似于上面的誤不匹配與丟棄方法,誤匹配與丟棄方法的目的是表明如何有效地丟棄具有低質量得分的樣本,從而改進(即降低)誤匹配率。假設一個應用,其中來自不同數(shù)據(jù)主體i和j的具有質量得分qi和qj的一對生物特征樣本,經(jīng)比對后產(chǎn)生相似度得分sij。由于質量得分預計會隨著質量的提高而提高,因此引入質量閾值u來定義可接受的質量水平,并定義低質量記錄的集合D(u),如公式(5)所示:GB/T33767.1—20XX/ISO/IECFDIS29794-1:2023DU={ij:Fqi,qj<U},i≠j…………………(5)其中,使用Fqi,qj=minqi,qj來合并質量值,因為較低質量的樣本會導致較低的比對得分,或者,如果在評估或操作中已有意將參考樣本qi設置為具有高質量的樣本,則簡單地使用Fqi,qj=qj。然后,對于不在集合D(u)中的樣本對,將誤匹配率計算為不配對的相似度得分(例如,不同數(shù)據(jù)主體的人臉圖像的比對)超過某個識別閾值t的分數(shù)(即誤匹配數(shù)量占全部不配對的比對數(shù)量的比例)。識別閾值t是固定的,而質量閾值u在特定于算法的質量得分域中變化,以顯示所選識別閾值下誤匹配率對質量閾值的依賴關系。相關示例腳本,參見附錄D。誤匹配率的值作為識別閾值t的質量閾值u的函數(shù)能用圖形表示。圖6給出了兩個識別閾值的誤匹配與丟棄特性的示例,這兩個閾值分別對應0.1%和0.01%的誤匹配率,這是由NFIQ2[6]、開源手指紋細節(jié)點比對軟件[7]、[8]與指紋數(shù)據(jù)庫計算的質量得分,其中指紋數(shù)據(jù)庫的樣本由光學指紋傳感器采集[9。]圖6在對應于0.1%和0.01%的初始FMR的兩個不同識別閾值下,誤匹配與丟棄特性示例11.4DET與丟棄方法用于比較評估生物特征樣本質量評估算法的第三個度量項是DET與丟棄圖。這種方法適用于任何類型的參考(樣本、模板、模型)。目的是表明如何有效地丟棄具有低質量得分樣本,從而改進DET圖。這種方法的優(yōu)點是同時考慮了誤不匹配和誤匹配,并且它不需要臨界識別閾值,因為包含了所有可能的閾值。假設一個應用,將來自相同或不同生物特征數(shù)據(jù)主體i和j的具有質量得分qi樣本與具有質量得分rj參考樣本進行比對,以產(chǎn)生相似度得分sij,其中N對樣本來自相同的數(shù)據(jù)主體,M對樣本來自不同的數(shù)據(jù)主體。能夠根據(jù)這些得分創(chuàng)建兩個直方圖,即sij的配對的直方圖,其中i=j,和sij的不配對的直方圖,i≠j。這些能為所有sij<t創(chuàng)建兩個累積分布函數(shù),即MatedCDF(t)和NonMatedCDF(t每個直方圖都有一條累積曲線。當t在依賴于比對算法的整個分數(shù)值范圍內(nèi)增加時,能夠通過繪制誤不匹配率(FNMR)=1-MatedCDF(t)與誤匹配率(FMR)=NonMatedCDF(t)的值來創(chuàng)建DET。引入質量閾值u來GB/T33767.1—20XX/ISO/IECFDIS29794-1:2023定義可接受的質量水平,并定義低質量記錄的集合D(u),如公式(6)所示:Du={qi<uORrj<u}…………………(6)如果質量評估不適用于參考樣本(即不計算rj),則Du={qi<u}。對于若干質量閾值u,丟棄集合D(u)中的樣本比對,并計算一組DET曲線。對于好的質量評估算法,隨著質量閾值u的增加,誤不匹配率宜在廣泛的誤匹配率值范圍內(nèi)降低。11.5樣本接受率或丟棄率本節(jié)定義了兩個相關度量項,用于評價質量評估算法的性能,這些算法用于決定是否保留生物特征樣本以供進一步處理。第一個度量項是錯誤率,表示當生物特征樣本由下游比對子系統(tǒng)做出正確匹配決策時被錯誤丟棄的生物特征樣本的比例。錯誤的樣本丟棄率(RISD)由質量得分向量q、配對的比對得分向量s、識別閾值t和質量閾值u組成的一組測試輸出來評估的,如公式(7)所示:RISDqi?uSi?t……………式中:N——向量中的樣本數(shù);H(x)——當x<0時,階躍函數(shù)等于0,當x≥0時,階躍函數(shù)等于1。公式(7)給出了質量得分低于質量閾值u但比對得分高于識別閾值的樣本比例。第二個度量項也是錯誤率,表示當生物特征樣本最終導致比對子系統(tǒng)的誤不匹配時被錯誤保留的生物特征樣本的比例。該錯誤率被稱為錯誤的樣本接受率RISA,相關計算如公式(8)所示:RISAu=ΣHqi?u1?HSi?t))……………(8)公式(8)給出了具有高質量得分但最終無法識別的樣本比例。GB/T33767.1—20XX/ISO/IECFDIS29794-1:2023(資料性)生物特征質量記錄編碼示例A.1ASN.1示例遵循ISO/IEC39794-1中定義的抽象語法的ASN.1值表示法的示例如下:qualityBlocks{{algorithmIdBlock{organization257,scoreOrErrorscore:50}}A.2XML示例遵循ISO/IEC39794-4中定義的XSD的XML示例如下:<fir:qualityBlocks><cmn:qualityBlock><cmn:algorithmIdBlock><cmn:organization>257</cmn:organization><cmn:id>56</cmn:id></cmn:algorithmIdBlock><cmn:scoreOrError><cmn:score>50</cmn:score></cmn:scoreOrError></cmn:qualityBlock></fir:qualityBlocks>A.3二進制示例ISO/IEC39794-4中定義的指紋圖像質量數(shù)據(jù)塊的已標記二進制編碼的質量塊的十六進制轉儲如A00780020101A103GB/T33767.1—20XX/ISO/IECFDIS29794-1:2023質量評估算法結果的規(guī)范化交換示例B.1概述如第8章中所述,質量評估算法供應商宜能夠向生物特征識別行業(yè)提供質量度量,包括原始質量得分和原生質量度量(不一定是0到100范圍內(nèi)的整數(shù))。特別是公共數(shù)據(jù)集生成的質量得分交換將有助于提供技術見解,并允許質量得分的使用者檢查和理解質量得分與樣本的內(nèi)在信息內(nèi)容之間的關系。本附錄提供以XML格式交換此類信息的示例。B.2質量交換文檔示例本節(jié)提供了一個XML編碼示例,該示例中id=123的供應商“SampleVendor”在測試集“FERET-grayscale”和“FERET-color”上進行測試,并發(fā)布了id=456的算法“SampleAlgo_v10”的測試結果。該示例的XML文檔可從/iso-iec/29794/-1/ed-3獲得。<?xmlversion="1.0"encoding="UTF-8"?><iso:isoVendorQualityReportxmlns:iso="/iso-iec/29794/-1"qualityVendorId="123"qualityAlgorithmId="456"qualityAlgorithmMinValue="0.0"qualityAlgorithmMaxValue="100.0"><iso:testSets><iso:testSetname="FERET-grayscale"location="/humanid/feret/feret_master.html"><iso:samplename="ID-00001fa010_930831"qualityValue="73.64"/><iso:samplename="ID-00002fa010_930831"qualityValue="48.91"/></iso:testSet><iso:testSetname="FERET-color"ocation="/humanid/colorferet/home.html"><iso:samplename="ID-00002_931230_fa"qualityValue="51.26"/><iso:samplename="ID-00002_931230_fb"qualityValue="82.17"/></iso:testSet></iso:testSets></iso:isoVendorQualityReport>B.3XML質量交換文檔示例的信息模式GB/T33767.1—20XX/ISO/IECFDIS29794-1:2023該XSD可在/iso-iec/29794/-1/ed-3獲得。<!--Permissionisherebygranted,freeofchargeinperpetuity,toanypersonobtainingacopyoftheSchema,touse,copy,modify,mergeanddistributefreeofcharge,copiesoftheSchemaforthepurposesofdeveloping,implementing,installingandusingsoftwarebasedontheSchema,andtopermitpersonstowhomtheSchemaisfurnishedtodoso,subjecttothefollowingconditions:THESCHEMAISPROVIDED"ASIS",WITHOUTWARRANTYOFANYKIND,EXPRESSORIMPLIED,INCLUDINGBUTNOTLIMITEDTOTHEWARRANTIESOFMERCHANTABILITY,FITNESSFORAPARTICULARPURPOSEANDNONINFRINGEMENT.INNOEVENTSHALLTHEAUTHORSORCOPYRIGHTHOLDERSBELIABLEFORANYCLAIM,DAMAGESOROTHERLIABILITY,WHETHERINANACTIONOFCONTRACT,TORTOROTHERWISE,ARISINGFROM,OUTOFORINCONNECTIONWITHTHESCHEMAORTHEUSEOROTHERDEALINGSINTHESCHEMA.Inaddition,anymodifiedcopyoftheSchemashallincludethefollowingnotice:THISSCHEMAHASBEENMODIFIEDFROMTHESCHEMADEFINEDINISO/IEC29794-1,ANDSHOULDNOTBEINTERPRETEDASCOMPLYINGWITHTHATSTANDARD--><xs:schemaxmlns:xs="/2001/XMLSchema"xmlns:vc="/2007/XMLSchema-versioning"xmlns="/iso-iec/29794/-1"vc:minVersion="1.0"targetNamespace="/iso-iec/29794/-1"elementFormDefault="qualified"attributeFormDefault="unqualified"><xs:annotation><xs:documentationxml:lang="en">ISO-IEC29794-1Edition1VendorQualityReport</xs:documentation></xs:annotation><xs:elementname="isoVendorQualityReport"type="isoVendorQualityReportType"/><xs:complexTypename="isoVendorQualityReportType"><xs:sequenceminOccurs="0"><xs:elementname="testSets"type="testSetsType"/></xs:sequence><xs:attributename="qualityVendorId"type="xs:int"use="required"/><xs:attributename="qualityAlgorithmId"type="xs:int"use="required"/><xs:attributename="qualityAlgorithmMinValue"type="xs:float"use="required"/><xs:attributename="qualityAlgorithmMaxValue"type="xs:float"use="required"/></xs:complexType><xs:complexTypename="testSetsType"><xs:sequencemaxOccurs="unbounded">GB/T33767.1—20XX/ISO/IECFDIS29794-1:2023<xs:elementname="testSet"type="testSetType"/></xs:sequence></xs:complexType><xs:complexTypename="testSetType"><xs:sequenceminOccurs="0"maxOccurs="unbounded"><xs:elementname="sample"type="sampleType"/></xs:sequence><xs:attributename="name"type="xs:ID"use="required"/><xs:attributename="location"type="xs:anyURI"use="required"/></xs:complexType><xs:complexTypename="sampleType"><xs:attributename="name"type="xs:ID"use="required"/><xs:attributename="qualityValue"type="xs:float"use="required"/></xs:complexType></xs:schema>GB/T33767.1—20XX/ISO/IECFDIS29794-1:2023基于效用的質量得分在樣本為基礎的系統(tǒng)中的聚合過程本附錄對在樣本集上適當進行基于效用的質量得分的聚合過程給出了建議,如整個企業(yè)范圍的匯總。其結果是一個有助于質量監(jiān)測匯總值。質量匯總通常在使用情況類似的樣本中進行,例如,企業(yè)的所有注冊樣本的質量匯總,或者企業(yè)的所有驗證樣本的質量匯總。在用戶與生物特征識別系統(tǒng)頻繁交互的操作中(如考勤應用),可以基于每個用戶進行質量得分的匯總。這將揭示是否存在持續(xù)產(chǎn)生低質量樣本的個體。C.2方法假設企業(yè)收集生物特征樣本,并使用質量評估算法度量每個樣本的質量。質量得分與配對的相似度得分呈單調關系,即質量得分越高,相似度得分越高。在這種情況下,質量得分被量化為L級,這樣(在不失一般性的前提下)q=0...L,其中q=0和q=L分別表示最低和最高的質量得分。如果在運行情況下,在給定時間間隔內(nèi)收集的生物特征樣本數(shù)量為n,并且由nq個質量為q的生物特征樣本組成,則可以計算所有n個樣本的平均質量。然而,算數(shù)平均值并不是匯總質量得分的首選方法,因為所有樣本無論其質量得分如何,都被賦予相同的權重。如果質量為q的生物特征樣本t的預期效用是uq=Uq,則質量的更好匯總表述如公式(C.1)所示:………如果效用uq(t)實際上是對生物特征驗證系統(tǒng)在閾值t運行時質量為q的樣本的誤匹配或誤不匹配錯誤率的估算,其錯誤是可以估算的,則q-(t)將是對預期錯誤率的估算。接下來,將引入不同等級質量評估算法的效用uq(t)計算過程,從而使匯總的質量得分成為預期錯誤率的估算值。假設一個同時使用探針樣本和參考樣本的生物特征驗證系統(tǒng),該系統(tǒng)的語料庫包含來自N個主體的N對生物特征樣本。第一個樣本代表參考樣本,第二個樣本代表探針樣本。每對樣本都有整型的質量qj1和qj2),其中j=1,…,N。對這些樣本運用V個比對算法,得到以下結果:——N個配對的相似度得分Sjjv;——最多N(N-1)個不配對的相似度得分sj(j≠k)。其中,v=1,…,V,且V≥1。a)對于每種比對算法v和從0到L的每個可能質量得分i,根據(jù)公式(C.2)計算FNMRvτv,i。FNMRvτv,i是指在決策得分閾值τv處的誤不匹配率,對應于使用比對算法v的配對得分、質量為i的探針樣本與質量優(yōu)于或等于i的參考樣本的特定預期系統(tǒng)誤不匹配率或誤匹配率(質量因數(shù)或fom,f)。質量得分越高表明質量越好。for(v=1,…,V)for(i=0,…,L)endend從而得到以下數(shù)組:GB/T33767.1—20XX/ISO/IECFDIS29794-1:2023FNMR1(τ1,1)FNMR2(τ2,1)…FNMRV(τV,1)FNMR1(τ1,L)FNMR2(τ2,L)…FNMRV(τV,L)FNMRFNMR1(τ1,L)FNMR2(τ2,L)…FNMRV(τV,L)V=1相當于使用單一比對算法。如果V>1,則針對每種比對算法計算相似度得分和FNMR。b)按照公式(C.3)計算權重ui:…………因此,整個企業(yè)的聚合質量如公式(C.4)所示:pi……其中pi是質量為qi的樣本分數(shù)。計算出的Q值不會在使用者熟悉的范圍內(nèi)。如果所有樣本都是最佳質量(即,q=L結果將是Q=uL。同理,最壞的情況是企業(yè)中的所有樣本的質量都是q=0,即Q=u0。因此,這種表述會使質量匯總的范圍為[u0,uL]。公式(C.4)適合作為基于多種算法總體FNMR的樣本集合的一般質量因數(shù)。不過,建議將[u0,uL]轉換到推薦范圍[0,100],即0為最低質量,100為最佳質量。這能通過以下任一方法實現(xiàn):1)如公式(C.5)所述,將質量匯總數(shù)Q(即,預期錯誤率)與原生質量范圍關聯(lián)起來:=U?1=U?10uipi………其中,U?1是參數(shù)對i,ui的函數(shù)逼近(例如,分段線性插值)。2)將[u0,uL]映射(例如,線性映射)到[0,100]。因此,映射到[0,100]的質量匯總由公式(C.6)給出:=100Σ…………………公式(C.3)中的權重是對在某固定閾值上計算的觀察到的誤不匹配率的估算值。這些權重在特定閾值上最準確,而對于其它閾值下運行的生物特征識別系統(tǒng)則不準確。在驗證應用中,當操作閾值固定為τ時,質量評估算法的使用者能夠根據(jù)列出的步驟確立其權重。注:公式(C.3)中的權重是共識估算值。這意味著它們是使用一組比對算法中觀察到的誤不匹配率估算出來的。因此,這些權重未必是任何一種算法或一組指定算法的權重。公式(C.3)中的權重,除GB/T33767.1—20XX/ISO/IECFDIS29794-1:2023(資料性)計算效用預測性能指標的示例代碼用于計算錯誤與丟棄特性的Python腳本可從/iso-iec/29794/-1/ed-3上獲取。已測試的CPython最低版本為3.5.6,numpy版本為1.7.0。importnumpyasnpdefcompute_edc(pair_comparison_scores,pair_quality_scores,comparison_threshold,comparison_function):Thisdocstringiswritteninthenumpydocstyle.Parameterspaircomparisonscores:arraylikeThepairwisebiometriccomparisonscores(floating-pointorinteger).Thisdoesnotneedtobesorted,butthecomparisonscoresneedtocorrespondtothe`pair_quality_scores`,sothat`zip(pair_comparison_scores,pair_quality_scores)`representsthepairwisecomparison&qualityscores.pairqualityscores:arraylikeThepairwisebiometricqualityscores(floating-pointorinteger).Itisassumedthathigherqualityscoresmeanbetterquality,sothatcomparisonswithlowerqualityscoresarediscardedfirst.Pairwisequalityscorescanbederivedastheminimumofthepairs'correspondingsamplequalityparisonthreshold:floatorintThe`pair_quality_scores`arecomparedagainstthis`comparison_threshold`viathe`comparison_function`todeterminewhichofthecomparisonsrepresentan"error"inthecomputedEDC.comparisonfunction:np.ufuncChoosingthisfunctiondependsonwhetherhigherorlowercomparisonscoresmeanhighersimilarity,anditdependsonwhetherafalsenon-matcherrorvsdiscardcharacteristicorafalsematcherrorvsdiscardcharacteristicistobecomputed.The`pair_comparison_scores`aretheleft-handsideofthecomparison,GB/T33767.1—20XX/ISO/IECFDIS29794-1:2023`comparison_threshold`istheright-handside.E.g.ifhighercomparisonscoresmeanhighersimilarity,errorvsdiscardcharacteristic,and`np.greater_equal`canbeusedtocomputethefalseerrorvsdiscardcharacteristic.Returns-------tuple[np.ndarray,np.ndarray]The`discard_fractions`andthecorresponding`error_fractions`ofthecomputedEDCarereturned.ForEDCplots,the`discard_fractions`aretypicallyplottedonthex-axis,`error_fractions`onthe"""#Createanumpyarrayandsortitbyquality:scores=np.array(lis

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論