下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
CCKS2021技術(shù)評(píng)測(cè)任務(wù)書(shū)面向中文電子病歷的醫(yī)療實(shí)體識(shí)別及事件抽取本任務(wù)是CCKS圍繞中文電子病歷語(yǔ)義化開(kāi)展的系列評(píng)測(cè)的一個(gè)延續(xù),在CCKS2017,2018,2019,2020相關(guān)評(píng)測(cè)任務(wù)的基礎(chǔ)上進(jìn)行了延伸和拓展。本次評(píng)測(cè)依然是聚焦在兩個(gè)任務(wù):醫(yī)療命名實(shí)體識(shí)別和醫(yī)療事件抽取。與往年不同的是本次評(píng)測(cè)要求參賽者提供一個(gè)解決方案來(lái)同時(shí)解決實(shí)體識(shí)別和事件抽取兩個(gè)任務(wù)。參賽者在建模過(guò)程中盡可能的利用兩個(gè)任務(wù)間的關(guān)系來(lái)提高最終的效果。參賽者需在兩個(gè)子任務(wù)上進(jìn)行測(cè)試,兩個(gè)子任務(wù)測(cè)試集上的綜合表現(xiàn)作為最終的評(píng)測(cè)結(jié)果。一、醫(yī)療命名實(shí)體識(shí)別任務(wù)定義及描述本任務(wù)為中文病歷醫(yī)療實(shí)體識(shí)別任務(wù),即對(duì)于給定的一組電子病歷純文本文檔,識(shí)別并抽取出與醫(yī)學(xué)臨床相關(guān)的實(shí)體提及(entitymention),并將它們歸類(lèi)到預(yù)定義類(lèi)別(pre-definedcategories),比方疾病、治療、檢查檢驗(yàn)等。相比2020命名實(shí)體識(shí)別任務(wù)我們做了如下調(diào)整:a.參賽者需要將實(shí)體識(shí)別和事件抽取兩個(gè)任務(wù)形式化定義輸入:L電子病歷的自然語(yǔ)言文本集合:7)=(dlfdN]f4=仙1,…Win)預(yù)定義類(lèi)別:C=(clf-cm)輸出:實(shí)體提及和所屬類(lèi)別對(duì)的集合:Cmi)f(m2fCm2),…⑺P,cmp))其中叫=〈小瓦是出現(xiàn)在文檔山中的醫(yī)療實(shí)體提及(mention),加和分分別表示叫在山中的起止位置,c恤EC表示所屬的預(yù)定義類(lèi)別。要求實(shí)體提及之間不重疊,即立Vd+1。2預(yù)定義類(lèi)別預(yù)定義類(lèi)別定義如下:1)疾病和診斷:醫(yī)學(xué)上定義的疾病和醫(yī)生在臨床工作中對(duì)病因、病生理、分型分期等所作的判斷。2)檢查:.影像檢查(X線、CT、MR、PETCT等)+造影+超聲+心電圖,未防止檢查操作與手術(shù)操作過(guò)多沖突,不包含此外其它的診斷性操作,如胃鏡、腸寸。3)檢驗(yàn):在實(shí)驗(yàn)室進(jìn)行的物理或化學(xué)檢查,本期特指臨床工作中檢驗(yàn)科進(jìn)行的化驗(yàn),不含免疫組化等廣義實(shí)驗(yàn)室檢查4)手術(shù):醫(yī)生在患者身體局部進(jìn)行的切除、縫合等治療,是外科的主要治療方法。
5)藥物:用于疾病治療的具體化學(xué)物質(zhì)。6)解剖部位:指疾病、病癥和體征發(fā)生的人體解剖學(xué)部位。數(shù)據(jù)集描述數(shù)據(jù)標(biāo)注說(shuō)明詞表及電子病歷數(shù)據(jù)由醫(yī)渡云(北京)技術(shù)編寫(xiě),標(biāo)注數(shù)據(jù)由醫(yī)渡云公司組織專(zhuān)業(yè)的醫(yī)學(xué)團(tuán)隊(duì)進(jìn)行人工標(biāo)注,僅限CCKS競(jìng)賽評(píng)測(cè)用。有關(guān)數(shù)據(jù)集的詳細(xì)描述及標(biāo)注規(guī)范,將隨數(shù)據(jù)的發(fā)布一并加以說(shuō)明,任務(wù)書(shū)中不再贅述。2數(shù)據(jù)例如("originalText〃:〃患者3月前因“直腸癌”于在我院于全麻上行直腸癌根治術(shù)(DIXON術(shù)),手術(shù)過(guò)程順利,術(shù)后給予抗感染及營(yíng)養(yǎng)支持治療,患者恢復(fù)好,切口愈合良好。,術(shù)后病理示:直腸腺癌(中低度分化),浸潤(rùn)潰瘍型,面積3.5*2CM,侵達(dá)外膜。雙端切線另送“近端”、“遠(yuǎn)端”及環(huán)周底部切除面未查見(jiàn)癌。腸壁一站(10個(gè))、中間組(8個(gè))淋巴結(jié)未查見(jiàn)癌。,免疫組化染色示:ERCC1彌漫(+)、TS少局部弱(+)、SYN(-)、CGA(")o術(shù)后查無(wú)化療禁忌后給予3周期化療,,方案為:奧沙利鉗150MGDL亞葉酸鈣0.3G+替加氟LOGD2-D6,同時(shí)給與升白細(xì)胞、護(hù)肝、止吐、免疫增強(qiáng)治療,患者副反響輕。院外期間患者一般情況好,無(wú)惡心,無(wú)腹痛腹脹脹不適,無(wú)現(xiàn)患者為行復(fù)查及化療再次來(lái)院就診,門(mén)診以“直腸癌術(shù)后”收入院?!ā癳ntities”:[(〃label_type〃:〃疾病和診斷〃,"overlap”:0,"start_pos”:8,"end_pos”:11),(〃label_type〃:〃手術(shù)”,"overlap”:0,“start_pos”:21,“end_pos”:35},(〃label_type〃:〃疾病和診斷",“overlap”:0,“start_pos”:78,"end_pos”:95)]2.32.32.3數(shù)據(jù)集描述
2.3數(shù)據(jù)集描述本次評(píng)測(cè)的訓(xùn)練數(shù)據(jù)有:1500條中文標(biāo)注數(shù)據(jù)1000條中文非標(biāo)注數(shù)據(jù)6個(gè)類(lèi)別的6292個(gè)中文實(shí)體詞詞表此外,本評(píng)測(cè)將使用300條標(biāo)注數(shù)據(jù)作為最終評(píng)測(cè)的測(cè)試集。有關(guān)數(shù)據(jù)集的詳細(xì)描述也將隨數(shù)據(jù)的發(fā)布一并加以說(shuō)明。評(píng)價(jià)指標(biāo)本任務(wù)采用精確率(Precision)、召回率(Recall)以及Fl-Measure作為評(píng)測(cè)指標(biāo)。參賽系統(tǒng)的輸出結(jié)果集合記為5=白1浮2…Sm},人工標(biāo)注的結(jié)果(GoldStandard)集合記為6={。?比…呢}。集合元素為一個(gè)實(shí)體提及,表示為四元組(dfposbfposefc),d表示文檔,pos》和pos?分別對(duì)應(yīng)實(shí)體提及在文檔d中的起止下標(biāo),C表示實(shí)體提及所屬預(yù)定義類(lèi)別。分別從兩個(gè)層面進(jìn)行評(píng)價(jià)。嚴(yán)格指標(biāo)我們定義豆eS與gjeG嚴(yán)格等價(jià),當(dāng)且僅當(dāng):Sj.d=g卜dst.posb=gj.posbst.pose=Qj.pose*.c=gj.c基于以上等價(jià)關(guān)系,我們定義集合S與G的嚴(yán)格交集為5。由此得到嚴(yán)格評(píng)測(cè)指標(biāo):_|snsG|_|sn5G|_2PRs_⑸'s_⑹,is_p+R2松弛指標(biāo)我們定義*GS與/EG松弛等價(jià),當(dāng)且僅當(dāng):S[.d=9j?d(,gkposb)W(,g,.pose)S[.c=gj.c基于以上等價(jià)關(guān)系,我們定義集合S與G的松弛交集為、。由此得到松弛評(píng)測(cè)指標(biāo):_|snrG|_|snrG|_2PR_丁一|S|,r-⑹,lr-P+R最后,按照預(yù)定義類(lèi)別的6個(gè)不同類(lèi)別,對(duì)每個(gè)子類(lèi)進(jìn)行分開(kāi)評(píng)測(cè),共得到14個(gè)評(píng)測(cè)結(jié)果:疾病和診斷檢查檢驗(yàn)手術(shù)藥物解剖部位綜合嚴(yán)格指標(biāo)松弛指標(biāo)二、醫(yī)療事件抽取1.任務(wù)定義及描述
1.任務(wù)定義及描述本任務(wù)為中文病歷醫(yī)療事件抽取任務(wù),即給定主實(shí)體為腫瘤的電子病歷文本數(shù)據(jù),定義腫瘤事件的假設(shè)干屬性,如腫瘤大小,腫瘤原發(fā)部位等,識(shí)別并抽取事件及屬性,進(jìn)行文本結(jié)構(gòu)化。本任務(wù)提供少量中文標(biāo)注數(shù)據(jù)、大量非標(biāo)注數(shù)據(jù)集及詞表,旨在訓(xùn)練數(shù)據(jù)有限的情況下,利用非標(biāo)注文本、半監(jiān)督學(xué)習(xí)和遷移學(xué)習(xí)等方法提升模型性能。更接近真實(shí)世界的場(chǎng)量。事件主實(shí)體:屬性L屬性2:屬性事件主實(shí)體:屬性L屬性2:屬性3:官】腫瘤原發(fā)部位病灶大小轉(zhuǎn)移部位【原發(fā)部位的大小】【某種疾病從最先發(fā)生的組織或者器官轉(zhuǎn)移到的其他組織或器每個(gè)文本的一個(gè)屬性可能出現(xiàn)0個(gè)或多個(gè)屬性實(shí)體,比方多個(gè)原發(fā)部位。2認(rèn)識(shí)例如右肺下葉后基底段占位考慮周圉型肺、癌可能性大.左肺上葉結(jié)節(jié),轉(zhuǎn)■排.建議追查.右側(cè)腳膜增厚,考慮受侵可能?縱NI內(nèi)淋巴結(jié),性質(zhì)待定.右腳下葉后基底段見(jiàn)類(lèi)圓形結(jié)節(jié),均為17X15MMQM47),結(jié)節(jié)邊緣見(jiàn)素條影與鄰近的竣相連.另見(jiàn)左肺上葉見(jiàn)小結(jié)節(jié),約為8MM(IM17).左肺舌葉.數(shù)據(jù)集描述數(shù)據(jù)標(biāo)注說(shuō)明電子病歷數(shù)據(jù)由醫(yī)渡云(北京)技術(shù)編寫(xiě),標(biāo)注數(shù)據(jù)由醫(yī)渡云公司組織專(zhuān)業(yè)的醫(yī)學(xué)團(tuán)隊(duì)進(jìn)行人工標(biāo)注,僅限CCKS競(jìng)賽評(píng)測(cè)用。有關(guān)數(shù)據(jù)集的詳細(xì)描述及標(biāo)注規(guī)范,將隨數(shù)據(jù)的發(fā)布一并加以說(shuō)明,任務(wù)書(shū)中不再贅述。數(shù)據(jù)例如原文:右肺癌化療后,比照2016-11-29CT:右上肺病變較前范圍稍縮小,周邊少許炎癥較前稍減少。兩肺散在小結(jié)節(jié),大致同前。左側(cè)鎖骨下區(qū)、縱隔多發(fā)淋巴結(jié),考慮轉(zhuǎn)移,較前稍縮小。肝囊腫。左腎小囊腫。右肺癌化療后,比照2016T1-29CT:右肺上葉見(jiàn)不規(guī)那么結(jié)節(jié)狀、片狀病灶,邊界不清,最大層面大小約12mmX8mm,邊緣呈分葉狀,增強(qiáng)掃描不均勻強(qiáng)化,緊貼斜裂胸膜,局部范圍較前略縮小,右上肺見(jiàn)少許斑片狀稍高密度影,邊界不清,較前明顯減少。左下肺(se8,im96)、左上肺(se8,im221)及右下肺(se8,iml04)散在數(shù)個(gè)小類(lèi)結(jié)節(jié),邊界清,大者直徑3mm,大致同前。右肺上葉前內(nèi)基底段支氣管變窄,基底段支氣管分支管壁增厚,氣管及其余支氣管分支通暢。左側(cè)鎖骨下區(qū)、兩下上氣管旁、血管前、主動(dòng)脈弓旁、主肺動(dòng)脈窗、隆突上見(jiàn)多發(fā)淋巴結(jié),局部相互融合,大者短徑約5mm,輕度強(qiáng)化,較前稍縮小。兩側(cè)胸腔未見(jiàn)積液,左側(cè)胸膜未見(jiàn)明顯增厚。心包未見(jiàn)明顯積液。肝臟形態(tài)正常,各葉比例在正常范圍以?xún)?nèi),其外形輪廓光整,肝內(nèi)見(jiàn)多個(gè)低密度灶,邊界清,大者直徑約9mm,未見(jiàn)強(qiáng)化。肝內(nèi)膽管正常,其內(nèi)未見(jiàn)結(jié)石影,膽囊大小正常,其內(nèi)未見(jiàn)結(jié)石影,膽總管未見(jiàn)擴(kuò)張,其內(nèi)未見(jiàn)結(jié)石影。肝門(mén)區(qū)正常。門(mén)靜脈未見(jiàn)異常。脾大小正常,密度均勻。胰腺大小、形態(tài)正常,密度均勻。左腎見(jiàn)低密度灶,邊界清,大小約4mmX3mm,未見(jiàn)強(qiáng)化。右腎及兩腎下腺未見(jiàn)異常。膈腳后、腹主動(dòng)脈旁未見(jiàn)腫大淋巴結(jié)。掃描范圍未見(jiàn)骨質(zhì)破壞征象。腫瘤原發(fā)部位:右肺上葉原發(fā)病灶大?。?2mmX8mm轉(zhuǎn)移部位:左側(cè)鎖骨下區(qū)、縱隔多發(fā)淋巴結(jié)數(shù)據(jù)集描述本次評(píng)測(cè)的訓(xùn)練數(shù)據(jù)有:1400條中文標(biāo)注數(shù)據(jù)1300條中文非標(biāo)注數(shù)據(jù)8
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 白銀靖遠(yuǎn)縣高一數(shù)學(xué)試卷
- 人民版道德與法治七年級(jí)上冊(cè)4.1《回憶那一刻》聽(tīng)課評(píng)課記錄
- 蘇科版數(shù)學(xué)九年級(jí)下冊(cè)《7.1 正切》聽(tīng)評(píng)課記錄1
- 城南學(xué)校五年級(jí)數(shù)學(xué)試卷
- 蘇科版數(shù)學(xué)七年級(jí)下冊(cè)聽(tīng)評(píng)課記錄7.4認(rèn)識(shí)三角形2
- 武松打虎聽(tīng)評(píng)課記錄
- 2025年度智慧城市大數(shù)據(jù)中心合同變更及信息安全保障協(xié)議
- 2025年度綠色建筑項(xiàng)目設(shè)計(jì)施工合同
- 九年級(jí)化學(xué)上冊(cè) 第二單元 課題1 空氣說(shuō)課稿 (新版)新人教版
- 鴉片戰(zhàn)爭(zhēng)的聽(tīng)評(píng)課記錄
- 氧氣、乙炔工安全操作規(guī)程(3篇)
- 建筑廢棄混凝土處置和再生建材利用措施計(jì)劃
- 集裝箱知識(shí)培訓(xùn)課件
- 某縣城區(qū)地下綜合管廊建設(shè)工程項(xiàng)目可行性實(shí)施報(bào)告
- 《架空輸電線路導(dǎo)線舞動(dòng)風(fēng)偏故障告警系統(tǒng)技術(shù)導(dǎo)則》
- 2024年計(jì)算機(jī)二級(jí)WPS考試題庫(kù)
- JJF(京) 92-2022 激光標(biāo)線儀校準(zhǔn)規(guī)范
- 普惠金融政策解讀
- 2024年疾控中心支部工作計(jì)劃范本
- 廣東省廣州黃埔區(qū)2023-2024學(xué)年八年級(jí)上學(xué)期期末數(shù)學(xué)試卷(含答案)
- 法理學(xué)課件馬工程
評(píng)論
0/150
提交評(píng)論