![數(shù)字媒體學院考博_第1頁](http://file4.renrendoc.com/view12/M02/30/20/wKhkGWXt6ACAA2tRAADu_XLfad8846.jpg)
![數(shù)字媒體學院考博_第2頁](http://file4.renrendoc.com/view12/M02/30/20/wKhkGWXt6ACAA2tRAADu_XLfad88462.jpg)
![數(shù)字媒體學院考博_第3頁](http://file4.renrendoc.com/view12/M02/30/20/wKhkGWXt6ACAA2tRAADu_XLfad88463.jpg)
![數(shù)字媒體學院考博_第4頁](http://file4.renrendoc.com/view12/M02/30/20/wKhkGWXt6ACAA2tRAADu_XLfad88464.jpg)
![數(shù)字媒體學院考博_第5頁](http://file4.renrendoc.com/view12/M02/30/20/wKhkGWXt6ACAA2tRAADu_XLfad88465.jpg)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
張遠鵬
102952014040117考生介紹江南大學2014年報考攻讀博士學位研究生普通招考生PPT目錄1. 基本信息2. 學習經歷主要研究工作及成果攻讀博士期間的科學研究計劃基本信息姓名張遠鵬
性別男
(電子照片)政治面貌
群眾出生年月1984.10.12聯(lián)系電話
報考類別定向
報考學院數(shù)字媒體報考專業(yè)
輕工信息技術報考導師(組)
王士同研究方向輕工信息技術
最后學歷
研究生最后學位碩士外語語種及水平英語,CET6
外國語
考試
□申請免試
√參加考試本科畢業(yè)學校
安徽師范大學學校層次
省重點本科專業(yè)計算機科學與技術
碩士畢業(yè)學校江南大學
學校層次
211碩士專業(yè)計算機應用技術
學習經歷2002.09-2006.07安徽師范大學計算機科學與技術專業(yè)2006.09-2008.08江南大學計算機應用技術專業(yè)2008.08-2009.08中國船舶重工業(yè)集團第723所2009.08-南通大學醫(yī)學信息學系主要研究工作及成果論文成果:張遠鵬,凌利峰,耿興云等.關聯(lián)規(guī)則在電子健康檔案系統(tǒng)中的應用[J].中國數(shù)字醫(yī)學,2011,4張遠鵬,董建成,耿興云等.區(qū)域電子健康檔案系統(tǒng)的分布式應用程序框架模型研究[J],醫(yī)學信息學雜志,2011,2張遠鵬,董建成,耿興云等.NET分布式技術在電子健康檔案系統(tǒng)中的應用[J].中國數(shù)字醫(yī)學,2010,10YuanpengZhang,
KuiJiang,
JianchengDong.NegationDetectioninChineseElectronicMedicalRecordBasedonRulesandWordCo-occurrence[C].FrontierandFutureDevelopmentofInformationTechnologyinMedicineandEducation,Volume269,
2014,
pp2215-2220張遠鵬,王理,董建成.基于規(guī)則和詞共現(xiàn)的中文電子病歷否定檢出[J].計算機應用與軟件.已錄用課題成果:2009.09-2012.09南通市科技計劃項目《基于社區(qū)醫(yī)療衛(wèi)生服務的居民健康檔案應用平臺建設》(XA2009001-1),排名第四,已經驗收結題2011.12-2013.12南通大學自然科學基金《基于關聯(lián)規(guī)則的電子健康檔案海量數(shù)據的挖掘》,排名第一,在研2013.05-2014.12)江蘇省教育科學研究院《高校思政課虛擬實驗室建設的研究與實踐》(2013-R-24890
)排名第三,在研2012.09-2015.09國家自然科學基金《基于Web的居民電子健康檔案數(shù)據共享平臺研究》(81271668)排名第八,在研攻讀博士期間的科學研究計劃一、自我評價本人2008年8月從江南大學信息工程學院碩士畢業(yè)以后,就職于中國船舶重工業(yè)集團公司第723研究所,主要從事軟件開發(fā)工作,先后參與了多項重大國防軍工項目的研發(fā)工作,如:(1)***型艦顯控分機的操作和控制軟件研發(fā);(2)***型艦顯控分機的數(shù)據接口軟件的研發(fā);(3)***型艦顯控分機觸控鍵盤軟件的研發(fā);(4)***型艦雙搜索雷達協(xié)同控制軟件的研發(fā)。目前,這些軟件已經投入到艦船實際應用。
2009年8月,為了解決和妻子的兩地分居,離開723所,就職于南通大學醫(yī)學信息學系,從事該專業(yè)的教學和科研工作。直至今日,主要的開發(fā)和科研工作如下:(1)參與南通市重大科技創(chuàng)新項目《南通市居民電子健康檔案共享平臺》的研發(fā)工作;(2)參與2012年度國家自然科學基金面上項目《基于Web的居民電子健康檔案數(shù)據共享平臺研究》的申報,并立項(基金號:81271668);(3)主持南通大學2011年度校級自然科學研究項目《基于關聯(lián)規(guī)則的電子健康檔案海量數(shù)據挖掘》;(4)參與2013江蘇省教育科學研究院課題《高校思政課虛擬實驗室建設的研究與實踐》申報,并立項;(5)主持南通大學杏林學院(獨立學院)自然科學研究項目《.NET平臺的區(qū)域電子健康檔案系統(tǒng)的分布式應用程序框架模型研究》;(6)主持南通大學杏林學院(獨立學院)教育研究項目《以社區(qū)醫(yī)療服務信息化為導向的全科醫(yī)學專業(yè)教學改革》。攻讀博士期間的科學研究計劃二、攻讀博士期間的科學研究計劃本人目前就職于南通大學醫(yī)學院醫(yī)學信息學系,所以希望在博士期間,能夠完成和醫(yī)學信息學相關方面的研究。而目前文本中命名實體的識別是人工智能研究的一個重要領域,所以希望能夠結合自己的工作背景,從中文電子病歷文本中,完成對命名實體的識別工作。隨著臨床信息化的發(fā)展,電子病歷開始在臨床中逐漸普及,如何智能地利用其中的信息也越來越受到關注,不少臨床決策支持系統(tǒng)(clinicaldecisionsupportsystem,CDSS)都將電子病歷作為重要的知識來源。然而,以自然語言形式存在的病歷信息成為信息智能利用的障礙,如何讓計算機自動匯總患者信息,構建和挖掘大型臨床數(shù)據庫以服務于臨床決策,成為臨床信息化所亟需解決的問題。攻讀博士期間的科學研究計劃二、攻讀博士期間的科學研究計劃在病歷中,命名實體的類別繁多,除了時間、人名、組織機構等常見的實體類別外,還有疾病、癥狀、手術操作、病因、病理、藥品等特有的實體類別。目前,命名實體的識別方法主要有3種:基于詞典的方法、基于規(guī)則的方法、基于機器學習的方法?;谠~典的方法,需要建立具有廣泛覆蓋性的命名實體詞典,并添加相應的個類,如縮寫、同義詞,變形詞甚至通常錯誤詞等注釋內容,配合相應的匹配算法來實現(xiàn)對于文本中命名實體的識別,其缺陷是對于出現(xiàn)的新命名實體缺乏兼容能力,往往存在覆蓋率不足的問題,特別是在醫(yī)學領域,術語量非常龐大,國內尚缺乏能夠有效支撐自然語言處理能力的中文醫(yī)學術語詞典。基于規(guī)則的方法,雖然在一定程度上彌補了基于詞典方法不能識別未收錄詞的缺陷,但是對于特定領域需要專業(yè)知識的工程師和專家來說,建立針對性的識別規(guī)則庫,規(guī)則的制定不僅需要消耗大量的時間和人力,而且所制定的規(guī)則可移植性差。相對于前兩種方法,基于機器學習的方法具有更好的實用性,通?;跇俗⑦^的語料進行訓練,然后基于訓練結果來智能完成對于命名實體的識別。因此,該方法具有很好的移植性,所以希望在讀博期間,能從基于機器學習的方法上尋找突破口,提高識別率。攻讀博士期間的科學研究計劃二、攻讀博士期間的科學研究計劃在實體命名識別研究中,常用的機器學習模型包括支持向量機(supportvectormachine,SVM)、隱馬爾可夫(hiddenMarkovmodel,HMM)、最大熵馬爾可夫(maximumentropyMarkovmodel,MEMM)、條件隨機場(CRF)等。1)支持向量機:將識別問題看作是一個分類問題,通過構造一個超平面,以超平面間的距離作為最大邊緣來把訓練實例分割為兩類,因此主要處理二元分類。2)隱馬爾可夫:是一種被應用得較早的模型,在語音識別中獲得廣泛應用,在生物醫(yī)學領域的實體識別研究中也有使用。3)最大熵馬爾可夫:是一種較早就被應用并對NER系統(tǒng)有較大促進的指數(shù)線性模型,它解決了隱馬爾可夫的問題,可以任意選擇特征,但由于其在每一節(jié)點都要進行歸一化,所以只能找到局部的最優(yōu)值,同時也帶來了標記偏見的問題,凡是訓練語料中未出現(xiàn)的情況全都忽略。4)條件隨機場:只需要考慮當前已經出現(xiàn)的觀測狀態(tài)特征,沒有獨立性的嚴格要求,并很好地解決了MEMM的標注偏見問題。它并不在每一個節(jié)點進行歸一化,而是對所有特征進行全局歸一化,因此可以求得全局的最優(yōu)值。此外,在小規(guī)模的訓練數(shù)據上,它也獲得了理想的效果。攻讀博士期間的科學研究計劃二、攻讀博士期間的科學研究計劃目前在生物醫(yī)學領域,基于條件隨機場得方法用的相對比較多,而且效果也比其他的方法理想。Tsai等利用CRF對GENIAV3.02中的5類實體進行識別,其中蛋白質的F值達70.2%,彭春艷等在相似的實驗中達到了73.7%的F值,這兩個實驗都證明CRF優(yōu)于其他機器學習模型。Leaman等對生物醫(yī)學文獻中的多類實體進行識別,總體F值達81.96%,其中疾病的F值僅為54.84%。而在其隨后針對Arizona疾病語料庫(ArizonaDiseaseCorpus,AZDC)的研究中,疾病的F值提升到了77.9%。同樣,基于AZDC語料庫,F(xiàn)aisal等則采用了一系列針對疾病量身定制的特征,達到了81.8%的F值。在中醫(yī)學領域,王世昆等在數(shù)據清洗和特征空間降維的基礎上,對中醫(yī)病案中的病癥和發(fā)病機理進行智能
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 金融科技下知識產權融資的實踐與探索
- 個人住房抵押貸款合同
- 中外雙方進出口合同范本
- 二手房全款交易合同范本
- 個人租賃倉儲空間的合同范本
- 中外合作研發(fā)合同范本(人工智能)
- 專業(yè)技術人才培養(yǎng)合作合同
- 產業(yè)投資合作協(xié)議合同模板
- 主要農作物新品種推廣合同示范文本
- 個人與合作方倉儲運輸合同例文
- 2024年山東省高中學業(yè)水平合格考生物試卷試題(含答案詳解)
- 2025年中考英語復習熱點話題作文范文
- 小學數(shù)學教學工作交流數(shù)學教學中的體會總結經驗交流會課件
- 2024年美國智能馬桶和馬桶蓋市場現(xiàn)狀及上下游分析報告
- 中國成人暴發(fā)性心肌炎診斷和治療指南(2023版)解讀
- 復產復工六個一
- 招商引資項目落地工作方案
- 湘教版高中數(shù)學必修二知識點清單
- 商業(yè)綜合體投資計劃書
- 2024妊娠期糖尿病指南課件
- 《鋼鐵是怎樣煉成的》練習題(含答案)
評論
0/150
提交評論