醫(yī)療GPT:讀懂?dāng)?shù)字醫(yī)療新紀(jì)元_第1頁
醫(yī)療GPT:讀懂?dāng)?shù)字醫(yī)療新紀(jì)元_第2頁
醫(yī)療GPT:讀懂?dāng)?shù)字醫(yī)療新紀(jì)元_第3頁
醫(yī)療GPT:讀懂?dāng)?shù)字醫(yī)療新紀(jì)元_第4頁
醫(yī)療GPT:讀懂?dāng)?shù)字醫(yī)療新紀(jì)元_第5頁
已閱讀5頁,還剩109頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

醫(yī)療GPT讀懂?dāng)?shù)字醫(yī)療新紀(jì)元目錄TOC\h\h現(xiàn)實(shí)篇\h第1章“人工智能+”醫(yī)療\h技術(shù)篇\h第2章“大數(shù)據(jù)+”醫(yī)療\h第3章“區(qū)塊鏈+”醫(yī)療\h第4章“云計(jì)算+”醫(yī)療\h產(chǎn)業(yè)篇\h第5章“GPT+”醫(yī)院\h第6章“GPT+”健康\h第7章“GPT+”醫(yī)藥\h第8章“GPT+”中醫(yī)\h第9章“GPT+”醫(yī)學(xué)教育\h未來篇\h第10章醫(yī)療GPT的未來挑戰(zhàn)\h第11章通向精準(zhǔn)醫(yī)療新時(shí)代現(xiàn)實(shí)篇第1章“人工智能+”醫(yī)療1.1什么是“人工智能+”醫(yī)療?人工智能(ArtificialIntelligence,AI)的概念從首次提出到現(xiàn)在已近70年,經(jīng)歷了追捧和黯淡。近幾年,人工智能終于呈現(xiàn)出爆發(fā)的趨勢(shì)。當(dāng)前,人工智能的勃興已經(jīng)成為推動(dòng)社會(huì)經(jīng)濟(jì)發(fā)展的新動(dòng)力之一,在提高社會(huì)生產(chǎn)效率、實(shí)現(xiàn)社會(huì)發(fā)展和經(jīng)濟(jì)轉(zhuǎn)型等方面發(fā)揮重要作用。作為主導(dǎo)新一代產(chǎn)業(yè)變革的核心力量,人工智能在醫(yī)療方面展示出了新的應(yīng)用方式,在深度融合中又催生出新業(yè)態(tài)。今天,作為一項(xiàng)創(chuàng)新性技術(shù),醫(yī)療AI遍布在醫(yī)療領(lǐng)域的方方面面。人工智能在醫(yī)療健康領(lǐng)域廣泛應(yīng)用正形成全球共識(shí)??梢哉f,人工智能以獨(dú)特的方式捍衛(wèi)著人類健康福祉,但這一切還要從人工智能與醫(yī)療的相逢開始說起。1.1.1國外醫(yī)療AI從哪里開始?20世紀(jì)70年代,國外開始出現(xiàn)了醫(yī)療領(lǐng)域的人工智能探索嘗試。1972年,利茲大學(xué)研發(fā)的AAPHelp能根據(jù)病人的癥狀判斷出產(chǎn)生劇烈腹痛可能的原因。1974年,資深醫(yī)生診斷的準(zhǔn)確性已經(jīng)不如該系統(tǒng)。盡管AAPHelp運(yùn)行耗時(shí)久,但在20世紀(jì)70年代的計(jì)算機(jī)硬件條件下,AAPHelp的產(chǎn)生仍具有突破性意義。在隨后的幾年內(nèi),不少新的人工智能醫(yī)療產(chǎn)品成果再次出現(xiàn)在人們的視野中。1974年,匹茲堡大學(xué)研發(fā)出INTERNIST-I內(nèi)科疾病的專家系統(tǒng),它主要用于輔助診斷內(nèi)科復(fù)雜疾病。1976年,斯坦福大學(xué)研發(fā)出MYCIN系統(tǒng),它能診斷出感染病患者并提供抗生素處方。MYCIN系統(tǒng)的內(nèi)部共有500條規(guī)則,只要按照MYCIN系統(tǒng)的提問依次進(jìn)行回答,就能自動(dòng)判斷出患者所感染細(xì)菌的類別并開出相應(yīng)處方。此外,在20世紀(jì)70年代,還有斯坦福大學(xué)開發(fā)的ONCOCIN,麻省理工學(xué)院開發(fā)的PIP、ABEL,羅格斯大學(xué)開發(fā)的CASNET/Glaucoma等。20世紀(jì)80年代,一些商業(yè)化應(yīng)用系統(tǒng)開始出現(xiàn),如QMR(QuickMedicalReference)和DXplain,主要是依據(jù)臨床表現(xiàn)提供診斷方案。20世紀(jì)90年代,計(jì)算機(jī)輔助診斷(ComputerAidedDiagnosis,CAD)系統(tǒng)問世,它是比較成熟的醫(yī)學(xué)影像計(jì)算機(jī)輔助應(yīng)用,包括乳腺X射線CAD系統(tǒng)。進(jìn)入21世紀(jì),IBMWatson是人工智能醫(yī)療領(lǐng)域最知名的系統(tǒng),并且已經(jīng)取得了非凡的成績(jī)。例如,在癌癥治療方面,Watson能夠在幾秒內(nèi)對(duì)數(shù)十年癌癥治療歷史中的150萬份患者記錄進(jìn)行篩選,并提出循證治療方案供醫(yī)生選擇。目前,癌癥治療領(lǐng)域排名前三的醫(yī)院都在使用Watson,并且中國也正式引進(jìn)了Watson。2016年以來,美國、加拿大、日本、英國、歐盟、印度、韓國、俄羅斯等國家和地區(qū)相繼發(fā)布人工智能研發(fā)戰(zhàn)略。2016年10月,美國《國家人工智能研究和發(fā)展戰(zhàn)略計(jì)劃》提出,要在醫(yī)學(xué)診斷等領(lǐng)域開發(fā)有效的人類與人工智能協(xié)作的方法,當(dāng)人類需要幫助時(shí),人工智能系統(tǒng)能夠自動(dòng)執(zhí)行決策和進(jìn)行醫(yī)療診斷。日本將醫(yī)療健康及護(hù)理作為人工智能的突破口。為了應(yīng)對(duì)快速老齡化,日本基于醫(yī)療、護(hù)理系統(tǒng)的大數(shù)據(jù)化,將建成以人工智能為依托、世界一流的醫(yī)療與護(hù)理先進(jìn)國家。英國提出發(fā)展人工智能醫(yī)療的三大潛力領(lǐng)域:輔助診斷領(lǐng)域、早期預(yù)防控制流行病并追蹤其發(fā)病率領(lǐng)域和圖像診斷領(lǐng)域。2016年2月,谷歌DeepMind宣布成立DeepMindHealth部門,并與英國國家醫(yī)療服務(wù)體系(NationalHealthService,NHS)合作,輔助他們進(jìn)行決策。DeepMind還參與NHS的一項(xiàng)利用深度學(xué)習(xí)開展頭頸癌患者放療療法設(shè)計(jì)的研究。同時(shí),DeepMind與Moorfields眼科醫(yī)院開展將人工智能技術(shù)應(yīng)用于及早發(fā)現(xiàn)和治療威脅視力的眼部疾病的合作。遺憾的是,2021年,谷歌健康部門GoogleHealth遭遇重大變故。該部門負(fù)責(zé)人大衛(wèi)·范伯格(DavidFeinberg)宣布于9月1日離職,并于10月1日起擔(dān)任美國最大電子健康記錄服務(wù)提供商之一Cerner的CEO兼總裁。之后,谷歌也決定解散GoogleHealth。1.1.2國內(nèi)醫(yī)療AI發(fā)展風(fēng)云20世紀(jì)80年代初,我國開始進(jìn)行人工智能醫(yī)療領(lǐng)域的開發(fā)研究,雖然起步落后于發(fā)達(dá)國家,但是發(fā)展迅猛。1978年,北京中醫(yī)醫(yī)院關(guān)幼波教授與計(jì)算機(jī)科學(xué)領(lǐng)域的專家合作開發(fā)了“關(guān)幼波肝病診療程序”,第一次將醫(yī)學(xué)專家系統(tǒng)應(yīng)用到我國傳統(tǒng)中醫(yī)領(lǐng)域。此后,我國加快開展人工智能醫(yī)療產(chǎn)品的研發(fā),具有代表性的產(chǎn)品有“中國中醫(yī)治療專家系統(tǒng)”和“林如高骨傷計(jì)算機(jī)診療系統(tǒng)”,以及具有咨詢和輔助診斷性質(zhì)的“中醫(yī)計(jì)算機(jī)輔助診療系統(tǒng)”等。進(jìn)入21世紀(jì)以來,我國人工智能在醫(yī)療的更多細(xì)分領(lǐng)域都取得了長(zhǎng)足的發(fā)展。2016年10月,百度發(fā)布“百度醫(yī)療大腦”,對(duì)標(biāo)谷歌和IBM的同類產(chǎn)品?!鞍俣柔t(yī)療大腦”作為百度大腦在醫(yī)療領(lǐng)域的具體應(yīng)用,大量收集與分析醫(yī)學(xué)專業(yè)文獻(xiàn)和醫(yī)療數(shù)據(jù),通過模擬問診流程,基于用戶癥狀,給出診療的最終建議。2018年11月,百度發(fā)布人工智能醫(yī)療品牌“百度靈醫(yī)”,2019年品牌升級(jí)為“靈醫(yī)智惠”,主要產(chǎn)品有“臨床輔助決策支持系統(tǒng)”“醫(yī)療大數(shù)據(jù)解決方案”“眼底影像分析系統(tǒng)”“智能診前助手”。2017年7月,阿里健康發(fā)布醫(yī)療AI系統(tǒng)“DoctorYou”,包括臨床醫(yī)學(xué)科研診斷平臺(tái)、醫(yī)療輔助檢測(cè)引擎等。此外,阿里健康還與政府、醫(yī)院、科研院校等外部機(jī)構(gòu)合作,開發(fā)了20種常見、多發(fā)疾病的智能診斷引擎,包括糖尿病、肺癌預(yù)測(cè)和眼底篩查等。2018年9月,阿里健康和阿里云聯(lián)合宣布阿里醫(yī)療人工智能系統(tǒng)“ET醫(yī)療大腦”2.0版本問世。2018年11月,騰訊牽頭承擔(dān)的“數(shù)字診療裝備研發(fā)專項(xiàng)”啟動(dòng),該項(xiàng)目作為國家重點(diǎn)研發(fā)計(jì)劃首批啟動(dòng)的6個(gè)試點(diǎn)專項(xiàng)之一,基于“AI+CDSS”(人工智能的臨床輔助決策支持系統(tǒng))探索和助力醫(yī)療服務(wù)升級(jí)。新冠疫情期間,人工智能在公共衛(wèi)生領(lǐng)域特別是傳染病的預(yù)防與控制方面發(fā)揮了重要作用,傳染病大數(shù)據(jù)分析預(yù)警系統(tǒng)、疫情排查系統(tǒng)、智能測(cè)溫機(jī)器人、消毒機(jī)器人、語音服務(wù)機(jī)器人等在戰(zhàn)“疫”一線被廣泛應(yīng)用。在全球抗疫的背景下,人工智能從“云端”落地,在疫情之中出演關(guān)鍵角色,提高了抗疫防疫的整體效率。新冠疫情成為數(shù)字技術(shù)的試金石,人工智能作為新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動(dòng)力量,體現(xiàn)了對(duì)社會(huì)的真正價(jià)值。1.2“人工智能+”怎么看上了醫(yī)療?1.2.1供需矛盾突出從需求端來看,當(dāng)前,四十多年的工業(yè)化進(jìn)程也帶來了不同程度的環(huán)境污染,疊加我國人口老齡化加劇,患慢性疾?。ê?jiǎn)稱慢性病、慢?。┤丝跀?shù)量增多,形成大量醫(yī)療需求。第七次全國人口普查結(jié)果顯示,我國60歲及以上人口為26402萬人,占18.70%。未來幾十年,老齡化程度還將持續(xù)加深,到2035年前后,我國老年人口占總?cè)丝诘谋壤龑⒊^四分之一,到2050年前后將超過三分之一。目前,中國已成為全世界老年人口數(shù)量最多、老齡化速度最快的大國。其中,東北三省的老齡化現(xiàn)象尤為明顯。2020年,東北三省總?cè)丝诒仁昵皽p少了1101萬人,而老齡化程度加深,65歲及以上人口比重為16.39%,提高7.26個(gè)百分點(diǎn),高于全國平均水平。遼寧省65歲及以上人口比重為17.42%,為全國省市中最高。在人口老齡化背景下,現(xiàn)代生活節(jié)奏加快,患慢性疾病人口數(shù)量也隨之增加。我國已確診的患慢性疾病人口數(shù)量超過3億,同時(shí)患病率以每年5.8%的速度增長(zhǎng)。2021年11月初,國際糖尿病聯(lián)合會(huì)(InternationalDiabetesFederation,IDF)在官網(wǎng)上更新了今年IDF全球糖尿病概覽的相關(guān)數(shù)據(jù),在中國,2011—2021年的十年間,糖尿病患病人數(shù)從9000萬增長(zhǎng)到了1.4億,占全國人口數(shù)的十分之一,與世界范圍內(nèi)的發(fā)病率持平。在這1.4億人中,有51.7%的人群未被診斷,屬于“隱性”糖尿病群體。根據(jù)全國衛(wèi)生服務(wù)調(diào)查,65歲以上群體的慢性疾病患病率高達(dá)78.4%,是全部人口患病率的3.2倍,即老齡人口越多慢性疾病人群基數(shù)越大。如今,慢性疾病已成為健康的頭號(hào)威脅,占到了中國77%的健康生命年損失和85%的死亡誘因,占全部疾病負(fù)擔(dān)的60%以上。人口結(jié)構(gòu)的變化還將帶來診療以外的醫(yī)療健康需求的結(jié)構(gòu)性增加,包括疾病預(yù)防和治療、健康監(jiān)測(cè)和管理、養(yǎng)生和保健、臨終關(guān)懷等。以體檢為例,與美、日、德超過70%的覆蓋率相比,我國的健康管理市場(chǎng)還有巨大的發(fā)展空間。而健康管理借助人工智能可以極大地賦能,讓健康管理實(shí)時(shí)可見、可控。伴隨著生活水平的提高,以及國家政策對(duì)家庭醫(yī)生、慢病防治、健康生活等方面的支持,越來越多的人將主動(dòng)參與健康管理。然而,從供給端來看,優(yōu)質(zhì)醫(yī)生及醫(yī)療資源不足,且醫(yī)療資源分布不均,難以承受快速增長(zhǎng)的醫(yī)療需求。從總量上看,醫(yī)療資源供給增長(zhǎng)落后于需求增長(zhǎng)。我國醫(yī)生與總?cè)丝诘谋壤s為1∶343,而西方國家的這一比例約為1∶280。醫(yī)生資源缺口問題在影像科醫(yī)生、病理科醫(yī)生及全科醫(yī)生方面尤為嚴(yán)重。目前,我國醫(yī)學(xué)影像數(shù)據(jù)的年增長(zhǎng)率約為30%,而影像科醫(yī)生數(shù)量的年增長(zhǎng)率僅為4.1%,病理科醫(yī)生缺口達(dá)到10萬人。我國全科醫(yī)生數(shù)量約30萬人,占醫(yī)生總數(shù)的7.37%。這一比例還遠(yuǎn)遠(yuǎn)達(dá)不到建立真正的全科醫(yī)生制度體系的需求——德國、法國、日本的占比均在20%以上,美國在12%以上。由于醫(yī)生的培養(yǎng)周期很長(zhǎng),我國獨(dú)立上崗醫(yī)生的培養(yǎng)周期長(zhǎng)達(dá)8年,較長(zhǎng)的培養(yǎng)周期帶來醫(yī)療人力成本提高,難以滿足持續(xù)增長(zhǎng)的醫(yī)療需求。從分布上看,醫(yī)療資源集中于三級(jí)醫(yī)院和發(fā)達(dá)地區(qū),基層醫(yī)院醫(yī)療水平低,醫(yī)生資源少。從配置上看,據(jù)統(tǒng)計(jì),2018年我國醫(yī)院數(shù)量超過3.2萬家,三級(jí)醫(yī)院僅占總數(shù)量的19%,卻承接了全國49.8%的醫(yī)療需求。三級(jí)醫(yī)院長(zhǎng)期超負(fù)荷運(yùn)轉(zhuǎn),承擔(dān)了過多基礎(chǔ)診療工作,導(dǎo)致核心醫(yī)療資源無法發(fā)揮最大價(jià)值。供需結(jié)構(gòu)不匹配導(dǎo)致了醫(yī)院運(yùn)營效率低、誤診率高、醫(yī)療體驗(yàn)差等諸多問題??梢哉f,供給與需求矛盾突出,是我國醫(yī)療行業(yè)的根本問題。而這些問題,不論是醫(yī)生的培養(yǎng),還是醫(yī)生醫(yī)療技術(shù)水平的提升,借助人工智能技術(shù)都將有望得到改善。1.2.2人工智能技術(shù)不斷突破一直以來,算法、算力和數(shù)據(jù)被認(rèn)為是人工智能發(fā)展的三駕馬車,也是推動(dòng)人工智能發(fā)展的重要基礎(chǔ)。1.在算法層面在算法層面,超大規(guī)模預(yù)訓(xùn)練模型等成為近兩年最受關(guān)注的熱點(diǎn)之一。自O(shè)penAI于2020年推出GPT-3以來,谷歌、華為、智源研究院、中國科學(xué)院、阿里巴巴等企業(yè)和研究機(jī)構(gòu)相繼推出超大規(guī)模預(yù)訓(xùn)練模型,包括SwitchTransformer、DALL·E、MT-NLG、盤古、悟道2.0、紫東太初和M6等,不斷刷新著各榜單紀(jì)錄。而OpenAI更是一舉將大模型的訓(xùn)練之路打開了,讓大家看到了基于深度學(xué)習(xí)的路徑方向,基于參數(shù)優(yōu)化一旦正確,機(jī)器就能具備類人的智能邏輯。深度學(xué)習(xí)是人工智能技術(shù)的重要一脈,目前語音識(shí)別和計(jì)算機(jī)視覺都基于深度學(xué)習(xí)技術(shù)來完成。隨著圖像領(lǐng)域深度學(xué)習(xí)Resnet網(wǎng)絡(luò)結(jié)構(gòu)發(fā)展,計(jì)算機(jī)視覺和綜合圖像處理技術(shù)取得長(zhǎng)足進(jìn)步,醫(yī)學(xué)影像分析在診療過程中發(fā)揮更大作用。例如,應(yīng)用計(jì)算機(jī)視覺技術(shù)進(jìn)行結(jié)腸鏡檢查,可以獲得更為有效、可靠的數(shù)據(jù),以降低結(jié)腸癌死亡率;在外科手術(shù)中,計(jì)算機(jī)視覺對(duì)腦瘤病人進(jìn)行三維頭骨建模,有利于后續(xù)神經(jīng)外科治療。此外,近年來,人工智能對(duì)海量數(shù)據(jù)的分析能力能夠讓研究者不再局限于常規(guī)的“推導(dǎo)定理式”研究,可以基于高維數(shù)據(jù)發(fā)現(xiàn)相關(guān)信息,繼而加速研究進(jìn)程。2020年,DeepMind提出的AlphaFold2在國際蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)競(jìng)賽(CriticalAssessmentofproteinStructurePrediction,CASP)中拔得頭籌,能夠精確地預(yù)測(cè)蛋白質(zhì)的三維結(jié)構(gòu),其準(zhǔn)確性可以與使用冷凍電子顯微鏡等實(shí)驗(yàn)技術(shù)解析的三維結(jié)構(gòu)相媲美。中美研究團(tuán)隊(duì)使用人工智能的方法,在保證“從頭計(jì)算”高精度的同時(shí),將分子動(dòng)力學(xué)極限提升了數(shù)個(gè)量級(jí),比過去同類工作計(jì)算空間尺度增大100倍,計(jì)算速度提高1000倍,獲得2020年國際計(jì)算機(jī)協(xié)會(huì)(AssociationforComputingMachinery,ACM)戈登貝爾獎(jiǎng)。2.在算力層面在算力層面,當(dāng)前,人工智能算力仍在持續(xù)突破,面向訓(xùn)練用和推斷用的芯片仍在快速演進(jìn)。這主要源于算力需求的驅(qū)動(dòng)。一方面,體現(xiàn)在模型訓(xùn)練階段,根據(jù)OpenAI數(shù)據(jù),模型計(jì)算量增長(zhǎng)速度遠(yuǎn)超人工智能硬件算力增長(zhǎng)速度,存在萬倍差距;另一方面,由于推斷的泛在性,使得推斷用算力需求持續(xù)增長(zhǎng)。與此同時(shí),新的算力架構(gòu)也在不斷研究中,類腦芯片、存內(nèi)計(jì)算、量子計(jì)算等備受關(guān)注,但總體上處于探索階段。3.在數(shù)據(jù)層面在數(shù)據(jù)層面,以深度學(xué)習(xí)為代表的人工智能技術(shù)需要大量的標(biāo)注數(shù)據(jù),這也催生出專門的技術(shù)乃至服務(wù)。隨著面向問題的不斷具體化和深入,數(shù)據(jù)服務(wù)走向精細(xì)化和定制化。此外,隨著知識(shí)在人工智能的重要性被廣泛提及,對(duì)知識(shí)集的構(gòu)建和利用不斷增多。人工智能的快速發(fā)展推動(dòng)數(shù)據(jù)規(guī)模不斷提升。據(jù)互聯(lián)網(wǎng)數(shù)據(jù)中心(InternetDataCenter,IDC)測(cè)算,2025年全球數(shù)據(jù)規(guī)模將達(dá)到163ZB,其中80%~90%是非結(jié)構(gòu)化數(shù)據(jù)。數(shù)據(jù)服務(wù)進(jìn)入深度定制化的階段,百度、阿里巴巴、京東等公司推出根據(jù)不同場(chǎng)景和需求進(jìn)行數(shù)據(jù)定制的服務(wù)。企業(yè)需求的數(shù)據(jù)集從通用簡(jiǎn)單場(chǎng)景向個(gè)性化復(fù)雜場(chǎng)景過渡。例如,語音識(shí)別數(shù)據(jù)集從普通話向小語種、方言等場(chǎng)景發(fā)展,智能對(duì)話數(shù)據(jù)集從簡(jiǎn)單問答、控制等場(chǎng)景向應(yīng)用場(chǎng)景、業(yè)務(wù)問答等方向發(fā)展。各方積極探索建立高質(zhì)量知識(shí)集,支撐未來知識(shí)驅(qū)動(dòng)的人工智能應(yīng)用發(fā)展。數(shù)據(jù)生成和共享速度迅速增長(zhǎng)。在數(shù)據(jù)方面,我國擁有得天獨(dú)厚的優(yōu)勢(shì),我國人口眾多,數(shù)據(jù)基數(shù)大,同時(shí)多樣性豐富,為大數(shù)據(jù)分析提供了豐富的數(shù)據(jù)來源,也為人工智能不斷訓(xùn)練與優(yōu)化算法模型提供了廣泛數(shù)據(jù)集。盡管中國有比較龐大的人口數(shù)量與相對(duì)的數(shù)據(jù)優(yōu)勢(shì),但醫(yī)療信息化與數(shù)據(jù)化普及程度不足,也制約著人工智能醫(yī)療產(chǎn)業(yè)的發(fā)展。但相比較而言,盡管美國的人口基數(shù)與數(shù)據(jù)樣本量沒有中國龐大,但美國有著比較健全的醫(yī)療數(shù)據(jù)化系統(tǒng),或者說醫(yī)療的信息化、數(shù)據(jù)化程度比較高,這就使得美國在人工智能醫(yī)療方面的訓(xùn)練上,更容易基于數(shù)據(jù)化與標(biāo)準(zhǔn)化訓(xùn)練出診斷準(zhǔn)確性更高的人工智能醫(yī)生。1.2.3政策引導(dǎo)和支持近年來,我國出臺(tái)了一系列全國性政策及醫(yī)療人工智能專項(xiàng)政策,鼓勵(lì)“人工智能+”醫(yī)療產(chǎn)業(yè)發(fā)展。在政策引導(dǎo)下,醫(yī)療產(chǎn)業(yè)有望迎來真正的變革。2017年7月,國務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》(以下簡(jiǎn)稱《規(guī)劃》),這也是我國在人工智能領(lǐng)域進(jìn)行系統(tǒng)部署的第一份文件。《規(guī)劃》指出,到2030年,我國人工智能理論、技術(shù)與應(yīng)用總體上要達(dá)到世界領(lǐng)先水平。在《規(guī)劃》提出的六大重點(diǎn)任務(wù)中,特別提出要在醫(yī)療領(lǐng)域發(fā)展便捷高效的智能服務(wù),圍繞醫(yī)療等方面的迫切民生需求,加快人工智能創(chuàng)新應(yīng)用,使精準(zhǔn)化智能服務(wù)更加豐富多樣,使社會(huì)治理智能化水平大幅提升。《規(guī)劃》提出發(fā)展智能醫(yī)療:“推廣應(yīng)用人工智能治療新模式新手段,建立快速精準(zhǔn)的智能醫(yī)療體系。探索智慧醫(yī)院建設(shè),開發(fā)人機(jī)協(xié)同的手術(shù)機(jī)器人、智能診療助手,研發(fā)柔性可穿戴、生物兼容的生理監(jiān)測(cè)系統(tǒng),研發(fā)人機(jī)協(xié)同臨床智能診療方案,實(shí)現(xiàn)智能影像識(shí)別、病理分型和智能多學(xué)科會(huì)診?;谌斯ぶ悄荛_展大規(guī)模基因組識(shí)別、蛋白質(zhì)組學(xué)、代謝組學(xué)等研究和新藥研發(fā),推進(jìn)醫(yī)藥監(jiān)管智能化。加強(qiáng)流行病智能監(jiān)測(cè)和防控”。2018年,教育部印發(fā)《高等學(xué)校人工智能創(chuàng)新行動(dòng)計(jì)劃》,國務(wù)院辦公廳印發(fā)《關(guān)于促進(jìn)“互聯(lián)網(wǎng)+醫(yī)療健康”發(fā)展的意見》。2020年,中共中央政治局常務(wù)委員會(huì)召開會(huì)議時(shí)指出,要加大公共衛(wèi)生服務(wù)、應(yīng)急物資保障領(lǐng)域投入,加快5G網(wǎng)絡(luò)、數(shù)據(jù)中心等新型基礎(chǔ)設(shè)施建設(shè)進(jìn)度。2020年新冠疫情暴發(fā)之時(shí),工信部網(wǎng)站發(fā)布了《充分發(fā)揮人工智能賦能效用協(xié)力抗擊新型冠狀病毒感染的肺炎疫情倡議書》,倡議進(jìn)一步發(fā)揮人工智能賦能效用,組織科研和生產(chǎn)力量,把加快有效支撐疫情防控的相關(guān)產(chǎn)品攻關(guān)和應(yīng)用作為優(yōu)先工作,進(jìn)一步推動(dòng)了“人工智能+”醫(yī)療的發(fā)展。2023年更是著重于電子病歷的推行。國家衛(wèi)健委在4月發(fā)布新版國家二級(jí)公立醫(yī)院績(jī)效考核操作手冊(cè)。對(duì)于二級(jí)公立醫(yī)院的電子病歷應(yīng)用功能水平分級(jí)、患者滿意度等指標(biāo),新版手冊(cè)要求逐步提高。以電子病歷為核心的醫(yī)院信息化建設(shè)是深化醫(yī)改的重要內(nèi)容之一。電子病歷的推行,是數(shù)字化醫(yī)療的一個(gè)重要舉措,或者說是人工智能醫(yī)療向前發(fā)展的一個(gè)基礎(chǔ)條件。沒有數(shù)據(jù)就很難訓(xùn)練出高質(zhì)量的人工智能醫(yī)生,而電子病歷的數(shù)據(jù)化,給人工智能的醫(yī)療變革奠定了基礎(chǔ)。1.3“人工智能+”下,醫(yī)療正進(jìn)擊相對(duì)于制造業(yè)、通信、傳媒、零售、教育等人工智能應(yīng)用領(lǐng)域,全球的人工智能醫(yī)療還處于早期階段,商業(yè)化程度相對(duì)較低,行業(yè)滲透率較低。但不可否認(rèn)的是,人工智能在醫(yī)療領(lǐng)域的結(jié)合點(diǎn)響應(yīng)了傳統(tǒng)醫(yī)療的諸多困境,具有廣泛的市場(chǎng)需求和多元業(yè)務(wù)趨向,擁有廣闊的發(fā)展空間。尤其是OpenAI大語言模型(也稱大型語言模型)的突破,將加速人工智能技術(shù)介入醫(yī)療的普及與應(yīng)用速度。例如,訓(xùn)練人工智能輔助醫(yī)生完成病歷的撰寫及診療過程的問題概述?;谟跋駥W(xué)與檢測(cè)指標(biāo)的人工智能診斷,以及借助人工智能技術(shù)的??漆t(yī)生打造,都正在實(shí)現(xiàn)的路上。從具體應(yīng)用層面來看,人工智能在醫(yī)療領(lǐng)域主要有5個(gè)應(yīng)用方向:輔助診療、醫(yī)學(xué)影像、健康管理、藥物研發(fā)、疾病預(yù)測(cè)。1.3.1輔助診療人工智能輔助診療主要提供醫(yī)學(xué)影像、電子病歷、導(dǎo)診機(jī)器人、醫(yī)療助手、輔助醫(yī)療、臨床輔助決策等服務(wù),利用機(jī)器學(xué)習(xí)+計(jì)算機(jī)視覺緩解病理專家稀缺的現(xiàn)狀,利用人工智能+大數(shù)據(jù)對(duì)患者進(jìn)行系統(tǒng)化記錄和健康管理,利用人工智能+機(jī)器人技術(shù)分擔(dān)醫(yī)院從醫(yī)人數(shù)不足的壓力。(1)在電子病歷方面,人工智能普遍在病種專業(yè)化平臺(tái)、智能語音錄入、自然語言識(shí)別、臨床決策支持這4個(gè)場(chǎng)景開展服務(wù)。以語音電子病歷為例,人工智能基于脫敏的病歷數(shù)據(jù)和臨床使用不斷訓(xùn)練模型、優(yōu)化算法,通過語音識(shí)別引擎實(shí)現(xiàn)人機(jī)交互和文本轉(zhuǎn)錄。(2)在導(dǎo)診機(jī)器人方面,我國機(jī)器人應(yīng)用相對(duì)成熟,應(yīng)用場(chǎng)景明晰,一般多為院內(nèi)導(dǎo)診環(huán)節(jié),使得醫(yī)療機(jī)器人具有相應(yīng)的發(fā)展優(yōu)勢(shì)。醫(yī)療領(lǐng)域機(jī)器人主要基于人臉識(shí)別、語音識(shí)別等技術(shù),再通過后臺(tái)嫁接醫(yī)院信息等知識(shí)系統(tǒng),實(shí)現(xiàn)導(dǎo)診功能。(3)在醫(yī)療助手方面,智能問診是主要應(yīng)用場(chǎng)景,通過建立疾病知識(shí)庫和歷史問診記錄,實(shí)現(xiàn)人機(jī)交互的智能問診功能。例如,在新冠疫情期間,入院?jiǎn)栐\存在交叉感染的風(fēng)險(xiǎn),對(duì)有問診需求的患者造成不便,并且疫情給公眾帶來一定的心理恐慌,在線下醫(yī)療受阻,但又急需專業(yè)的醫(yī)學(xué)信息來解決問題的情況下,在線問診發(fā)展迅速。在在線問診的過程中,用戶在在線問診平臺(tái)輸入癥狀,人工智能系統(tǒng)將識(shí)別用戶輸入的文本,并完成分詞、詞性標(biāo)注、句法解析、信息抽取等一系列工作,最終在知識(shí)庫中進(jìn)行檢索,把類似信息推給用戶,完成精準(zhǔn)的信息匹配。騰訊云基于醫(yī)療行業(yè)語料及醫(yī)療專業(yè)詞匯,打造醫(yī)療行業(yè)語音識(shí)別模型。醫(yī)生在門診、住院查房、交接班等場(chǎng)景下,均可使用語音輸入軟件,將傳統(tǒng)的手寫病歷轉(zhuǎn)換為語音輸入,大幅度縮短病歷錄入的時(shí)間,減輕工作負(fù)擔(dān)。(4)在輔助醫(yī)療方面,人工智能已經(jīng)形成了一些實(shí)質(zhì)性應(yīng)用,手術(shù)機(jī)器人和醫(yī)療機(jī)器人就是比較活躍的嘗試。手術(shù)機(jī)器人已經(jīng)在胃腸外科、泌尿外科、婦科和心外科等的手術(shù)中滲透與應(yīng)用。手術(shù)機(jī)器人通過高分辨率三維立體視覺及器械自由度,在狹小的手術(shù)空間內(nèi)提供超越人類的視覺系統(tǒng)、更大的操作靈活性與精準(zhǔn)度,拓展了腹腔鏡手術(shù)的適應(yīng)證,增強(qiáng)了手術(shù)效果。(5)人工智能技術(shù)還可用于臨床輔助決策。臨床輔助決策支持系統(tǒng)(ClinicalDecisionSupportSystem,CDSS)相當(dāng)于一個(gè)不斷更新的醫(yī)學(xué)知識(shí)庫,是基于人機(jī)交互的醫(yī)療信息技術(shù)應(yīng)用系統(tǒng),通過數(shù)據(jù)和模型輔助醫(yī)生完成臨床決策。CDSS的使用場(chǎng)景涵蓋診前決策、診中支持和診后評(píng)價(jià)全流程,幫助臨床醫(yī)生做出最為恰當(dāng)?shù)脑\療決策,提高診斷效率與診斷質(zhì)量。目前,世界上絕大多數(shù)CDSS都由3個(gè)部分組成,即臨床知識(shí)庫、推理機(jī)和人機(jī)交流接口,其中龐大可靠的臨床知識(shí)庫是CDSS的行業(yè)壁壘。一個(gè)完整的臨床知識(shí)庫應(yīng)當(dāng)包含各種最新臨床指南、循證醫(yī)學(xué)證據(jù)、醫(yī)學(xué)文獻(xiàn)、醫(yī)學(xué)辭典、醫(yī)學(xué)圖譜計(jì)算工具、大量電子病歷等海量數(shù)據(jù),還應(yīng)當(dāng)交互良好,方便臨床醫(yī)生從中獲取信息。此外,臨床知識(shí)庫必須是開放的、動(dòng)態(tài)更新的。1.3.2醫(yī)學(xué)影像作為輔助診療的一個(gè)細(xì)分領(lǐng)域,將人工智能技術(shù)應(yīng)用于醫(yī)學(xué)影像診斷中,是醫(yī)療領(lǐng)域人工智能應(yīng)用最為廣泛的場(chǎng)景。人工智能醫(yī)學(xué)影像得以率先爆發(fā)與落地應(yīng)用,主要是由于影像數(shù)據(jù)的相對(duì)易獲取性和易處理性。相比于病歷等跨越三五年甚至更長(zhǎng)時(shí)間的數(shù)據(jù)積累,影像數(shù)據(jù)僅需要單次拍攝,幾秒鐘即可獲取,一張影像片子即可反映病人的大部分病情狀況,成為醫(yī)生確定治療方案的直接依據(jù)。醫(yī)學(xué)影像龐大且相對(duì)標(biāo)準(zhǔn)的數(shù)據(jù)基礎(chǔ),以及智能圖像識(shí)別等算法的不斷進(jìn)步,為人工智能醫(yī)療在該領(lǐng)域的落地應(yīng)用提供了堅(jiān)實(shí)基礎(chǔ)。具體而言,醫(yī)學(xué)影像診斷主要依托圖像識(shí)別和深度學(xué)習(xí)這兩項(xiàng)技術(shù)。依據(jù)臨床診斷路徑,首先,將圖像識(shí)別技術(shù)應(yīng)用于感知環(huán)節(jié),對(duì)非結(jié)構(gòu)化影像數(shù)據(jù)進(jìn)行處理和分析,提取有用信息;其次,利用深度學(xué)習(xí)技術(shù),將大量臨床影像數(shù)據(jù)和診斷經(jīng)驗(yàn)輸入人工智能模型,使神經(jīng)元網(wǎng)絡(luò)進(jìn)行深度學(xué)習(xí)訓(xùn)練;最后,基于不斷驗(yàn)證與打磨的算法模型,進(jìn)行影像診斷智能推理,輸出個(gè)性化的診療判斷結(jié)果。從落地方向來看,人工智能主要解決3種影像需求:第1種是病灶識(shí)別與標(biāo)注,針對(duì)X射線影像(也稱X影像或X線片)、計(jì)算機(jī)斷層掃描(ComputedTomography,CT)影像(也稱CT片)、磁共振成像(MagneticResonanceImaging,MRI)影像等醫(yī)學(xué)影像進(jìn)行圖像分割、特征提取、定量分析和對(duì)比分析,識(shí)別與標(biāo)注病灶,幫助醫(yī)生發(fā)現(xiàn)肉眼難以發(fā)現(xiàn)的病灶,降低假陰性診斷發(fā)生率,提高醫(yī)生診斷效率;第2種是靶區(qū)自動(dòng)勾畫與自適應(yīng)放療,針對(duì)腫瘤放療環(huán)節(jié)進(jìn)行影像處理,幫助影像科醫(yī)生對(duì)200~450張CT影像進(jìn)行自動(dòng)勾畫,時(shí)間縮短到30分鐘一套,在患者15~20次上機(jī)照射過程中不斷識(shí)別病灶位置變化以達(dá)到自適應(yīng)放療,減少射線對(duì)患者健康組織的輻射與傷害;第3種是影像三維重建,基于灰度統(tǒng)計(jì)量的配準(zhǔn)算法和基于特征點(diǎn)的配準(zhǔn)算法,解決斷層圖像配準(zhǔn)問題,有效節(jié)約配準(zhǔn)時(shí)間,在手術(shù)環(huán)節(jié)有重要應(yīng)用。從落地情況來看,目前中國人工智能醫(yī)學(xué)影像產(chǎn)品主要應(yīng)用在疾病篩查方面,以腫瘤和慢性疾病領(lǐng)域?yàn)橹?。其中,肺癌和眼底篩查領(lǐng)域介入企業(yè)最多,近兩年乳腺癌也成為熱門布局領(lǐng)域之一。此外,不同企業(yè)針對(duì)客戶群體也有所差別,除三甲醫(yī)院和基層醫(yī)院外,也有面向C端和保險(xiǎn)公司等的產(chǎn)品。1.3.3健康管理將人工智能技術(shù)應(yīng)用到健康管理的具體場(chǎng)景,通常與互聯(lián)網(wǎng)醫(yī)療緊密結(jié)合,被視為互聯(lián)網(wǎng)醫(yī)療的深化發(fā)展階段。目前,人工智能技術(shù)主要應(yīng)用于風(fēng)險(xiǎn)識(shí)別、虛擬護(hù)士、精神健康、移動(dòng)醫(yī)療、可穿戴設(shè)備等健康管理領(lǐng)域。人工智能可實(shí)現(xiàn)精準(zhǔn)健康管理。從技術(shù)驅(qū)動(dòng)的角度看,人工智能能通過高效的計(jì)算和精準(zhǔn)的決策分析,使個(gè)性化健康管理成為可能,推動(dòng)健康管理的精準(zhǔn)化,甚至未來營養(yǎng)師和運(yùn)動(dòng)專家可以基于人工智能系統(tǒng)生成精準(zhǔn)健康干預(yù)方案,并探究數(shù)據(jù)背后的學(xué)科邏輯。例如,日本就將醫(yī)療健康管理和護(hù)理作為結(jié)合人工智能的突破口,旨在緩解本國嚴(yán)重的老齡化問題帶來的壓力。借助各種智能設(shè)備,如智能馬桶可以對(duì)尿液與糞便進(jìn)行自動(dòng)監(jiān)測(cè)與檢測(cè),結(jié)合人工智能的健康管理系統(tǒng),不僅能實(shí)時(shí)地掌握健康狀況,同時(shí)還能推演出潛在的健康問題。我國的人工智能健康管理產(chǎn)業(yè)起步較晚,但隨著各種檢測(cè)技術(shù)(如可穿戴設(shè)備、基因檢測(cè)等)的發(fā)展,伴隨著物聯(lián)網(wǎng)大環(huán)境的促進(jìn),當(dāng)前健康管理市場(chǎng)正在進(jìn)入一個(gè)高速發(fā)展階段。盡管可穿戴設(shè)備產(chǎn)業(yè)之前已經(jīng)發(fā)展了十多年,但一直沒有獲得足夠的市場(chǎng)認(rèn)同,其中兩大核心制約要素就是硬件與軟件。所謂的硬件,就是可穿戴設(shè)備產(chǎn)品本身,不論是傳感器還是其他的監(jiān)測(cè)技術(shù),其針對(duì)人體健康指標(biāo)的健康精密度都還存在著優(yōu)化的空間。所謂的軟件,就是基于可穿戴設(shè)備所采集的大量健康數(shù)據(jù),我們需要借助人工智能的健康管理系統(tǒng),才能構(gòu)建實(shí)時(shí)的健康管理效果,否則可穿戴設(shè)備就只能停留在運(yùn)動(dòng)計(jì)步等初級(jí)運(yùn)動(dòng)數(shù)據(jù)的監(jiān)測(cè),難以進(jìn)入真正的健康管理領(lǐng)域。不過可以預(yù)見的是,在人工智能醫(yī)療技術(shù)的突破之下,可穿戴設(shè)備產(chǎn)業(yè)擁有更加廣闊的發(fā)展前景。尤其是在健康管理領(lǐng)域,可穿戴設(shè)備是不可或缺的實(shí)現(xiàn)載體。1.3.4藥物研發(fā)藥物研發(fā)主要包括藥物發(fā)現(xiàn)、臨床前研究、臨床研究及審批上市4個(gè)階段。目前,藥物研發(fā)的核心困難在于研發(fā)過程中存在諸多不確定性因素,如靶點(diǎn)有效性、模型有效性等問題,需要通過大量實(shí)驗(yàn)予以確認(rèn)。而在藥物研發(fā)過程中引入人工智能技術(shù),利用深度學(xué)習(xí)技術(shù)對(duì)分子結(jié)構(gòu)進(jìn)行處理和分析,在不同研發(fā)環(huán)節(jié)建立擁有較高準(zhǔn)確性的預(yù)測(cè)系統(tǒng),可以減少各個(gè)研發(fā)環(huán)節(jié)的不確定性,從而縮短研發(fā)周期,降低試錯(cuò)成本,提高研發(fā)成功率。在新冠疫情期間,通過大數(shù)據(jù)處理、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等技術(shù),人工智能在藥物研發(fā)領(lǐng)域發(fā)揮了重要作用,這些應(yīng)用主要集中在靶點(diǎn)發(fā)現(xiàn)、疾病網(wǎng)絡(luò)構(gòu)建和藥物篩選等方面。1.人工智能技術(shù)在智能藥物研發(fā)中的優(yōu)勢(shì)基于大語言模型人工智能技術(shù)的不斷發(fā)展,將會(huì)加速人工智能在醫(yī)療領(lǐng)域的應(yīng)用,其中智能藥物研發(fā)必然是不可或缺的環(huán)節(jié)。人工智能技術(shù)在智能藥物研發(fā)中主要有以下3個(gè)方面的優(yōu)勢(shì):首先是加速研發(fā)。傳統(tǒng)的藥物研發(fā)需要耗費(fèi)大量的時(shí)間和人力、物力,而人工智能技術(shù)可以通過對(duì)海量數(shù)據(jù)的分析和挖掘,加快藥物篩選和優(yōu)化的過程,并且可以針對(duì)疾病配對(duì)出更加有效的藥物,就能在最大程度上縮短研發(fā)時(shí)間,降低研發(fā)成本。其次是提高成功率。人工智能技術(shù)可以通過對(duì)疾病與藥物數(shù)據(jù)的深度學(xué)習(xí)和模式識(shí)別,發(fā)現(xiàn)和分析隱藏在數(shù)據(jù)中的規(guī)律和特征,包括對(duì)不同藥物分子的合成模擬配對(duì),最大程度地提高藥物研發(fā)的準(zhǔn)確性與成功率。最后是提高效率。通常的藥物研發(fā)需要處理大量的數(shù)據(jù)、實(shí)驗(yàn)和信息,而人工智能技術(shù)通過自動(dòng)化的算法和模型,不僅可以對(duì)數(shù)據(jù)進(jìn)行準(zhǔn)確、快速的處理和分析,同時(shí)還可以模擬推演各種配對(duì)結(jié)果,讓實(shí)驗(yàn)從實(shí)驗(yàn)室走向人工智能虛擬實(shí)驗(yàn),從而提高研發(fā)效率。2.人工智能技術(shù)在智能藥物研發(fā)中的局限性目前,人工智能技術(shù)在智能藥物研發(fā)中還存在一些局限性,主要體現(xiàn)在以下3個(gè)方面。一是數(shù)據(jù)不足。人工智能驅(qū)動(dòng)下的智能藥物研發(fā),顯然需要基于大量的數(shù)據(jù)和信息,但是目前可用的數(shù)據(jù)仍然相對(duì)有限,不論是臨床疾病的數(shù)據(jù),還是藥物數(shù)據(jù)庫的信息,這在很大程度上限制了人工智能技術(shù)在藥物研發(fā)領(lǐng)域的應(yīng)用。二是算法不完善。尤其是在沒有大語言模型技術(shù)之前,人工智能的算法技術(shù)更像是數(shù)據(jù)統(tǒng)計(jì)分析,而不具備自研發(fā)的能力。但隨著大語言模型技術(shù)的突破,基于人工智能藥物研發(fā)的算法技術(shù)將會(huì)在最大程度上獲得優(yōu)化。三是涉及倫理和法律問題。人工智能技術(shù)的應(yīng)用涉及一些倫理和法律問題。一方面是數(shù)據(jù)隱私保護(hù)與數(shù)據(jù)安全等方面的問題;另一方面則是人工智能技術(shù)驅(qū)動(dòng)下的藥物研發(fā),需要相對(duì)應(yīng)的監(jiān)管與審批流程,尤其是一些臨床測(cè)試環(huán)節(jié)在借助人工智能技術(shù)獲得了模擬與優(yōu)化之后。但總的來說,借助人工智能技術(shù)優(yōu)化藥物研發(fā),并推動(dòng)藥物研發(fā)、監(jiān)管、審批等體系的變革與優(yōu)化,以及借助人工智能技術(shù)實(shí)現(xiàn)快速、高效、精準(zhǔn)、個(gè)性化藥物配對(duì)、研發(fā)、生產(chǎn)、治療的時(shí)代正在到來。1.3.5疾病預(yù)測(cè)對(duì)公共衛(wèi)生領(lǐng)域來說,人工智能技術(shù)的疾病預(yù)測(cè)無疑具有重要意義。傳染病防控是目前人工智能在疾病預(yù)測(cè)領(lǐng)域的最大應(yīng)用場(chǎng)景,人工智能主要在傳染病暴發(fā)預(yù)測(cè)、傳播與溯源排查、發(fā)展趨勢(shì)預(yù)測(cè)等方面發(fā)揮作用。(1)在傳染病暴發(fā)預(yù)測(cè)方面,利用網(wǎng)絡(luò)爬蟲技術(shù)、自然語言處理技術(shù)及其他人工智能技術(shù),持續(xù)收集并分析全球范圍內(nèi)關(guān)于疾病和重大公共衛(wèi)生事件的新聞、報(bào)告、評(píng)論和搜索引擎指數(shù),從海量數(shù)據(jù)中過濾并提取有效信息,對(duì)關(guān)鍵信息進(jìn)行智能化分析,可對(duì)傳染病暴發(fā)做出可能性預(yù)測(cè)。(2)在傳染病傳播與溯源排查方面,利用深度學(xué)習(xí)技術(shù),根據(jù)出行軌跡流動(dòng)信息、社交信息、消費(fèi)信息、暴露接觸史等大量數(shù)據(jù)進(jìn)行科學(xué)建模,結(jié)合感染者確診時(shí)間及其密切接觸者的空間位置信息確定可能存在交叉感染的時(shí)間點(diǎn)與具體傳播路徑,為傳染病溯源分析提供可靠依據(jù)。(3)在傳染病發(fā)展趨勢(shì)預(yù)測(cè)方面,基于高危人群感染數(shù)據(jù),結(jié)合新增確診病例、疑似病例、死亡病例與治愈病例數(shù)等,借助傳播動(dòng)力學(xué)模型、動(dòng)態(tài)感染模型、回歸模型等大數(shù)據(jù)分析模型,人工智能技術(shù)可以對(duì)發(fā)病熱力分布與密切接觸者的風(fēng)險(xiǎn)熱力分布進(jìn)行分析與展示,并對(duì)疫情峰值與拐點(diǎn)等重要趨勢(shì)進(jìn)行研判。在新冠疫情期間,基于人工智能技術(shù)的創(chuàng)新防疫應(yīng)用在各地相繼落地。在韓國,基于地理位置和行動(dòng)軌跡的大數(shù)據(jù)信息平臺(tái)成為控制病毒傳播的重要工具,當(dāng)人們靠近疫情危險(xiǎn)區(qū)時(shí),會(huì)自動(dòng)收到危險(xiǎn)報(bào)警。在美國加州,科學(xué)家研發(fā)出針對(duì)易感者的健康預(yù)警系統(tǒng),能夠遠(yuǎn)程監(jiān)控包括獨(dú)居老人在內(nèi)的易感人群的身體健康狀況,起到傳染病預(yù)警作用。在我國,人工智能在無接觸式體溫檢測(cè)、社區(qū)居民健康快速篩查、疫情宣教、流行病學(xué)數(shù)據(jù)采集與應(yīng)用、智慧化管理平臺(tái)建設(shè)等方面展開應(yīng)用。1.4ChatGPT如何影響醫(yī)療?從2022年底到2023年,聊天機(jī)器人程序ChatGPT火遍全網(wǎng)。推出才兩個(gè)月時(shí),ChatGPT月活躍用戶數(shù)就已經(jīng)突破1億,成為互聯(lián)網(wǎng)歷史上用戶數(shù)增長(zhǎng)最快的消費(fèi)應(yīng)用。而當(dāng)初,抖音海外版TikTok在全球發(fā)布后,花了大約9個(gè)月的時(shí)間才達(dá)到這個(gè)成績(jī)。作為人工智能領(lǐng)域的“頂流”產(chǎn)品。ChatGPT的出現(xiàn)進(jìn)一步加速了人工智能在醫(yī)療領(lǐng)域的落地,并展現(xiàn)出令人興奮的應(yīng)用前景。1.4.1ChatGPT是個(gè)啥?ChatGPT是OpenAI發(fā)布的最新一代的AI語言模型,是自然語言處理(NaturalLanguageProcessing,NLP)中一項(xiàng)引人矚目的進(jìn)展。這個(gè)當(dāng)今最火爆的AI語言模型,與過去那些智能語音助手的回答模式有很大的不同,ChatGPT出人意料地聰明。與當(dāng)前的一些人工智能客服相比,ChatGPT真正走向了人工智能,有了我們期待的模樣。很多人形容它是一個(gè)真正的“六邊形戰(zhàn)士”——不僅能聊天、搜索、做翻譯,還能撰寫詩詞、論文、代碼,甚至能開發(fā)小游戲、參加考試、干科研、當(dāng)醫(yī)生等。外媒評(píng)論稱,ChatGPT會(huì)成為科技行業(yè)的下一個(gè)顛覆者。GPT的英文全稱為GenerativePre-trainedTransformer(生成式預(yù)訓(xùn)練轉(zhuǎn)換器),是一種基于互聯(lián)網(wǎng)的、可用數(shù)據(jù)來訓(xùn)練的、文本生成的深度學(xué)習(xí)模型。ChatGPT“脫胎”于OpenAI在2020年發(fā)布的GPT-3。GPT-3剛問世時(shí),也曾引起相似的轟動(dòng)。當(dāng)時(shí),GPT-3也展示出了答題、翻譯、寫文章,甚至數(shù)學(xué)計(jì)算和編寫代碼等多種能力。由GPT-3所寫的文章幾乎達(dá)到了以假亂真的地步。GPT-3被認(rèn)為是當(dāng)時(shí)最強(qiáng)大的語言模型,甚至在當(dāng)時(shí)有網(wǎng)友評(píng)價(jià)GPT-3“無所不能”。但現(xiàn)在,ChatGPT所表現(xiàn)出來的能力比GPT-3還要強(qiáng)大,可以說是智商、情商都在線。ChatGPT不僅能進(jìn)行天馬行空的長(zhǎng)對(duì)話,可以回答問題,還能根據(jù)人們的要求撰寫各種書面材料,如商業(yè)計(jì)劃書、廣告宣傳材料、詩歌、笑話、計(jì)算機(jī)代碼和電影劇本等,甚至還可以進(jìn)行化學(xué)用品的模擬研發(fā)。簡(jiǎn)單來說,就是ChatGPT具備了類人的邏輯、思考與溝通的能力,并且它的溝通能力在一些領(lǐng)域表現(xiàn)得相當(dāng)驚人。文學(xué)創(chuàng)作對(duì)ChatGPT而言,更是不在話下。例如,給ChatGPT一個(gè)主題,它就可以寫出小說框架。我們讓ChatGPT以“AI改變世界”為主題寫一個(gè)小說框架,ChatGPT就能清晰地給出故事背景、主要角色、故事情節(jié)和結(jié)局。若覺得小說框架還不夠完整,則可對(duì)ChatGPT進(jìn)行適當(dāng)提醒,ChatGPT就能在“調(diào)教”之下,繼續(xù)回答,補(bǔ)充完整。ChatGPT已經(jīng)具備了一定的記憶能力,能夠進(jìn)行連續(xù)對(duì)話。有用戶體驗(yàn)之后評(píng)價(jià)稱,“ChatGPT的語言組織能力、文本水平、邏輯能力,可以說已經(jīng)令人驚艷了”。甚至已經(jīng)有用戶打算把日?qǐng)?bào)、周報(bào)、總結(jié)這些文字工作,交給ChatGPT來輔助完成了。普通的文本創(chuàng)作,只是最基本的。ChatGPT還能給程序員的代碼找Bug(Bug指的是計(jì)算機(jī)程序中出現(xiàn)的錯(cuò)誤,也可以稱為缺陷、故障或漏洞)。一些開發(fā)者在試用中表示,ChatGPT針對(duì)他們的技術(shù)問題提供了非常詳細(xì)的解決方案,比一些搜索軟件的回答還要靠譜。美國代碼托管平臺(tái)Replit的首席執(zhí)行官AmjadMasad在推特上發(fā)文稱,ChatGPT是一個(gè)優(yōu)秀的“調(diào)試伙伴”,“它不僅解釋了錯(cuò)誤,而且能夠修復(fù)錯(cuò)誤,并解釋修復(fù)方法”。ChatGPT還敢于質(zhì)疑不正確的前提和假設(shè),主動(dòng)承認(rèn)錯(cuò)誤,主動(dòng)拒絕一些無法回答的問題和不合理的問題,提升了對(duì)用戶意圖的理解,提高了答題結(jié)果的準(zhǔn)確性。在醫(yī)學(xué)領(lǐng)域,美國《科學(xué)公共圖書館·數(shù)字健康》雜志在2023年2月9日刊載論文稱,ChatGPT在沒有經(jīng)過專門訓(xùn)練或加強(qiáng)學(xué)習(xí)的情況下就能通過或接近通過美國執(zhí)業(yè)醫(yī)師資格考試(UnitedStatesMedicalLicensingExamination,USMLE)。此外,ChatGPT還在考試中表現(xiàn)出高度的一致性和洞察力。這些結(jié)果表明,基于大語言模型的人工智能技術(shù),可能有輔助醫(yī)學(xué)教育,甚至臨床診療、決策的潛力。1.4.2比ChatGPT更強(qiáng)大的版本ChatGPT的強(qiáng)悍已經(jīng)讓人們足夠震驚,而ChatGPT的下一代——GPT-4則讓人們進(jìn)一步感受到,人工智能帶來的顛覆或許真的要來了。事實(shí)上,ChatGPT其實(shí)只是OpenAI匆忙推出的測(cè)試品。據(jù)美國媒體報(bào)道,2022年11月中旬,OpenAI員工被要求快速上線一款聊天機(jī)器人。一位高管稱,該聊天機(jī)器人將被稱為“ChatwithGPT-3.5”,兩周后將免費(fèi)向公眾開放。這與原本安排不符。近兩年,OpenAI一直在開發(fā)名為“GPT-4”的更強(qiáng)大語言模型,并計(jì)劃于2023年發(fā)布。2022年,GPT-4還在進(jìn)行內(nèi)部測(cè)試和微調(diào),做好上線前準(zhǔn)備。但OpenAI的高管改變了主意。由于擔(dān)心競(jìng)爭(zhēng)對(duì)手可能會(huì)在GPT-4之前搶先發(fā)布自己的AI聊天機(jī)器人超越他們,因此,OpenAI拿出了2020年推出的舊語言模型GPT-3的強(qiáng)化版本GPT-3.5,在此基礎(chǔ)上進(jìn)行了微調(diào)。這才有了新款聊天機(jī)器人ChatGPT的誕生。與ChatGPT的匆忙發(fā)布不同,GPT-4是有所準(zhǔn)備的結(jié)果。根據(jù)網(wǎng)傳的消息,GPT-4早在2022年8月就訓(xùn)練完成了。之所以到2023年3月才面市,是OpenAI需要花6個(gè)月的時(shí)間讓它變得更安全。而圖像識(shí)別、高級(jí)推理、強(qiáng)大的文本處理能力,是GPT-4的三大特點(diǎn)。(1)就圖像識(shí)別功能來說,GPT-4可以分析圖像并提供相關(guān)信息。例如,它可以根據(jù)食材照片來推薦食譜,為圖片生成圖像描述和圖注等。但是,出于對(duì)潛在濫用的擔(dān)憂,OpenAI推遲了圖像描述功能的發(fā)布。也就是說,GPT-4的圖像輸入功能還處于尚未公開的預(yù)覽階段,目前僅能在OpenAI的直播中觀看效果。(2)就高級(jí)推理功能來說,GPT-4能夠針對(duì)3個(gè)人的不同情況做出一個(gè)會(huì)議的時(shí)間安排,回答存在上下文關(guān)聯(lián)性的復(fù)雜問題。GPT-4甚至可以講出一些質(zhì)量不怎么樣、模式化的冷笑話。雖然并不好笑,但至少,它已經(jīng)開始理解“幽默”這一人類特質(zhì)了。要知道,AI的推理能力,正是AI向人類思維慢慢進(jìn)化的標(biāo)志。(3)就文本處理能力來說,GPT-4能夠處理超過2.5萬個(gè)單詞的文本。GPT-4在文本處理能力上是ChatGPT的8倍,并可以用所有流行的編程語言寫代碼。其實(shí),在隨意談話中,ChatGPT和GPT-4之間的區(qū)別是很細(xì)微的。但是,當(dāng)任務(wù)的復(fù)雜性達(dá)到足夠的閾值時(shí),差異就出現(xiàn)了,GPT-4比ChatGPT更可靠,更有創(chuàng)意,并且能夠處理更細(xì)微的指令。GPT-4還能以高分通過各種標(biāo)準(zhǔn)化考試:GPT-4在模擬律師考試中的成績(jī)超出90%的人類考生,在俗稱“美國高考”的SAT(ScholasticAptitudeTest)閱讀考試中超出93%的人類考生,在SAT數(shù)學(xué)考試中超出89%的人類考生。而同樣面對(duì)律師資格考試,ChatGPT背后的GPT-3.5排名在倒數(shù)10%左右,而GPT-4考到了前10%左右。1.4.3GPT-4意味著什么?自人工智能誕生以來,科學(xué)家們就在努力實(shí)現(xiàn)通用AI。而所謂的通用AI,其實(shí)就是指應(yīng)對(duì)多種甚至泛化問題的人工智能技術(shù)。通用AI將擁有在事務(wù)中推理、計(jì)劃、解決問題、抽象思考、理解復(fù)雜思想、快速學(xué)習(xí)和從經(jīng)驗(yàn)中學(xué)習(xí)的能力,能夠像人類一樣輕松地完成所有這些事情。ChatGPT和GPT-4的成功證明了大模型路線的有效性,這直接打開了通用AI發(fā)展的大門,讓AI終于完成了從0到1的突破,開啟了真正的AI時(shí)代。ChatGPT和GPT-4的成功,根本原因其實(shí)是技術(shù)路線的成功。在OpenAI的GPT模型之前,人們?cè)谶M(jìn)行自然語言處理時(shí),都用的是循環(huán)神經(jīng)網(wǎng)絡(luò)(RecurrentNeuralNetwork,RNN),然后再加入注意力機(jī)制(AttentionMechanism)。所謂注意力機(jī)制,就是想將人的感知方式、注意力的行為應(yīng)用在機(jī)器上,讓機(jī)器學(xué)會(huì)去感知數(shù)據(jù)中的重要和不重要的部分。例如,當(dāng)我們要讓AI識(shí)別一張動(dòng)物圖片時(shí),最重要該關(guān)注的地方就是圖片中動(dòng)物的面部特征,包括耳朵、眼睛、鼻子、嘴巴,而不用太關(guān)注背景的一些信息。注意力機(jī)制核心的目的就在于希望機(jī)器能在很多的信息中注意到對(duì)當(dāng)前任務(wù)更關(guān)鍵的信息,而對(duì)于其他的非關(guān)鍵信息就不需要太多的注意力側(cè)重。換言之,注意力機(jī)制讓AI擁有了理解的能力。但RNN+Attention會(huì)讓整個(gè)模型的處理速度變得非常慢,因?yàn)镽NN是一個(gè)詞一個(gè)詞處理的。所以,才有了2017年谷歌大腦團(tuán)隊(duì)的那篇名為“AttentionIsAllYouNeed”(《自我注意力是你所需要的全部》)的論文的誕生。簡(jiǎn)單來說,這篇論文的核心就是“不要RNN,只要Attention”。而這個(gè)沒有RNN只有Attention的自然語言模型就是Transformer,也就是今天ChatGPT能夠成功的技術(shù)基礎(chǔ)。這個(gè)只有Attention的Transformer模型不再是一個(gè)詞一個(gè)詞的處理,而是一個(gè)序列一個(gè)序列的處理,可以并行計(jì)算,所以計(jì)算速度大大加快,一下子讓訓(xùn)練大模型、超大模型、巨大模型、超巨大模型成為可能。于是,OpenAI在一年之內(nèi)開發(fā)出了第一代GPT,第一代GPT在當(dāng)時(shí)已經(jīng)是前所未有的巨大語言模型,具有1.17億個(gè)參數(shù)。而GPT的目標(biāo)只有一個(gè),就是預(yù)測(cè)下一個(gè)單詞。如果說過去的AI是遮蓋句子中的一個(gè)詞,讓AI根據(jù)上下文“猜出”那個(gè)詞,進(jìn)行完形填空,那么GPT要做的,就是要“猜出”后面一堆的詞,甚至形成一篇通順的文章。事實(shí)證明,基于Transformer模型和龐大的數(shù)據(jù)集,GPT做到了。特別值得一提的是,在GPT誕生的同期,還有另一種更火的語言模型,那就是BERT。BERT是谷歌基于Transformer模型做的語言模型。BERT是一種雙向的語言模型,通過預(yù)測(cè)屏蔽子詞——先將句子中的部分子詞屏蔽,再令模型去預(yù)測(cè)被屏蔽的子詞——進(jìn)行訓(xùn)練,這種訓(xùn)練方式在語句級(jí)的語義分析中取得了極好的效果。BERT模型還使用了一種特別的訓(xùn)練方式——先預(yù)訓(xùn)練,再微調(diào)。這種方式可以使一個(gè)模型適用于多個(gè)應(yīng)用場(chǎng)景。這使得BERT模型刷新了11項(xiàng)NLP任務(wù)處理的紀(jì)錄。在當(dāng)時(shí),BERT直接改變了自然語言理解(NaturalLanguageUnderstanding,NLU)這個(gè)領(lǐng)域,引起了多數(shù)AI研究者的跟隨。面對(duì)BERT的大火,GPT的開發(fā)者們依然選擇了堅(jiān)持做生成式模型,而不是去做理解。于是,就有了后來大火的GPT-3、ChatGPT和GPT-4。從GPT-1到GPT-4,OpenAI做了兩年多時(shí)間,用大力出奇跡的辦法證明了大模型的可行性,參數(shù)從1.17億個(gè)飆升至1.8萬億個(gè)甚至更多,也似乎證明了參數(shù)越多,AI能力越強(qiáng)。在這樣的模型下,開放端口給專業(yè)領(lǐng)域的組織合作,以GPT-4的學(xué)習(xí)能力,再結(jié)合參數(shù)與模型的優(yōu)化,將很快在一些專業(yè)領(lǐng)域成為專家級(jí)水平。人類發(fā)展到今天,已經(jīng)從世界歷史中吸收了大量數(shù)據(jù),這些數(shù)據(jù)以不可估量的方式改變了人類大腦中的神經(jīng)連接。就像我們?nèi)祟惖乃伎己蛯W(xué)習(xí)一樣,人工智能研究的大語言模型也能夠做類似的事情,并有效地引導(dǎo)它們自己的智能。當(dāng)GPT-4廣泛地開放給大眾使用后,數(shù)以億計(jì)的人涌入與GPT-4進(jìn)行互動(dòng),GPT-4就將獲得龐大又寶貴的數(shù)據(jù)。于是,憑借著比人類更為強(qiáng)大的學(xué)習(xí)能力,GPT-4的學(xué)習(xí)與進(jìn)化速度正在超越我們的想象。未來,借助各種國際科研期刊與科研資料,AI就能基于這些前沿研究來為科學(xué)家的科研提供分析、建議、模型、推演,甚至可以進(jìn)行模擬科研的推演。而一旦我們將人類社會(huì)所沉淀的醫(yī)療數(shù)據(jù)信息開發(fā)給GPT進(jìn)行訓(xùn)練,基于GPT的人工智能醫(yī)生在常規(guī)與標(biāo)準(zhǔn)化的診療方面超越我們?nèi)祟愥t(yī)生,將是指日可待的事情。1.4.4ChatGPT進(jìn)軍醫(yī)療ChatGPT是Transformer、基于人類反饋的強(qiáng)化學(xué)習(xí)(ReinforcementLearningfromHumanFeedback,RLHF)和GPT等相關(guān)技術(shù)發(fā)展的集大成者。它可以被理解為NLP領(lǐng)域的結(jié)晶,也可以被理解為通過深度學(xué)習(xí),進(jìn)而理解文本,同時(shí)生成類似于人類所創(chuàng)造文本的人工智能模型。ChatGPT強(qiáng)悍的性能令世界震驚,在ChatGPT的熱潮席卷各行各業(yè)之時(shí),它也來到了醫(yī)療行業(yè)。例如,美國執(zhí)業(yè)醫(yī)師資格考試以難度大著稱,而美國研究人員測(cè)試后卻發(fā)現(xiàn),聊天機(jī)器人ChatGPT無須經(jīng)過專門訓(xùn)練或加強(qiáng)學(xué)習(xí)就能通過或接近通過這一考試。參與這項(xiàng)研究的研究人員主要來自美國醫(yī)療保健初創(chuàng)企業(yè)安西布爾健康公司(AnsibleHealth)。他們?cè)诿绹犊茖W(xué)公共圖書館·數(shù)字健康》雜志刊載的論文中說,他們從美國執(zhí)業(yè)醫(yī)師資格考試官網(wǎng)2022年6月發(fā)布的376個(gè)考題中篩除基于圖像的問題,讓ChatGPT回答剩余的350道題。這些題類型多樣,既有要求考生依據(jù)已有信息給患者下診斷這樣的開放式問題,也有諸如判斷病因之類的選擇題。兩名評(píng)審人員負(fù)責(zé)閱卷打分。結(jié)果顯示,在3個(gè)考試部分,去除模糊不清的回答后,ChatGPT得分率在52.4%至75%之間。而得分率在60%左右即可視為通過考試。其中,ChatGPT有88.9%的主觀回答包括“至少一個(gè)重要的見解”,即見解較新穎、臨床上有效果且并非人人能看出來。研究人員認(rèn)為,“在這個(gè)出了名難考的專業(yè)考試中達(dá)到及格分?jǐn)?shù),且在沒有任何人為強(qiáng)化(訓(xùn)練)的前提下做到這一點(diǎn)”,這是人工智能在臨床醫(yī)學(xué)應(yīng)用方面“值得注意的一件大事”,顯示“大語言模型可能有輔助醫(yī)學(xué)教育,甚至臨床決策的潛力”。除通過醫(yī)考外,ChatGPT的問診水平也得到了業(yè)界的肯定?!睹绹t(yī)學(xué)會(huì)雜志》(TheJournaloftheAmericanMedicalAssociation,JAMA)發(fā)表研究性簡(jiǎn)報(bào),針對(duì)以ChatGPT為代表的在線對(duì)話人工智能模型在腦血管疾病預(yù)防建議方面的使用合理性進(jìn)行探討,表示ChatGPT具有輔助臨床工作的潛力,有助于加強(qiáng)患者教育,減少醫(yī)生與患者溝通的壁壘和成本。過程中,根據(jù)現(xiàn)行指南對(duì)腦血管疾病三級(jí)預(yù)防保健建議和臨床醫(yī)生治療經(jīng)驗(yàn),研究人員設(shè)立了25個(gè)具體問題,涉及疾病預(yù)防概念、風(fēng)險(xiǎn)因素咨詢、檢查結(jié)果和用藥咨詢等。針對(duì)每個(gè)問題均向ChatGPT提問3次,記錄每次的回答內(nèi)容。每個(gè)問題的3次回答都由1名評(píng)審員進(jìn)行評(píng)定,評(píng)定結(jié)果分為“合理”、“不合理”或“不靠譜”。3次回答中只要有1次回答有明顯的醫(yī)學(xué)錯(cuò)誤,可直接評(píng)定為“不合理”。結(jié)果顯示,ChatGPT回答的合理概率為84%(21/25)。僅從這25個(gè)問題的回答來看,在線對(duì)話人工智能模型回答腦血管疾病預(yù)防問題的結(jié)果較好,具有輔助臨床工作的潛力。顯然,ChatGPT與其他人工智能工具不同。事實(shí)上,它很像醫(yī)生解決問題的方式:從一個(gè)大型數(shù)據(jù)庫開始(對(duì)醫(yī)生來說,數(shù)據(jù)來自課堂、已經(jīng)發(fā)表的研究和專業(yè)經(jīng)驗(yàn);對(duì)ChatGPT來說,數(shù)據(jù)是數(shù)字出版材料的總和),醫(yī)生會(huì)回憶或查找符合病人癥狀的相關(guān)信息,ChatGPT則使用大量參數(shù)來精確定位合適的文本。當(dāng)然,ChatGPT在醫(yī)療場(chǎng)景中的應(yīng)用遠(yuǎn)不止于此。GPT是一項(xiàng)極具韌性的技術(shù),它本身可以有非常多的應(yīng)用,只要稍經(jīng)改動(dòng)便可以遷移到其他領(lǐng)域,同時(shí)產(chǎn)生良好的結(jié)果。盡管當(dāng)前ChatGPT主要應(yīng)用于文本對(duì)話領(lǐng)域,但未來融合語音、文本、圖像信號(hào)的多模態(tài)交互技術(shù)可能會(huì)成為未來行業(yè)研究的熱點(diǎn)方向。全球最快的圖像生成應(yīng)用StableDiffusion便是一個(gè)成功的應(yīng)用案例。StableDiffusion可以通過文字描述生成圖片,實(shí)現(xiàn)1秒出圖。如果在醫(yī)學(xué)影像AI上能夠應(yīng)用類GPT技術(shù),通過建立起文本與圖像之間的聯(lián)系,反過來將圖像上的關(guān)鍵信息轉(zhuǎn)換為準(zhǔn)確的文字信息,那么或許能進(jìn)一步提升醫(yī)生檢測(cè)效率和檢測(cè)能力。從醫(yī)學(xué)教育的過程來看,醫(yī)學(xué)生和住院醫(yī)生是通過結(jié)合教科書、期刊論文、課堂指導(dǎo)和觀察熟練的臨床醫(yī)生來學(xué)習(xí)醫(yī)療技能的。而以ChatGPT為代表的AI大模型也能夠遵循同樣的方法。一旦ChatGPT連接到床邊的病人監(jiān)護(hù)系統(tǒng),就可以訪問實(shí)驗(yàn)室數(shù)據(jù)并聽到醫(yī)患之間的互動(dòng),該應(yīng)用程序?qū)㈤_始預(yù)測(cè)最佳的一系列臨床步驟。每次ChatGPT將這些決定與電子健康記錄中的臨床記錄和主治醫(yī)生的指令進(jìn)行比較時(shí),它都會(huì)學(xué)習(xí)和改進(jìn)。大一的醫(yī)學(xué)生需要經(jīng)過十年以上時(shí)間的教育和培訓(xùn)才能技術(shù)嫻熟。未來幾代的ChatGPT將在幾個(gè)月或更短的時(shí)間內(nèi)完成這一過程。隨著時(shí)間的推移,ChatGPT將不斷改進(jìn)并解決越來越復(fù)雜的醫(yī)療問題。1.5從曲折前進(jìn)到拐點(diǎn)之年隨著人工智能技術(shù)的加速成熟,人工智能在醫(yī)療領(lǐng)域的應(yīng)用場(chǎng)景不斷豐富,為疾病檢測(cè)、診斷及治療模式帶來深刻變革,為提升居民健康質(zhì)量提供新方式。不過,一直以來,醫(yī)療AI的商業(yè)化難題也限制著醫(yī)療AI的進(jìn)一步發(fā)展。而今天,對(duì)也曾經(jīng)歷波峰的醫(yī)療AI而言,ChatGPT和GPT-4的成功無疑是一個(gè)絕佳的機(jī)會(huì)。1.5.1醫(yī)療AI的起落1.醫(yī)療AI的發(fā)展事實(shí)上,很早之前,醫(yī)療AI就已經(jīng)啟動(dòng)。(1)1978—2013年是醫(yī)療AI的萌芽階段,我國開始進(jìn)行醫(yī)療AI領(lǐng)域的研究開發(fā),整體以臨床知識(shí)庫為主。1978年,“關(guān)幼波肝病診療程序”的開發(fā)被認(rèn)為是我國首次將醫(yī)學(xué)專家系統(tǒng)應(yīng)用到傳統(tǒng)中醫(yī)領(lǐng)域。此后,“中國中醫(yī)治療專家系統(tǒng)”“林如高骨傷計(jì)算機(jī)診療系統(tǒng)”“中醫(yī)計(jì)算機(jī)輔助診療系統(tǒng)”等醫(yī)療AI雛形產(chǎn)品相繼涌現(xiàn)。(2)2014—2019年是醫(yī)療AI的起步階段。2014年以來,我國醫(yī)療AI領(lǐng)域創(chuàng)投熱度持續(xù)升溫,2018年投資案例數(shù)達(dá)到近年來最多,有197起。2018年,HC3i盤點(diǎn)了超過120家中國醫(yī)療AI初創(chuàng)企業(yè),應(yīng)用場(chǎng)景覆蓋醫(yī)學(xué)影像、輔助診斷、健康管理、藥物挖掘等八大領(lǐng)域。同時(shí)期,外媒也曾列舉過105家醫(yī)療AI初創(chuàng)企業(yè),其中包括IBM、谷歌等投資的企業(yè)。我國人工智能技術(shù)加速突破,AI醫(yī)學(xué)影像廠商陣營逐漸壯大,人工智能技術(shù)在新藥研發(fā)、基因檢測(cè)等領(lǐng)域的融合不斷加深,新產(chǎn)品相繼問世。頭部廠商憑借技術(shù)、資源等優(yōu)勢(shì)逐步構(gòu)筑競(jìng)爭(zhēng)壁壘。(3)2020年至今,醫(yī)療AI則進(jìn)入商業(yè)化探索階段。2020年1月,第一張醫(yī)療AI產(chǎn)品三類證落地頒發(fā),2020年醫(yī)療AI行業(yè)合計(jì)落地10張國家藥品監(jiān)督管理局(NationalMedicalProductsAdministration,NMPA)三類證,開啟醫(yī)療AI商業(yè)化元年。2021年,科亞方舟、推想醫(yī)療、數(shù)坤科技等企業(yè)相繼遞交招股書,醫(yī)渡科技、鷹瞳科技正式登陸港交所,醫(yī)療AI開始進(jìn)入商業(yè)化探索階段。2.AI在醫(yī)療場(chǎng)景落地面臨的商業(yè)化困境在我國,雖然醫(yī)療AI近年來被資本熱捧,單是2020年一年,醫(yī)療AI領(lǐng)域的投資就高達(dá)64億元,但是資本熱捧改變不了AI在醫(yī)療場(chǎng)景落地面臨的商業(yè)化困境。究其原因,首先,系統(tǒng)標(biāo)準(zhǔn)化程度低。經(jīng)歷了30多年的發(fā)展,醫(yī)院信息系統(tǒng)(HospitalInformationSystem,HIS)逐漸迭代完善,走到今天,受到不同歷史時(shí)期技術(shù)的限制及不同體系醫(yī)院需求的影響,各廠商版本均有不同程度的差異,每家醫(yī)院的HIS都是不完全一樣的。對(duì)于醫(yī)療AI產(chǎn)品,進(jìn)醫(yī)院的第一步就是先搞清楚每家醫(yī)院的HIS,包括功能、流程和數(shù)據(jù),再進(jìn)行有針對(duì)性的開發(fā)。而這個(gè)過程耗時(shí)、費(fèi)力,而且難度很大,需要醫(yī)療AI產(chǎn)品廠商消耗大量的人力成本和時(shí)間成本,彌合這個(gè)歷史帶來的必須要面對(duì)的行業(yè)現(xiàn)狀。其次,數(shù)據(jù)標(biāo)準(zhǔn)化程度低。近年來,醫(yī)院開始推進(jìn)互聯(lián)互通,搭建數(shù)據(jù)中心,漸漸開始重視數(shù)據(jù)治理工作。然而,一千家醫(yī)院有一千種數(shù)據(jù)管理方式、數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)、數(shù)據(jù)呈現(xiàn)方法,結(jié)果拿到的數(shù)據(jù)有不同的存儲(chǔ)格式、架構(gòu)和標(biāo)準(zhǔn),數(shù)據(jù)一致性、完整性和準(zhǔn)確性都很難保證。最后,交付能力弱,這也是最重要的原因所在。而導(dǎo)致交付能力弱的根本原因,還是在于人工智能依然停留在智能不智的層面。顯然,隨著人工智能技術(shù)的普及發(fā)展,人工智能不再需要諾貝爾獎(jiǎng)級(jí)別的創(chuàng)新,而需要將現(xiàn)有的技術(shù)產(chǎn)品化、商業(yè)化,創(chuàng)造出真正的價(jià)值。但由于部分人工智能企業(yè)及媒體傳播的夸大,導(dǎo)致人工智能仍然青澀的能力在某些領(lǐng)域存在被夸大的情況。市場(chǎng)對(duì)人工智能寄予過高的期望,而實(shí)際的產(chǎn)品體驗(yàn)卻往往欠佳。人們對(duì)人工智能能力、易用性、可靠性、體驗(yàn)等方面的要求都給當(dāng)前的人工智能技術(shù)帶來了更多的挑戰(zhàn)。目前,人工智能能夠真正商業(yè)化處理的還只是對(duì)數(shù)據(jù)或信息的歸類、識(shí)別,以及一些簡(jiǎn)單特定問題的機(jī)器回復(fù)。例如,以交通事故來說,在全程監(jiān)控的道路上發(fā)生交通事故,人工智能需要的是能夠讀懂交通法規(guī),依據(jù)全程錄制的行車與道路情況做出識(shí)別,并依據(jù)交通法規(guī)做出判定,這樣的人工智能才是人工智能應(yīng)該有的樣子。又如,雖然各種在線平臺(tái)都推出了人工智能客服,但是現(xiàn)在這種人工智能客服更直觀的理解是標(biāo)準(zhǔn)化問題的程序主動(dòng)回復(fù),超出標(biāo)準(zhǔn)化的問題,人工智能客服就不再智能,而需要人工。當(dāng)前的人工智能高度依賴數(shù)據(jù),但數(shù)據(jù)積累、共享和應(yīng)用的生態(tài)仍然比較初級(jí),這直接阻礙著人工智能部分應(yīng)用的實(shí)現(xiàn)。此外,人工智能作為一種新的技術(shù),在市場(chǎng)上的應(yīng)用無疑需要長(zhǎng)期與實(shí)體世界和商業(yè)社會(huì)進(jìn)行磨合,避免意外的情況發(fā)生。1.5.2破局之路,行則將至醫(yī)療AI苦于商業(yè)化難題久矣,ChatGPT的成功無疑是一個(gè)機(jī)會(huì)。ChatGPT具有強(qiáng)大的信息整合能力和語言組織能力,并具有接近于人類的常識(shí)、認(rèn)知和價(jià)值觀,這都讓用戶更愿意接納它。以ChatGPT和GPT技術(shù)為代表的AI大模型,將為醫(yī)療AI提供了新的機(jī)遇和突破口,推動(dòng)醫(yī)療AI進(jìn)入全新的智能階段。首先,醫(yī)院將成為未來醫(yī)療AI應(yīng)用最為廣泛的領(lǐng)域之一。未來,隨著通用AI大模型的發(fā)展和應(yīng)用,醫(yī)療AI將更好地為醫(yī)院提供智能化服務(wù)和支持。醫(yī)療AI將會(huì)對(duì)醫(yī)院的工作流程、醫(yī)療質(zhì)量和工作效率產(chǎn)生重要影響。醫(yī)療AI可以大大提高醫(yī)院的工作效率。例如,醫(yī)療AI可以通過自動(dòng)化診斷流程減輕醫(yī)生的工作負(fù)擔(dān),提高醫(yī)生的工作效率。醫(yī)療AI還可以提高醫(yī)院的醫(yī)療質(zhì)量。通過分析大量的醫(yī)療數(shù)據(jù)和知識(shí),醫(yī)療AI可以為醫(yī)生提供更準(zhǔn)確的診斷和治療建議。此外,醫(yī)療AI還可以為醫(yī)院提供智能化的管理和監(jiān)控服務(wù),幫助醫(yī)院更好地管理和控制醫(yī)療過程,從而提高醫(yī)院的管理效率和醫(yī)療質(zhì)量。其次,醫(yī)療AI將給健康管理注入新的活力。未來,隨著通用AI大模型的發(fā)展和應(yīng)用,醫(yī)療AI將在健康管理中發(fā)揮更為重要的作用。醫(yī)療AI可以通過分析個(gè)人的健康數(shù)據(jù)和行為,為健康管理提供更為智能和個(gè)性化的服務(wù)與支持。在今天,很多人患有兩種或兩種以上的慢性疾病,這些疾病每天都影響著他們的健康。這些患者需要的是持續(xù)的日常監(jiān)測(cè)和護(hù)理。但傳統(tǒng)的面對(duì)面醫(yī)療體系并沒有為他們提供這種服務(wù)。這就是未來人工智能可以發(fā)揮巨大作用的地方。未來,被改進(jìn)過的GPT技術(shù)的加入,將能夠全天候監(jiān)測(cè)患者,并提供持續(xù)的醫(yī)療專業(yè)知識(shí)。這將有助于預(yù)防心臟病、高血壓和糖尿病等慢性疾病,并最大限度地減少致命的并發(fā)癥。GPT技術(shù)可以與可穿戴設(shè)備和支持性消費(fèi)技術(shù)同步,提供全天候監(jiān)控,也可以將可穿戴設(shè)備的讀數(shù)與每個(gè)患者的醫(yī)生預(yù)先設(shè)定的預(yù)期范圍進(jìn)行比較,從而在出現(xiàn)問題時(shí)向患者和醫(yī)生發(fā)出警報(bào)。另外,GPT技術(shù)還能提醒在家的患者何時(shí)應(yīng)該進(jìn)行預(yù)防性篩查、補(bǔ)充藥物或每日鍛煉。再次,藥物研發(fā)是醫(yī)療AI應(yīng)用的另一個(gè)重要領(lǐng)域。未來,隨著通用AI大模型的發(fā)展和應(yīng)用,醫(yī)療AI將在藥物研發(fā)中發(fā)揮更為重要的作用。醫(yī)療AI可以通過分析大量的醫(yī)療數(shù)據(jù)和知識(shí),為藥物研發(fā)提供更加準(zhǔn)確和高效的方法和工具。醫(yī)療AI可以通過分析大量的醫(yī)療數(shù)據(jù),發(fā)現(xiàn)疾病發(fā)展規(guī)律和治療方法的關(guān)聯(lián),從而為新藥研發(fā)提供更準(zhǔn)確的方向和思路。醫(yī)療AI還可以通過模擬和仿真技術(shù),加速新藥研發(fā)的進(jìn)程。此外,醫(yī)療AI還可以為藥物臨床試驗(yàn)提供更加準(zhǔn)確和高效的方法和工具,從而提高臨床試驗(yàn)的效率和成功率。最后,醫(yī)療AI還可以為醫(yī)學(xué)教育提供全新的學(xué)習(xí)方式和教學(xué)工具。醫(yī)療AI可以通過智能化的學(xué)習(xí)和教育方式,幫助醫(yī)學(xué)生更好地掌握醫(yī)學(xué)知識(shí)和技能。醫(yī)療AI可以為醫(yī)學(xué)生提供智能化的學(xué)習(xí)輔助工具。例如,醫(yī)療AI可以通過自然語言處理技術(shù),幫助學(xué)生更好地理解醫(yī)學(xué)文獻(xiàn)和知識(shí);醫(yī)療AI還可以通過模擬和虛擬現(xiàn)實(shí)技術(shù),為學(xué)生提供更真實(shí)的醫(yī)學(xué)實(shí)踐環(huán)境,幫助學(xué)生更好地掌握醫(yī)學(xué)技能和操作技巧。醫(yī)療AI還可以為醫(yī)學(xué)生提供智能化的評(píng)估和反饋服務(wù),幫助學(xué)生了解自己的學(xué)習(xí)情況和不足之處,從而更好地提高自己的醫(yī)學(xué)水平。ChatGPT就像一道火光閃過,讓人們重新審視AI技術(shù),并學(xué)會(huì)如何與之進(jìn)行對(duì)話。ChatGPT也為醫(yī)療AI提供了方向指引,ChatGPT對(duì)醫(yī)療AI的顛覆,是綜合而又全面的,是從醫(yī)療到醫(yī)藥、從診斷到治療的全過程的顛覆。技術(shù)篇第2章“大數(shù)據(jù)+”醫(yī)療2.1大數(shù)據(jù),大價(jià)值搭上人工智能的醫(yī)療,要走上發(fā)展快車道,離不開“大數(shù)據(jù)”這把金鑰匙。如果把醫(yī)療AI比作一幢大廈,那么,大數(shù)據(jù)就是這幢大廈的地基,萬丈高樓平地起,沒有堅(jiān)固的地基,空中樓閣難以觸及;甚至,大數(shù)據(jù)還可以說是這幢大廈的磚瓦,沒有充足的磚瓦,海市蜃樓不長(zhǎng)久。一個(gè)小小的比喻,讓大數(shù)據(jù)或者說醫(yī)療大數(shù)據(jù)的重要性不言而喻。這讓我們?cè)谔骄酷t(yī)療AI之前不得不先去認(rèn)識(shí)一下如此風(fēng)靡的大數(shù)據(jù)。2.1.1什么是大數(shù)據(jù)?大數(shù)據(jù),顧名思義,就是大量的數(shù)據(jù)。大數(shù)據(jù)技術(shù)是通過獲取、存儲(chǔ)、分析手段,從大容量數(shù)據(jù)中挖掘價(jià)值的一種全新的技術(shù)架構(gòu)。從數(shù)據(jù)的體量來看,傳統(tǒng)的個(gè)人計(jì)算機(jī)處理的是GB、TB級(jí)別的數(shù)據(jù),而大數(shù)據(jù)處理的是PB、EB、ZB級(jí)別的數(shù)據(jù)。如果一塊1TB的硬盤可以存儲(chǔ)大約20萬張照片或20萬首MP3音樂,那么1PB的大數(shù)據(jù)需要大約2個(gè)機(jī)柜的存儲(chǔ)設(shè)備,存儲(chǔ)約2億張照片或2億首MP3音樂。1EB的大數(shù)據(jù)則需要大約2000個(gè)機(jī)柜的存儲(chǔ)設(shè)備。當(dāng)前,全球數(shù)據(jù)量仍在飛速增長(zhǎng)。根據(jù)國際機(jī)構(gòu)Statista的統(tǒng)計(jì)和預(yù)測(cè),2023年全球數(shù)據(jù)產(chǎn)生量預(yù)計(jì)達(dá)到93.8ZB,而到2035年,這一數(shù)字將達(dá)到2142ZB,全球數(shù)據(jù)量即將迎來更大規(guī)模的爆發(fā)。換言之,大數(shù)據(jù)時(shí)代已真正來臨。大量的數(shù)據(jù)增長(zhǎng)來自每人每天的日常行為:查天氣、查股票、查地圖導(dǎo)航、網(wǎng)絡(luò)購物、網(wǎng)絡(luò)聊天、刷微信朋友圈、轉(zhuǎn)發(fā)、點(diǎn)贊等。2015年,每人每天的數(shù)據(jù)交互行為為218次,而到2025年,預(yù)計(jì)每人每天的數(shù)據(jù)交互行為將飆升到4785次。除了體量之大,大數(shù)據(jù)真正的“大”還在于其發(fā)揮的價(jià)值之大。早在1980年,美國著名未來學(xué)家阿爾文·托夫勒在他的著作《第三次浪潮》中,就明確提出“數(shù)據(jù)就是財(cái)富”,并且將大數(shù)據(jù)稱為“第三次浪潮的華彩樂章”。大數(shù)據(jù)的核心本質(zhì)就是價(jià)值。這種價(jià)值在人工智能時(shí)代的意義越來越重大,已經(jīng)不僅僅是用于大數(shù)據(jù)的用戶行為分析與商業(yè)價(jià)值挖掘,更重要的是用于人工智能應(yīng)用的訓(xùn)練。牛津大學(xué)互聯(lián)網(wǎng)研究所維克托·邁爾-舍恩伯格教授指出,大數(shù)據(jù)所代表的是當(dāng)今社會(huì)所獨(dú)有的一種新型的能力——以一種前所未有的方式,通過對(duì)海量數(shù)據(jù)進(jìn)行分析,獲得有巨大價(jià)值的產(chǎn)品、服務(wù)和見解。通過大數(shù)據(jù)處理和分析,人們就能獲得客戶、友商、產(chǎn)品、渠道在各個(gè)維度的信息情報(bào),借此為創(chuàng)新應(yīng)用模式及商業(yè)模式的設(shè)計(jì)提供研判線索和技術(shù)基礎(chǔ)。大數(shù)據(jù)的價(jià)值在新冠疫情防控中也得到體現(xiàn)。例如,在疫情趨勢(shì)研判、流行病學(xué)調(diào)查、輿情信息動(dòng)態(tài)、人員遷徙和車輛流動(dòng)、資源調(diào)配和物流運(yùn)輸?shù)确矫?,通過政企合作開發(fā)大數(shù)據(jù)分析產(chǎn)品或服務(wù),為政府、企業(yè)和公眾提供實(shí)時(shí)動(dòng)態(tài)的信息以輔助決策;諸多大數(shù)據(jù)企業(yè)和互聯(lián)網(wǎng)平臺(tái)發(fā)揮大數(shù)據(jù)技術(shù)的優(yōu)勢(shì),為人們提供線上教育、在線醫(yī)療、遠(yuǎn)程辦公、無接觸外送、在線娛樂等服務(wù),大批中小微企業(yè)開啟數(shù)字化轉(zhuǎn)型。當(dāng)前,大數(shù)據(jù)正在給整個(gè)社會(huì)帶來從生活到思維上的革命性變化:企業(yè)和政府的管理人員在進(jìn)行決策時(shí),會(huì)出現(xiàn)從“經(jīng)驗(yàn)即決策”到“數(shù)據(jù)輔助決策”再到“數(shù)據(jù)即決策”的變化;人們所接受的服務(wù),將以數(shù)字化和個(gè)性化的方式呈現(xiàn),借助三維打?。ㄓ址Q3D打?。┘夹g(shù)和生物基因工程,零售業(yè)和醫(yī)療業(yè)亦將實(shí)現(xiàn)數(shù)字化和個(gè)性化的服務(wù);以小規(guī)模實(shí)驗(yàn)、定性或半定量分析為主要手段的科學(xué)分支,如社會(huì)學(xué)、心理學(xué)、管理學(xué)等,將向大規(guī)模定量化數(shù)據(jù)分析轉(zhuǎn)型;將會(huì)出現(xiàn)數(shù)據(jù)運(yùn)營商和數(shù)據(jù)市場(chǎng),以數(shù)據(jù)和數(shù)據(jù)產(chǎn)品為對(duì)象,通過加工和交易數(shù)據(jù)獲取商業(yè)價(jià)值;人類將在哲學(xué)層面重新思考諸如“物質(zhì)和信息誰更基礎(chǔ)?”“生命的本質(zhì)是什么?”“生命存在的最終形態(tài)是什么?”等本體論問題。作為一種商品,數(shù)據(jù)可以買賣,可以增值,更重要的是還可以用于訓(xùn)練。這不僅是大數(shù)據(jù)時(shí)代的特征,更是人工智能時(shí)代的特征。國際市場(chǎng)上的數(shù)據(jù)交易大致開始于2008年,一些前瞻性的企業(yè)開始加大對(duì)數(shù)據(jù)業(yè)務(wù)的投入。初見端倪的數(shù)據(jù)應(yīng)用新業(yè)態(tài)包括“數(shù)據(jù)市場(chǎng)”“數(shù)據(jù)銀行”“數(shù)據(jù)交易公約”等,知名數(shù)據(jù)服務(wù)商則有微軟數(shù)據(jù)市場(chǎng)、亞馬遜公共數(shù)據(jù)集、甲骨文在線數(shù)據(jù)交易等。國內(nèi)數(shù)據(jù)交易起步于2010年左右。2015年9月,我國發(fā)布的《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》中明確提出,要引導(dǎo)培育大數(shù)據(jù)交易市場(chǎng),開展面向應(yīng)用的數(shù)據(jù)交易市場(chǎng)試點(diǎn),探索開展大數(shù)據(jù)衍生產(chǎn)品交易,建立健全數(shù)據(jù)資源交易機(jī)制和定價(jià)機(jī)制。綜上所述,我們對(duì)大數(shù)據(jù)的概念基本能有一個(gè)全方面的認(rèn)識(shí)。大數(shù)據(jù)不是數(shù)據(jù)量的簡(jiǎn)單刻畫,也不是特定算法、技術(shù)或商業(yè)模式上的發(fā)展,而是從數(shù)據(jù)量、數(shù)據(jù)形態(tài)和數(shù)據(jù)分析處理方式到理念和形態(tài)上重大變革的總和。大數(shù)據(jù)具有大價(jià)值,這也是為什么今天社會(huì)各界如此關(guān)注大數(shù)據(jù)的原因所在。2.1.2大數(shù)據(jù)和人工智能在英國政府2017年發(fā)布的《在英國發(fā)展人工智能產(chǎn)業(yè)》報(bào)告中,對(duì)于大數(shù)據(jù)和人工智能的關(guān)系,用一句話進(jìn)行了簡(jiǎn)要概括:數(shù)據(jù)是為了開發(fā)人工智能,人工智能是為了管理數(shù)據(jù)(DatafordevelopingAI,AIformanagingdata)。該報(bào)告指出,正是數(shù)據(jù)的快速增長(zhǎng)催生出人工智能,獲取大量數(shù)據(jù)和特定數(shù)據(jù)是成功訓(xùn)練機(jī)器學(xué)習(xí)算法的關(guān)鍵。在有關(guān)機(jī)器學(xué)習(xí)的報(bào)告中,英國皇家學(xué)會(huì)指出,如果要在一個(gè)行業(yè)中使用人工智能,則必須使用與該行業(yè)相關(guān)的數(shù)據(jù)來培訓(xùn)人工智能。如果缺乏相關(guān)性和高質(zhì)量的數(shù)據(jù),那么人工智能將無法得到發(fā)展。若訓(xùn)練數(shù)據(jù)的可用性提高,則人工智能算法的準(zhǔn)確性也會(huì)相應(yīng)提高。日益增大的數(shù)據(jù)量使得人工智能變得尤為必要,有些部門的數(shù)據(jù)量已經(jīng)大到只有人工智能有能力處理的程度??梢哉f,大數(shù)據(jù)和人工智能是密不可分的兩項(xiàng)技術(shù)。一方面,人工智能的發(fā)展需要有大數(shù)據(jù)支撐。在過去,人工智能由于處理器的運(yùn)行速度慢、數(shù)據(jù)量小而不能很好地工作。而今天,大數(shù)據(jù)為人工智能提供了海量的數(shù)據(jù),使得人工智能技術(shù)有了長(zhǎng)足的發(fā)展,能夠?qū)崿F(xiàn)計(jì)算機(jī)數(shù)據(jù)信息分類存儲(chǔ)目標(biāo),擴(kuò)展數(shù)據(jù)信息存儲(chǔ)容量,全面提升計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)的活躍度。另一方面,大數(shù)據(jù)挖掘少不了人工智能技術(shù)的支持。大數(shù)據(jù)的“數(shù)據(jù)”可以分為結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)與半結(jié)構(gòu)化數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)是指企業(yè)的客戶信息、經(jīng)營數(shù)據(jù)、銷售數(shù)據(jù)、庫存數(shù)據(jù)等存儲(chǔ)于普通數(shù)據(jù)庫之中的數(shù)據(jù),專指可作為數(shù)據(jù)庫進(jìn)行管理的數(shù)據(jù)。例如,填寫的表格中的數(shù)據(jù)就是結(jié)構(gòu)化數(shù)據(jù)。非結(jié)構(gòu)化數(shù)據(jù)是指不存儲(chǔ)于數(shù)據(jù)庫之中的數(shù)據(jù),包括電子郵件、文本文件、圖像、視頻等數(shù)據(jù)。目前,非結(jié)構(gòu)化數(shù)據(jù)激增,企業(yè)數(shù)據(jù)的80%左右都是非結(jié)構(gòu)化數(shù)據(jù)。隨著社交媒體的興起,非結(jié)構(gòu)化數(shù)據(jù)更是迎來了爆發(fā)式增長(zhǎng)。半結(jié)構(gòu)化數(shù)據(jù)則是指一些XML或HTML格式的數(shù)據(jù)。從大數(shù)據(jù)挖掘角度來看,大數(shù)據(jù)的分析并不簡(jiǎn)單,尤其是非結(jié)構(gòu)化數(shù)據(jù)。文本挖掘需要自然語言處理技術(shù),圖像與視頻解析需要圖像解析技術(shù)。如今,語音識(shí)別技術(shù)也不可或缺。這些都是傳統(tǒng)意義上人工智能領(lǐng)域所研究的技術(shù)??偟膩碚f,大數(shù)據(jù)和人工智能二者相輔相成、相互連接,才有了今天人工智能的持續(xù)進(jìn)化給人們帶來的驚喜。對(duì)于人工智能醫(yī)療,或者人工智能醫(yī)生的打造,數(shù)據(jù)與技術(shù)也同樣是相互驅(qū)動(dòng)的要素。2.2當(dāng)醫(yī)療接軌大數(shù)據(jù)隨著信息技術(shù)的快速發(fā)展,各類數(shù)據(jù)急劇增長(zhǎng),數(shù)據(jù)資源與自然資源一樣,已成為重要的戰(zhàn)略資源,人類社會(huì)進(jìn)入大數(shù)據(jù)時(shí)代。大數(shù)據(jù)時(shí)代下的醫(yī)療活動(dòng),如就診治療、醫(yī)學(xué)研究、健康保健和衛(wèi)生管理等,時(shí)刻在產(chǎn)生大量的醫(yī)療數(shù)據(jù)。醫(yī)療大數(shù)據(jù)是醫(yī)生對(duì)患者進(jìn)行診斷和治療過程中產(chǎn)生的數(shù)據(jù),包括患者基本數(shù)據(jù)、電子病歷、診療數(shù)據(jù)、醫(yī)學(xué)影像數(shù)據(jù)、醫(yī)學(xué)管理數(shù)據(jù)、經(jīng)濟(jì)數(shù)據(jù)、醫(yī)療設(shè)備和儀器數(shù)據(jù)等。不斷數(shù)據(jù)化的信息,在使醫(yī)院數(shù)據(jù)庫信息容量不斷膨脹的同時(shí),也對(duì)疾病及病人的管理、控制和醫(yī)療研究起到了積極的作用,意義重大。通過對(duì)醫(yī)療大數(shù)據(jù)的分析和加工,就可以挖掘出疾病診斷和治療、公共衛(wèi)生服務(wù)等方面的重要價(jià)值。醫(yī)療大數(shù)據(jù)的應(yīng)用并不僅僅是在信息化時(shí)代才出現(xiàn)的。早在19世紀(jì),英國流行病學(xué)家、麻醉學(xué)家約翰·斯諾(JohnSnow)博士運(yùn)用近代早期的數(shù)據(jù)科學(xué),記錄每天的死亡人數(shù)和患病人數(shù),并將死亡者的地址標(biāo)注在地圖上,繪制了倫敦霍亂暴發(fā)的“群聚”地圖?;魜y在過去被普遍認(rèn)為是由“有害”空氣導(dǎo)致的。斯諾通過調(diào)查數(shù)據(jù)的匯總,確定了霍亂的元兇是被污染的公共水井,并同時(shí)奠定了疾病細(xì)菌理論的基礎(chǔ)??梢哉f,現(xiàn)代醫(yī)學(xué)就是基于數(shù)據(jù)的醫(yī)學(xué),是基于大數(shù)據(jù)的醫(yī)學(xué)。2.2.1醫(yī)療數(shù)據(jù)從哪里來?隨著醫(yī)療衛(wèi)生信息化建設(shè)進(jìn)程的不斷加快,醫(yī)療數(shù)據(jù)的類型和規(guī)模也在以前所未有的速度迅猛增長(zhǎng)。醫(yī)療大數(shù)據(jù)主要由結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)構(gòu)成,且以非結(jié)構(gòu)化數(shù)據(jù)為主。不過,如此具有特殊性、復(fù)雜性的龐大的醫(yī)療大數(shù)據(jù),其搜集如果僅靠個(gè)人甚至個(gè)別機(jī)構(gòu),那基本是不可能完成的任務(wù)。那么這些數(shù)據(jù)到底是怎么產(chǎn)生的?又都來自哪里呢?經(jīng)過簡(jiǎn)單的梳理,這些數(shù)據(jù)的來源大致可以分為4類。(1)患者就醫(yī)過程中產(chǎn)生的信息。從患者進(jìn)入醫(yī)院開始,在掛號(hào)環(huán)節(jié)便將個(gè)人姓名、年齡、住址、電話等信息輸入數(shù)據(jù)庫;隨后在就醫(yī)環(huán)節(jié),患者的身體狀況、醫(yī)學(xué)影像等信息也將被錄入數(shù)據(jù)庫;看病結(jié)束后,在患者結(jié)算的過程中,費(fèi)用信息、報(bào)銷信息、醫(yī)保使用情況等信息被添加到醫(yī)院的數(shù)據(jù)庫中。這將形成醫(yī)療大數(shù)據(jù)最基礎(chǔ)也是最龐大的原始資源。(2)臨床醫(yī)療研究和實(shí)驗(yàn)室的數(shù)據(jù)。臨床醫(yī)療研究和實(shí)驗(yàn)室的數(shù)據(jù)整合在一起,將形成龐大的醫(yī)療數(shù)據(jù)集。一張普通的CT影像含有大約150MB的數(shù)據(jù),一張標(biāo)準(zhǔn)病理圖的數(shù)據(jù)量則接近5GB。如果將這些數(shù)據(jù)量乘以人口數(shù)量和平均壽命,那么僅一個(gè)社區(qū)醫(yī)院累積的數(shù)據(jù)量就可達(dá)數(shù)萬億字節(jié)甚至數(shù)千萬億字節(jié)(PB)之多。(3)藥物研發(fā)產(chǎn)生的數(shù)據(jù)。藥物研發(fā)所產(chǎn)生的數(shù)據(jù)是相當(dāng)密集的,從分子設(shè)計(jì)到臨床試驗(yàn),每個(gè)環(huán)節(jié)都會(huì)產(chǎn)生大量的數(shù)據(jù)。根據(jù)NatureBiotechnology發(fā)表的一篇論文,藥物研發(fā)過程中產(chǎn)生的數(shù)據(jù)量已經(jīng)遠(yuǎn)遠(yuǎn)超過了天文學(xué)、基因組學(xué)等領(lǐng)域。該論文中提到,到2020年,全球每年產(chǎn)生的生物醫(yī)學(xué)數(shù)據(jù)量已經(jīng)達(dá)到2.8ZB,其中大部分是藥物研發(fā)產(chǎn)生的數(shù)據(jù)。(4)智能可穿戴設(shè)備帶來的健康管理數(shù)據(jù)。隨著移動(dòng)設(shè)備和移動(dòng)互聯(lián)網(wǎng)的飛速發(fā)展,便攜式的可穿戴醫(yī)療設(shè)備正在普及。各種智能可穿戴設(shè)備的出現(xiàn),使得血壓、心率、體重、體脂、血糖、心電圖等健康體征數(shù)據(jù)的監(jiān)測(cè)都變?yōu)榭赡埽瑐€(gè)體健康信息都可以直接連入互聯(lián)網(wǎng)。除健康體征數(shù)據(jù)外,還有其他智能設(shè)備收集的健康行為數(shù)據(jù),如每天的卡路里攝入量、喝水量、步行數(shù)、運(yùn)動(dòng)時(shí)間、睡眠時(shí)間等。由此將實(shí)現(xiàn)對(duì)個(gè)人健康管理數(shù)據(jù)隨時(shí)隨地的采集,而帶來的數(shù)據(jù)量將更是不可估量的。2.2.2醫(yī)療大數(shù)據(jù)有什么特性?1.大數(shù)據(jù)的特性規(guī)模巨大的臨床試驗(yàn)數(shù)據(jù)、疾病診斷數(shù)據(jù)及居民健康管理數(shù)據(jù)等匯聚在一起所形成的醫(yī)療大數(shù)據(jù),已然呈現(xiàn)出其作為大數(shù)據(jù)的特性。(1)數(shù)據(jù)規(guī)模大。一張CT影像含有大約150MB的數(shù)據(jù),而一個(gè)基因組序列文件的大小約為750MB,一張標(biāo)準(zhǔn)的病理圖則大得多,接近5GB。(2)數(shù)據(jù)增長(zhǎng)快速。一方面,醫(yī)療信息服務(wù)包含大量在線或?qū)崟r(shí)數(shù)據(jù)的分析處理,如臨床決策支持中的診斷和用藥建議、流行病分析報(bào)表生成、健康指標(biāo)預(yù)警等;另一方面,得益于信息技術(shù)的發(fā)展,越來越多的醫(yī)療信息被數(shù)字化,而未來,醫(yī)療健康領(lǐng)域數(shù)據(jù)的增長(zhǎng)速度還將更快。(3)數(shù)據(jù)價(jià)值巨大。毋庸置疑,數(shù)據(jù)是資源,是資產(chǎn)。醫(yī)療大數(shù)據(jù)與每個(gè)人的個(gè)人生活息息相關(guān),對(duì)這些數(shù)據(jù)的有效利用更關(guān)系到國家乃至全球的疾病防控、新藥研發(fā)和頑疾攻克的能力。2.醫(yī)療大數(shù)據(jù)將有的特性除大數(shù)據(jù)所具有的特性外,醫(yī)療大數(shù)據(jù)還具有多態(tài)性、不完整性、時(shí)間性及冗余性等醫(yī)療領(lǐng)域特有的一些特性。(1)多態(tài)性。醫(yī)療大數(shù)據(jù)包括純數(shù)據(jù)(如體檢結(jié)果、化驗(yàn)結(jié)果)、信號(hào)(如腦電信號(hào)、心電信號(hào)等)、影像(如CT影像、MRI影像等)、文字(如主訴、現(xiàn)病史、既往史、過敏史、檢測(cè)報(bào)告等),以及用于科普、咨詢的動(dòng)畫、語音和視頻信息等多種形態(tài)的數(shù)據(jù),這是區(qū)別于其他領(lǐng)域數(shù)據(jù)的最顯著特性。(2)不完整性。醫(yī)療數(shù)據(jù)的搜集和處理過程經(jīng)常相互脫節(jié),這使得醫(yī)療數(shù)據(jù)庫不可能對(duì)任何疾病信息都能全面反映。大量數(shù)據(jù)來源于人工記錄,導(dǎo)致數(shù)據(jù)記錄的偏差和殘缺,許多數(shù)據(jù)的表達(dá)、記錄本身也具有不確定性,病例和病案尤為突出。這些都造成了醫(yī)療大數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論