




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
國家社會科學(xué)基金青年項(xiàng)目:當(dāng)代西方數(shù)字資本主義批判理
論與數(shù)字化生活問題研究(項(xiàng)目編號:19CKS006)
人工智能的倫理問題
及其治理研究
鄧若玉趙洋?/?著
圖書在版編目(CIP)
人工智能的倫理問題及其治理研究/鄧若玉,趙洋
著.--北京:新華出版社,2022.10
ISBN978-7-5166-6466-7
Ⅰ.①人…Ⅱ.①鄧…②趙…Ⅲ.①人工智能-技
術(shù)倫理學(xué)-研究Ⅳ.①TP18②B82-057
中國版本圖書館CIP數(shù)據(jù)核字(2022)第178857號
人工智能的倫理問題及其治理研究
作??者:鄧若玉趙洋
責(zé)任編輯:唐波勇陳君君封面設(shè)計:匯文書聯(lián)
出版發(fā)行:新華出版社
地??址:北京石景山區(qū)京原路8號郵??編:100040
網(wǎng)??址:
經(jīng)??銷:新華書店、新華出版社天貓旗艦店、京東旗艦店及各大網(wǎng)店
購書熱線國新聞書店購書熱線/p>
照??排:匯文書聯(lián)
印??刷:北京厚誠則銘印刷科技有限公司
成品尺寸:170mm×240mm
印??張:8.75字??數(shù):142千字
版??次:2022年10月第1版印??次:2022年10月第1次印刷
書??號:ISBN978-7-5166-6466-7
定??價:36.00元
版權(quán)專有,侵權(quán)必究。如有質(zhì)量問題,請與出版社聯(lián)系調(diào)換/p>
?
前言
人工智能作為時代變革的驅(qū)動力,不僅賦能傳統(tǒng)行業(yè)加速產(chǎn)業(yè)結(jié)構(gòu)轉(zhuǎn)型,
而且將人們從高強(qiáng)度工作中解放出來,提供了精準(zhǔn)化、人性化、便捷化的服務(wù),
為實(shí)現(xiàn)人們向往的美好生活增添了強(qiáng)大動力。近年來,中國人工智能產(chǎn)業(yè)高速
發(fā)展,世界已經(jīng)有目共睹。人工智能作為一類“賦能”技術(shù),與經(jīng)濟(jì)發(fā)展、社
會治理息息相關(guān),更重要的是,廣大民眾在追求美好和公平健康的生活時會提
出新的要求。
科學(xué)技術(shù)是中性的,可用于造福人類,但也可能危害人類。要避免人工智
能技術(shù)創(chuàng)新治理陷入“科林格里奇困境”,就必須預(yù)先研判,提前布局。人工
智能倫理問題發(fā)生在人工智能技術(shù)的應(yīng)用場景中,即人工智能技術(shù)介入人與人
之間,改變了原來的“人與人的關(guān)系”而引發(fā)新的倫理問題。人工智能倫理規(guī)
范就是要探討如何解決這些倫理問題,包括提出人工智能倫理準(zhǔn)則,制定人工
智能設(shè)計原則,約束從業(yè)人員職業(yè)規(guī)范等。
在此時代背景下,從人工智能倫理問題入手,構(gòu)建人工智能技術(shù)與行業(yè)的
規(guī)范化治理已刻不容緩。治理是一個長期且不斷演化的過程,本書從人工智能
研究領(lǐng)域的倫理、公平和包容性、透明性、隱私性,人和AI系統(tǒng)之間的合作,
以及相關(guān)技術(shù)的可靠性與魯棒性等角度,覆蓋信息科學(xué)及倫理、哲學(xué)、法律等
學(xué)科的前沿理論,為讀者全面理解相關(guān)領(lǐng)域知識奠定基礎(chǔ)。本書首先介紹了人
工智能的基本概念,然后對人工智能倫理的相關(guān)內(nèi)容進(jìn)行了研究,接下來從人
工智能安全、人工智能社會治理、人工智能與信息安全這三個方面,列舉和說
明了人工智能技術(shù)對各行各業(yè)產(chǎn)生的社會性影響及應(yīng)對之策,最后討論了人工
智能治理的相關(guān)問題,并提出了人工智能倫理問題的治理路徑。
1
人工智能的倫理問題及其治理研究
本書在編寫的過程中,得到了出版社的領(lǐng)導(dǎo)和編輯的大力支持,還有許多
同事為本書的編寫提供了大量的資料,在此一并表示衷心的感謝。由于時間緊,
工作量大,難免會出現(xiàn)不足之處,懇請大家批評指正。
2
目錄
第一章人工智能???????????????????????????????????????????????????????????????????1
第一節(jié)人工智能的起源與發(fā)展????????????????????????????????????????????????????????????????????????????2
第二節(jié)人工智能的三個學(xué)術(shù)流派??????????????????????????????????????????????????????????????????????14
第三節(jié)人工智能的行業(yè)應(yīng)用??????????????????????????????????????????????????????????????????????????????25
第二章人工智能倫理???????????????????????????????????????????????????????????39
第一節(jié)IEEE發(fā)布的《人工智能設(shè)計的倫理準(zhǔn)則》?????????????????????????????????????40
第二節(jié)機(jī)器道德????????????????????????????????????????????????????????????????????????????????????????????????????41
第三節(jié)倫理風(fēng)險評估????????????????????????????????????????????????????????????????????????????????????????????44
第三章人工智能安全???????????????????????????????????????????????????????????51
第一節(jié)人工智能與安全的辯證關(guān)系?????????????????????????????????????????????????????????????????52
第二節(jié)人工智能安全體系架構(gòu)與分類?????????????????????????????????????????????????????????????55
第三節(jié)人工智能安全所處位置及外部關(guān)聯(lián)????????????????????????????????????????????????????59
第四章“安全”“可信”人工智能???????????????????????????????????????61
第一節(jié)人工智能的“安全”??????????????????????????????????????????????????????????????????????????????62
第二節(jié)人工智能的“可信”??????????????????????????????????????????????????????????????????????????????63
第三節(jié)聯(lián)邦學(xué)習(xí)????????????????????????????????????????????????????????????????????????????????????????????????????69
1
人工智能的倫理問題及其治理研究
第五章人工智能與社會治理????????????????????????????????????????????????81
第一節(jié)智能化社會治理???????????????????????????????????????????????????????????????????????????????????????82
第二節(jié)協(xié)同化社會治理???????????????????????????????????????????????????????????????????????????????????????88
第三節(jié)生態(tài)化社會治理???????????????????????????????????????????????????????????????????????????????????????90
第四節(jié)法治化社會治理???????????????????????????????????????????????????????????????????????????????????????91
第五節(jié)探索人工智能社會治理的方案?????????????????????????????????????????????????????????????95
第六章人工智能與信息安全??????????????????????????????????????????????101
第一節(jié)網(wǎng)絡(luò)攻擊與防御?????????????????????????????????????????????????????????????????????????????????????102
第二節(jié)基于人工智能的網(wǎng)絡(luò)攻擊????????????????????????????????????????????????????????????????????106
第三節(jié)基于人工智能的網(wǎng)絡(luò)防御????????????????????????????????????????????????????????????????????108
第四節(jié)人工智能時代的網(wǎng)絡(luò)技術(shù)發(fā)展???????????????????????????????????????????????????????????112
第七章人工智能的倫理問題治理體系????????????????????????????????117
第一節(jié)人工智能倫理治理現(xiàn)狀????????????????????????????????????????????????????????????????????????118
第二節(jié)人工智能倫理治理難點(diǎn)????????????????????????????????????????????????????????????????????????119
第三節(jié)人工智能倫理治理路徑????????????????????????????????????????????????????????????????????????121
參考文獻(xiàn)??????????????????????????????????????????????????????????????????????????????131
2
第一章
人工智能
人工智能的倫理問題及其治理研究
第一節(jié)人工智能的起源與發(fā)展
人工智能自1956年被提出以來,經(jīng)過半個多世紀(jì)的發(fā)展,目前已經(jīng)取得
了長足的進(jìn)展。但是,人工智能的發(fā)展并非一帆風(fēng)順,而是經(jīng)歷了從繁榮到衰
退,再到繁榮的螺旋式發(fā)展過程,先后出現(xiàn)了三次發(fā)展高峰。
一、人工智能第一次發(fā)展高峰
人工智能的第一次發(fā)展高峰出現(xiàn)在20世紀(jì)60年代末到70年代初,這次
高峰出現(xiàn)的主要原因是人們看到了人工智能系統(tǒng)能夠與具體應(yīng)用相結(jié)合,感受
到了人工智能的巨大魅力,從而著手將人工智能由理論研究推向?qū)嵱?。其主?/p>
標(biāo)志是專家系統(tǒng)的出現(xiàn)。在20世紀(jì)50年代人工智能剛剛被提出的時候,人工
智能的研究主要停留在理論研究階段,其基本方法是邏輯法,研究方向主要包
括自動推理,認(rèn)知模型,知識表示和推理,人工智能的語言、架構(gòu)和工具等。
最初的人工智能應(yīng)用于機(jī)器翻譯、定理證明、通用問題求解、下棋程序、工業(yè)
反饋控制、機(jī)器人等領(lǐng)域。
1957年,康奈爾大學(xué)的實(shí)驗(yàn)心理學(xué)家弗蘭克·羅森布拉特在一臺IBM
704計算機(jī)上模擬實(shí)現(xiàn)了“感知機(jī)”神經(jīng)網(wǎng)絡(luò)模型。這個模型雖然看上去只是
簡單地把一組M-P(McCulloch-Pitts)神經(jīng)元平鋪排列在一起,但是依靠機(jī)
器學(xué)習(xí)卻能完成一部分的機(jī)器視覺和模式識別方面的任務(wù),從而推動了人工
智能的發(fā)展。1959年,牛津大學(xué)邏輯學(xué)家王浩在一臺BM704計算機(jī)上只用9
分鐘就證明了《數(shù)學(xué)原理》中超過350條的一階邏輯全部定理4,他也因此成
了機(jī)器證明領(lǐng)域的開創(chuàng)性人物。[1]
20世紀(jì)60年代,人工智能相關(guān)的研究人員開始把研究重點(diǎn)轉(zhuǎn)移到智能表
示、智能推理、智能搜索方向,認(rèn)為人工智能求解問題的過程是一個搜索的
過程,效果與啟發(fā)式函數(shù)有關(guān)。這一階段的主要研究成果包括A算法(搜索
[1]郭毅可.論人工智能歷史、現(xiàn)狀與未來發(fā)展戰(zhàn)略[J].人民論壇·學(xué)術(shù)前沿,2021(23):
41-53
2
第一章人工智能
方法)、人工智能程序設(shè)計語言LISP、沖突歸結(jié)原理、語義網(wǎng)絡(luò)的知識表示方
法等。
20世紀(jì)60年代末到70年代初,以愛德華·費(fèi)根鮑姆為首的一批年輕科
學(xué)家提出了知識工程的概念,開展了以知識為基礎(chǔ)的專家系統(tǒng)的研究與應(yīng)用。
該研究將人工智能推向第一次高潮。當(dāng)時的學(xué)術(shù)界認(rèn)為人工智能時代已經(jīng)來
臨,1969年發(fā)起的國際人工智能聯(lián)合會議(InternationalJointConferenceson
ArtificialIntelligence,IJCAI)匯集了當(dāng)時學(xué)術(shù)界的人工智能研究最新成果。這
一階段出現(xiàn)的主要研究成果包括計算機(jī)配置專家系統(tǒng)、化學(xué)質(zhì)譜分析系統(tǒng)、醫(yī)
療咨詢系統(tǒng)、地質(zhì)勘探專家系統(tǒng)、疾病診斷和治療系統(tǒng)、語音理解系統(tǒng)等。這
一系列專家系統(tǒng)產(chǎn)品的研究和開發(fā),將人工智能由理論研究推向了實(shí)用系統(tǒng)。
然而,人們當(dāng)時對人工智能給予了過高的期望,甚至預(yù)言“十年以后人工智
能將超越人類思維”,但人工智能受囿于領(lǐng)域的局限性、知識的生成困難、經(jīng)
驗(yàn)與數(shù)據(jù)量的不足等約束,表現(xiàn)出專家系統(tǒng)所能解決的問題非常有限,更遠(yuǎn)
談不上“超越人類思維”,從而使人們從對人工智能的看法由過高的希望轉(zhuǎn)為
失望。[1]
1972年7月,詹姆斯·萊特希爾爵士受英國科學(xué)研究委員會委托,對人
工智能的研究狀況進(jìn)行了總體調(diào)查,提供了一個公正的調(diào)查報告。調(diào)查報告發(fā)
表于1973年。在這份報告中,萊特希爾批評了人工智能并未實(shí)現(xiàn)其“宏偉目
標(biāo)”。報告指出:“人工智能研究及相關(guān)領(lǐng)域的大多數(shù)工作者都對過去25年所
取得的成就感到失望。人們在20世紀(jì)50—60年代進(jìn)入該領(lǐng)域,但充滿希望的
事情遠(yuǎn)未在1972年實(shí)現(xiàn)。迄今為止,該領(lǐng)域到目前為止沒有獲得任何其承諾
將產(chǎn)生的重大影響的發(fā)現(xiàn)。”[2]萊特希爾的報告使得英國和美國學(xué)術(shù)機(jī)構(gòu)對人
工智能的信心驟降,在人工智能方面的資金投入也被大幅度削減,最終造成人
工智能走入低谷。那段低谷被認(rèn)為是人工智能的第一個冬天。
二、人工智能第二次發(fā)展高峰
人工智能第二次發(fā)展高峰出現(xiàn)在20世紀(jì)80年代末到90年代初。這次高
峰出現(xiàn)的主要原因是日本政府于1981年啟動了“第五代機(jī)”項(xiàng)目,其目標(biāo)是
[1]人工智能的起源與歷史[J].氣象科技進(jìn)展,2018,8(01):63.
[2]林永青.人工智能起源處的“群星”[J].金融博覽,2017(05):46-47.
3
人工智能的倫理問題及其治理研究
造出能夠與人對話、翻譯語言、解釋圖像、能夠像人一樣推理的機(jī)器。日本政
府為此撥款8.5億美元支持該項(xiàng)目。日本的第五代機(jī)計劃也影響了中國學(xué)術(shù)界。
中國學(xué)術(shù)界在1984年起開始跟進(jìn),并于1985年初在涿州召開了第一次全國第
五代計算機(jī)會議,會議就第五代計算機(jī)體系結(jié)構(gòu)、知識情報處理、規(guī)則和推理
以及第五代機(jī)的應(yīng)用(包括機(jī)器翻譯、機(jī)器人、圖像處理等)等方面展開深入
研討。從1986年起,中國把智能計算機(jī)系統(tǒng)、智能機(jī)器人和智能信息處理等
重大項(xiàng)目列入國家高技術(shù)研究發(fā)展計劃(863計劃),這標(biāo)志著中國將人工智
能作為了重點(diǎn)研究領(lǐng)域。
20世紀(jì)80年代,針對特定領(lǐng)域的專家系統(tǒng)在商業(yè)上獲得成功應(yīng)用,專家
系統(tǒng)及其工具越來越成熟和商品化。同時,霍普菲爾德神經(jīng)網(wǎng)絡(luò)和反向傳播神
經(jīng)網(wǎng)絡(luò)的提出,使得人們對人工智能的信心倍增。1987年,美國召開第一次
神經(jīng)網(wǎng)絡(luò)國際會議,學(xué)術(shù)界及企業(yè)界共1500余人參加了該會議。會議主要議
題包括神經(jīng)計算機(jī)設(shè)計、神經(jīng)計算機(jī)功能、神經(jīng)計算機(jī)的軟件模擬、神經(jīng)計算
機(jī)芯片、人工智能與神經(jīng)網(wǎng)絡(luò)等。會上宣布成立“國際神經(jīng)網(wǎng)絡(luò)協(xié)會”,并決
定出版刊物《神經(jīng)計算機(jī)》(NeuroComputer)。該會議掀起了神經(jīng)網(wǎng)絡(luò)研究
的熱潮。神經(jīng)網(wǎng)絡(luò)的出現(xiàn)解決了非線性分類和學(xué)習(xí)問題,這使神經(jīng)網(wǎng)絡(luò)迅速發(fā)
展,出現(xiàn)了語音識別、機(jī)器翻譯等系列研究項(xiàng)目。各國在神經(jīng)網(wǎng)絡(luò)方面的投資
也逐漸增加。
有學(xué)者評論,20世紀(jì)80—90年代,這一階段人工智能的特點(diǎn)是建立在對
分門別類地大量知識的多種處理方法之上,但存在著應(yīng)用領(lǐng)域過于狹窄、更新
迭代和維護(hù)成本非常高、缺乏海量數(shù)據(jù)訓(xùn)練機(jī)器等問題。
1992年,日本政府宣布“第五代機(jī)”項(xiàng)目失敗,結(jié)束了為期10年的研究。
一個主要的原因是,在日本學(xué)者全力研究面向人工智能計算機(jī)的同時,美國等
國家在通用計算機(jī)方面的發(fā)展步伐非常大,計算機(jī)的速度及其并行效率都有明
顯的提高,使得日本專用計算機(jī)所表現(xiàn)出來的推理速度反倒被高速的通用計算
機(jī)所秒殺。
事實(shí)上,在中國也存在著同樣的技術(shù)路線的爭論。一方面人們在研究通用
型高性能巨型機(jī),例如國防科大的銀河計算機(jī);另一方面人工智能研究人員在
研究支持人工智能的專用機(jī),包括Prolog推理機(jī)、數(shù)據(jù)庫機(jī)、產(chǎn)生式計算機(jī)、
4
第一章人工智能
數(shù)據(jù)流驅(qū)動計算機(jī)等,但只有通用計算機(jī)以其強(qiáng)大的生命力及適用性真正地占
據(jù)了市場,而其他一些人工智能專用計算機(jī)很多都是曇花一現(xiàn)。
第五代機(jī)的相關(guān)研究不僅重塑了人們對人工智能的看法,也將人工智能發(fā)
展所面臨的困難都展現(xiàn)了出來。凡事都有兩面性,雖然知識導(dǎo)入使人工智能發(fā)
展到了一個新高度,但其也將知識描述的困難和復(fù)雜性展現(xiàn)得淋漓盡致。當(dāng)時
人們面臨一個很大的問題:如果人工智能的所有知識都需要人類輸入,那么需
要輸入的內(nèi)容將是無窮無盡的。
與此同時,神經(jīng)網(wǎng)絡(luò)本身缺少相應(yīng)的嚴(yán)格數(shù)學(xué)理論支持,反向傳播神經(jīng)網(wǎng)
絡(luò)存在梯度消失問題(vanishinggradientproblem)。另外,當(dāng)時的專家系統(tǒng)對
領(lǐng)域要求苛刻,不能跨界,而真實(shí)的應(yīng)用常常并不完全受限于一個確切的領(lǐng)域,
使得專家系統(tǒng)的實(shí)用性變差;再就是專家系統(tǒng)的知識庫構(gòu)建困難,因?yàn)閺氖氯?/p>
工智能的人員不懂領(lǐng)域知識,而掌握領(lǐng)域知識的專家不知道如何將他們的知識
轉(zhuǎn)化到專家系統(tǒng)所需要的形式中,這也是缺乏令人贊嘆不已的人工智能應(yīng)用成
果的原因之一。
20世紀(jì)90年代以后,計算機(jī)發(fā)展趨勢逐漸演化為小型化、并行化、網(wǎng)絡(luò)
化以及智能化,人工智能技術(shù)逐漸與多媒體技術(shù)、數(shù)據(jù)庫技術(shù)等主流技術(shù)相結(jié)
合,并融合在主流技術(shù)之中,旨在使計算機(jī)更聰明、更有效、與人更接近,人
工智能就如同一般性的計算機(jī)應(yīng)用一樣,不再顯示出其獨(dú)特的光環(huán)。第二次高
峰過后,人工智能進(jìn)入第二次低谷。
三、人工智能第三次發(fā)展高峰
人工智能第三次發(fā)展高峰出現(xiàn)在21世紀(jì)。這次高峰出現(xiàn)的主要原因是深
度學(xué)習(xí)技術(shù)的出現(xiàn),解決了神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)過程中的梯度消失和梯度爆炸等問
題,以及深度學(xué)習(xí)的網(wǎng)絡(luò)深層結(jié)構(gòu)能夠使其自動提取并表征復(fù)雜的特征,解決
了傳統(tǒng)方法中通過人工提取特征的問題。2006年,杰弗里·辛頓提出深度學(xué)
習(xí)概念以后,掀起了對深度學(xué)習(xí)研究的熱潮,人工智能研究再次爆發(fā)。這一
階段的主要研究成果包括:2010年,谷歌無人駕駛汽車創(chuàng)下了超過16萬公里
無事故的紀(jì)錄;2011年,BM沃森參加“危險邊緣”智力游戲擊敗了最高獎
金得主和連勝紀(jì)錄保持者;2016年,谷歌阿爾法狗戰(zhàn)勝圍棋九段棋手李世石;
2017年,谷歌阿爾法狗先以比分3∶0完勝世界圍棋冠軍柯潔,之后阿爾法
5
人工智能的倫理問題及其治理研究
狗·零完全從零開始,不需要任何歷史棋譜的指引和人類先驗(yàn)知識的指導(dǎo),花
三天時間自己左右互搏490萬個棋局,最終無師自通戰(zhàn)勝阿爾法狗。[1]
多個吸引人們眼球的、在局部領(lǐng)域內(nèi)(特別是屬于確定性知識的領(lǐng)域)超
過人類的人工智能成果的展示,讓人們尤其是行外人員真切地感受到了人工智
能的威力,也真切地意識到人工智能已經(jīng)來到了身邊。這使得人工智能在商業(yè)
市場上炙手可熱,創(chuàng)業(yè)公司層出不窮,投資者競相追逐。
人工智能發(fā)展第三次高峰的一個顯著特點(diǎn)是許多國家政府也跟著行動起來
了,通過制定國策、投入資金,引導(dǎo)發(fā)展人工智能技術(shù),推動人工智能的應(yīng)用。
2011年,美國政府推出了《國家機(jī)器人發(fā)展倡議》(NationalRobotics
Initiative,NRI),并在2012年由美國國家基金會資助近5000萬美元;2013
年,作為NRI的后續(xù)行動,美國政府資助的《美國機(jī)器人技術(shù)路線圖:從互
聯(lián)網(wǎng)到機(jī)器人技術(shù)》對外發(fā)布,隨后發(fā)布了旨在推進(jìn)該技術(shù)路線圖的《通往尖
端機(jī)器人的道路》;2013年4月,美國國立衛(wèi)生研究院發(fā)布了《推動創(chuàng)新神
經(jīng)技術(shù)腦研究計劃》(BRAINInitiative,簡稱腦計劃),旨在研發(fā)更全面的工
具和信息庫以了解大腦在健康和疾病中的功能;2016年5月,美國白宮發(fā)布
了《為人工智能的未來做好準(zhǔn)備》;2016年10月,美國國家科學(xué)與技術(shù)委員
會發(fā)布了旨在向美國提供一個跨部門的指導(dǎo)人工智能發(fā)展戰(zhàn)略導(dǎo)向的《國家人
工智能研究與發(fā)展戰(zhàn)略計劃》;2016年12月,美國白宮發(fā)布了關(guān)于人工智能
將在未來幾十年改變我們經(jīng)濟(jì)方式的《人工智能、自動化與經(jīng)濟(jì)》;2017年7
月,美國提出了《自動駕駛汽車法案》,旨在確保自動駕駛車輛安全性的要求;
2017年10月,美國信息產(chǎn)業(yè)協(xié)會發(fā)布了旨在確保人工智能能夠發(fā)揮最大潛力
而倡導(dǎo)相關(guān)公共與私營部門進(jìn)行合作的《人工智能政策原則》。[2]
2013年,歐盟推出了被稱為是四個未來和新興技術(shù)的旗艦項(xiàng)目、歐盟資
助的最大的科學(xué)項(xiàng)目《人腦計劃》;2014年,歐盟委員會與歐洲機(jī)器人協(xié)會
推出了旨在維持和擴(kuò)展歐洲在機(jī)器人技術(shù)方面領(lǐng)導(dǎo)地位的《歐盟機(jī)器人技術(shù)合
作伙伴計劃》;2016年5月,歐盟委員會提出了旨在應(yīng)對機(jī)器人的發(fā)展給人
[1]郭毅可.論人工智能歷史、現(xiàn)狀與未來發(fā)展戰(zhàn)略[J].人民論壇·學(xué)術(shù)前沿,2021(23):
41-53.
[2]袁珩,耿喆,徐峰,高芳,張東.美國人工智能戰(zhàn)略布局與對外策略[J].科技管理研究,
2022,42(12):34-39.
6
第一章人工智能
類帶來影響的機(jī)器人規(guī)則立法提議,隨后歐洲議會于同年10月發(fā)布了《歐盟
機(jī)器人民事法律規(guī)則》。2016年12月,英國政府科學(xué)辦公室發(fā)布了旨在展示
如何負(fù)責(zé)任地使用人工智能技術(shù)來改善英國所有人生活水平的《人工智能:未
來決策制定的機(jī)遇與影響》;2017年10月,英國政府發(fā)布了《在英國發(fā)展人
工智能產(chǎn)業(yè)的報告》,報告包含18條針對政府、企業(yè)和學(xué)術(shù)界如何共同努力發(fā)
展人工智能的建議。[1]
四、人工智能第三次發(fā)展高峰的技術(shù)推手
人工智能之所以能進(jìn)入第三次發(fā)展高峰,除了由于一些諸如AlphaGo戰(zhàn)
勝人類棋手的搶人眼球的事件引起了人們高度關(guān)注之外,其根本原因還是由于
技術(shù)上的突破,同時大數(shù)據(jù)、移動網(wǎng)絡(luò)、物聯(lián)網(wǎng)、微電子技術(shù)等新技術(shù)的發(fā)展
也為人工智能的進(jìn)步奠定了技術(shù)基礎(chǔ)。
(一)深度學(xué)習(xí)的貢獻(xiàn)
深度學(xué)習(xí)(DeepLearning,DL)是一種以人工神經(jīng)網(wǎng)絡(luò)為架構(gòu),對數(shù)據(jù)
進(jìn)行表征學(xué)習(xí)的算法。深度學(xué)習(xí)使用了分層次抽象的思想,模擬人類大腦神經(jīng)
網(wǎng)絡(luò)的工作原理,搭建多層神經(jīng)網(wǎng)絡(luò)分別處理不同層的數(shù)據(jù)信息,原始數(shù)據(jù)通
過底層神經(jīng)網(wǎng)絡(luò)抽象出底層特征輸出給高層神經(jīng)網(wǎng)絡(luò),高層神經(jīng)網(wǎng)絡(luò)可以更有
效率地獲取高層概念,從而更精準(zhǔn)地處理信息。
1974年,保羅·韋伯斯提出的標(biāo)準(zhǔn)反向傳播算法對后來的深度神經(jīng)網(wǎng)絡(luò)
的發(fā)展起到了重要的作用。翁巨揚(yáng)等人在1992年發(fā)表的生長網(wǎng)可以算是一個
早期的深度學(xué)習(xí)網(wǎng)絡(luò)方案,其可以在一般自然雜亂圖像中進(jìn)行自然物體的識
別。同年,于爾根·施密德胡伯發(fā)表了一種多層級神經(jīng)網(wǎng)絡(luò)模型,通過對一組
多層的循環(huán)神經(jīng)網(wǎng)絡(luò)(RecurrentNeuralNetwork,RNN)使用無監(jiān)督的預(yù)訓(xùn)練
以預(yù)測其下一個輸入,從而訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)的每一層。在這一模型中,神經(jīng)
網(wǎng)絡(luò)中的每一層都代表觀測變量的一種壓縮表示,其基本上沒有信息丟失,這
一表示也被傳遞到下一層網(wǎng)絡(luò);然后再使用反向傳播算法進(jìn)行調(diào)優(yōu)。施密德胡
[1]殷佳章,房樂憲.歐盟人工智能戰(zhàn)略框架下的倫理準(zhǔn)則及其國際含義[J].國際論壇,
2020,22(02):18-30+155-156.
7
人工智能的倫理問題及其治理研究
伯后來將這種多層級神經(jīng)網(wǎng)絡(luò)模型稱為深度學(xué)習(xí)系統(tǒng)。當(dāng)然,在那個年代,這
些學(xué)習(xí)方法盡管有效,但受計算能力的限制,這些方法距離實(shí)用還比較遙遠(yuǎn)。[1]
2012年,亞歷克斯·克里熱夫斯基、伊利亞·薩茨克維爾和導(dǎo)師辛頓發(fā)
表了論文《基于深度卷積神經(jīng)網(wǎng)絡(luò)的ImageNet分類》。ImageNet數(shù)據(jù)集在目
前深度學(xué)習(xí)圖像領(lǐng)域應(yīng)用非常多,很多圖像分類、定位、檢測等研究工作大多
基于此數(shù)據(jù)集展開。該論文介紹了使用深度學(xué)習(xí)技術(shù)所開發(fā)的一個大型的深度
卷積神經(jīng)網(wǎng)絡(luò)AlexNet,包含5個卷積層、1個最大池化層和2個全連接層,
共有6000萬個參數(shù)和50萬個神經(jīng)元,將130萬個高分辨率圖像分為1000個
不同的類。因AlexNet證明了在GPU上訓(xùn)練的深度卷積神經(jīng)網(wǎng)絡(luò)可以將圖像
識別任務(wù)提升到一個新的水平,所以被業(yè)界廣泛認(rèn)為是一項(xiàng)真正的開創(chuàng)性工作。
AlexNet在ImageNet競賽中獲得冠軍,其對神經(jīng)網(wǎng)絡(luò)的發(fā)展產(chǎn)生了非常重要
的影響,之后的ImageNet冠軍幾乎全都采用了卷積神經(jīng)網(wǎng)絡(luò)(Convolutional
NeuralNetwork,CNN)結(jié)構(gòu),使其成了圖像分類的核心模型,并由此開啟了
深度學(xué)習(xí)的新一波浪潮。[2]
2013年,托馬斯·米科洛夫等人發(fā)表了論文《單詞和短語的分布式表示
及其構(gòu)成》,對連續(xù)Skip-gram模型進(jìn)行了改進(jìn)。Skip-gram模型是一種從大
量非結(jié)構(gòu)化文本數(shù)據(jù)中學(xué)習(xí)高質(zhì)量向量表示的有效方法。改進(jìn)的結(jié)果使Skip-
gram模型具備更強(qiáng)的表示能力,通過對高頻詞進(jìn)行二次抽樣的方法,以及衡
量短語的方法,使其處理速度顯著提高,可以更快地學(xué)習(xí)質(zhì)量更高的向量,甚
至可以很好地表示由數(shù)百萬個句子構(gòu)成的向量。這使得深度學(xué)習(xí)對文本的處理
能力又上了一個新的臺階。[3]
2014年,伊恩·古德費(fèi)洛等人發(fā)表了論文《生成對抗網(wǎng)絡(luò)》。該論文提出
了一個新的框架一一生成對抗網(wǎng)絡(luò)(GenerativeAdversarialNets,GAN)來構(gòu)
建生成模型。GAN框架同時訓(xùn)練兩個模型:一個是生成器,用以獲取數(shù)據(jù)分
布;另一個是鑒別器,用以鑒別樣本,評估樣本是來自訓(xùn)練數(shù)據(jù)而非生成器的
概率。通過兩者之間的博弈,GAN能夠?qū)?shù)據(jù)分布進(jìn)行很好的建模。生成器
[1]李敏.人工智能:技術(shù)、資本與人的發(fā)展[D].中南財經(jīng)政法大學(xué),2018.
[2]何江玲.人工智能對人的全面發(fā)展的影響研究[D].哈爾濱師范大學(xué),2022.
[3]郭毅可.論人工智能歷史、現(xiàn)狀與未來發(fā)展戰(zhàn)略[J].人民論壇·學(xué)術(shù)前沿,2021(23):
41-53.
8
第一章人工智能
的目的是盡量降低鑒別器正確判斷出假樣本的概率,而鑒別器的目標(biāo)是最大限
度地降低識別假樣本時發(fā)生的錯誤。由于GAN會訓(xùn)練生成器讓鑒別器錯誤識
別的概率最大化,可以減小梯度飽和,提高訓(xùn)練穩(wěn)定性,并產(chǎn)生驚人的效果,
因此使得GAN迅速走紅,成為目前人們在機(jī)器學(xué)習(xí)、模式識別中優(yōu)先采用的
訓(xùn)練算法。[1]
2015年,迪德里克·金馬等人發(fā)表了論文《Adam:一種隨機(jī)優(yōu)化方法》。
該論文介紹了一種基于自適應(yīng)低階矩估計的隨機(jī)目標(biāo)函數(shù)一階梯度優(yōu)化算法
Adam。Adam可以為每個參數(shù)單獨(dú)調(diào)節(jié)學(xué)習(xí)速率,很快成了一個非常流行的
自適應(yīng)優(yōu)化器。Adam的出現(xiàn)促進(jìn)了深度學(xué)習(xí)的有效運(yùn)用,是目前深度學(xué)習(xí)中
最受歡迎的優(yōu)化算法之一。[2]
2016年,何凱明等人發(fā)表了論文《用于圖像識別的深度殘差學(xué)習(xí)》。對一
個普通的神經(jīng)網(wǎng)絡(luò)來說,越深的神經(jīng)網(wǎng)絡(luò)(層數(shù)越多)就越難訓(xùn)練,因?yàn)槠錅?zhǔn)
確率可能會隨著深度的增加而下降。為此,何凱明等人的論文提出了一種殘差
學(xué)習(xí)框架,采用更深的網(wǎng)絡(luò)但卻簡化了網(wǎng)絡(luò)的訓(xùn)練,其思路是顯式地將層重新
定義,參考每層輸入的同時還要學(xué)習(xí)其殘余函數(shù),即將輸入從卷積層的每個塊
之前添加到輸出中,從而構(gòu)造成了殘差網(wǎng)絡(luò)。實(shí)驗(yàn)結(jié)果表明,這些殘差網(wǎng)絡(luò)更
容易優(yōu)化,并且可以從顯著增加的深度中獲得更高的精度。在ImageNet數(shù)據(jù)
集上,當(dāng)殘差網(wǎng)絡(luò)深度達(dá)152層(比VGG網(wǎng)絡(luò)深8倍)時,仍然具有較低的
復(fù)雜度,且誤差僅為3.57%。[3]
殘差網(wǎng)絡(luò)解決了人們對神經(jīng)網(wǎng)絡(luò)分解為更多的層會導(dǎo)致退化的擔(dān)心,因?yàn)?/p>
在最壞的情況下,殘差網(wǎng)絡(luò)可以將其他層簡單地設(shè)置為恒等映射,從而使之僅
僅退化為一個淺層網(wǎng)絡(luò)而已。
2017年,阿希什·瓦斯瓦尼等人發(fā)表了論文《你只需要“注意”》。人們
在從事用于翻譯的序列轉(zhuǎn)換時,通常在編碼器和解碼器結(jié)構(gòu)中運(yùn)用復(fù)雜的遞歸
或卷積神經(jīng)網(wǎng)絡(luò),為提高性能,人們還會加入注意力機(jī)制來連接編碼器和解碼
器。該論文提出了Transformer模型。這是一種完全依賴于注意力機(jī)制來構(gòu)建
[1]趙楠,譚惠文.人工智能技術(shù)的發(fā)展及應(yīng)用分析[J].中國電子科學(xué)研究院學(xué)報,2021,
16(07):737-740.
[2]王嫄,解文霞,孔德莉,高喜平.論人工智能技術(shù)應(yīng)用研究現(xiàn)狀和發(fā)展前景[J].科技與
創(chuàng)新,2019(20):18-21.
[3]譚鐵牛.人工智能的歷史、現(xiàn)狀和未來[J].智慧中國,2019(Z1):87-91.
9
人工智能的倫理問題及其治理研究
輸入和輸出之間全局依賴關(guān)系的模型,其不再需要遞歸和卷積神經(jīng)網(wǎng)絡(luò),更易
于并行化,在8個P100GPU上只訓(xùn)練12個小時就可以使翻譯質(zhì)量達(dá)到更高
的新水平。在兩個機(jī)器翻譯任務(wù)上的實(shí)驗(yàn)表明,模型具有更高的質(zhì)量以及更高
的并行性,訓(xùn)練時間也顯著減少。Transformer模型在很大程度上優(yōu)于循環(huán)神
經(jīng)網(wǎng)絡(luò)(RNN),這是因?yàn)樵诔笮途W(wǎng)絡(luò)中前者具有計算成本上的優(yōu)勢。RNN
中的長距離傳播梯度會導(dǎo)致內(nèi)存訪問成為瓶頸,因此需要更復(fù)雜的LSTM
(LongShort-TermMemory,長短期記憶網(wǎng)絡(luò))和GRU(GatedRecurrentUnit,
門控循環(huán)單元)模型。相比之下,Transformer模型針對高度并行處理進(jìn)行了
優(yōu)化,其計算成本最高的部分是注意力層之后的前饋網(wǎng)絡(luò),這可以并行化應(yīng)用。
再就是注意力層本身,這是大矩陣乘法,也容易優(yōu)化。Transformer模型單純
使用注意力機(jī)制,放棄了卷積,這種大道至簡的做法,把基于“注意”的序列
神經(jīng)模型推向了高潮,現(xiàn)在已成為幾乎所有最新自然語言處理模型的基礎(chǔ)。[1]
當(dāng)然,深度神經(jīng)網(wǎng)絡(luò)也并非完美無缺。如果僅僅進(jìn)行簡單的訓(xùn)練,深度神
經(jīng)網(wǎng)絡(luò)可能會出現(xiàn)很多問題,如過擬合問題、可靠性問題、不可解釋性問題等。
目前尚無完備的理論能夠?qū)ζ渥龀龊侠斫忉?,隨著越來越多的人工智能算法應(yīng)
用在實(shí)際生產(chǎn)生活中,不可解釋的問題則會存在產(chǎn)生結(jié)果不可控的隱患。
(二)解決不同軟硬件的適配
在實(shí)際工程應(yīng)用中,開發(fā)者在開發(fā)人工智能應(yīng)用時往往有多種軟件框架可
供選擇,各種選擇也均能取得不錯的效果。同時,開發(fā)者也有多種硬件選項(xiàng)可
供選擇。但是軟件框架和硬件選項(xiàng)的多樣性也帶來了一些在所難免的問題。第
一個問題就是不同軟件框架的適用性問題。由于各個軟件框架的底層實(shí)現(xiàn)方法
不一樣,不同軟件框架下開發(fā)的人工智能模型很難快速轉(zhuǎn)換。比如開發(fā)者在
TensorFlow框架下開發(fā)了一個人臉識別神經(jīng)網(wǎng)絡(luò)并將其開源,而其他框架(如
PyTorch、PaddlePaddle等)的忠實(shí)愛好者很難直接使用TensorFlow中的神經(jīng)
網(wǎng)絡(luò)模型,還需要對開源的模型進(jìn)行重構(gòu),才能在新的軟件框架下成功運(yùn)行。
第二個問題是軟件框架和硬件的適配性問題。計算芯片發(fā)展迅速,而軟件框架
往往很難跟上芯片的發(fā)展,從而導(dǎo)致底層芯片和軟件框架的不適配,使得人工
智能算法遇到一些莫名的錯誤。業(yè)界也有公司提出了針對深度神經(jīng)網(wǎng)絡(luò)模型的
[1]譚鐵牛.人工智能的歷史、現(xiàn)狀和未來[J].智慧中國,2019(Z1):87-91.
10
第一章人工智能
編譯器,旨在通過擴(kuò)充面向深度學(xué)習(xí)模型的各項(xiàng)專屬功能,解決深度學(xué)習(xí)在不
同軟件框架、不同硬件設(shè)備之間的適配性和可移植性問題。
但是,這樣的編譯器暫時沒有統(tǒng)一的標(biāo)準(zhǔn),各硬件廠商在中間表示層的競
爭也成了人工智能技術(shù)實(shí)用化的阻礙。如何從模型底層、硬件、存儲、計算及
優(yōu)化等方面形成統(tǒng)一的標(biāo)準(zhǔn),將是影響人工智能快速應(yīng)用和普及的重要環(huán)節(jié)。
1.中間表示層解決可移植性問題
在具體的工程實(shí)踐和應(yīng)用中,一般采用中間表示(Intermediate
Representation,IR)層的規(guī)定將人工智能模型(訓(xùn)練完成以后的模型)進(jìn)行表
達(dá)和存儲。中間表示層可以看作是很多中間件的集合,使用中間表示層可以優(yōu)
化程序性能、提升通信效率。深度學(xué)習(xí)訓(xùn)練軟件框架實(shí)現(xiàn)方式各異,為了打通
不同的軟件框架和不同的表達(dá)模式,擴(kuò)充中間表示層可以使深度學(xué)習(xí)網(wǎng)絡(luò)模型
編譯器更加有效地工作。在深度學(xué)習(xí)網(wǎng)絡(luò)模型編譯器中,通過新增加的專屬中
間件可以實(shí)現(xiàn)終端側(cè)模型適配并可運(yùn)行在不同的軟硬件平臺。當(dāng)前支持中間表
示層的包括亞馬遜云服務(wù)(AWS)所推出的NNVM/TVM(1231和谷歌所推
出的XLA-TensorFlow。
華盛頓大學(xué)保羅·艾倫計算機(jī)科學(xué)與工程學(xué)院的亞馬遜云服務(wù)AI團(tuán)隊(duì)于
2017年9月在DMLC開源社區(qū)發(fā)布了TVM堆棧,旨在彌合深度學(xué)習(xí)框架與
面向性能或效率的硬件后端之間的鴻溝。TVM堆棧使深度學(xué)習(xí)框架可以輕松
地構(gòu)建端到端編譯。同年10月,威斯康星大學(xué)艾倫分校和AWS的AI團(tuán)隊(duì)正
式發(fā)布NNVM編譯器。作為一種開放式深度學(xué)習(xí)編譯器,NNVM編譯器將前
端框架工作負(fù)載直接編譯到硬件后端,從而提供了一種適用于所有框架的統(tǒng)一
解決方案。NNVM與TVM的聯(lián)手,使得NNVM編譯器借助TVM堆棧可以
實(shí)現(xiàn):①在高級圖中間表示層中表示并優(yōu)化常見的深度學(xué)習(xí)工作負(fù)載;②轉(zhuǎn)換
計算圖,最大限度地降低對內(nèi)存的使用,優(yōu)化數(shù)據(jù)布局并融合不同硬件后端的
計算模式;③提供從前端深度學(xué)習(xí)框架到裸機(jī)硬件的端到端編譯管道。
XLA(加速線性代數(shù))是谷歌推出的一種針對特定領(lǐng)域的線性代數(shù)編譯器,
能夠優(yōu)化TensorFlow計算。它可以提高服務(wù)器和移動平臺的運(yùn)行速度,改進(jìn)
內(nèi)存使用情況和可移植性。TensorFlow是一種靈活且可擴(kuò)展的深度學(xué)習(xí)框架,
可定義任意數(shù)據(jù)流圖并使用異構(gòu)計算設(shè)備以分布式方式高效執(zhí)行。但Tensor
Flow的靈活性與其目標(biāo)性能不符,盡管TensorFlow旨在支持定義任何類型的
11
人工智能的倫理問題及其治理研究
數(shù)據(jù)流圖,但要使所有圖都能夠高效執(zhí)行卻是一件很有挑戰(zhàn)的事情。當(dāng)各操
作之間的權(quán)重不同時就不能保證這樣的組合可以以最有效的方式運(yùn)行。為此,
谷歌內(nèi)部的XLA團(tuán)隊(duì)與TensorFlow團(tuán)隊(duì)合作,于2017年3月推出了XLA-
TensorFlow,用XLA作為TensorFlow的編譯器。XLA使用JIT編譯技術(shù)來
分析用戶在運(yùn)行時創(chuàng)建的TensorFlow圖,將多個操作融合在一起,并為不同
CPU、GPU以及自定義加速器生成高效的本機(jī)代碼。
2.模型轉(zhuǎn)換及其交換格式
為了解決不同軟硬件的適配問題,除了使用統(tǒng)一的中間表示層對模型進(jìn)行
統(tǒng)一的表達(dá)及存儲外,輸入數(shù)據(jù)的格式也需要進(jìn)行處理。由于不同的軟件框架
實(shí)現(xiàn)方式不一樣,它們定義的輸入數(shù)據(jù)格式也各有不同,并會采用不同的技術(shù)
實(shí)現(xiàn)數(shù)據(jù)操作。例如,TensorFlow定義了TFRecord,這是一種用于存儲二進(jìn)
制記錄序列的簡單格式,將數(shù)據(jù)序列化并存儲在一組可以線性讀取的文件(每
個文件100—200MB)中,可支持高效地讀取數(shù)據(jù),同時也有助于緩存數(shù)據(jù)的
預(yù)處理。而MXNet及PaddlePaddle框架使用的是RecordIO,這是一組二進(jìn)制
數(shù)據(jù)交換格式,其基本思想是將數(shù)據(jù)分成單獨(dú)的塊(也稱為“記錄”),先在
每個記錄之前添加該記錄的長度值(以字節(jié)為單位),然后再保存記錄中的數(shù)
據(jù)。但是,RecordIO并沒有正式的格式規(guī)范,因此RecordIO在實(shí)際使用時往
往存在一些不兼容的問題。
深度學(xué)習(xí)網(wǎng)絡(luò)模型的表示規(guī)范主要有兩類:一類是Facebook和Microsoft
創(chuàng)建的社區(qū)項(xiàng)目所推出的ONNX(OpenNeuralNetworkExchange,開放神經(jīng)
網(wǎng)絡(luò)交換);另一類是由開放行業(yè)聯(lián)盟Khronos集團(tuán)所推出的NNEF(Neural
NetworkExchangeFormat,神經(jīng)網(wǎng)絡(luò)交換格式)。
ONNX是由Facebook和Microsoft創(chuàng)建的社區(qū)推出的一種代表深度學(xué)習(xí)模
型的開放格式,可使模型在不同軟件框架之間進(jìn)行轉(zhuǎn)移。ONNX支持的軟件
框架目前主要包括Caffe2、PyTorch、CognitiveToolkit、MXNet等,而谷歌的
TensorFlow并沒有被包含在內(nèi)。ONNX有兩個主要特點(diǎn)。
(1)框架的互操作性:通過啟用互操作性可以更快地將設(shè)計付之實(shí)現(xiàn)。
ONNX讓模型可以在一個框架中進(jìn)行訓(xùn)練,然后轉(zhuǎn)移到另一個框架中進(jìn)行推理。
ONNX模型已得到Caffe2、CognitiveToolkit、MXNet和PyTorch的支持,并
且具有許多其他常見的框架和庫的連接器。
12
第一章人工智能
(2)硬件優(yōu)化:0NNX通過硬件優(yōu)化覆蓋更多的開發(fā)人員。任何導(dǎo)出
ONNX模型的工具都可以從ONNX兼容的RUNTIME和庫中受益。這些
RUNTME和庫旨在最大限度地提高深度學(xué)習(xí)領(lǐng)域某些硬件的最佳性能。2019
年7月,0NNXv1.6正式推出,使用新數(shù)據(jù)類型和運(yùn)算符可以支持更多的模型。
NNEF支持不同設(shè)備、平臺的應(yīng)用可以使用豐富的神經(jīng)網(wǎng)絡(luò)訓(xùn)練工具和推
理引擎(及其組合),能很大程度減少機(jī)器學(xué)習(xí)的零散部署。NNEF支持包括
PyTorch、Caffe2、TensorFlow等大多數(shù)人工智能軟件框架的模型格式轉(zhuǎn)換。
目前已經(jīng)有30多家計算芯片企業(yè)參與到NNEF中。NNEF的目標(biāo)是讓使用者
能夠輕松地將經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)移到各種各樣的推理引擎中。由于神經(jīng)
網(wǎng)絡(luò)在邊緣設(shè)備上廣泛應(yīng)用,制造商對于NNEF的依賴是至關(guān)重要的。因此,
NNEF封裝了一個訓(xùn)練神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)、操作和參數(shù)的完整描述,使之獨(dú)立于
用于產(chǎn)生它的訓(xùn)練工具和用于執(zhí)行它的推理機(jī)。
(三)算力大幅提升的貢獻(xiàn)
人工智能技術(shù)的飛速發(fā)展也離不開算力的大幅提升。近年來涌現(xiàn)的許多新
型高性能計算架構(gòu)也成了人工智能技術(shù)發(fā)展的催化劑。深度學(xué)習(xí)算法需要對網(wǎng)
絡(luò)連接權(quán)重進(jìn)行多次調(diào)整,也需要很高的計算能力的支撐。由于集成電路按
摩爾定律迅速發(fā)展,使計算成本迅速下降,同時云計算的出現(xiàn)、GPU的大規(guī)
模應(yīng)用等,這些都使得針對集中化數(shù)據(jù)的計算能力變得前所未有的強(qiáng)大。與
此同時,計算芯片的架構(gòu)也逐漸向深度學(xué)習(xí)應(yīng)用優(yōu)化的趨勢發(fā)展,以傳統(tǒng)的
CPU為主、GPU為輔的英特爾公司也開始聯(lián)手AMD公司,推出整合了AMD
VegaGPU的全新產(chǎn)品Inteli7-8809GCPU。因此說,人工智能的爆發(fā)式發(fā)展在
很大程度上與硬件算力的提升有關(guān)。
(四)移動互聯(lián)網(wǎng)與傳感器的貢獻(xiàn)
移動互聯(lián)網(wǎng)的迅猛發(fā)展也是促進(jìn)人工智能發(fā)展的重要因素。移動互聯(lián)網(wǎng)的
出現(xiàn)使智能設(shè)備時刻與人類相伴,通過智能設(shè)備能夠采集到足夠充分和完整的
數(shù)據(jù)。相比個人計算機(jī),智能設(shè)備便于攜帶,并且智能手機(jī)、智能手環(huán)等可穿
戴設(shè)備貫穿于人們的日常生活之中。這些設(shè)備貢獻(xiàn)的數(shù)據(jù)是完善的和連續(xù)的,
為后續(xù)信息處理和人工智能算法的訓(xùn)練提供了基礎(chǔ)。另外,移動互聯(lián)網(wǎng)為人們
帶來了不同的使用場景和使用習(xí)慣。比如移動互聯(lián)網(wǎng)讓人們可以更傾向于進(jìn)行
語音輸入,而非鍵盤輸入;解鎖手機(jī)的時候更傾向于刷臉解鎖,而非輸入開機(jī)
13
人工智能的倫理問題及其治理研究
密碼或圖案。這些使用場景和使用習(xí)慣在很大程度上也促進(jìn)了圖像識別、語音
識別、自然語言處理等核心技術(shù)的發(fā)展。受智能手機(jī)、可穿戴設(shè)備等爆發(fā)式增
長的推動,傳感器無論在數(shù)量上還是在質(zhì)量上都有了巨大的飛躍。傳感器的發(fā)
展,如LIGA(光刻)等微電子技術(shù)日趨成熟,使得機(jī)器的感知能力變強(qiáng),進(jìn)
而為機(jī)器變“聰明”奠定了基礎(chǔ)。通過這些感知能力強(qiáng)的傳感器,人們可以獲
取更準(zhǔn)確的數(shù)據(jù),如每天走路的步數(shù)、心率的變化數(shù)據(jù)等。
數(shù)據(jù)是人工智能快速發(fā)展的基石,人工智能依賴于數(shù)據(jù)支持。據(jù)WeAre
Social和Hootsuite兩家機(jī)構(gòu)發(fā)布的《2019年全球數(shù)字報告》顯示,全球互聯(lián)
網(wǎng)用戶數(shù)已經(jīng)突破了51億,而移動設(shè)備數(shù)量巨大,意味著移動設(shè)備所貢獻(xiàn)的
數(shù)據(jù)量逐漸會成為主流。
第二節(jié)人工智能的三個學(xué)術(shù)流派
一、符號主義
符號主義是指符號人工智能,也被稱為邏輯主義、心理學(xué)派或計算機(jī)學(xué)派,
其依托的是一種基于問題、邏輯和搜索的高級符號處理體系,其基礎(chǔ)主要為物
理符號系統(tǒng)假設(shè)和有限合理性原理。在人工智能中,符號認(rèn)知的基本要素是符
號,通過將信息和行為抽象到基于符號規(guī)則的物理符號系統(tǒng)中,利用計算機(jī)邏
輯推理模擬人類的抽象思維,實(shí)現(xiàn)了智能行為的模擬。
1955年,西蒙意識到能夠操縱符號的機(jī)器可以很好地模擬決策行為,甚
至能模擬人類思想的過程,他與紐厄爾開始討論教機(jī)器思考的可能性。他們
邀請了約翰·肖于1956年編寫了一個命名為“邏輯理論家”(LogicTheorist,
LT)的程序。這是第一個模仿人類進(jìn)行問題求解的程序,也被稱為“第一個
人工智能程序”。LT建立了啟發(fā)式程序設(shè)計領(lǐng)域,并很快證明伯特蘭·羅素和
艾爾費(fèi)雷德·懷特黑德著的《數(shù)學(xué)原理》第二章前52個定理中的38個定理,
其中一個定理的證明比羅素和懷特黑德的手工證明顯得更優(yōu)雅。1956年,西
蒙和紐厄爾作為人工智能首次會議——達(dá)特茅斯會議的受邀參加者,在會上介
紹了他們所發(fā)明的“邏輯理論家”,這項(xiàng)成果被認(rèn)為是此次會議的一個亮點(diǎn)。
14
第一章人工智能
1956年,著迷于研究計算機(jī)下棋的麥卡錫發(fā)起并參加了達(dá)特茅斯會議,
他在會議上介紹了他所提出的α-β搜索算法。該算法是會議的亮點(diǎn)之一、通
過設(shè)置棋類博弈中己方必須考慮的不能輸棋的下限因素α和對手必須考慮的
需要贏棋的上限因素β作為判定條件,判斷哪些選擇是在上下界之外的,那
就表明這些選擇可以不予考慮,由此可以將搜索樹的空間剪枝為原來的平方根
級別。1997年,戰(zhàn)勝國際象棋大師卡斯帕羅夫的“深藍(lán)”就是使用的α-β搜
索算法。麥卡錫在達(dá)特茅斯會議上指出:這次會議是基于這樣的推測,即原則
上可以精確地描述學(xué)習(xí)的各個方面或智能的任何特征,從而可以制造出能夠模
擬它的機(jī)器。[1]在麥卡錫的推動下,使用符號描述或?qū)W習(xí)智能的特征一直是人
工智能的研究重點(diǎn)。1956年,麥卡錫與香農(nóng)合著《自動機(jī)研究》一書;之后,
麥卡錫還發(fā)明了人工智能符號語言LISP(listprocessinglanguage,表處理語言)。
該語言一度成為人工智能的代名詞,進(jìn)一步奠定了麥卡錫在人工智能領(lǐng)域中的
地位。
麥卡錫、西蒙和紐厄爾的早期推動,以及他們在符號主義人工智能方面的
貢獻(xiàn),使得他們被譽(yù)為符號主義學(xué)派的奠基人。
符號主義學(xué)派認(rèn)為,人們通過使用不同的符號進(jìn)行變流,可以更加容易地
相互理解,這也是人類變得聰明的主要原因之一;認(rèn)知過程是在符號表示上的
一種運(yùn)算,可以通過計算機(jī)進(jìn)行符號操作從而模擬人的認(rèn)知過程。符號主義學(xué)
派的研究思路一般可以分為三步:第一步是研究并理解人類認(rèn)知系統(tǒng)的功能機(jī)
理;第二步是使用符號和基于符號的運(yùn)算描述人類的認(rèn)知過程;第三步是利用
計算機(jī)系統(tǒng)實(shí)現(xiàn)符號的表示和基于符號的運(yùn)算,從而模擬人類的認(rèn)知過程,實(shí)
現(xiàn)人工智能。符號主義學(xué)派的特點(diǎn)體現(xiàn)在其自上而下地通過推理演繹的方式實(shí)
現(xiàn)人工智能。從符號主義學(xué)派的觀點(diǎn)來看,人工智能的核心問題是知識表示、
知識推理與知識運(yùn)用。知識是構(gòu)成智能的基礎(chǔ),是信息的一種表現(xiàn)形式:知識
可以使用符號進(jìn)行表示,而認(rèn)知是對符號的處理過程;推理是采用啟發(fā)式方式
對問題求解的過程,也是可以用某種形式化的符號及語言進(jìn)行描述的。因此,
通過符號的表示、處理、計算等有可能建立起基于知識的人類智能和機(jī)器智能
的統(tǒng)一理論體系。
[1]林永青.人工智能起源處的“群星”[J].金融博覽,2017(05):46-47.
15
人工智能的倫理問題及其治理研究
符號主義學(xué)派的研究者在1956年首先采用了“人工智能”這個術(shù)語,后
來發(fā)展出了多種啟發(fā)式技術(shù)、專家系統(tǒng)、知識工程等理論及技術(shù),為早期人工
智能的發(fā)展和應(yīng)用奠定了基礎(chǔ)。其中,專家系統(tǒng)可以基于專家知識設(shè)計計算機(jī)
程序來解決復(fù)雜問題,是一種典型的符號化計算范例。專家系統(tǒng)結(jié)合了專家知
識,能精確地通過符號計算來處理規(guī)則,并進(jìn)行推理,如使用產(chǎn)生式規(guī)則網(wǎng)絡(luò),
以類似于If-Then語句的關(guān)系連接符號來支撐推理過程,從而根據(jù)實(shí)際問題可
以設(shè)計和實(shí)現(xiàn)不同領(lǐng)域的專家系統(tǒng)。
由于專家系統(tǒng)的多方面優(yōu)勢,使得符號主義在相當(dāng)長的一段時間內(nèi)占據(jù)了
人工智能研究的主流地位,尤其是20世紀(jì)70年代后出現(xiàn)了大量結(jié)合領(lǐng)域知識
的專家系統(tǒng),促進(jìn)人工智能技術(shù)進(jìn)入實(shí)際工程應(yīng)用中。通過定義邏輯推理相關(guān)
的符號及操作,可以創(chuàng)建執(zhí)行各種任務(wù)的符號人工智能程序,面向?qū)ο蟮某绦?/p>
設(shè)計(ObjectOrientedProgramming,OOP)也可以說是符號人工智能的一個
典型成果。
由于符號主義的思想體系在20世紀(jì)50年代中期至80年代末期一直主導(dǎo)
著人工智能的發(fā)展,并成為人工智能研究的主要范例,因此符號主義的研究方
法被學(xué)者視為傳統(tǒng)的人工智能方法。該方法假設(shè)可以通過操縱符號來實(shí)現(xiàn)部分
智能。這一假設(shè)被紐厄爾和西蒙定義為“物理符號系統(tǒng)假說”。約翰·豪格蘭
在其1985年的著作《人工智能:非凡的想法》中將這種傳統(tǒng)的人工智能方法
稱為GOFAI(GoodOld-FashionedArtificialIntelligence,出色的老式人工智能),
并將其命名為符號人工智能。
符號人工智能的一個鮮明特點(diǎn)是邏輯演繹特性,這使其行為具有可解釋
性,人們可以輕松地可視化展示基于規(guī)則的程序的邏輯,從而可以對其系統(tǒng)進(jìn)
行故障檢查。對于規(guī)則非常清晰的輸入事務(wù),符號人工智能可以輕松地獲取規(guī)
則描述并將其轉(zhuǎn)換為符號,從而進(jìn)行邏輯演繹。由于邏輯演繹具有很好的可解
釋性,在符號表達(dá)完整、規(guī)則描述清晰的系統(tǒng)上取得了良好的應(yīng)用效果。
符號主義曾長期一枝獨(dú)秀,尤其是專家系統(tǒng)的成功開發(fā)與應(yīng)用為人工智能
技術(shù)從理論走向工程實(shí)踐起到了至關(guān)重要的作用,為人工智能的發(fā)展做出了重
要貢獻(xiàn)。盡管人工智能的其他學(xué)派先后出現(xiàn),符號主義依然是人工智能的主流
學(xué)派。近些年出現(xiàn)的知識圖譜技術(shù)為符號主義學(xué)派注入了新的生機(jī)和活力。盡
管知識圖譜并不是規(guī)則模式,自身并不具有直接的推理能力,但其是知識工程
16
第一章人工智能
的一種形態(tài),可以擁有龐大的知識庫,且通過符號之間的連接,可將相關(guān)的內(nèi)
容有機(jī)地關(guān)聯(lián)起來,再通過基于知識庫的各種服務(wù)提供抽取、搜索等服務(wù),還
可以基于已知的關(guān)系推演出未知的關(guān)系,從而反映出一種廣義的推理能力,表
達(dá)出其智能特性。知識圖譜的構(gòu)造過程有兩種:一種是通過信息抽取技術(shù)抽取
出已有的知識;另一種是通過傳統(tǒng)的符號推理方法生成新的知識。
二、連接主義
連接主義(connectionism,也可翻譯為“聯(lián)結(jié)主義”)學(xué)派也被稱為仿生
學(xué)派或生理學(xué)派,其研究方法是一種基于網(wǎng)絡(luò)連接機(jī)制和學(xué)習(xí)算法的智能模擬
方法。當(dāng)前,這一學(xué)派在人工智能研究領(lǐng)域同樣占有重要地位。
連接主義的提出可追溯到1943年生理學(xué)家沃倫·麥卡洛克和數(shù)理邏輯學(xué)
家沃爾特·皮茨所發(fā)表的文章《神經(jīng)活動中內(nèi)在思想的邏輯演算》。該文章提
出了神經(jīng)元的M-P(McCul-loch-Pitts)數(shù)學(xué)模型,提出了用形式化方式描述
神經(jīng)元和網(wǎng)絡(luò)結(jié)構(gòu)的方法,開創(chuàng)了使用電子裝置模仿人腦結(jié)構(gòu)和功能的新途徑。
M-P模型一直沿用至今,成為神經(jīng)元最基本的結(jié)構(gòu)。這篇文章認(rèn)為,人類的
認(rèn)知系統(tǒng)和智能行為是人腦高層活動的結(jié)果,智能活動是由大量簡單的神經(jīng)元
通過復(fù)雜的相互連接后并行運(yùn)行的結(jié)果。
1951年,馬文·明斯基和迪安·埃德蒙茲合作設(shè)計了世界上第一臺人
工神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)機(jī)器——SNARC(StochasticNeuralAnalogReinforcement
Calculator,隨機(jī)神經(jīng)模擬強(qiáng)化計算器)。SNARC由3000個真空管構(gòu)成,模擬
了40個神經(jīng)元的運(yùn)行,其最初目的是學(xué)習(xí)如何穿越迷宮。在經(jīng)過不斷的嘗試
后,SNARC學(xué)會一些解決問題的方法,由此形成了基于連接主義的人工智能
發(fā)展道路。明斯基也是1956年達(dá)特茅斯會議的發(fā)起者之一。他在會議上介紹
了SNARC的工作,被認(rèn)為是值得關(guān)注的學(xué)術(shù)成果。這也是明斯基被視為連接
主義奠基人的原因之一。
連接主義學(xué)派使用基于神經(jīng)網(wǎng)絡(luò)的模擬方法,以工程技術(shù)手段模擬人腦神
經(jīng)系統(tǒng)的結(jié)構(gòu)、功能等,通過大量的并行處理器模擬人腦中數(shù)量龐大的神經(jīng)細(xì)
胞(神經(jīng)元),用處理器互相之間的連接關(guān)系模擬人腦中神經(jīng)細(xì)胞突觸之間的
連接行為。人工神經(jīng)網(wǎng)絡(luò)首先將多個神經(jīng)元組成一層網(wǎng)絡(luò),再由多層這樣的網(wǎng)
絡(luò)通過互相連接實(shí)現(xiàn)一個完整的神經(jīng)網(wǎng)絡(luò),然后利用大量的數(shù)據(jù)訓(xùn)練這一網(wǎng)
17
人工智能的倫理問題及其治理研究
絡(luò),用學(xué)習(xí)算法調(diào)整神經(jīng)元之間的連接權(quán)重,從而使神經(jīng)網(wǎng)絡(luò)不斷完善。人工
神經(jīng)網(wǎng)絡(luò)技術(shù)開辟了人工智能的又一發(fā)展道路。
20世紀(jì)60年代出現(xiàn)的感知機(jī)(perceptron)模型可以根據(jù)訓(xùn)練數(shù)據(jù)自動調(diào)
整M-P模型中連接的權(quán)重,以此機(jī)制建立的腦模型一度備受關(guān)注,但是受到
當(dāng)時各種技術(shù)條件的限制,腦模型的研究在20世紀(jì)70年代后期至80年代初
期進(jìn)入低潮。直到約翰·霍普菲爾特教授先后在1982年和1984年發(fā)表了該領(lǐng)
域的兩篇重要論文,提出用硬件模擬神經(jīng)網(wǎng)絡(luò)的方法,連接主義才又重受重視。
1986年,大衛(wèi)·魯梅爾哈特等人提出在多層神經(jīng)網(wǎng)絡(luò)中調(diào)整連接權(quán)重的反向
傳播算法,在理論研究上取得了巨大突破。此后,連接主義人工智能勢頭大振,
從模型到算法,從理論研究到工程實(shí)現(xiàn),神經(jīng)網(wǎng)絡(luò)逐步從學(xué)術(shù)界走向工業(yè)界,
開始在多個領(lǐng)域逐步普及并走向市場。
2007年,連接主義的領(lǐng)軍者辛頓提出了深度學(xué)習(xí)算法,大大提高了神經(jīng)
網(wǎng)絡(luò)的學(xué)習(xí)能力。根據(jù)《麻省理工技術(shù)評論》的2013年4月的報道,2013年
3月,谷歌收購了辛頓所創(chuàng)辦的初創(chuàng)企業(yè),以便“把這一領(lǐng)域的想法拿出來,
應(yīng)用到實(shí)際問題上”,比如應(yīng)用到圖像識別、搜索和自然語言理解等實(shí)際場合;
谷歌當(dāng)時的神經(jīng)網(wǎng)絡(luò)擁有超過10億個連接,通過深度學(xué)習(xí)技術(shù),能識別人類
從未定義或標(biāo)記過的物體;微軟美國研究部主管彼得·李表示,深度學(xué)習(xí)重
新引發(fā)了人工智能領(lǐng)域的一些重大挑戰(zhàn)。[1]微軟首席研究官里克·拉希德2012
年10月在中國的一次演講中演示了一款語音處理軟件。該軟件將他的口語轉(zhuǎn)
換成英語文本(錯誤率僅僅約為7%),并翻譯成中文文本,然后模擬他自己的
聲音用中文普通話朗讀。
深度學(xué)習(xí)算法被認(rèn)為是最接近模擬人類大腦智能學(xué)習(xí)的過程,逐漸成為
人工智能必不可少的組成部分,包括BM的“沃森”、谷歌的搜索引擎以及
Facebook的算法都離不開深度學(xué)習(xí)。由于眾多企業(yè)大力推進(jìn)深度學(xué)習(xí)技術(shù),
并將其應(yīng)用于語音識別、圖像識別、自然語言處理等領(lǐng)域,《麻省理工技術(shù)評
論》把深度學(xué)習(xí)列入了2013年度十大技術(shù)突破之一,稱“深度學(xué)習(xí)借助強(qiáng)大
的計算能力,使得機(jī)器現(xiàn)在可以識別對象并實(shí)時翻譯語音。人工智能終于變得
聰明了?!?/p>
[1]劉菊,鐘紹春.網(wǎng)絡(luò)時代學(xué)習(xí)理論的新發(fā)展——連接主義[J].外國教育研究,2011,
38(01):34-38.
18
第一章人工智能
連接主義的主要優(yōu)勢在于神經(jīng)網(wǎng)絡(luò)可以從訓(xùn)練數(shù)據(jù)中發(fā)現(xiàn)規(guī)則。首先,用
戶提供樣本數(shù)據(jù),包括輸入數(shù)據(jù)和對應(yīng)的輸出數(shù)據(jù)(數(shù)據(jù)集越大越好);然后,
連接主義算法應(yīng)用統(tǒng)計回歸模型來調(diào)整其中間變量的權(quán)重系數(shù),直到找到最佳
擬合模型為止。使用諸如梯度下降之類的技術(shù),可在使所有訓(xùn)練數(shù)據(jù)點(diǎn)的累積
誤差最小化的方向上調(diào)整權(quán)重。由于這些技術(shù)是有效地使錯誤率最小化的算
法,因此它們具有固有的“抗噪”能力。它們將消除異常值,并使誤差收斂在
一定范圍內(nèi),從而得到良好的對數(shù)據(jù)進(jìn)行分類的解決方案。
連接主義算法不需要實(shí)際模型,它們只需要足夠的樣本數(shù)據(jù),就可以從統(tǒng)
計學(xué)上推斷出實(shí)際模型。這是一個非常強(qiáng)大的特性,但也是一個弱點(diǎn),因此輸
入功能必須非常仔細(xì)地選擇,避免出現(xiàn)錯誤污染,還必須對其進(jìn)行歸一化或縮
放,避免一個功能勝過另一個功能。
人們經(jīng)常提到的語音識別、語音處理、機(jī)器
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 法律顧問聘請合同
- 中小學(xué)生校外培訓(xùn)服務(wù)合同
- 項(xiàng)目管理效率提升的實(shí)施方案
- 建筑工程投資合作協(xié)議合同
- 本小區(qū)物業(yè)管理合同書
- 酒店合作協(xié)議書范本旅游
- 智能交通大數(shù)據(jù)分析平臺服務(wù)協(xié)議
- 債權(quán)代償及擔(dān)保協(xié)議
- 智能穿戴設(shè)備研發(fā)及生產(chǎn)銷售合同
- 醫(yī)療器械研發(fā)及生產(chǎn)合作協(xié)議
- 新版高中物理必做實(shí)驗(yàn)?zāi)夸浖捌鞑?(電子版)
- 五金采購合同含價格清單
- 食品安全與營養(yǎng)健康課件
- 機(jī)械基礎(chǔ) 第2版全書電子教案
- 歸檔文件整理規(guī)則
- 學(xué)校辦公室主任述職報告
- 《列夫·托爾斯泰》-完整版PPT
- 高考古代詩歌鑒賞復(fù)習(xí)教案
- 負(fù)數(shù)的認(rèn)識1202
- 中國鐵塔建設(shè)維護(hù)工作培訓(xùn)PPT通用通用課件
- 新視野大學(xué)英語第三版Book 2 Unit 1 Text A
評論
0/150
提交評論