AI極簡經(jīng)濟(jì)學(xué)(中文版)_第1頁
AI極簡經(jīng)濟(jì)學(xué)(中文版)_第2頁
AI極簡經(jīng)濟(jì)學(xué)(中文版)_第3頁
AI極簡經(jīng)濟(jì)學(xué)(中文版)_第4頁
AI極簡經(jīng)濟(jì)學(xué)(中文版)_第5頁
已閱讀5頁,還剩105頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

AI極簡經(jīng)濟(jì)學(xué)目錄TOC\h\h第1章導(dǎo)言\h第2章廉價改變一切\(zhòng)h第一部分預(yù)測\h第3章預(yù)測機(jī)器的魔力\h第4章為什么叫它智能\h第5章數(shù)據(jù)就是新一代的石油\h第6章新的勞動分工\h第二部分決策\h第7章拆解決策\h第8章判斷的價值\h第9章預(yù)測判斷\h第10章馴服復(fù)雜性\h第11章全自動決策\h第三部分工具\h第12章解構(gòu)工作流程\h第13章分解決策\h第14章重新設(shè)計工作崗位\h第四部分戰(zhàn)略\h第15章人工智能在高管辦公室\h第16章當(dāng)人工智能改變企業(yè)\h第17章你的學(xué)習(xí)策略\h第18章管理人工智能風(fēng)險\h第五部分社會\h第19章商業(yè)之外第1章

導(dǎo)言下面的場景就算眼下聽上去不太耳熟,也很快會變成生活中的常態(tài)。一個小孩正獨自在房間寫作業(yè)。突然,房里傳來:“特拉華州的首府是哪里?”家長開始琢磨。巴爾的摩……顯然不對……威爾明頓……不是首府。家長還沒想完,一臺名叫“Alexa”的機(jī)器就給出了正確答案:“特拉華州的首府是多佛。”Alexa是亞馬遜的人工智能(ArtificialIntelligence,簡稱AI)語音助手,能夠理解自然語言,并以閃電般的速度回答問題。Alexa將取代父母,成為孩子眼里全知全能的信息來源。人工智能無處不在。它在手機(jī)、汽車?yán)?,在我們購物、相親的過程中,它甚至遍布醫(yī)院、銀行和媒體。難怪公司董事、首席執(zhí)行官、高級副總裁、經(jīng)理、團(tuán)隊領(lǐng)導(dǎo)、企業(yè)家、投資人、教練和決策者都在這場了解人工智能的競賽中感到焦慮:他們意識到,人工智能即將從根本上改變他們的行業(yè)。我們?nèi)苏驹诹艘粋€有利于觀察人工智能進(jìn)步的獨特位置。我們都是經(jīng)濟(jì)學(xué)家,因為研究上一輪偉大的技術(shù)革命——互聯(lián)網(wǎng)而奠定了職業(yè)發(fā)展的方向。經(jīng)過多年的研究,我們學(xué)會了透過鋪天蓋地的宣傳,把目光聚焦于技術(shù)對于決策者的意義上。我們還創(chuàng)立了顛覆性創(chuàng)新實驗室(CreativeDestructionLab,簡稱CDL)。這是一個尚處于種子階段的項目,旨在提高科學(xué)型初創(chuàng)企業(yè)的創(chuàng)業(yè)成功率。起初,該實驗室對所有類型的初創(chuàng)企業(yè)開放,但到2015年,許多激動人心的投資結(jié)果都是來自人工智能方向的公司。據(jù)我們所知,截至2017年9月,顛覆性創(chuàng)新實驗室已連續(xù)三年成為全球最密集的人工智能初創(chuàng)企業(yè)的聚集地。出于這個原因,該領(lǐng)域的許多領(lǐng)導(dǎo)者定期前往多倫多參加顛覆性創(chuàng)新實驗室的活動。例如,在整個項目研發(fā)期間,為亞馬遜的Alexa發(fā)明人工智能動力引擎的主要人物之一威廉·滕斯托爾-佩多(WilliamTunstall-Pedoe),每隔八周就從英國劍橋飛到多倫多與我們碰頭。舊金山的巴尼·佩爾(BarneyPell)也是如此,此前,他曾領(lǐng)導(dǎo)美國國家航空航天局旗下一支85人的團(tuán)隊,把第一代人工智能發(fā)射上了浩瀚太空。顛覆性創(chuàng)新實驗室在這一領(lǐng)域獲得主導(dǎo)地位,一部分原因是我們恰好位于加拿大的多倫多。近年來,機(jī)器學(xué)習(xí)推動了人們對人工智能的研究興趣,而多倫多又孕育了很多機(jī)器學(xué)習(xí)領(lǐng)域的核心發(fā)明。實際上,當(dāng)今已經(jīng)產(chǎn)業(yè)化的世界頂級人工智能團(tuán)隊,包括Facebook、蘋果公司和埃隆·馬斯克(ElonMusk)的OpenAI在內(nèi),其領(lǐng)頭專家都有多倫多大學(xué)計算機(jī)科學(xué)系的背景。與如此多人工智能的應(yīng)用近距離接觸后,我們不得不思考這一技術(shù)給企業(yè)戰(zhàn)略帶來了何種影響。我們的解釋是,人工智能是一種預(yù)測技術(shù),預(yù)測是決策的輸入端,而經(jīng)濟(jì)學(xué)又為任何決策所包含的權(quán)衡取舍提供了一套完美的解釋框架。所以,一半靠運氣,一半靠策劃,我們發(fā)現(xiàn)自己在恰當(dāng)?shù)臅r間和地點為技術(shù)專家和商界從業(yè)者架起了一座橋梁,結(jié)果便是這本書。我們的第一個重要發(fā)現(xiàn)是,人工智能新浪潮實際上并沒有給我們帶來智能,它帶來的是智能的一個關(guān)鍵組成部分——預(yù)測。在上面的場景中,小孩提出問題時,Alexa做的是,收錄聽到的聲音,預(yù)測小孩說出的單詞,再預(yù)測這些單詞要查找的信息。Alexa并不“知道”特拉華州的首府,但可以預(yù)測:當(dāng)人們提出這樣一個問題時,他們尋找的就是一個特定的答案——多佛。顛覆性創(chuàng)新實驗室的每一家初創(chuàng)企業(yè)都建立在更準(zhǔn)確的預(yù)測帶來的好處上。DeepGenomics(深度學(xué)習(xí)基因公司)通過預(yù)測DNA改變時細(xì)胞發(fā)生的變化來改進(jìn)其醫(yī)學(xué)實踐。Knote公司通過預(yù)測文檔的哪些部分應(yīng)該編輯來改進(jìn)法律實踐。Validere公司通過預(yù)測輸入原油的含水量來提高煉油廠的效率。這些應(yīng)用之道,就是大多數(shù)企業(yè)不久的將來發(fā)展方向的縮影。如果你想弄明白人工智能對自己意味著什么,卻又一頭霧水,那么這里有我們帶來的好消息。哪怕你從未涉足卷積神經(jīng)網(wǎng)絡(luò)的編程工作,也從未研究過貝葉斯統(tǒng)計學(xué),我們也能幫你理解人工智能的含義,領(lǐng)略這一技術(shù)的進(jìn)步。如果你是公司領(lǐng)導(dǎo),我們可以幫助你了解人工智能對管理和決策的影響。如果你是學(xué)生,或者剛畢業(yè),我們能為你提供一套框架,思考就業(yè)的演變和未來的職業(yè)發(fā)展。如果你是金融分析師或風(fēng)險投資人,我們將為你提供可構(gòu)建個人投資主張的結(jié)構(gòu)。如果你是一位政治決策者,我們將為你提供指導(dǎo),幫助你理解人工智能將怎樣改變社會,政策又該如何塑造這些變化,讓它們朝著好的方向前進(jìn)。經(jīng)濟(jì)學(xué)為理解不確定性,以及不確定性對決策的意義,提供了堅實的基礎(chǔ)。更準(zhǔn)確的預(yù)測可以降低不確定性,我們用經(jīng)濟(jì)學(xué)告訴你,人工智能對你在運營企業(yè)的過程中即將做出的決策意味著什么。反過來說,憑借這些認(rèn)識,你將更加明白,對于企業(yè)內(nèi)部的工作流程來說,哪些人工智能工具可能給你帶來最高的投資回報率。由此,你將構(gòu)建起一套設(shè)計企業(yè)戰(zhàn)略的框架,比如怎樣重新思考企業(yè)的規(guī)模和經(jīng)營范圍,以便利用基于廉價預(yù)測的全新經(jīng)濟(jì)現(xiàn)實。最后,我們還羅列了與人工智能相關(guān)的重要權(quán)衡:就業(yè)、企業(yè)權(quán)力的集中度、隱私和地緣政治。什么樣的預(yù)測對你的公司最為重要?人工智能的進(jìn)一步發(fā)展,會怎樣改變你賴以為重的預(yù)測?隨著個人電腦和互聯(lián)網(wǎng)的興起,各行各業(yè)重新配置了就業(yè)崗位,為響應(yīng)預(yù)測技術(shù)的進(jìn)步,你所在的行業(yè)將怎樣對就業(yè)崗位進(jìn)行重新配置?人工智能是全新的技術(shù),目前人們對其缺乏了解,但我們所應(yīng)用的經(jīng)濟(jì)學(xué)堅實可靠;我們所舉的案例當(dāng)然會隨著時代前進(jìn)而被淘汰,但本書所介紹的框架卻不然。哪怕隨著技術(shù)進(jìn)步,預(yù)測更加精確化和復(fù)雜化,我們的這些見解仍將適用。但《AI極簡經(jīng)濟(jì)學(xué)》并非你在人工智能經(jīng)濟(jì)時代取得成功的制勝法寶。身為經(jīng)濟(jì)學(xué)家,我們強(qiáng)調(diào)權(quán)衡與取舍。數(shù)據(jù)越多,意味著隱私越少。速度越快,意味著準(zhǔn)確度越低。自主性越強(qiáng),意味著控制力越弱。我們無法為你的企業(yè)開出最佳戰(zhàn)略的處方。那是你的任務(wù)。最適合你所在公司或所屬職業(yè)的戰(zhàn)略應(yīng)該取決于你在每一次權(quán)衡時怎樣拿捏各方要素的權(quán)重。本書提供的是一種結(jié)構(gòu),讓你鎖定關(guān)鍵的權(quán)衡,評估利弊,以做出最適合你的決策。當(dāng)然,就算你手里有了我們的框架,情況也在迅速變化。這意味著,你需要在無法充分掌握信息的條件下做出決定,但即便如此,這也比無所作為好。本章要點※人工智能當(dāng)前的進(jìn)步浪潮給我們帶來的其實不是智能,而是智能的一個關(guān)鍵組成部分——預(yù)測。※預(yù)測是決策的核心輸入。經(jīng)濟(jì)學(xué)有著成熟完備的框架可解釋決策的產(chǎn)生。預(yù)測技術(shù)的進(jìn)步帶來的潛在意義還很新,人們也缺乏足夠理解,但它與經(jīng)濟(jì)學(xué)中歷史悠久且為人熟知的決策理論的邏輯結(jié)合起來時,可帶來一系列洞見,指導(dǎo)你所在的組織走向通往人工智能的道路。※什么是最好的人工智能戰(zhàn)略,什么是最出色的人工智能工具,往往并無固定答案,因為人工智能關(guān)乎權(quán)衡:速度越快,準(zhǔn)確度就越低;自主性越強(qiáng),控制權(quán)就越弱;數(shù)據(jù)越多,隱私就越少。我們?yōu)槟闾峁┝艘环N方法,這一方法可以識別出各種人工智能決策的相關(guān)權(quán)衡,讓你可以根據(jù)自己組織的使命和目標(biāo),評估交易的兩面性,最終做出最適合自己的決策。第2章

廉價改變一切所有人都已經(jīng),或者即將迎來自己的人工智能頓悟時刻。我們習(xí)慣了媒體上充斥著“新技術(shù)即將改變生活”的報道。雖然我們中有些人是技術(shù)愛好者,歡慶著未來的無盡可能,另一些人是技術(shù)恐懼者,哀悼逝去的美好時光,但幾乎所有人,都太習(xí)慣技術(shù)新聞不斷敲響的鼓點了,以至于近乎麻木地念叨著,“唯一不變的就是變化本身”。直到我們迎來自己的人工智能頓悟時刻。然后,我們意識到這次的技術(shù)有些不一樣了。2012年,一些計算機(jī)科學(xué)家經(jīng)歷了他們的人工智能頓悟時刻。當(dāng)時,多倫多大學(xué)的一支學(xué)生團(tuán)隊在可視物體識別大賽ImageNet(ImageNet是按照WordNet架構(gòu)組織的大規(guī)模帶標(biāo)簽圖像數(shù)據(jù)集。)中以優(yōu)異的成績勝出,第二年,所有的決賽隊伍都采用了當(dāng)時還很新穎的“深度學(xué)習(xí)”法參與競爭。物體識別不僅僅是一場比賽——它能讓機(jī)器“看見”。2014年1月,一些技術(shù)公司的首席執(zhí)行官經(jīng)歷了他們的人工智能頓悟時刻。他們看到頭條新聞上說,谷歌剛剛花了6億多美元買下了英國初創(chuàng)公司DeepMind。盡管相較收購價格,這家初創(chuàng)公司創(chuàng)造的收入微不足道,但它展示了人工智能在獨立自主且未安裝預(yù)設(shè)程序的情況下學(xué)會了玩雅達(dá)利電子游戲,并且獲得高于人類的成績。那年晚些時候,一些普通人經(jīng)歷了他們的人工智能頓悟時刻。他們聽到著名物理學(xué)家斯蒂芬·霍金(StephenHawking)著重解釋道:“……文明能提供的一切,都是人類智慧的產(chǎn)物……人工智能的成功發(fā)明將成為人類歷史上的最大事件。”還有些人在第一次乘坐高速行駛的特斯拉時,經(jīng)歷了自己的人工智能頓悟時刻。他們將手從方向盤上松開,讓汽車依靠自動駕駛儀(AutopilotAI)在車流里穿梭。中國政府經(jīng)歷了人工智能頓悟時刻:全國上下目睹了DeepMind公司開發(fā)的人工智能圍棋軟件AlphaGo(阿爾法狗)在2016年擊敗韓國圍棋選手李世石,并于次年擊敗全球排名第一的中國棋手柯潔。《紐約時報》將這次比賽形容為中國的“斯普特尼克時刻(Sputnikmoment)”。正如蘇聯(lián)發(fā)射人造衛(wèi)星“斯普特尼克號”使得美國大力投資科研,中國對這一事件做出了類似反應(yīng),制定了到2030年占據(jù)人工智能世界領(lǐng)先地位的國家政策,并對此給予了財政支持。2012年,我們自己也經(jīng)歷了人工智能頓悟時刻:當(dāng)時我們觀察到,采用最先進(jìn)的機(jī)器學(xué)習(xí)技術(shù)、向顛覆性創(chuàng)新實驗室提出申請的人工智能初創(chuàng)公司的數(shù)量,已經(jīng)從涓涓細(xì)流變成了一股激流。這些公司涉及多個行業(yè)——藥物開發(fā)、客戶服務(wù)、制造、質(zhì)保、零售和醫(yī)療器械。這項技術(shù)十分強(qiáng)大且通用性極強(qiáng),在范圍極廣的應(yīng)用領(lǐng)域中創(chuàng)造了重要價值。我們著手研究,試圖從經(jīng)濟(jì)角度理解它的意義。我們知道,與其他技術(shù)一樣,人工智能受制于同一種經(jīng)濟(jì)環(huán)境。簡而言之,技術(shù)本身讓人驚嘆。早些時候,著名風(fēng)險投資家史蒂夫·尤爾韋特松(SteveJurvetson)打趣說:“幾乎可以肯定的是,你在未來5年體驗到的任何像變戲法一樣的產(chǎn)品,都建立在這些算法之上?!笔返俜蛘f人工智能就像是“變戲法”,跟《2001太空漫游》《星球大戰(zhàn)》《銀翼殺手》,以及更近的《她》和《機(jī)械姬》等電影里的描述相呼應(yīng)。我們理解史蒂夫?qū)θ斯ぶ悄軕?yīng)用的描述(“變戲法”),也對此感同身受,但身為經(jīng)濟(jì)學(xué)家,我們的任務(wù)是把這些撲朔迷離的設(shè)想變得簡單、清晰且實用。戳穿噱頭經(jīng)濟(jì)學(xué)家對世界有著與眾不同的看法。我們會從供求關(guān)系、生產(chǎn)與消費、價格與成本的框架來思考一切問題。雖然經(jīng)濟(jì)學(xué)家們之間經(jīng)常意見不一,但我們立足于一套共同的框架。我們對假設(shè)和闡釋存在爭議,但我們對基本的概念,如稀缺性和價格競爭所扮演的角色意見一致。這種觀察世界的方法帶給我們一個獨特且有利的視角。從消極的一面來說,我們的視角可能會顯得很枯燥,無法讓我們成為晚宴上受歡迎的客人。從積極的一面來說,它有利于為商業(yè)決策提供清晰的信息。我們從最基礎(chǔ)的價格著手。如果某樣?xùn)|西的價格下降,那么我們會更多地使用它——這就是簡單的經(jīng)濟(jì)學(xué)。這種情況正出現(xiàn)在人工智能行業(yè)。人工智能變得隨處可見了。它擠滿了你手機(jī)的應(yīng)用程序,它正在優(yōu)化你的電網(wǎng),它正在取代你的股票投資組合經(jīng)紀(jì)人。用不了多久,它說不定就會載著你到處走,或者給你配送快遞了。如果說經(jīng)濟(jì)學(xué)家擅長做某件事的話,那就是“戳穿噱頭”。當(dāng)其他人看到的是改頭換面的新發(fā)明時,我們只看到價格下跌。但不僅如此,要了解人工智能如何影響了你所在的機(jī)構(gòu),你必須清楚地知道哪些東西的價格發(fā)生了變化,以及這種變化將如何蔓延至更廣闊的經(jīng)濟(jì)領(lǐng)域。此時,你才能制定應(yīng)對之策。經(jīng)濟(jì)發(fā)展的歷史告訴我們,對重大發(fā)明帶來的沖擊感受最深的通常是人們意想不到的領(lǐng)域。讓我們回想一下1995年商業(yè)互聯(lián)網(wǎng)的故事。在大多數(shù)人看著《宋飛正傳》時,微軟發(fā)布了自家第一套多任務(wù)操作系統(tǒng)Windows95。同年,美國政府解除了在互聯(lián)網(wǎng)上承載商業(yè)流量的最后限制,網(wǎng)景公司迎來了商業(yè)互聯(lián)網(wǎng)上第一次重大的首次公開募股(IPO)?;ヂ?lián)網(wǎng)從“新奇好玩的技術(shù)”變成一股席卷所有行業(yè)和政府的商業(yè)浪潮,那一年是轉(zhuǎn)折點。網(wǎng)景公司的首次公開募股獲得了30億美元的估值,哪怕它一分錢也沒賺過。風(fēng)險投資家對初創(chuàng)公司動輒給予數(shù)百萬美元的估價,即便它們還處在用一個新詞描述即“前收入”(pre-revenue)的階段。剛畢業(yè)的工商管理碩士(MBA)畢業(yè)生拒絕了收入誘人的投資銀行和咨詢工作,打算到網(wǎng)上去搏一搏運氣。隨著互聯(lián)網(wǎng)的影響逐漸擴(kuò)散至各行各業(yè),遍及價值鏈上下,技術(shù)倡導(dǎo)者們不再把互聯(lián)網(wǎng)稱為新技術(shù),而開始把它稱作“新經(jīng)濟(jì)”。這個詞流行開來?;ヂ?lián)網(wǎng)超越了技術(shù),從基礎(chǔ)層面滲透到了人類活動的方方面面。政治家、企業(yè)高管、投資人、企業(yè)家和主要新聞機(jī)構(gòu)開始使用這個詞。每個人都開始暢談“新經(jīng)濟(jì)”。每個人,我的意思是,除了經(jīng)濟(jì)學(xué)家之外的每個人。我們沒有看到新的經(jīng)濟(jì),或者新的經(jīng)濟(jì)學(xué)。對于經(jīng)濟(jì)學(xué)家來說,它看起來就是尋常的舊經(jīng)濟(jì)。誠然,發(fā)生了一些重要的變化。商品和服務(wù)可以數(shù)字化流通了。交流變得更容易。想要查找信息,點擊搜索按鈕就行了。但所有這些事情,從前都能做到。只不過,它們現(xiàn)在可以以低廉的成本做到了。換句話說,互聯(lián)網(wǎng)的興起意味著分銷、通信和搜索成本的下降。從由貴轉(zhuǎn)賤、由稀缺變富足的思維來重新闡釋這種技術(shù)進(jìn)步,有利于思考它對你的事業(yè)會產(chǎn)生何種影響。例如,如果要你回想第一次使用谷歌搜索的體驗,你會記起它魔術(shù)般呈現(xiàn)信息的能力。而以經(jīng)濟(jì)學(xué)家的角度看,谷歌只是讓搜索變得更廉價了。當(dāng)搜索變得廉價時,那些通過別的方式提供信息檢索并以此賺錢的企業(yè)(如黃頁、旅行社、分類廣告等)感到了嚴(yán)重的危機(jī)。與此同時,那些仰賴被人發(fā)現(xiàn)的職業(yè)(如自助出版作品的作家、稀有收藏品賣家、本土電影制作人等)得到了蓬勃發(fā)展。沒錯,特定活動相對成本的這種變化,極大地影響了部分企業(yè)的商業(yè)模式,甚至也影響了部分行業(yè)的結(jié)構(gòu)體系。然而,經(jīng)濟(jì)規(guī)律并未發(fā)生改變。一切仍然可以從供求的角度來理解。我們?nèi)匀豢梢岳矛F(xiàn)成的經(jīng)濟(jì)學(xué)原理,制定策略、為政策提供信息、預(yù)測未來。廉價意味著隨處可見當(dāng)某種基礎(chǔ)產(chǎn)品的價格大幅下跌時,整個世界都可能發(fā)生變化。以照明為例。你很可能是在人工光源下閱讀這本書的。而且你興許從來沒想過,為了讀書而打開燈是否值得的問題。照明太廉價了,任你使用。但經(jīng)濟(jì)學(xué)家威廉·諾德豪斯(WilliamNordhaus)曾做過細(xì)致的考察,要在19世紀(jì)初獲得等量的照明,你的花銷是如今的400倍。在這樣的價格下,你不可能不注意到成本。要不要使用人工照明工具來閱讀本書,會讓你反復(fù)掂量。照明價格此后的下跌點亮了整個世界。它不僅把夜晚變成了白晝,而且讓人得以在自然光線無法穿透的大型建筑物里工作和生活。要不是人工照明的成本跌到幾近于無,我們今天擁有的一切幾乎都無法實現(xiàn)。技術(shù)變革讓原本昂貴的東西變得廉價。照明成本的急劇下降,使我們的行為發(fā)生了轉(zhuǎn)變,從先前需要決定是否開燈,到現(xiàn)在毫不遲疑地打開電燈開關(guān)。這種下降給了我們機(jī)會去做原先無法做到的事情;它把“不可能”變成了“可能”。所以,像照明這樣的基本生產(chǎn)資料的價格大規(guī)模下跌將帶來什么樣的影響,經(jīng)濟(jì)學(xué)家毫無例外會對此著迷。廉價照明帶來的一些影響很容易想象,另一些卻不那么明顯。當(dāng)新技術(shù)(不管是人工照明、蒸汽動力、汽車,還是計算機(jī))令得某種東西變得廉價,到底什么會受到影響,并不總是一目了然的。蒂姆·布雷斯納漢(TimBresnahan)是斯坦福的經(jīng)濟(jì)學(xué)家,也是我們的導(dǎo)師之一。他指出,計算機(jī)運行算法,僅此而已。計算機(jī)的出現(xiàn)和商業(yè)化讓算法變得廉價了。(這屬于運算的整體成本逐漸減少這一漫長趨勢的一部分。)一旦算法變得廉價,我們不僅在傳統(tǒng)領(lǐng)域內(nèi)需要運算的地方更加頻繁地應(yīng)用它,也會把這種新近變得廉價的運算能力應(yīng)用到一些此前與運算無關(guān)的領(lǐng)域,例如音樂。被譽(yù)為第一位程序員的埃達(dá)·洛夫萊斯(AdaLovelace)看到了這種潛力。在19世紀(jì)初昂貴的照明條件下,她撰寫了最早的錄制程序,在查爾斯·巴比奇(CharlesBabbage)設(shè)計的一臺尚處理論階段的“計算機(jī)”上,計算出了一連串?dāng)?shù)字(“伯努利數(shù)”)。這里,有必要提一筆巴比奇,因為他也是一位經(jīng)濟(jì)學(xué)家。我們在本書中會看到,這不是經(jīng)濟(jì)學(xué)和計算機(jī)科學(xué)唯一的交叉點。但理解運算能夠“擴(kuò)大規(guī)?!保ㄟ@是現(xiàn)代初創(chuàng)公司的術(shù)語)和實現(xiàn)更多功能的人是洛夫萊斯。她意識到,計算機(jī)的應(yīng)用并不局限于數(shù)學(xué)運算?!氨热纾僭O(shè)和聲科學(xué)和音樂作品里音調(diào)的基本關(guān)系可以用數(shù)學(xué)方式來表達(dá),那么,這臺引擎就能創(chuàng)作出精致而又科學(xué)的作品,再復(fù)雜的作品都沒問題?!碑?dāng)時計算機(jī)并未問世,但洛夫萊斯卻預(yù)見到,音樂(按照定義,它是一種充滿藝術(shù)和人性的形式)可以存儲在運算機(jī)器里,并反復(fù)播放。日后發(fā)生的情況正是如此。一個半世紀(jì)之后,運算的成本變得足夠低,繼而產(chǎn)生了大多數(shù)人做夢都不曾料到的成千上萬種應(yīng)用方式。由于算法對于許多事情都是一種重要的輸入要素,在它變得廉價之后,與此前照明上發(fā)生的事情一樣,它改變了世界。以凈成本之類的術(shù)語來描述某種最新的偉大技術(shù),能夠戳穿噱頭,盡管這么做不能讓這一技術(shù)看上去那么令人興奮。你永遠(yuǎn)不會見到史蒂夫·喬布斯發(fā)布“一臺全新的加法機(jī)”,盡管這就是他做的全部事情。通過減少某些重要部分的成本,喬布斯的全新加法機(jī)改變了世界?,F(xiàn)在,讓我們來看看人工智能。人工智能在經(jīng)濟(jì)上的重要意義,正是因為它會讓重要的東西變得廉價。此刻,你或許正思考這東西會是智能、推理或思想本身。你也許想象著,機(jī)器人或那種沒有血肉之軀的“生命”已經(jīng)無處不在,就像《星際迷航》里友好的機(jī)器人,它們讓你不需要再費心思考。洛夫萊斯也想到了同樣的內(nèi)容,但她很快打消了這個念頭。她寫道,至少考慮到計算機(jī)本身,“它沒有創(chuàng)造的野心。它可以做任何我們吩咐它去執(zhí)行的事情。它可以按照分析去做,但它不具備預(yù)知需要解析的關(guān)系或真相的能力”。盡管伴隨人工智能的概念出現(xiàn)了各種噱頭和信仰,但阿蘭·圖靈(AlanTuring)日后所稱的這一“洛夫萊斯夫人的異議”始終屹立不倒。計算機(jī)依然無法思考,所以思考還不會變得廉價。相反,會變得廉價的是某種非常普遍的東西,就跟運算一樣,你甚至都意識不到它會變得何等常見,以及其價格下跌將對我們的生活和經(jīng)濟(jì)產(chǎn)生何等龐大的影響。新的人工智能技術(shù)會讓什么東西變得廉價呢?預(yù)測。故此,經(jīng)濟(jì)學(xué)顯示,我們不僅會大量運用預(yù)測,還將看到它應(yīng)用于出人意料的新領(lǐng)域。廉價創(chuàng)造價值預(yù)測是填補(bǔ)缺失信息的過程。預(yù)測將運用你現(xiàn)在掌握的信息(通常稱為“數(shù)據(jù)”),生成你尚未掌握的信息。大部分有關(guān)人工智能的討論強(qiáng)調(diào)的是花樣繁多的預(yù)測技術(shù),而這些技術(shù)有著愈發(fā)艱澀模糊的名稱和標(biāo)簽:分類、聚類、回歸、決策樹、貝葉斯估計、神經(jīng)網(wǎng)絡(luò)、拓?fù)鋽?shù)據(jù)分析、深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、深度強(qiáng)化學(xué)習(xí)等。對有志于將人工智能應(yīng)用于解決具體預(yù)測問題的技術(shù)人員而言,這些技術(shù)都非常重要。本書會替各位讀者略過這些方法背后的數(shù)學(xué)細(xì)節(jié)。我們強(qiáng)調(diào)的是,這里的每一種方法都與預(yù)測有關(guān):用你已有的信息生成你尚未掌握的信息。我們的重點是幫助你找出預(yù)測會在哪些環(huán)境下體現(xiàn)出價值,以及怎樣盡量多地從預(yù)測中受益。預(yù)測更廉價,意味著預(yù)測會變得更多。這是簡單的經(jīng)濟(jì)學(xué):某件事情的成本下降,我們就會更多地做這件事。例如,20世紀(jì)60年代,運算成本開始迅速下降,我們就在需要的地方使用了更多的運算,比如人口普查局、國防部和美國國家航空航天局(電影《隱藏人物》中曾出現(xiàn)過)。更有趣的是,后來,我們還開始在非傳統(tǒng)運算問題的地方運用全新的廉價運算,例如攝影。我們過去用化學(xué)方法來解決攝影問題,但當(dāng)運算變得足夠廉價后,我們便改用基于運算的解決方法:數(shù)碼相機(jī)。一張數(shù)碼照片不過是能通過算法變成可觀看圖像的一連串0和1的組合而已。預(yù)測也一樣。預(yù)測被應(yīng)用于傳統(tǒng)事務(wù),例如存貨管理和需求預(yù)測。更為重要的是,由于預(yù)測變得廉價,它也逐漸被用來解決一些非傳統(tǒng)預(yù)測領(lǐng)域的問題。集合人工智能(Integrate.ai)公司的凱瑟琳·豪(KathrynHowe)把那種將傳統(tǒng)問題重組為預(yù)測問題的能力稱為“人工智能洞見(AIInsight)”。時至今日,全世界的工程師都在學(xué)習(xí)這種能力。自動駕駛汽車已經(jīng)在受控的環(huán)境下存在了20多年。然而,它們只能在有著詳細(xì)平面圖的場所活動,比如工廠、倉庫等。有了平面圖意味著工程師可以設(shè)計機(jī)器人按基本的“如果-那么(if-then)”邏輯來運行:如果有人在車輛前面行走,那么就停下;如果貨架是空的,那么就轉(zhuǎn)向下一排。但這些車輛永遠(yuǎn)無法進(jìn)入普通的城市街道。普通大街上會發(fā)生的事情太多了,不可能一一對應(yīng)地編寫成“如果-那么”的代碼。自動駕駛車輛無法在高度可預(yù)測、可控制的環(huán)境之外運行,直到工程師們重新從預(yù)測的角度對問題做了框定。工程師們意識到,不必告訴機(jī)器在每一種場合下要做什么,只要把焦點放在一個預(yù)測問題上即可——“人類會怎么做”,依靠足夠廉價的預(yù)測,我們把駕駛變成了預(yù)測問題。如今,企業(yè)投入數(shù)十億美元訓(xùn)練機(jī)器在非受控環(huán)境下,甚至在城市的街道和高速公路上自動駕駛。試想一下一個人工智能機(jī)器人和人類駕駛員一起坐在汽車?yán)锏那榫啊H祟愸{駛員開車行駛過數(shù)百萬英里,他通過眼睛和耳朵接收環(huán)境數(shù)據(jù),用大腦處理這些數(shù)據(jù),再根據(jù)傳入的數(shù)據(jù)采取相應(yīng)的行動:直行或轉(zhuǎn)彎,剎車或加速。工程師們給人工智能安裝了各種傳感器(如攝像機(jī)、雷達(dá)、激光定位器等),讓它有了自己的眼睛和耳朵。所以,人類駕駛員開車的時候,人工智能觀測傳入的數(shù)據(jù),同時觀察人的行為。當(dāng)特定的環(huán)境數(shù)據(jù)傳入時,人類駕駛員會右轉(zhuǎn)、剎車,還是加速?人工智能對人類駕駛員觀察得越多,就能越好地預(yù)測駕駛員在接收到特定環(huán)境數(shù)據(jù)時將要采取的具體行動。通過預(yù)測人類駕駛員在特定路況下怎么做,人工智能學(xué)會了駕駛。關(guān)鍵在于,當(dāng)預(yù)測等生產(chǎn)資料變得廉價時,另一些東西的價值會隨之提高。經(jīng)濟(jì)學(xué)家稱之為“互補(bǔ)品”。一如咖啡成本的下降會提高糖和奶油的價值,對自動駕駛汽車而言,預(yù)測成本的下降會提高捕捉車輛周邊數(shù)據(jù)的傳感器的價值。這里舉一個例子說明這些互補(bǔ)品的價值:2017年,英特爾拿出150多億美元收購以色列初創(chuàng)公司Mobileye。這主要是為了得到后者的數(shù)據(jù)采集技術(shù),該技術(shù)可讓車輛有效地“看到”物體(停車標(biāo)志、行人等)和標(biāo)識(車道線、道路)。一旦預(yù)測變得廉價,就會出現(xiàn)更多的預(yù)測,更多的預(yù)測互補(bǔ)品。這兩種簡單的經(jīng)濟(jì)力量推動了預(yù)測機(jī)器創(chuàng)造的新機(jī)遇。從初級層面看,預(yù)測機(jī)器可以代替人完成預(yù)測任務(wù),節(jié)省成本。隨著預(yù)測機(jī)器開始運轉(zhuǎn),預(yù)測有可能發(fā)生變化,并提高決策的質(zhì)量。但等到了某個時間點,預(yù)測機(jī)器變得十分精確且可靠,以至足以改變組織運作的方式。換句話說,一些人工智能對企業(yè)的經(jīng)濟(jì)效益產(chǎn)生了巨大的影響,它們不光可以提高策略執(zhí)行過程中的生產(chǎn)力,還將改變策略本身。從廉價到戰(zhàn)略企業(yè)高管們最常問我們的一個問題便是:“人工智能對企業(yè)戰(zhàn)略有怎樣的影響?”以下是我們用來回答這個問題所做的思想實驗。大多數(shù)人都熟悉怎樣在亞馬遜網(wǎng)站上購物。跟大部分在線零售商一樣,你訪問網(wǎng)站,選購商品,將商品放進(jìn)“購物車”里,付款,接著亞馬遜把商品寄給你。目前,亞馬遜的商業(yè)模式是先購物再發(fā)貨。在購物過程中,亞馬遜的人工智能預(yù)測你想要買什么,然后提供相應(yīng)的推薦。考慮到眼下亞馬遜有數(shù)百萬種商品在售,人工智能的工作算是合理。但它遠(yuǎn)遠(yuǎn)不夠完美。就我們自己而言,對我們想要購買的東西,人工智能能準(zhǔn)確預(yù)測5%。換句話說,它每推薦20種商品,我們實際上會購買一件。這樣的成績還不賴嘛!設(shè)想一下,亞馬遜的人工智能收集了我們更多的信息,并使用這些數(shù)據(jù)來改進(jìn)它的預(yù)測。照我們的想法,這種改進(jìn)就像是調(diào)高揚(yáng)聲器的音量旋鈕。只不過,它們調(diào)高的不是音量,而是人工智能預(yù)測的準(zhǔn)確性。它們轉(zhuǎn)動旋鈕到了某個點,人工智能預(yù)測的準(zhǔn)確度跨越了某個臨界值,以至于改變了亞馬遜的商業(yè)模式。這種預(yù)測準(zhǔn)確到,直接把它預(yù)測你想要購買的商品寄送給你(甚至不用等到你下訂單)。這樣能讓亞馬遜賺更多錢!有了它,你再也不需要到其他零售商那里去了,而且商品還沒買就寄送到手,這有可能促使你購買更多其他的東西。亞馬遜能從你的錢包里撈到更多錢。很顯然,這對亞馬遜來說很棒,但對你來說同樣很棒。倘若一切進(jìn)展順利,亞馬遜還沒等你選購就把商品送上了門,讓你免于購物之苦。預(yù)測的旋鈕調(diào)得足夠高,使亞馬遜的商業(yè)模式從“先買后寄”變成了“先寄后買”。當(dāng)然,退回所有自己不想要的東西,這樣的麻煩事消費者可不愿承擔(dān)。因此,亞馬遜將投資產(chǎn)品退換方面的基礎(chǔ)設(shè)施,比如一支負(fù)責(zé)配送的車隊,每周做一輪巡檢,輕松地回收顧客不想要的東西。(亞馬遜已經(jīng)在著手解決潛在的安全隱患。2017年,它推出了AmazonKey,這套系統(tǒng)允許配送人員打開你家的大門,將包裹放在室內(nèi),監(jiān)控攝像頭將錄制其間的一切情況,確保一切順利進(jìn)行。)如果這是一種更好的商業(yè)模式,為什么亞馬遜還沒有這么做呢?因為如果現(xiàn)在執(zhí)行它,收集和處理退貨商品的成本將遠(yuǎn)遠(yuǎn)超出從顧客那里多賺到的錢。比方說,如今我們要退掉寄來的95%的商品。這對我們來說會很煩人,對亞馬遜來說也代價高昂。這樣的預(yù)測,對亞馬遜而言還不夠好。我們不難想到,亞馬遜會在這項技術(shù)精確到能夠為其帶來利潤之前,就搶先采用這一戰(zhàn)略,因為亞馬遜已預(yù)見,只要預(yù)測精確到一定程度,它必會帶來利潤。早人一步推行,亞馬遜的人工智能將更快地獲得更多數(shù)據(jù),進(jìn)而更迅速地改進(jìn)。亞馬遜意識到,開始得越早,競爭對手就越難趕上。好的預(yù)測會吸引更多的購物者,更多的購物者會產(chǎn)生更多的數(shù)據(jù)來訓(xùn)練人工智能,更多的數(shù)據(jù)會帶來更好的預(yù)測,如此周而復(fù)始,實現(xiàn)良性循環(huán)。太早采用新戰(zhàn)略可能代價高昂,但出手太晚,對公司而言恐怕是致命的。(有趣的是,一些初創(chuàng)公司已經(jīng)在這么考慮了。StitchFix公司使用機(jī)器學(xué)習(xí)來預(yù)測客戶想要什么樣的衣服,并郵遞包裹給他們??蛻舨幌胍脑?,就把衣服退還給公司。2017年,StitchFix基于這一模式成功進(jìn)行了首次公開募股——這或許是第一家高舉“人工智能優(yōu)先”大旗成功上市的初創(chuàng)公司。)我們的觀點不是亞馬遜會這樣做或者應(yīng)該這么做,雖說我們也有個消息想告訴心存疑慮的讀者們:早在2013年,亞馬遜就在美國拿到了一項“預(yù)測性購物”的專利。我們主要想指出,上調(diào)預(yù)測旋鈕對戰(zhàn)略很明顯有著重大影響。從這個例子來看,它將亞馬遜的商業(yè)模式從先買后寄變成了先寄后買,激發(fā)了將產(chǎn)品退貨服務(wù)(包括組建卡車車隊)垂直整合到運營當(dāng)中的動力,使得投資時機(jī)更為緊迫。所有這一切,完全是因為預(yù)測機(jī)器的旋鈕上調(diào)了。這對戰(zhàn)略來說意味著什么呢?首先,針對你所在的行業(yè)和你對人工智能的應(yīng)用,預(yù)測機(jī)器的旋鈕上調(diào)的速度有多快,程度有多高,你必須進(jìn)行投資,以收集相關(guān)方面的情報。其次,你還需要對旋鈕上調(diào)后帶來的戰(zhàn)略選擇進(jìn)行投資,以發(fā)展出一套相關(guān)理論。為開展這一“科幻小說式”的練習(xí),請閉上眼睛,想象一下把自己的手指放到預(yù)測機(jī)器的旋鈕上,默念電影《搖滾萬萬歲》(ThisisSpinalTap)里那句不朽的臺詞:把它轉(zhuǎn)到11。(按照電影里的表現(xiàn),吉他手自豪地向同伴們展示了一臺放大器,音量旋鈕上的記號是0到11,而不是通常的從0到10。這里指:本質(zhì)上相同的東西,隨著數(shù)量的累積,從量變進(jìn)入了質(zhì)變?!g注)本書計劃預(yù)測機(jī)器對你所在的組織有什么樣的戰(zhàn)略意義?在這一切豁然開朗之前,你必須先打好基礎(chǔ)。而這就是我們這本書的結(jié)構(gòu),從地基開始打造一座金字塔。我們在第一部分打基礎(chǔ),解釋機(jī)器學(xué)習(xí)如何使預(yù)測變得更好。接著,我們將解釋為什么這些新的進(jìn)步,與你在學(xué)校里學(xué)過的統(tǒng)計學(xué)以及你的分析師所做的統(tǒng)計工作不一樣。然而,我們要考慮預(yù)測的一項關(guān)鍵互補(bǔ)品,即數(shù)據(jù),尤其是做出準(zhǔn)確預(yù)測所需要的那種數(shù)據(jù),以及怎樣判斷自己是否擁有此類數(shù)據(jù)。最后,我們深入探索預(yù)測機(jī)器的表現(xiàn)在哪些方面會變得比人類更優(yōu)秀,而哪些方面機(jī)器和人一同工作可能會獲得更準(zhǔn)確的預(yù)測。在第二部分,我們把預(yù)測的角色闡述為決策的輸入端,并解釋了另一要素——判斷的重要性。人工智能界迄今為止尚未給予這一要素足夠的重視。預(yù)測通過減少不確定性使人們做出決策更加便利,而判斷的作用則在于分配價值。用經(jīng)濟(jì)學(xué)家的話來說,判斷是一種用來確定損益(payoff)(payoff在博弈論中常被譯作“支付”或“收益”,但該詞本身就有正負(fù)兩義,故此譯為“損益”較合適?!g注)、效用、回報或利潤的技能。預(yù)測機(jī)器最重要的影響是它提高了判斷的價值。第三部分著眼于實際問題。人工智能工具讓預(yù)測機(jī)器變得有用,同時它也是預(yù)測機(jī)器執(zhí)行特定任務(wù)的實現(xiàn)手段。我們概述了三個步驟,幫助讀者們了解什么時候開發(fā)(或購買)人工智能工具獲得的投資回報最高。有時候,這些工具能完美地跟現(xiàn)有工作流程相結(jié)合;另一些時候,它們促進(jìn)了對工作流程的重新設(shè)計。在這個過程中,我們會引入一種重要的輔助手段,以明確某個人工智能工具的關(guān)鍵特征。這一輔助手段便是人工智能畫布。我們在第四部分轉(zhuǎn)向戰(zhàn)略。正如我們在亞馬遜思想實驗中所介紹,有一些人工智能將對任務(wù)的經(jīng)濟(jì)特性產(chǎn)生深遠(yuǎn)影響,以至能夠徹底改變相關(guān)的企業(yè)或行業(yè)。等到了那個時候,人工智能就將成為一個組織的戰(zhàn)略基石。一旦人工智能對戰(zhàn)略產(chǎn)生影響,關(guān)注人工智能的人就會從產(chǎn)品經(jīng)理和維運工程師變成豪華辦公室里的企業(yè)高層。有時候,人們很難提前判斷一種工具能否產(chǎn)生如此強(qiáng)大的效果。比方說,人們第一次使用谷歌的搜索工具時,幾乎沒有人預(yù)料到,它竟然徹底改變了媒體行業(yè),并且成為這個全球最有價值的公司的業(yè)務(wù)基礎(chǔ)。除了這些正面的機(jī)遇,人工智能也會帶來系統(tǒng)性風(fēng)險,除非你搶先行動,否則,它會沖擊你的業(yè)務(wù)。大眾最近的討論似乎著眼于人工智能對人性的危脅,而人工智能對組織造成的危害,人們給予的關(guān)注就少得多。比方說,一些在人類生成的數(shù)據(jù)的基礎(chǔ)上訓(xùn)練的預(yù)測機(jī)器已經(jīng)“學(xué)會”了危險的偏見和刻板印象。我們將在本書結(jié)束的第五部分拿出經(jīng)濟(jì)學(xué)家的工具包,探索對社會影響更為寬泛的若干問題,考查五個最常見的人工智能議題:1.未來還存在工作崗位嗎?當(dāng)然。2.這會造成更多的不平等嗎?有可能。3.少數(shù)大公司會控制一切嗎?要看情況。4.各國是否會采用逐底競爭的方式制定政策,放棄人們的隱私和安全,好讓本國企業(yè)獲得競爭優(yōu)勢?有些國家的確會這么做。5.世界末日會到來嗎?不管它什么時候來,各位讀者都還有足夠時間從本書獲益。本章要點※經(jīng)濟(jì)學(xué)為廉價預(yù)測的商業(yè)意義提供了清晰的觀點。預(yù)測機(jī)器將被用來完成傳統(tǒng)的預(yù)測任務(wù)(庫存和需求預(yù)測),以及解決新的問題(如導(dǎo)航和翻譯)。預(yù)測成本的下降將影響其他東西的價值:提高互補(bǔ)品(數(shù)據(jù)、判斷和行動)的價值,降低替代品(人類預(yù)測)的價值。※組織可以采用人工智能工具來協(xié)助執(zhí)行當(dāng)前戰(zhàn)略,通過這種方式應(yīng)用預(yù)測機(jī)器。當(dāng)這些工具越來越強(qiáng)大之后,它們就可能促進(jìn)戰(zhàn)略本身的轉(zhuǎn)變。比方說,如果亞馬遜可以預(yù)測購物者想買什么,就有可能從如今的先買后寄模式變?yōu)橄燃暮筚I模式——顧客訂購前就把商品送到家。這一轉(zhuǎn)變也將讓組織發(fā)生天翻地覆的變化?!?dāng)各種機(jī)構(gòu)致力于利用人工智能時,這些新戰(zhàn)略帶來的結(jié)果是,我們將面臨一系列與人工智能對社會的重大影響相關(guān)的新權(quán)衡。我們的選擇將取決于人的需求和偏好,在不同的國家和文化中,這些選擇定然有所不同。我們將本書分為五部分,以反映人工智能在五個不同層面上的影響,從預(yù)測的基礎(chǔ)一路上升至社會的權(quán)衡:(1)預(yù)測,(2)決策,(3)工具,(4)戰(zhàn)略,(5)社會。第一部分

預(yù)測第3章

預(yù)測機(jī)器的魔力哈利·波特、白雪公主和麥克白這三個人物有什么共同點嗎?他們都被預(yù)言或者預(yù)測所驅(qū)動。就連《黑客帝國》這部看似講智能機(jī)器的電影里,人類對預(yù)測的信念也是劇情的推力。不管是宗教還是童話,有關(guān)未來的知識都會產(chǎn)生重大結(jié)果。預(yù)測影響行為。預(yù)測影響決策。古希臘人敬奉的許多神諭宣示所都有著了不起的預(yù)言能力。有時候,這些預(yù)言中的謎語會捉弄提問人。舉個例子,呂底亞國王克羅伊斯打算冒險攻打波斯帝國。國王不信任何特定的神諭,于是決定在尋求攻打波斯的建議之前逐一檢驗這些神諭。他向每一座神諭宣示所派去了使者。在第100天,信使們被派去詢問克羅伊斯此刻正在做什么。來自德爾斐的神諭最為準(zhǔn)確,于是國王請它降示有關(guān)攻打波斯的預(yù)言,并對此深信不疑。(為提醒讀者們注意到謹(jǐn)慎闡釋預(yù)測的重要性,我們需要指出:德爾斐的神諭是,如果國王發(fā)動攻擊,一個大的帝國將被毀滅。于是,國王大膽地攻打了波斯,可令他震驚的是,被毀滅的竟是他自己的呂底亞帝國。從技術(shù)上說,預(yù)言說得沒錯,只是遭到了誤讀。)跟克羅伊斯的例子一樣,預(yù)測可以是關(guān)于當(dāng)下的。我們預(yù)測當(dāng)前的信用卡交易是合法還是欺詐,醫(yī)學(xué)影像中的腫瘤是惡性還是良性,以及出現(xiàn)在蘋果手機(jī)攝像頭里的是不是它的主人。盡管“預(yù)測”的拉丁語詞源“praedicere”的意思是“事先知道”,但我們對預(yù)測的文化解讀強(qiáng)調(diào)的是看到本來看不見的信息,不管這信息是來自過去、現(xiàn)在還是未來。水晶球也許是人們最熟悉的魔法預(yù)言的象征了。我們常把水晶球跟“算命師預(yù)測某人將來的財運或愛情”聯(lián)系起來,但在《綠野仙蹤》里,水晶球讓多蘿西看到了當(dāng)下的愛姆嬸嬸。這給我們帶來了預(yù)測的定義:預(yù)測是填補(bǔ)缺失信息的過程。預(yù)測將運用你現(xiàn)在掌握的信息(通常稱為“數(shù)據(jù)”),來生成你尚未掌握的信息。預(yù)測的魔力幾年前,阿維(本書作者之一)注意到自己的信用卡在拉斯維加斯賭場產(chǎn)生了一筆大得異乎尋常的交易。他本人并不在拉斯維加斯。他只去過那兒一次,而且是很久以前;賭博注定要輸,以他的經(jīng)濟(jì)學(xué)家世界觀而言,這毫無吸引力。他跟信用卡服務(wù)商展開了漫長而艱難的拉鋸式對話,終于,服務(wù)商取消了交易,給他換了卡。最近,又出現(xiàn)了一次類似的情形。有人用阿維的信用卡買了東西。但這一次,阿維沒有在對賬單里看到這筆交易,也沒大費口舌地跟禮貌但立場堅定的客戶代表解釋。相反,他接到了服務(wù)商事后主動打來的電話,對方說他的卡遭到盜用,新卡片已經(jīng)在寄來的路上了。信用卡服務(wù)商根據(jù)阿維的消費習(xí)慣和其他大量數(shù)據(jù)準(zhǔn)確地推斷出涉事交易屬于欺詐。信用卡公司很有信心,調(diào)查期間甚至沒有凍結(jié)他的信用卡。而且,就像變戲法一樣,他用不著做任何事,公司就為他發(fā)放了替換的卡。當(dāng)然,信用卡服務(wù)商并沒有水晶球。它擁有的是數(shù)據(jù)和良好的預(yù)測模型——一臺預(yù)測機(jī)器。萬事達(dá)信用卡公司的企業(yè)風(fēng)險和安全部門總裁阿杰伊·巴拉(AjayBhalla)表示,更好的預(yù)測可以減少盜刷,“解決消費者遭到誤拒的重大痛點”。商業(yè)應(yīng)用場景完全符合我們對預(yù)測的定義,即填補(bǔ)缺失信息的過程。信用卡網(wǎng)絡(luò)發(fā)現(xiàn),(要判斷盜刷)了解前一筆信用卡交易是否盜刷是很有用的。信用卡網(wǎng)絡(luò)運用過去盜刷(和非盜刷)交易的信息來預(yù)測最近一筆交易是不是盜刷。如果的確是盜刷,那么,信用卡服務(wù)商可以凍結(jié)該卡之后的交易,如果預(yù)測來得足夠及時,甚至當(dāng)前這一筆交易也可以凍結(jié)。這一概念(將一種信息轉(zhuǎn)化為另一種信息)是人工智能近期取得的一大進(jìn)步——翻譯的核心。翻譯語音是遍布于所有人類文明的一個目標(biāo),連流傳了數(shù)千年的巴別塔故事里也有它的身影。從古至今,要實現(xiàn)自動化翻譯語言就得雇用一位語言學(xué)家(精通語言規(guī)則的專家)來解析規(guī)則,并將其轉(zhuǎn)換成可編程的形式。比方說一條西班牙短語,除了逐字替換,你還需要理解如何調(diào)整名詞和形容詞的順序,這樣才能讓它成為能被讀懂的英文句子。然而,人工智能的最新進(jìn)展使我們可以把翻譯問題轉(zhuǎn)換為預(yù)測問題。我們可以從谷歌翻譯質(zhì)量的突飛猛進(jìn)中看到預(yù)測應(yīng)用于翻譯領(lǐng)域后體現(xiàn)出的神奇特質(zhì)。歐內(nèi)斯特·海明威的《乞力馬扎羅的雪》(TheSnowsofKilimanjaro)一文的開頭十分優(yōu)美:乞力馬扎羅是一座海拔19710英尺、常年積雪的高山,據(jù)說它是非洲最高的一座山。(Kilimanjaroisasnow-coveredmountain19,710feethigh,andissaidtobethehighestmountaininAfrica.)2016年11月的一天,東京大學(xué)計算機(jī)科學(xué)系教授歷本純一(JunRekimoto)通過谷歌把海明威這篇經(jīng)典小說的日文版翻譯成英文,內(nèi)容如下:乞力馬扎羅是19710英尺山被雪覆蓋的,據(jù)說是非洲最高山。(Kilimanjarois19,710feetofthemountaincoveredwithsnow,anditissaidthatthehighestmountaininAfrica.)第二天,谷歌的譯文變成了:乞力馬扎羅是一座19710英尺的山,常年積雪,據(jù)說是非洲最高的山。(Kilimanjaroisamountainof19,710feetcoveredwithsnowandissaidtobethehighestmountaininAfrica.)差異很明顯。一夜之間,谷歌的譯文就從一看就知道是機(jī)器翻譯的笨拙文本,變成了一句連貫的話,如同一個人前一天還只能拿著字典磕磕巴巴地講話,第二天就能流利地運用兩種語言了。誠然,谷歌的譯文并未達(dá)到海明威的高度,但進(jìn)步也很了不起。巴別塔仿佛重新建起來了。而且,這一改變不是出于偶然或者碰運氣。谷歌利用我們這里重點介紹的人工智能的最新進(jìn)步,更新了自家翻譯產(chǎn)品背后的引擎。具體而言,谷歌的翻譯服務(wù)現(xiàn)在依靠深度學(xué)習(xí)來提高預(yù)測效率。把英語翻譯成日語,其實就是要預(yù)測日語里哪些詞匯和短語與英語相匹配。有待預(yù)測的缺失信息是,日語單詞的集合及其正確的順序。從一門外語獲取數(shù)據(jù),然后按照你熟悉的語言中的正確順序來預(yù)測單詞的集合,這樣你就能夠理解另一門語言了。要是整個過程做得足夠好,你興許根本就意識不到這是翻譯過來的話。企業(yè)馬不停蹄地將這一神奇的技術(shù)付諸商業(yè)用途。例如,中國已有五億多人使用科大訊飛開發(fā)的深度學(xué)習(xí)服務(wù),使用自然語言進(jìn)行翻譯、轉(zhuǎn)錄和交流。房東用它跟使用其他語言的租客溝通,醫(yī)院的患者用它跟機(jī)器人溝通以尋求指示,醫(yī)生用它指導(dǎo)患者服藥,司機(jī)用它跟其他車輛聯(lián)絡(luò)。人工智能被用得越多,收集的數(shù)據(jù)也越多,學(xué)習(xí)得越多,它的效果也就越好。有了如此多的用戶,人工智能將突飛猛進(jìn)。預(yù)測比過去好了多少谷歌翻譯的變化說明了機(jī)器學(xué)習(xí)(深度學(xué)習(xí)是其子領(lǐng)域)怎樣顯著降低了質(zhì)量調(diào)整的預(yù)測成本。從運算能力的角度來看,谷歌現(xiàn)在可以用相同的成本提供更高質(zhì)量的翻譯。生成相同質(zhì)量的預(yù)測所需的成本大幅下降。預(yù)測技術(shù)的創(chuàng)新正對傳統(tǒng)的預(yù)測領(lǐng)域產(chǎn)生影響,比如盜刷檢測。信用卡盜刷檢測已經(jīng)得到了很大改善,在用戶注意到問題之前,信用卡公司就檢測并解決盜刷了。不過,這種改善仍然是漸進(jìn)式的。20世紀(jì)90年代后期,當(dāng)時最先進(jìn)的方法能抓住大約80%的盜刷交易。(請注意,這些比較并不完全對等,因為它們使用的是不同的訓(xùn)練數(shù)據(jù)。不過,人們對準(zhǔn)確率的寬泛看法是站得住腳的。)這一比值在2000年提高到了90%~95%,如今提高到了98%~99.9%。最后一步跨越來自機(jī)器學(xué)習(xí),從98%到99.9%的變化意味著天翻地覆的轉(zhuǎn)變。從98%到99.9%的變化看似漸進(jìn),但如果犯錯代價高昂,哪怕是小小的變化也有重要意義。準(zhǔn)確率從85%提高到90%,意味著失誤率降低了1/3。從98%提高到99.9%,意味著失誤率降到了從前的1/20。20倍的改進(jìn)似乎已經(jīng)不算是漸進(jìn)式的了。預(yù)測成本的下降讓人類的許多活動發(fā)生了巨大的變化。正如人們將第一批運算首先應(yīng)用于解決普查表、彈道表等熟悉的數(shù)學(xué)問題上,在機(jī)器學(xué)習(xí)帶來的廉價預(yù)測上,其第一批應(yīng)用中有不少被用來解決經(jīng)典的預(yù)測問題。除了盜刷檢測,還包括信用評級、健康保險和庫存管理。信用評級涉及預(yù)測某人償還貸款的可能性。健康保險涉及預(yù)測某人會花多少錢在醫(yī)療保健上。庫存管理涉及預(yù)測倉庫在某一天存有多少物品。最近,一類全新的預(yù)測問題浮出水面。在智能機(jī)器技術(shù)取得最新的進(jìn)展前,許多事幾乎不可能做到,包括物體識別、翻譯和藥物研發(fā)。例如,ImageNet挑戰(zhàn)賽是一項高度曝光的年度賽事,比賽內(nèi)容是讓機(jī)器預(yù)測圖像中物體的名稱。哪怕是人類,預(yù)測圖像中的物體也并非易事。ImageNet的數(shù)據(jù)包含了1000個類別的物體,其中包括各種狗及其他外形相似的圖像。有時候很難辨別藏獒與伯恩山犬,或保險柜與密碼鎖之間的區(qū)別,哪怕是人類,犯錯的概率也在5%左右。從2010年賽事舉辦的第一年到2017年的最后一場競賽,預(yù)測以極快的速度進(jìn)步。圖3-1顯示了每年比賽獲勝者的準(zhǔn)確率。縱軸衡量的是錯誤率,因此數(shù)值越低的表現(xiàn)越好。2010年,最出色的預(yù)測機(jī)器也會有28%的犯錯率。2012年,參賽者首次使用了深度學(xué)習(xí),錯誤率降至16%。如普林斯頓大學(xué)的教授兼計算機(jī)學(xué)家奧爾加·魯薩科夫斯基(OlgaRussakovsky)所言:“2012年實際上是準(zhǔn)確率實現(xiàn)重大突破的一年,但它同時也對已經(jīng)出現(xiàn)數(shù)十年的深度學(xué)習(xí)模型的概念做了證明?!彼惴ɡ^續(xù)迅速改進(jìn)。到2015年,一支參賽隊伍首次超越了人類。到2017年,38支隊伍里的絕大多數(shù)表現(xiàn)都比人類好了,而且最優(yōu)秀的隊伍犯錯率還不到人類的一半。機(jī)器能夠比人類更好地識別這類圖像了。廉價預(yù)測帶來的結(jié)果目前這一代人工智能與科幻小說里的智能機(jī)器相去甚遠(yuǎn)。預(yù)測并沒有帶給我們《2001太空漫游》里的哈爾、《終結(jié)者》里的天網(wǎng)或是《星球大戰(zhàn)》里的C-3PO。如果現(xiàn)代人工智能僅僅是預(yù)測,為什么人們還這么大驚小怪呢?原因在于,預(yù)測是一項十分基本的生產(chǎn)資料。你興許并未意識到,但預(yù)測是無所不在的。我們的商業(yè)活動和個人生活里充滿了預(yù)測。我們的預(yù)測往往化身為決策的輸入條件。更好的預(yù)測意味著更好的信息,更好的信息意味著更好的決策。用諜報活動的層面來表達(dá),預(yù)測即情報(情報一詞原文為intelligence,也有“智能”的意思,這里是一語雙關(guān)?!g注),即“得到有用的信息”。機(jī)器預(yù)測就是人工生成有用信息。智能(情報)很重要,我們用信用卡盜刷的例子說明更好的預(yù)測會帶來更好的結(jié)果。隨著預(yù)測成本的不斷下降,我們發(fā)現(xiàn)它對更大范圍的額外活動大有用處。在這個過程中,它使各種各樣從前難以想象的事情成為可能,比如機(jī)器翻譯。本章要點※預(yù)測是填補(bǔ)缺失信息的過程。預(yù)測將運用你現(xiàn)在掌握的信息(通常稱為“數(shù)據(jù)”),生成你尚未掌握的信息。除了生成關(guān)于未來的信息,預(yù)測還可以生成關(guān)于現(xiàn)在和過去的信息。比如,將信用卡交易歸為盜刷,將醫(yī)學(xué)影像中的腫瘤分類為惡性,或是判斷握著蘋果手機(jī)的人是不是機(jī)主,這些都是預(yù)測的用武之地?!A(yù)測準(zhǔn)確度的小幅提高帶來的影響,可能具有迷惑性。例如,準(zhǔn)確度從85%提高到90%,其幅度乍看起來是從98%提高到99.9%的兩倍(前者提高了五個百分點,后者只提高了兩個百分點不到)。然而,前者意味著錯誤率從15%降到了10%(降到了從前的2/3),后者意味著錯誤率從2%降到了0.1%(降到了從前的1/20)。在某些情況下,錯誤率降到了從前的1/20意味著發(fā)生了天翻地覆的變化?!钛a(bǔ)缺失信息,表面上看起來是一個平淡無奇的過程,卻讓預(yù)測機(jī)器變得神奇起來。這在機(jī)器視覺(物體識別)、導(dǎo)航(無人駕駛)和翻譯領(lǐng)域已經(jīng)得到實現(xiàn)。第4章

為什么叫它智能1956年,一群學(xué)者在新罕布什爾州達(dá)特茅斯學(xué)院會面,開辟了一條人工智能研究的路徑。他們想看看能不能為計算機(jī)編寫程序,使之參與認(rèn)知思維,做玩游戲、證明數(shù)學(xué)定理一類的事。他們還仔細(xì)思考了計算機(jī)能使用什么樣的語言和知識來描述事物。他們的努力包括給計算機(jī)不同選項,讓它們選出其中的最優(yōu)者。研究人員對人工智能的可能性持樂觀態(tài)度。他們向洛克菲勒基金會募資時這樣寫道:我們將致力于探索,怎樣讓機(jī)器使用語言,組織抽象的表達(dá)和概念,解決如今只有人類才能解決的各種問題,并自我改進(jìn)。我們認(rèn)為,一群精心挑選出來的科學(xué)家于某個夏天聚在一起攜手合作,便可以在一個或多個上述問題上取得可觀進(jìn)展。事實證明,這一議程與其說切實可行,不如說是對未來的展望。畢竟,20世紀(jì)50年代的計算機(jī)速度還不夠快,無法實現(xiàn)學(xué)者們的設(shè)想。在最初的研究聲明發(fā)表之后,人工智能在翻譯方面表現(xiàn)出了初步進(jìn)展,但進(jìn)展速度很慢。適用于特定環(huán)境(例如,有人嘗試設(shè)計人造治療師)的人工智能成果無法推而廣之。20世紀(jì)80年代早期,工程師們希望通過精心編程設(shè)計的專家系統(tǒng)來復(fù)制醫(yī)學(xué)診斷等高技能,他們雖然取得了一些進(jìn)展,但此類系統(tǒng)的開發(fā)費用極高,而且用起來十分煩瑣,無法應(yīng)對各種各樣的例外和可能,因此,人們便進(jìn)入了所謂的“人工智能寒冬”。然而,冬天似乎已經(jīng)結(jié)束了。更多的數(shù)據(jù)、更好的模型和更強(qiáng)大的計算機(jī)促成了機(jī)器學(xué)習(xí)最近的發(fā)展,改善了預(yù)測。大數(shù)據(jù)收集和存儲的進(jìn)步為新的機(jī)器學(xué)習(xí)算法提供了素材。相較從前的統(tǒng)計學(xué),新的機(jī)器學(xué)習(xí)借力于與之更適配的處理器,明顯變得更加靈活,能生成更好的預(yù)測——好到有人忍不住把計算機(jī)科學(xué)的這一分支稱作“人工智能”。預(yù)測客戶流失更好的數(shù)據(jù)、模型和計算機(jī)是預(yù)測取得進(jìn)步的核心。為了理解它們的價值,讓我們來思考一個古已有之的預(yù)測問題:預(yù)測營銷人員口里的“客戶流失”。對許多企業(yè)來說,獲取客戶是代價很高的一件事,故此,客戶流失帶來的損失很大。一旦獲得了客戶,企業(yè)就會通過減少流失率來充分利用獲取成本。在保險、金融、電信等服務(wù)行業(yè),控制客戶流失大概也是最重要的營銷活動。減少客戶流失的第一步是識別有著流失風(fēng)險的客戶。公司可以使用預(yù)測技術(shù)來做到這一點。歷史上,預(yù)測客戶流失的核心方法是一種被稱為“回歸”的統(tǒng)計技術(shù)。有一些研究聚焦于改進(jìn)回歸技術(shù)。研究人員在學(xué)術(shù)期刊和實踐中提出并檢驗了數(shù)百種不同的回歸方法?;貧w是做什么的?它根據(jù)過去發(fā)生事件的平均值來尋找一種預(yù)測。舉例來說,如果你手里只有上周每天的天氣情況,但要判斷明天會不會下雨,那么,你最好有一個平均值。如果過去七天里有兩天下了雨,你興許會猜測,明天下雨的概率大約是2/7或者29%。過去,我們對預(yù)測的大部分知識都來自構(gòu)建的模型,這些模型可納入關(guān)于環(huán)境的更多數(shù)據(jù),更好地算出平均值。我們的做法是使用所謂的“條件均值”。比如,如果你住在加利福尼亞州北部,你大概已經(jīng)知道,下不下雨取決于季節(jié):夏天的可能性低,冬天的可能性高。如果你觀察到此地冬天里任何一天降雨的概率是25%,夏天是5%,那么,你不會以為明天下雨的概率是兩者的平均值,即15%。為什么呢?因為你知道明天屬于冬季還是夏季,故此,你會根據(jù)條件來做出評估。根據(jù)季節(jié)調(diào)整預(yù)測只是我們根據(jù)條件對平均值進(jìn)行調(diào)整的方法之一(不過,這是最受零售業(yè)歡迎的一種方法)。我們可以根據(jù)當(dāng)天的時間、污染情況、云量、海洋溫度或任何其他可用信息來計算平均值。我們甚至有可能要同時根據(jù)多個條件進(jìn)行調(diào)整:如果今天下了雨,今天屬于冬季,西邊200英里外在下雨,南邊100英里外是晴天,地面很濕,北冰洋氣溫很低,風(fēng)正從西南方吹過來,風(fēng)速是每小時15英里——那么,明天會下雨嗎?這樣的運算很快就會變得難以處理。光是計算這七類信息的平均值,就會帶來128種不同的組合。添加更多類型的信息,組合數(shù)量也會隨之呈指數(shù)倍增加。在機(jī)器學(xué)習(xí)之前,多元回歸提供了一種處理多種條件的有效方法,而且無須計算數(shù)十、數(shù)百或數(shù)千種不同條件下的平均值。回歸將運用數(shù)據(jù),并嘗試找到那個將預(yù)測失誤最小化、“擬合優(yōu)度”最大化的結(jié)果。謝天謝地,這個術(shù)語在數(shù)學(xué)上比在詞句上表達(dá)得更精確。回歸將預(yù)測的平均失誤控制到了最低限度,對待大失誤比對待小失誤更加嚴(yán)厲。這是一種強(qiáng)大的方法,尤其是當(dāng)數(shù)據(jù)集相對較小,同時它能很好地感知什么因素對數(shù)據(jù)有用的時候。例如,有線電視訂閱用戶的流失有可能取決于人們看電視的頻率;如果他們不再看電視了,他們很可能就會停止訂閱有線電視服務(wù)。除此之外,回歸模型渴望產(chǎn)生無偏差的結(jié)果,所以,要是預(yù)測得足夠多,這些預(yù)測就平均概率而言是完全正確的。雖然我們喜歡無偏差的預(yù)測多過有偏差的預(yù)測(比如系統(tǒng)性地高估或低估一個值),但無偏差的預(yù)測也并非完美。我們可以用一個古老的統(tǒng)計學(xué)笑話來說明這一點:一位物理學(xué)家、一位工程師和一位統(tǒng)計學(xué)家外出狩獵。他們走進(jìn)森林,發(fā)現(xiàn)空地上有一頭鹿。物理學(xué)家計算了目標(biāo)的距離、子彈的速度和落點,調(diào)整,開火——結(jié)果,他朝左打偏了5英尺,錯過了目標(biāo)。工程師一臉沮喪?!澳阃浰闵巷L(fēng)了。我來試試?!彼蛄颂蚴种?,判斷了風(fēng)速和方向,一把奪過步槍并開了火——結(jié)果,他朝右打偏了5英尺,再次錯過了目標(biāo)。突然,一槍未開的統(tǒng)計學(xué)家歡呼道:“噢耶!我們打中了!”準(zhǔn)確無比的平均值可能在實際中每次都出錯?;貧w有可能一直導(dǎo)致要么左偏幾英尺,要么右偏幾英尺。它意味著,就算取平均值后得出了正解,實際也可能一次都沒打中。與回歸不同,機(jī)器學(xué)習(xí)的預(yù)測可能平均起來是錯誤的,但當(dāng)預(yù)測失誤的時候,它并不會失誤太多。按統(tǒng)計學(xué)家的說法,允許偏差,以求減少方差。(以犧牲平均數(shù)的準(zhǔn)確,來換取單次預(yù)測的準(zhǔn)確?!g注)機(jī)器學(xué)習(xí)和回歸分析之間一個重要的區(qū)別是新技術(shù)的開發(fā)方式。發(fā)明一種新的機(jī)器學(xué)習(xí)方法時還需證明它在實踐中能運作得更好。相反,發(fā)明一種新的回歸方法,首先要證明它在理論上是有效的。強(qiáng)調(diào)實踐效果,給了機(jī)器學(xué)習(xí)創(chuàng)新者更多的實驗空間,哪怕他們的方法生成的估計結(jié)果平均來看不正確或存在偏差。在這種自由實驗的推動下,機(jī)器學(xué)習(xí)借助過去十年的豐富數(shù)據(jù)和高速計算機(jī)實現(xiàn)了快速的進(jìn)步。從20世紀(jì)90年代末期到21世紀(jì)初期,那些利用機(jī)器學(xué)習(xí)預(yù)測顧客流失的實驗僅取得了有限的成功。雖然機(jī)器學(xué)習(xí)的方法有了穩(wěn)定的進(jìn)步,但回歸的方法依然表現(xiàn)得更好。數(shù)據(jù)仍然不夠豐富,計算機(jī)的速度也不夠快,無法使其利用機(jī)器學(xué)習(xí)可以做到的事情。例如,2004年,杜克大學(xué)的天睿中心(TeradataCenter)舉辦了預(yù)測客戶流失的數(shù)據(jù)科學(xué)比賽。當(dāng)時,這樣的比賽很不尋常。任何人都可以提交作品,一旦獲獎,即可獲得現(xiàn)金獎勵。獲獎作品使用的是回歸模型。一些機(jī)器學(xué)習(xí)的方法表現(xiàn)很好,但日后推動人工智能革命的神經(jīng)網(wǎng)絡(luò)方法卻表現(xiàn)不佳。到2016年,一切都改變了。使用機(jī)器學(xué)習(xí)和(神經(jīng)網(wǎng)絡(luò))深度學(xué)習(xí)來預(yù)測流失的模型整體比其他所有方法表現(xiàn)得都好。是什么發(fā)生了改變呢?首先,數(shù)據(jù)和計算機(jī)終于足夠好,讓機(jī)器學(xué)習(xí)占了上風(fēng)。20世紀(jì)90年代,建立足夠大的數(shù)據(jù)庫很難。比方說,一套經(jīng)典的流失預(yù)測研究只使用了650個客戶的數(shù)據(jù),不到30個變量。到2004年,計算機(jī)的處理和存儲都有了進(jìn)步。在杜克競賽中,用來訓(xùn)練的數(shù)據(jù)集包含了數(shù)萬客戶的數(shù)百個變量的信息。有了這么多的變量和客戶,機(jī)器學(xué)習(xí)方法逐漸能跟回歸一較高下了。如今,研究人員根據(jù)數(shù)千個變量和數(shù)百萬客戶展開流失預(yù)測。計算能力的提高意味著可以處理大量的數(shù)據(jù),除了數(shù)字,還包括文本和圖像。例如,在移動電話流失模型中,研究人員除了使用標(biāo)準(zhǔn)變量(如賬單額度大小和支付準(zhǔn)時性)之外,還調(diào)用了通話記錄數(shù)據(jù)(以小時為單位)。利用可用數(shù)據(jù),機(jī)器學(xué)習(xí)方法也變得更好了。在杜克大學(xué)的比賽中,成功的關(guān)鍵因素是,如何從數(shù)百個可用變量中進(jìn)行選擇,以及選擇使用哪一種統(tǒng)計模型。當(dāng)時最好的方法,不管是機(jī)器學(xué)習(xí)還是經(jīng)典的回歸,都通過結(jié)合直覺與統(tǒng)計檢定來選擇變量和模型?,F(xiàn)在,機(jī)器學(xué)習(xí)方法(尤其是深度學(xué)習(xí)方法)允許模型具備靈活性,這意味著變量彼此之間可以按照意想不到的方式相結(jié)合。在開始計費的月初就積累了大量通話時間、高額電話賬單的人比到月末才累積大量通話時間的人流失的可能性更低。此外,周末異地通話、付費時間遲,還愛發(fā)大量短信的人尤其容易流失。這樣的結(jié)合難以預(yù)料,但對預(yù)測有極大的幫助。由于難以預(yù)料,建模人員在使用標(biāo)準(zhǔn)的回歸模型進(jìn)行預(yù)測時無法將這些結(jié)合后的信息包含在內(nèi)。機(jī)器學(xué)習(xí)把哪一些結(jié)合與交匯事關(guān)重要的選擇權(quán)交給了機(jī)器,而不是程序員。機(jī)器學(xué)習(xí)(具體而言也是深度學(xué)習(xí))方法的改進(jìn),意味著可以有效地將可用數(shù)據(jù)轉(zhuǎn)化為對客戶流失的準(zhǔn)確預(yù)測?,F(xiàn)在,機(jī)器學(xué)習(xí)方法明顯優(yōu)于回歸和其他各種技術(shù)。超越客戶流失除了客戶流失領(lǐng)域,機(jī)器學(xué)習(xí)還改善了大量其他環(huán)境下(從金融市場到天氣)的預(yù)測。2008年的金融危機(jī)是回歸式預(yù)測方法的驚人失敗。對擔(dān)保債務(wù)憑證(collateralizeddebtobligation,簡稱CDO)違約率的預(yù)測部分地推動了金融危機(jī)。2007年,標(biāo)準(zhǔn)普爾評級機(jī)構(gòu)預(yù)測,AAA級CDO五年內(nèi)無法履約的概率不到1/800。五年后,1/4以上的CDO未能履約。哪怕有著豐富的歷史違約數(shù)據(jù),最初的預(yù)測仍然錯得離譜。失敗的原因不是數(shù)據(jù)不足,而是分析師怎樣使用這些數(shù)據(jù)來生成預(yù)測。評級機(jī)構(gòu)的預(yù)測是基于多個回歸模型,這些模型假定不同市場的房價相互之間無關(guān)聯(lián)。事實證明,這樣的假設(shè)是錯的,不僅2007年是這樣,從前也一樣。一旦將多個住房市場同時遭到?jīng)_擊的可能性包含進(jìn)去,你在CDO上虧損的可能性也會一路升高——哪怕你的房產(chǎn)分布在美國多個城市。分析師們根據(jù)自己認(rèn)為重要的假設(shè)(以及它們?yōu)槭裁粗匾﹣順?gòu)建回歸模型——這些看法對機(jī)器學(xué)習(xí)來說都沒有存在的必要。機(jī)器學(xué)習(xí)模型尤其擅長確定哪些可能的變量效果最好,識別出哪些(出人意料的)事情重要,哪些事情不重要。如今,分析師的直覺和假設(shè)沒那么重要了。通過這種方式,機(jī)器學(xué)習(xí)可以根據(jù)無法預(yù)知的相關(guān)要素進(jìn)行預(yù)測,包括拉斯維加斯、菲尼克斯和邁阿密的房價可能會同時出現(xiàn)漲落。如果僅僅是預(yù)測,為什么叫它“智能”機(jī)器學(xué)習(xí)的最新進(jìn)展讓我們利用統(tǒng)計學(xué)進(jìn)行預(yù)測的方式發(fā)生了徹底的轉(zhuǎn)變。把人工智能和機(jī)器學(xué)習(xí)的最新發(fā)展視為“傳統(tǒng)統(tǒng)計學(xué)的加強(qiáng)版”是很誘人的想法。如果最終的目標(biāo)是生成預(yù)測以填補(bǔ)缺失的信息,它們從某種意義上說的確如此。除此之外,機(jī)器學(xué)習(xí)的過程還涉及尋找一種最小化失誤的解決方案。那么,是什么令機(jī)器學(xué)習(xí)成為一種配得上“人工智能”這一標(biāo)簽的變革型計算技術(shù)呢?在某些情況下,預(yù)測的效果好到我們可以直接運用它,而不需要應(yīng)用基于規(guī)則的邏輯。有效的預(yù)測改變了計算機(jī)編程的方式。傳統(tǒng)的統(tǒng)計方法和“如果-那么”語句的算法都無法很好地在復(fù)雜環(huán)境下運行。想識別一組照片中的一只貓?貓有各種各樣的顏色和紋理。它們可能是站著、坐著、躺著、跳躍,或看起來一臉不悅。它們可能在室內(nèi),也可能在室外。情況很快變得復(fù)雜起來,無法限定條件。因此,哪怕僅僅想達(dá)到看得過去的識別效果,也需要大量謹(jǐn)慎的考量。這還僅僅是識別一只貓,如果我們想要用一種方法來描述照片中的所有物體呢?我們需要為每一物體單獨加以限定。支撐近年來進(jìn)步的技術(shù)基石叫作“深度學(xué)習(xí)”,它依靠一種“反向傳播”的方法。它采用與大腦極為類似的方式,通過例子來學(xué)習(xí)(而能否用人工神經(jīng)元模擬真實神經(jīng)元不過是這項有用技術(shù)的有趣旁枝),避免了各種限定條件帶來的麻煩。如果你想讓孩子知道哪個單詞對應(yīng)著“貓”,那么,每當(dāng)你看見一只貓,你就說出這個單詞。機(jī)器學(xué)習(xí)基本上也一樣。你給它饋進(jìn)大量帶有“貓”標(biāo)簽的貓照片,以及大量沒有貓也不帶“貓”標(biāo)簽的照片,機(jī)器就會學(xué)習(xí)怎樣識別與“貓”這一標(biāo)簽相關(guān)的像素圖案。如果你有一系列貓和狗的照片,貓和四足物體之間的關(guān)聯(lián)會強(qiáng)化,但與狗的關(guān)聯(lián)也會強(qiáng)化。無須詳細(xì)說明,只要你饋進(jìn)數(shù)百萬張有著不同圖案和標(biāo)簽的照片(包括畫面里沒有狗的照片),機(jī)器都會發(fā)展出諸多聯(lián)想,并學(xué)會區(qū)分貓和狗。許多問題已經(jīng)從算法問題(“貓有什么特點?”)轉(zhuǎn)變成了預(yù)測問題(“這一缺失了標(biāo)簽的圖像是否跟我從前見過的貓有著相同特點?”)。機(jī)器學(xué)習(xí)使用概率模型來解決問題。那么,為什么很多技術(shù)人員將機(jī)器學(xué)習(xí)稱為“人工智能”呢?因為機(jī)器學(xué)習(xí)的輸出(即預(yù)測)是智能的一個關(guān)鍵組成部分,預(yù)測的準(zhǔn)確性會隨著學(xué)習(xí)而改進(jìn),而較高的準(zhǔn)確性能讓機(jī)器執(zhí)行現(xiàn)今與人類智能相關(guān)的任務(wù)(如物體識別)。杰夫·霍金斯(JeffHawkins)在《人工智能的未來》(OnIntelligence)一書中率先提出預(yù)測是人類智慧的基礎(chǔ)。這一理論的實質(zhì)是,作為創(chuàng)造力和生產(chǎn)力增長的核心,人類的智慧是靠大腦使用記憶進(jìn)行預(yù)測來實現(xiàn)的:“我們在各個感官之間,進(jìn)行連續(xù)的低級別預(yù)測,但這還不是全部。我想提出的是一個更有力的命題,預(yù)測不僅僅是大腦在做的某一件事情,它是大腦皮層的主要功能,也是智能的基礎(chǔ)。皮層是預(yù)測的器官?!被艚鹚拐J(rèn)為,我們的大腦不斷地預(yù)測我們即將體驗到的事情——我們會看到什么,感受到什么,聽到什么。隨著我們的成長和成熟,大腦的預(yù)測越來越準(zhǔn)確,預(yù)測往往會變成真的。然而,要是預(yù)測未能準(zhǔn)確地昭示未來,我們會注意到異常,并將這一信息反饋到大腦,讓大腦更新算法,進(jìn)行學(xué)習(xí),對模型做更進(jìn)一步的優(yōu)化?;艚鹚沟难芯看嬖跔幾h。他的觀點在心理學(xué)界引發(fā)了爭論,他強(qiáng)調(diào)皮層是預(yù)測機(jī)器的模型,許多計算機(jī)科學(xué)家對此斷然否定。最嚴(yán)格意義上的“人工智能通過圖靈測試”的概念(一臺機(jī)器能騙過人,讓人相信機(jī)器其實是人類)仍然離現(xiàn)實很遠(yuǎn)。目前的人工智能算法還不能進(jìn)行推理,人們也很難理解人工智能預(yù)測的來源。無論他的基礎(chǔ)模型是否合適,霍金斯將預(yù)測視為智能的基礎(chǔ),這對理解人工智能近年來的變化帶來的沖擊很有用處。這里,我們強(qiáng)調(diào)的是預(yù)測技術(shù)的巨大進(jìn)步帶來的結(jié)果。1956年,達(dá)特茅斯會議上學(xué)者們提出的許多愿望如今馬上就要實現(xiàn)了。通過各種方式,預(yù)測機(jī)器能夠“使用語言,組織抽象的表達(dá)和概念,解決如今(1955年)只有人類才能解決的各種問題,并自我改進(jìn)”了。我們并不想貿(mào)然揣測這一進(jìn)步是否預(yù)示著通用人工智能、“奇點”或天網(wǎng)的降臨。不過,如你所見,即便只是聚焦于預(yù)測,未來幾年仍能出現(xiàn)了不起的變化。一如計算機(jī)促成的廉價運算有力地帶來了商業(yè)和個人生活的巨大變化,廉價預(yù)測也將帶來同樣深遠(yuǎn)的轉(zhuǎn)變。總而言之,不管它是不是智能,計算機(jī)從確定性編程到概率性編程的進(jìn)步都是一項重要的階梯函數(shù)式的轉(zhuǎn)變(盡管它跟社會科學(xué)和物理科學(xué)取得的進(jìn)步是一致的)。哲學(xué)家伊恩·哈金(IanHacking)在《馴服偶然》(TheTamingofChance)一書中說,19世紀(jì)之前,概率屬于賭徒的行當(dāng)。但到了19世紀(jì),政府人口普查數(shù)據(jù)的興起將新興的概率數(shù)學(xué)應(yīng)用到了社會科學(xué)。20世紀(jì),我們對物理世界的理解出現(xiàn)了根本性的重組,從牛頓式世界觀的確定性轉(zhuǎn)向量子力學(xué)的不確定性。也許,21世紀(jì)計算機(jī)科學(xué)最重要的進(jìn)步與社會科學(xué)和物理科學(xué)過去的進(jìn)步是互相呼應(yīng)的,即人們意識到,以數(shù)據(jù)為基礎(chǔ)、從概率意義上建立起結(jié)構(gòu)的算法效果最好。本章要點※機(jī)器學(xué)習(xí)這一科學(xué)跟統(tǒng)計學(xué)的目標(biāo)不同。統(tǒng)計學(xué)強(qiáng)調(diào)的是平均值的正確性,機(jī)器學(xué)習(xí)卻對此并無要求,相反,它的目標(biāo)是操作的有效性。預(yù)測可能會出現(xiàn)偏差,但只要夠好就行(在運算力強(qiáng)大的計算機(jī)中可以實現(xiàn))。這使得科學(xué)家們可以利用過去十年的豐富數(shù)據(jù)和高速計算機(jī)自由地進(jìn)行嘗試,以快速推動改進(jìn)?!鶄鹘y(tǒng)的統(tǒng)計方法需要闡述假設(shè),或至少闡述人對模型規(guī)范的直覺。機(jī)器學(xué)習(xí)不僅不需要事先指定進(jìn)入模型的內(nèi)容,還能夠適應(yīng)更加復(fù)雜、有著更多互動變量的模型?!鶛C(jī)器學(xué)習(xí)的最新進(jìn)步通常被稱為人工智能的進(jìn)步,因為:(1)以這一技術(shù)為基礎(chǔ)的系統(tǒng)會隨著時間的推移不斷學(xué)習(xí)和改進(jìn);(2)這些系統(tǒng)在某些條件下可產(chǎn)生比其他方法產(chǎn)生的更準(zhǔn)確的預(yù)測,一些專家認(rèn)為預(yù)測是智能的核心;(3)這些系統(tǒng)提高了預(yù)測的準(zhǔn)確性后,它們便能夠執(zhí)行從前被認(rèn)為專屬于人類智能領(lǐng)域的任務(wù),如翻譯和導(dǎo)航。對預(yù)測和智能之間的聯(lián)系,我們?nèi)匀怀植豢芍膽B(tài)度。預(yù)測的進(jìn)步是否代表了智能的進(jìn)步,我們對這一問題并無特定立場,我們的結(jié)論也不依賴于這樣的立場。我們關(guān)注的是預(yù)測成本下降(而非智能成本下降)帶來的結(jié)果。第5章

數(shù)據(jù)就是新一代的石油2013年,谷歌的首席經(jīng)濟(jì)學(xué)家哈爾·瓦里安(HalVarian)開導(dǎo)可口可樂公司的羅伯特·戈伊蘇埃塔(RobertGoizueta)說:“10億小時之前,現(xiàn)代智人出現(xiàn)了。10億分鐘之前,基督教誕生了。10億秒鐘前,IBM的個人電腦上市了。10億次谷歌搜索之前……是今天早上?!惫雀璨⒉皇俏ㄒ灰患覔碛泻A繑?shù)據(jù)的公司。從Facebook、微軟等大型公司到地方政府甚至初創(chuàng)公司,數(shù)據(jù)收集都變得比以往更廉價、更容易了。這些數(shù)據(jù)具有價值。數(shù)十億的搜索量意味著,谷歌有了數(shù)十億條可供改善服務(wù)的數(shù)據(jù)線索。有些人把數(shù)據(jù)稱為“新一代的石油”。預(yù)測機(jī)器依賴數(shù)據(jù)。越來越好的數(shù)據(jù)帶來越來越好的預(yù)測。從經(jīng)濟(jì)角度來說,數(shù)據(jù)是預(yù)測的關(guān)鍵互補(bǔ)品。隨著預(yù)測變得愈發(fā)廉價,它的價值水漲船高。數(shù)據(jù)在人工智能中扮演著三種角色。首先是輸入數(shù)據(jù),它被饋進(jìn)算法,用于生成預(yù)測。其次是訓(xùn)練數(shù)據(jù),它被用來生成最初的算法。訓(xùn)練數(shù)據(jù)用于訓(xùn)練人工智能,讓后者得以在現(xiàn)實環(huán)境下進(jìn)行良好的預(yù)測。最后一種是反饋數(shù)據(jù),通過經(jīng)驗來改進(jìn)算法的表現(xiàn)。在某些情況下,這三種角色存在大量重合,同一批數(shù)據(jù)甚至能身兼三職。但獲取數(shù)據(jù)的成本可能很高。因此,投資時有必要權(quán)衡的是以下兩者:更多數(shù)據(jù)帶來的好處與獲取更多數(shù)據(jù)所付出的成本。為了做出正確的數(shù)據(jù)投資決策,你必須理解預(yù)測機(jī)器是怎樣使用數(shù)據(jù)的。預(yù)測需要數(shù)據(jù)在新近的人工智能熱潮興起之前,有過一輪大數(shù)據(jù)熱。過去20年,數(shù)據(jù)的種類、數(shù)量和質(zhì)量均有大幅提升。圖像和文本如今都是數(shù)字形式了,機(jī)器可以對其進(jìn)行分析。傳感器無處不在。大數(shù)據(jù)熱的基礎(chǔ)是,人們希望數(shù)據(jù)能夠幫助減少不確定性,以及對正在發(fā)生的事情擁有更多了解。以檢測人類心率變化的傳感器的進(jìn)步為例。多家有著“醫(yī)學(xué)味”十足名字的公司和非營利組織(比如AliveCor(2011年成立的一家醫(yī)療設(shè)備和人工智能的公司,向消費者銷售移動設(shè)備端的硬件和軟件,提供心電圖實時檢測等功能?!g注)和Cardiio(Cardiio可通過前置攝像頭檢測使用者的心率?!g注))都在開發(fā)使用心率數(shù)據(jù)的產(chǎn)品。初創(chuàng)公司Cardiogram(其開發(fā)的軟件通過可穿戴設(shè)備和智能手機(jī)收集的睡眠和運動數(shù)據(jù)預(yù)測用戶的健康狀況?!g注)設(shè)計了一款蘋果手機(jī)應(yīng)用程序,使用蘋果手表的心率數(shù)據(jù)生成了大量信息:使用該款程序,用戶可按秒測量心率。用戶可以查看一天當(dāng)中,自己的心率什么時候會達(dá)到巔峰,又或者一年內(nèi)(甚至十年內(nèi)),心率是否有所加快或放緩。但這些產(chǎn)品的潛在力量來自大量數(shù)據(jù)與預(yù)測機(jī)器的結(jié)合。學(xué)術(shù)界和工業(yè)界的研究人員都指出,智能手機(jī)可以預(yù)測不規(guī)則的心律(醫(yī)學(xué)上叫作“心房顫動”)。因此,依靠各自的預(yù)測機(jī)器,Cardiogram、AliveCor、Cardiio和其他公司正在開發(fā)利用心率數(shù)據(jù)輔助診斷心臟疾病的功能。一般的方法是,使用心率數(shù)據(jù)預(yù)測如下未知信息:特定用戶是否心律異常。沒受過醫(yī)學(xué)專業(yè)訓(xùn)練的消費者從原始數(shù)據(jù)里是看不到心率數(shù)據(jù)與心律異常之間的關(guān)聯(lián)的。而Cardiogram可以運用深層神經(jīng)網(wǎng)絡(luò)探測到心律異常,準(zhǔn)確率高達(dá)97%。大約有1/4的中風(fēng)是心律異常導(dǎo)致的。有了更好的預(yù)測,醫(yī)生便可提供更好的治療。某些特定藥物可用來預(yù)防中風(fēng)。為此,每個消費者必須提供自己的心率數(shù)據(jù)。沒有個人數(shù)據(jù),機(jī)器無法預(yù)估當(dāng)事人的風(fēng)險。預(yù)測機(jī)器與個人數(shù)據(jù)相結(jié)合便可預(yù)測此人心律異常的概率。機(jī)器怎樣從數(shù)據(jù)中學(xué)習(xí)當(dāng)前這一代的人工智能技術(shù)被稱為“機(jī)器學(xué)習(xí)”是有原因的。機(jī)器從數(shù)據(jù)中學(xué)習(xí)。就心率監(jiān)測儀而言,根據(jù)心率數(shù)據(jù)預(yù)測心律異常(以及中風(fēng)概率提高的可能性),預(yù)測機(jī)器要先學(xué)習(xí)數(shù)據(jù)跟心律異常的實際發(fā)病率有著怎樣的相關(guān)性。為此,預(yù)測機(jī)器需要將來自蘋果手表的輸入數(shù)據(jù)(統(tǒng)計學(xué)家稱之為“自變量”)與心律異常信息(“因變量”)結(jié)合起來。要讓預(yù)測機(jī)器學(xué)習(xí),心律異常信息必須來自同一個向蘋果手表提供心率數(shù)據(jù)的群體。因此,預(yù)測機(jī)器需要多個心律異常者的數(shù)據(jù),以及他們的心率數(shù)據(jù)。重要的是,它還需要許多心律無異常人士的數(shù)據(jù),及其心率數(shù)據(jù)。接著,預(yù)測機(jī)器比較心律正常者和異常者的心率圖。有了這樣的比較,就可以進(jìn)行預(yù)測。如果新患者的心率圖與心律異常者提供的“訓(xùn)練”樣本更為接近,那么,機(jī)器就會預(yù)測這一患者有著心律異常的問題。像不少醫(yī)療應(yīng)用一樣,Cardiogram與學(xué)術(shù)研究人員進(jìn)行了合作,后者通過在研究中監(jiān)測6000名用戶的心率收集到了數(shù)據(jù)。在6000名用戶里,約有兩百人被確診患有心律不齊。故此,Cardiogram所做的就是收集來自蘋果手表的心率圖數(shù)據(jù)并與研究數(shù)據(jù)進(jìn)行對比。此類產(chǎn)品在上市之后仍會繼續(xù)改進(jìn)預(yù)測的準(zhǔn)確度。預(yù)測機(jī)器需要有關(guān)預(yù)測是否準(zhǔn)確的反饋數(shù)據(jù)。因此,它需要用戶中心律異常的發(fā)病率的數(shù)據(jù)。該機(jī)器將這些數(shù)據(jù)與心臟檢測的輸入數(shù)據(jù)相結(jié)合,生成反饋,并不斷提高預(yù)測的準(zhǔn)確度。不過,獲取訓(xùn)練數(shù)據(jù)也可能是件很棘手的事情。為了預(yù)測同一組項目(如本例中的心臟病患者),你除了需要目標(biāo)結(jié)果的信息(心律異常),還需要有助于在新條件下預(yù)測該結(jié)果的信息(心率監(jiān)控)。若要預(yù)測未來事件,就更具有挑戰(zhàn)性了。你只能把想要預(yù)測之時已知的信息饋進(jìn)預(yù)測機(jī)器。比方說,假設(shè)你正想購買明年自己最心愛運動隊的季票。在多倫多,大多數(shù)人會購買多倫多楓葉冰球隊的季票。你顯然希望自己去觀看比賽的時候,球隊獲勝,而不是輸?shù)?。你認(rèn)為,球隊至少要能贏半數(shù)以上的比賽,購買季票才劃算。為了做出這個決定,你需要預(yù)測球隊獲勝的次數(shù)。就冰球而言,進(jìn)球最多的球隊獲勝。所以,你認(rèn)為進(jìn)球多的球隊能贏,進(jìn)球少的球隊往往會輸。你決定為預(yù)測機(jī)器提供過往賽季的數(shù)據(jù),包括每支球隊的進(jìn)球數(shù),每支球隊對手的進(jìn)球數(shù),以及每支球隊的獲勝次數(shù)。你將這些數(shù)據(jù)提供給預(yù)測機(jī)器,發(fā)現(xiàn)這的確是預(yù)測獲勝次數(shù)的絕佳指標(biāo)。于是,你打算使用這些信息來預(yù)測明年球隊的獲勝次數(shù)。很可惜,你做不到。你一籌莫展,你沒有明年球隊進(jìn)球數(shù)的信息,所以,你沒法用這些數(shù)據(jù)來預(yù)測球隊的獲勝次數(shù)。你確實擁有去年的進(jìn)球數(shù)據(jù),但它沒用,因為你的訓(xùn)練模式是讓預(yù)測機(jī)器從當(dāng)前年份的數(shù)據(jù)中進(jìn)行學(xué)習(xí)的。為了做出這一預(yù)測,你需要掌握做出預(yù)測那一刻手頭將會擁有的數(shù)據(jù)。你也可以使用前一年的進(jìn)球數(shù)來重新訓(xùn)練預(yù)測機(jī)器,讓它預(yù)測今年的勝算。你還可以使用其他信息,比如前一年的獲勝次數(shù),球員的年齡,他們在冰上的過往表現(xiàn)。許多商業(yè)人工智能應(yīng)用程序都具有這種結(jié)構(gòu):將輸入數(shù)據(jù)和結(jié)果指標(biāo)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論