




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
大數據用數據說話目錄\h上篇帝國風云得數據者得天下——美國的成功經驗\h第一章歷史爭戰(zhàn)《信息自由法》\h第四股力量:知情權的起點\h國會議員:孤獨的戰(zhàn)爭\h白宮當家人:一個妥協者和機動者\h政府VS.社會:舊劇情重現新時代\h第二章數據帝國的興起\h摩爾定律:全世界半個世紀的發(fā)展規(guī)律\h最小數據集:上升到立法高度的開路先鋒\h民意幾時有:選票催生的創(chuàng)新\h普適計算:計算機本身將從人們的視線中消失\h“大數據”戰(zhàn)略:爭奪全世界的下一個前沿\h第三章數據治國\h循“數”管理:平安大道怎樣鋪\h數據“驗”平權:民權史上的碑石\h數據“打”假:最大的爭議就是福利濫用\hCompStat:街頭警察的創(chuàng)新傳奇\h第四章商務智能的前世今生\h起源:從數據到知識的挑戰(zhàn)和跨越\h結蛹:數據倉庫之厚積薄發(fā)\h蠶動:聯機分析之驚艷\h破繭:數據挖掘之智能生命的產生\h化蝶:數據可視化的華麗上演\h中篇法則博弈大數據時代的發(fā)展與危機\h第五章帝國的法則\h收集法則:減負,為人民減負\h使用法則:隱私,文明社會的共識\h發(fā)布法則:免費,人民已經交稅\h管理法則:質量,互聯網時代的根本\h第六章《數據質量法》的困局\h產業(yè)界“俘虜”政府:數據背后的政經戰(zhàn)爭\h美式“旋轉門”:權、名、利大串場\h“摻沙子”法案:國會對付總統的獨門秘器\h環(huán)?!帮L險門”:公共利益常常無人代表\h集體行動的邏輯:人人都想“搭便車”\h三權之歧:什么是真正的“和諧”\h第七章全國隱私風波\h《一九八四》:零隱私的恐懼\h大數據就是“老大哥”:中央數據銀行之爭\h百年糾結:統一身份證\h“9·11”大拐點:以反恐的名義向左轉\h萬維信息觸角計劃:追蹤恐怖分子的“數據腳印”\h6種改變政府的力量:山姆大叔大退讓\h下篇公民故事公民社會與數據互動之雙贏時代\h第八章數據開放運動\h一個新的世界:從軟件開源到數據開放\h總統的雄心:公共財政支出透明\h數據民主:印裔首席信息官的崛起\hData.Gov:從旗艦初航到保“數”運動\h大眾創(chuàng)新:航班延誤之候機經濟學\h第九章試金石:白宮訪客記錄\h總統在見誰:大醫(yī)改中的“小”插曲\h全體美國人的房子:白宮\h步步妥協:總統與草根的對決\h從白宮安保到政治監(jiān)督:執(zhí)著的公民改變世界\h第十章礦難中的歌聲和數據\h集體行動的號角:你站在哪一邊\h可以避免的悲?。簲祿沂镜娜笆秸嫦郳h默認公開推定:和礦難賽跑的原則\h唯一的道路:民主時時都要“爭”\h外篇天下趨勢大數據社會未來之世界走向\h第十一章大趨勢\h數據權:大不列顛的碩果\h大合流:國際開放聯盟\h云計算:新的航向\h再造互聯網:從網頁相連到數據相“聯”\h第十二章大挑戰(zhàn)\h逐鹿政壇:得數據者得天下\h數據競爭:企業(yè)贏之道\h下一波浪潮:從大數據到大社會\h第十三章大變革\h微學位:教育領域正在發(fā)生的革命\h大數據:再談教育領域正在發(fā)生的革命\h微學校:三談教育領域正在發(fā)生的革命\h尾聲挑戰(zhàn)中國:摘下“差不多先生”的文化標簽\h大事記20世紀大蕭條后美國信息開放、技術創(chuàng)新之路上篇帝國風云
得數據者得天下——美國的成功經驗第一章歷史爭戰(zhàn)《信息自由法》信息之于民主,就如貨幣之于經濟。\h\h01\h——托馬斯·杰斐遜(1743-1826),第3任美國總統(向公眾)隱瞞政府實情的力量,就是摧毀這個政府的力量。這種力量不能輕易授予,也不能輕率使用。\h\h02\h——美國國會《信息自由委員會的報告》,1976年在美國200多年的歷史河流中,作為總統,奧巴馬開放政府的雄心,其實并不多見。但早在開國之初,美國的建國者就對信息的作用展開了思考和辯論?!丢毩⑿浴返钠鸩萑?、美國第3任總統托馬斯·杰斐遜(ThomasJefferson)說:“信息之于民主,就如貨幣之于經濟?!毖韵轮?,如果信息停止了流動,就像貨幣停止了流通的經濟一樣,民主的制度將會名存實亡。美國早期的信息公開主要集中在立法機關:國會。從1841年起,美國國會的立法辯論、投票過程就向新聞界開放。由于三權分立的體制,政府獲得了相對獨立的行政權。1789年,美國國會制定了《管家法》(HousekeepingAct),規(guī)定了行政機關必須在統一的出版物上公開政務信息,但對于公開的內容,行政長官有自由裁定權。沒想到,這份立國之初通過的法案,后來“管”了150多年。進入20世紀以后,美國開始步入大政府時代:政府規(guī)模不斷膨脹,開支越來越大,公文數量急劇增加。為應對這種局面,國會于1935年、1946年先后通過了《聯邦登記法》(FederalRegisterAct)和《行政程序法》(AdministrativeProcedureAct),創(chuàng)建了專門公布聯邦政府信息的《聯邦登記日報》(FederalRegister),規(guī)定公眾可以向政府提出信息公開的要求,但如果危及公共利益,政府有權拒絕。一句話,美國行政部門的信息公開,100多年來,主要還是政府部門自己說了算。直到上個世紀50年代,世界形勢風起云涌,一場波瀾壯闊的信息公開運動才在美國真正拉開了序幕。但這場運動的中流砥柱,卻不是美國總統。相反,這個時期的幾任總統,在其中扮演的角色,都并不光彩。第四股力量:知情權的起點一個自由的新聞行業(yè)是居于政府和人民之間的偉大解釋者。你,如果同意給它加上桎梏,無異于給自己戴上腳鐐。\h\h03\h——喬治·薩瑟蘭(1862-1942),美國最高法院大法官,1936年這場運動的源頭來自于美國社會的“第四股力量”(FourthEstate)。在美國,第四股力量指的是除了立法、執(zhí)法和司法三權之外的“新聞和報紙”。談到新聞和報紙在美國的作用,又不得不提到杰斐遜,他說過:“如果由我來決定,我們是要一個有政府、沒報紙的社會,還是一個有報紙、沒政府的社會,我將毫不猶豫地選擇后者。”由于在立國時就確定了言論自由的原則,美國的記者和編輯一直都是推動社會發(fā)展進步最重要的一股力量。1944年6月,英美盟軍在諾曼底登陸,德國開始全面潰敗。這標志著第二次世界大戰(zhàn)即將結束。指日可待的勝利,令美國的新聞界興奮不已,因為,這意味著解除戰(zhàn)爭時期的新聞管制,重新開啟一個新聞自由的年代。在這個歷史的轉折點,美國的記者、編輯和律師一起拉開了信息自由運動的序幕。他們中的不少人,也因此青史留名。1945年1月,美聯社的執(zhí)行主編庫珀(KentCooper)率先在美國提出了“知情權”的概念(RighttoKnow)。他在《紐約時報》發(fā)表文章說:“知情權是指人民有權知道政府的運作情況和信息。如果不尊重公民的知情權,在任何一個國家,甚至全世界,都將無政治自由可言?!盶h\h04\h美國新聞界不僅對國內的新聞自由和信息開放充滿了憧憬,甚至雄心勃勃、躍躍欲試要將新聞自由推向全世界。他們相信,缺乏新聞自由,正是一些專制國家能夠發(fā)動戰(zhàn)爭的原因。他們預見到,二戰(zhàn)期間高漲的國家主義可能會成為戰(zhàn)后世界范圍內影響信息自由流通的最大障礙。為了克服這個障礙,1948年,美國報紙編輯協會(ASNE)成立了“世界信息自由委員會”(以下簡稱世委會)的分支機構,\h\h05\h著名的編輯沃爾特斯(BasilL.Walters)擔任了該委員會的首任主席。但誰也沒有想到,第四股力量的良好愿望,最后竟然兩頭落空。世委會成立之后,在聯合國進行了大量的動員和游說工作。在他們的努力下,1948年,有55個國家達成了世界新聞信息自由流動的初步協議,但由于前蘇聯的反對和攪局,這個方案最后在聯合國大會上流產。不僅在國際戰(zhàn)線受挫,而且在美國國內也陰霾重重。二戰(zhàn)結束后,美國確實撤銷了戰(zhàn)時新聞審查辦公室。但沒過多久,東西方的冷戰(zhàn)卻開始興起,杜魯門總統宣布全力對抗“赤色革命”,為了“國家安全”,他曾經多次直接下達命令,封存公務記錄、抵制信息公開。作為世委會的掌舵人,沃爾特斯很快認識到:國內的新聞管制并沒有真正解除,公眾的知情權依然沒有保障,和戰(zhàn)爭時期相比,甚至有過之而無不及。門前雪都掃不干凈,談何世界?1950年,東西方的冷戰(zhàn)格局已經清晰地形成,兩個陣營的對峙,如山雨欲來、一觸即發(fā)。沃爾特斯審時度勢,最終決定把視線收回到美國,他宣布將“世界信息自由委員會”中的“世界”兩字去掉,以務實的態(tài)度,把工作重點鎖定在美國本土。沃爾特斯把這個轉變稱為“再次覺醒”。他重新定義了信息自由委員會的目標和使命:“我們的工作就是要讓人民充分意識到以下事實:政府所有的公共記錄都屬于人民,公務員僅僅是人民的服務人員,而報紙,好比人民的眼睛,幫助人民把公共記錄和政府官員置于陽光之下?!盶h\h06\h沃爾特斯后來還當選為美國報紙編輯協會的主席。他在信息自由委員會的兩位繼任者,帕勃(JamesS.Pope)和韋金斯(J.RussellWiggins),都為信息自由運動做出了杰出的貢獻,也先后擔任了美國報紙編輯協會的主席。韋金斯曾經對美國報紙編輯協會的使命有過一個更直接的描述和定位,他寫道:“我們的協會必須挺身捍衛(wèi)知情權,和限制信息自由的做法斗爭?!?951年,杜魯門總統簽發(fā)第10290號行政命令,在美國歷史上第一次把軍事機構的保密制度引入了普通的行政部門,他授權聯邦政府的部門首腦可以對公共文件進行分級保密管理。只要定為保密的文件,公眾一律無權查看,一時間,“保密”之風在政府各個部門蔓延。這個時候,帕勃正擔任信息自由委員會的主席。針對杜魯門的做法,他認為必須從法理上厘清問題,找出信息自由的依據,遂委托報紙編輯協會的律師哈羅德·克勞斯(HaroldCross)對美國各級政府的信息使用管理情況進行調研。克勞斯是美國著名的律師,也是哥倫比亞大學的新聞學教授。1953年,他在兩年調研的基礎上,出版了《人民的知情權》(ThePeople'sRighttoKnow)一書。開篇明義,克勞斯就提出:“公共事務,就是大家的事。人民有權利知道這些事。如果沒有知情權,即使在一個民主制度下,人民所能做的也不過僅僅就是投票改選他們的國王罷了。”\h\h07\h克勞斯認為:只有擁有信息自由,人民才能真正擁有對公共事務的發(fā)言權。但美國的“知情權”,并沒有明確的法律保障:所有行政部門的檔案和記錄,實際上都處于“準機密”的狀態(tài)。因為是否屬于“機密”,完全取決于當權領導一時的態(tài)度。克羅斯總結說:既然是合法的權力,就不能寄望于當權者是否開明或寬容,也不能系于領導人的道德和品質,而必須受到法律的切實保障。他還為如何落實知情權指明了方向:要清除一大一小兩個法律障礙,大的是1946年的《行政程序法》,小的是1789年的《管家法》,這兩部法律都用模糊的語言規(guī)定了政府機關對其文件是否公開具有決定權。1953年出版的這一本《人民的知情權》,為美國整個信息自由運動指明了方向、奠定了框架,被后世譽為信息自由運動的“圣經”。后來美國出臺的《信息自由法》,基本主張也都來源于此。國會議員:孤獨的戰(zhàn)爭那美好的仗我已經打過,當跑的路我已經跑盡,所信的道我已經守住。從此以后,有公義的冠冕為我存留。\h\h08\h——保羅,《圣經·提摩太后書》也正是1953年,另一個更重要的人,約翰·摩斯(JohnE.Moss),走進了美國首都華盛頓。約翰·摩斯(1915-1997)《信息自由法》之父,擔任美國國會議員25年,六朝元老、連選連任。除《信息自由法》之外,他還是美國《消費者安全法》等多部法律的制訂者和推動者。(圖片來源:FirstAmendmentCenter)摩斯曾經是一個窮苦小子,名不見經傳,但卻被后世稱為《信息自由法》之父。1915年,摩斯出生于一個礦工家庭。母親早逝,父親棄家出走,12歲的他和弟弟相依為命。為了謀生,他賣過輪胎,做過股票交易員,開過運送尸體的靈車,因為籌不齊學費,社區(qū)大學都沒有讀完。但這樣一個人,最后居然選擇了從政,他加入了民主黨,在1949年當選為加州立法會議員。1953年,摩斯在加州立法會的表現獲得了選民的廣泛認可,又當選為美國國會的眾議員。這一年,在二戰(zhàn)中立下了赫赫軍功的艾森豪威爾(DwightEisenhower)完成了他從將軍到總統的轉變,也開始了他的白宮生涯。艾森豪威爾是共和黨員,但他延續(xù)了民主黨總統杜魯門的冷戰(zhàn)思維。為了抵制“赤色”思潮,這兩位總統先后在聯邦政府解雇了2800多名有“共產主義傾向”的工作人員。作為國會議員,摩斯為此大鳴不平,他要求調閱這2800人的名冊和相關檔案。這時候的聯邦政府,已經是水潑不進,立即以“國家安全”的理由拒絕了摩斯的要求。摩斯認為這既不公平,也不合理,他開始在國會倡導信息公開。1955年,在他的推動下,眾議院的政府運行委員會成立了政府信息分委會,摩斯擔任了該分委會的主席。不久后,他就提出了《信息自由法》的草案。一朝一野,摩斯和以美國報紙編輯協會為代表的新聞界兩相呼應,形成了一股力量。但這股力量還是屢屢碰壁。按照克勞斯確定的方向,摩斯開始著手清除大小兩個法律障礙。從1955年到1959年,政府信息分委會共舉行了173場聽證會,撰寫了17卷書面記錄和14卷調查報告。在該分委會的推動下,1958年,國會對1789年的《管家法》進行了重新解釋,明確規(guī)定禁止利用《管家法》來剝奪公眾查閱政府文獻的權利,這清除了克勞斯指出的“小障礙”。但因為共和黨當政,國會里面沒有一名共和黨議員愿意聯署摩斯的提案,《信息自由法》的草案長期在委員會擱淺,根本進入不了投票辯論的議程。艾森豪威爾連任兩屆總統。等到1961年,肯尼迪上臺,民主黨也扭轉了乾坤,成了國會的多數黨??夏岬弦蚤_明著稱,摩斯對此滿抱希望。但這位美國歷史上最受歡迎的總統,仍然不喜歡信息公開,他明確表示,大家應當自律,服從國家安全的大局。但摩斯卻固執(zhí)己見,仍然在國會高調鼓吹“信息自由”。一般而言,國會議員不會和本黨的總統以及本黨的議會主席唱反調,但摩斯卻針鋒相對,緊緊抓住《信息自由法》的提案不放。可以想象他當時在國會受到的孤立,后人甚至評論說,這也是摩斯從政幾十年最后終老于國會議員位置之上的根本原因。美國國會的立法步驟說明:這是眾議院的立法步驟,參議院的步驟類似。美國的國會由參議院、眾議院組成。每個議院都按功能劃分為多個委員會,委員會再下設分委會。美國國會共有200多個委員會和分委會。每一個議員都屬于一個或多個委員會或分委會。無論哪個議員提出的提案,都要在兩院投票,半數以上通過之后,才能提交總統簽署;總統簽署之后,提案才正式成為法律??偨y如果拒絕簽署,提案將返回國會,重新修改、投票,或通過,或擱置流產。1963年,肯尼迪遇刺,副總統約翰遜繼位。約翰遜也是民主黨員,這位新人一時擦亮過摩斯的希望火花。但他很快又失望了。和肯尼迪相比,約翰遜更煩記者對政府部門指手畫腳、說三道四。他甚至直接傳話給國會,即使他們通過了這個法案,他也會行使總統的擱置否決權(PocketVeto)。多年以后,他的新聞秘書莫耶斯(BillMoyers)回憶說,約翰遜聽到這個法案的第一反應是:摩斯想干什么?他想搞砸我這屆政府嗎?摩斯的提案似乎走入了歷史的死角。但歷史的轉變,常常因為一些偶然的事件而觸發(fā)、完成。真正的破冰之人,居然是一名來自共和黨的新議員:拉姆斯菲爾德(DonaldRumsfeld)。和出身貧窮、大學都沒有畢業(yè)的摩斯不同,年青的拉姆斯菲爾德出身富裕,畢業(yè)于普林斯頓大學,他信奉自由經濟學,反對政府管制,因此熱情支持《信息自由法》的提案。他在1962年當選國會議員之后,批評約翰遜政府“不斷滑向新聞管制、打壓人民應該擁有的信息自由”,成為高調支持《信息自由法》的第一位共和黨議員。他率先倒戈之后,越來越多的共和黨議員聯署了摩斯的《信息自由法》提案。當然,這背后更深刻的原因在于,這時候的共和黨失去了政權,需要重新打開局面。多年后,拉姆斯菲爾德成了一位赫赫有名的人物,他擔任了兩屆政府的國防部長,并和《信息自由法》再度結緣。1964年,摩斯終于在國會取得了足夠的支持,十年磨劍,他的提案終于走出了委員會,進入了辯論階段。但以總統為首的聯邦政府還是強烈反對這個法案。1965年,聯邦政府只有27個部門,但無一例外,全部在聽證會上大聲說“不”!預算分析局(BureauoftheBudgetAnalysis)甚至評論說:“如果這個法案得以通過,吃飽了沒事干的人,為了滿足好奇心,都來查詢政府的信息,這將產生不堪設想的嚴重后果?!卑讓m新聞秘書莫耶斯在法案的封面留下了這樣的字跡:“對!我們必須繼續(xù)反對這個法案?!卑讓m當家人:一個妥協者和機動者所有的政府,都是建立在妥協和交換的基礎之上。事實上,人類所有的收益和快樂、所有的美德、所有明智的行為無不如此。\h\h09\h——埃德蒙·伯克(1729-1797),英國政治學家但事情的發(fā)展,急轉而下。莫耶斯反倒成了第一個轉變態(tài)度的白宮官員。1965年10月,距離摩斯首次著手《信息自由法》的調查工作已經整整12年,參議院終于高票通過了《信息自由法》。次年6月,眾議院也以全票通過。這個勝利,將新聞界的士氣和大眾輿論推向了一個高潮。6月22日,提案送到了白宮。按照美國憲法,約翰遜總統必須在10個工作日內表明態(tài)度:或簽署,或否決。否決的提案將退回國會,再次投票,如果參眾兩院再次投票的支持率都高于三分之二,那總統的否決將失效,提案無需他的簽署,將自動成為法律。“春江水暖鴨先知”。作為白宮的新聞秘書,莫耶斯每天都要面對新聞界,面對強大的輿論壓力,他的態(tài)度轉變得最快。他知道約翰遜即便行使否決權,也可能無力回天,于是他建議約翰遜簽字接受這個既成事實。等到第8天,仍然毫無動靜。7月2日,美國報紙編輯協會給白宮發(fā)出電報催促說:“截止日期將近。特此提醒:不能因為懈怠,讓這項在國會大受歡迎的提案胎死腹中?!蹦够匦耪f:“懈怠不是我們的習慣,謝謝提醒?!边@時候的約翰遜,正在海水和火焰中一籌莫展。他拖到了法定10天期限的最后一天,7月4日,感覺確實無力回天,才在家中黯然簽署了這份文件。約翰遜總統熱衷交際,喜歡記日記,事無巨細,每天都按時記下。他一貫的做派是在簽署法案時舉行隆重的儀式,邀請記者拍照、電視采訪,將簽字筆送人留念,并在日記中寫得濃墨重彩。但對《信息自由法》,他沒有舉行任何儀式,甚至沒有在日記中留下一個字的評論。陰差陽錯,7月4日,正是美國獨立日,這使得后世在慶祝美國的生日的同時,也可以紀念信息自由的勝利。莫耶斯后來辭去了白宮新聞秘書的職務,成了一名新聞工作者。他“下海”以后,也成了《信息自由法》的公開擁護者。2002年,他接受國家公共電臺(NPR)的采訪,又回憶了這段歷史,他談到了約翰遜對這個法案的厭惡和無奈。莫耶斯承認,當時的聯邦政府確實以國家安全的名義,掩蓋了太多的秘密。他作出結論說,秘密越多,腐敗越多。\h\h10\h當然,約翰遜總統其實也心知肚明,知道《信息自由法》是歷史的進步。在生米煮成熟飯之后,他很快“調整”了自己的步伐,“跟”上了歷史的潮流,并開始給自己臉上“貼金”。他發(fā)表聲明說:“這部法律根植于美國一條至關重要的原則,那就是只有當人民能夠在國家安全允許的范圍內獲得一切信息的時候,民主制度才能達到最佳的運行狀態(tài),我為美國是一個開放的社會感到深深的驕傲?!盶h\h11\h伴隨著如此華麗的辭藻,1967年,《信息自由法》開始生效。美國成為繼瑞典、芬蘭之后,世界上第三個實施《信息自由法》的國家。但故事卻遠遠沒有結束,歷史還有逆流。《信息自由法》實施之后,聯邦政府采取了消極應對的策略:一是拖,對于查閱公共記錄的要求,常常拖延不予答復;二是貴,收取明顯偏高的信息查詢和復印費用,復印文件每頁1美元,查詢費用每小時7美元;三是擋,利用“國家安全”的豁免條款作為擋箭牌,由于該法規(guī)定的保密事項過于寬泛,中央情報局幾乎拒絕了所有的信息查詢及公開的申請。因為這種種障礙,《信息自由法》幾乎就成了一張“空頭支票”。1972年起,摩斯又重新啟動了該法案的調查工作。在他的推動下,美國國會提出了《信息自由法修正案》,對信息公開的范圍、時限和查詢的費用作出了更細致、更透明的規(guī)定;此外,該提案還建議,如果政府以保密的要求拒絕查詢,公民可以提起司法訴訟,法院擁有是否公開的最終裁判權。這個修改,直接擊中了聯邦政府的“七寸”。這時候白宮的當家人,是福特總統(GeraldFord)。理解美國信息公開的兩個重要概念:公開和發(fā)布要理解美國的信息公開,首先要理解兩個基本的概念:一是公開(Disclosure),公開是指政府對于公民或社會組織查詢信息的特定要求,給予一對一的回應,將信息公開給查詢方,查詢方收到信息之后,有自由使用、進一步公開的權利;二是發(fā)布(Distribution),發(fā)布是指將信息或者文件登載在政府出版物或政府網站上,廣而告之。例如,2009年11月,奧巴馬第一次訪問中國,他一共帶了多少隨從、開支了多少錢,這些信息,并不屬于發(fā)布的范圍,但如果有人查詢,就屬于公開的范圍。也可以說,公開,是政府和某一社會特定主體的關系,是點對點的;而發(fā)布,是政府和社會的關系,是點對面的。1966年,當《信息自由法》在國會投票表決時,福特擔任國會議員,他投下了贊成票。但時過境遷、位轉人移,這時候的福特,作為總統,聽到這個消息,心急火燎,立刻給國會發(fā)函,明確表示反對該修正案。更具諷刺意味的是,在60年代曾為《信息自由法》的通過有“破冰”之功的拉姆斯菲爾德,這時候正擔任炙手可熱的白宮辦公廳主任一職,他也力主福特否決《信息自由法修正案》。和約翰遜總統如出一轍,在參眾兩院已經高票通過的情況下,福特總統猶豫難決,也在第10天才做出決定。不同的是,福特走得更遠,最后孤注一擲,行使了總統否決權。但有驚無險,參眾兩院又以三分之二的多數推翻了福特的否決。無需福特的簽署,《信息自由法修正案》自動成為法律。歷史這才真正翻開了新的一頁。1975年,《信息自由法修正案》生效。此后,援引該法向聯邦政府部門申請信息公開的人數大幅增加。當年就收到2萬多起申請。這個數字不斷上升,2010年前后,僅聯邦政府每年就會收到50多萬宗信息公開的申請,《信息自由法》已經成為美國社會不可或缺的一項基本法案。從此,美國的信息自由獲得了前所未有的加速度。政府的文件,是靜態(tài)的決策記錄;而會議,才是動態(tài)的決策過程。1976年,美國國會又通過了《陽光政府法》(GovernmentintheSunshineAct),規(guī)定除了10種涉及國家安全和公民隱私的會議之外,合議制機關的會議應該公開。\h\h12\h此后,美國公民獲得了旁聽政府部門會議的權利。1978年,摩斯為他25年的國會生涯畫上了句號。當這位六朝元老退休的時候,《華盛頓郵報》評論說,他離開了華盛頓,但他卻給美國人的生活、政府的運行方式留下了一個深深的烙印。1997年,摩斯的生命走到了終點。這位風燭殘年的老人對歷史投下了最后的一瞥,他回顧說:“我們所做的,只是一個開始。在面對挑戰(zhàn)的時候,我沒有退縮。很多時候我們不能退縮,必須戰(zhàn)斗。那最美好的仗,我已經打過?!焙湍λ瓜啾龋匪狗茽柕聼o疑長袖善舞,他也因此步步高升,受到幾任總統的重用。1975年,作為福特身邊的紅人,他由白宮辦公廳主任晉升為國防部長。2001年,他再次擔任了布什政府的國防部長,可謂政壇“不倒翁”。“9·11”之后,以反恐戰(zhàn)爭為名,拉姆斯菲爾德又支持布什總統大幅收緊了信息公開的力度,再次成為反對信息自由的中堅人物。2006年,他也退出了歷史舞臺。當然,他并沒有忘記自己的年輕歲月和歷史成就。2010年,這位80歲的老人,還在自己的微博上喃喃自語:1966年,我也是《信息自由法》的共同發(fā)起人。\h\h13\h拉姆斯菲爾德、福特、約翰遜和莫耶斯,他們都是受過良好教育的社會精英,面對同一部《信息自由法》,盡管心知肚明這是歷史的進步,但行為態(tài)度為什么出爾反爾、前后矛盾呢?沿著近現代政治學家、經濟學家、心理學家所做的研究和探索,我們其實不難找到一個邏輯鏈條非常清楚的答案。18世紀,英國著名的政治學家埃德蒙·伯克曾經一針見血地指出:“所有的政府,都是建立在妥協和交換的基礎之上?!彼J為,政治的行為,在本質上,是一種妥協和交換。人類政府的歷史,其實是一部各種利益不斷妥協與交換的歷史,也只有在不斷的妥協與交換中,各種利益才可能獲得相對的平衡。他繼而指出,其實“人類所有的收益和快樂、所有的美德、所有明智的行為”,無一不是妥協和交換。對于這種妥協,美國的總統們并不忌諱。艾森豪威爾就曾經坦言說:“一提到中間路線,人們就認為這是不可以接受的。事實上,人類所有的問題,除了道德,都處在中間的灰色地帶。事情并不是非黑即白。我們總是要妥協的。馬路的中間才是全部可以使用的區(qū)域,最左邊和最右邊,都是溝渠等危險地帶?!盶h\h14\h馬斯洛的需求層次金字塔個人對“道德和真理”的追求只是其“自我實現”需求中的一小部分,很難在人的決策行為當中起到主導作用。約翰遜在談到他作為總統的體會時,也曾親口承認:“我是一個妥協者和機動者,我這樣爭取做成一些事情,我們的體系正是這樣運行的?!盶h\h15\h那么,為什么必須妥協?其背后交換的原則又是什么?幾乎和伯克同時,經濟學的鼻祖亞當·斯密在其經典著作《國富論》中提出了“理性經濟人”的假設。他主張,人都是利己的,在面臨兩種以上選擇時,總會選擇對自己更有利的方案,爭取最大的經濟利益。1943年,美國心理學家馬斯洛提出了人類的需求層次理論,對人類如何做出妥協和交換作出了更細致的解釋。馬斯洛把人類的需求劃分為生理、安全、社交、尊重和自我實現五大類,這五大類需求如階梯一樣從低到高展開,低層次的需求相對滿足了,更高層次的需求就會成為個人行為的主導。在人生的不同階段和境況,會有不同的“主導需求”。最高層次的需求,是“自我實現”。所謂的“自我實現”,又分為“名利、成就、道德、真理”等等,其中,個人對名利和成就的追求又占了主導。一切的妥協和交換,都是圍繞個人的“主導需求”發(fā)生的。但恰恰在所有能成為“主導需求”的因素當中,道德是最為薄弱的,很難成為一個人行為的“主導”。福特、約翰遜、莫耶斯和拉姆斯菲爾德的變化,就是因為人的位置變了,即使內心的道德判斷還是一樣,但利益結構變了,主導需求也變了,所以行為和選擇也就變了。人,絕不是天使。任何人的歷史,都是一部道德、理性與私欲的斗爭史;這種斗爭,此起彼伏,至死方休。精英也好,領袖也罷,其實都是凡人,很多時候,都無法戰(zhàn)勝自己的私心和欲望,需要外力的制約和推動。約翰遜、福特就是典型的例子。即使明知信息自由是歷史的進步,也拒絕簽署。但我們看到,雖然貴為總統,他們在信息自由的大潮面前,也沒能成為阻擋歷史進步的決定性因素。在外力的制約下,他們被迫妥協。這個外力,就是分權和制衡的制度。政府VS.社會:舊劇情重現新時代歷史的教訓很少被演員們自己吸取。\h\h16\h——詹姆斯·加菲爾德,第20任美國總統摩斯說的沒錯:他們那代人所做的,只是一個開始。1946年,聯邦政府擁有了第一臺電子計算機。其后,計算機的數量不斷增加。1955年,當摩斯第一次提出《信息自由法》草案時,聯邦政府擁有45臺計算機;1972年,當國會著手修訂《信息自由法》時,聯邦政府的計算機已經增加到6000多臺。但對于存儲在計算機內部的數據信息是否屬于公開的范圍,1966年的《信息自由法》及1974年通過的修正案,都只字未提。隨著計算機的不斷普及,法律和現實之間的脫節(jié)越來越明顯,真空越來越大。聯邦政府和社會各界之間開始出現了司法爭議。1976年,一家名叫SDCDevelopmentCorporations的公司(以下簡稱SDC)要求美國衛(wèi)生、教育和福利部(DepartmentofHealth,EducationandWelfare)公開《醫(yī)療文獻索引系統》中保存的全部數據,遭到了該部的拒絕。SDC根據《信息自由法》將美國衛(wèi)生、教育和福利部告上了聯邦地區(qū)法院;一審敗訴后,SDC又上訴到巡回法院,第九巡回法院最后認定該電子數據不屬于公開的范圍,SDC最終以敗訴收場。\h\h17\h除了公司之外,挑戰(zhàn)者也不乏普通的個人。1984年,一位叫Dismukes的普通公民向內務部查詢全國油田、天然氣的出租名單,內務部以微縮膠卷的形式提供了名單,但Dismukes堅持索要數據庫格式的電子文檔,內務部認為沒有這個義務,拒絕提供。Dismukes也將內務部告上了法院,聯邦地區(qū)法院最后認定:《信息自由法》沒有規(guī)定信息提供的格式,內務部履行了義務,Dismukes敗訴。\h\h18\h當然,也有個別的幸運者,在賠上了足夠的財力和時間之后,如愿以償??伎怂箞髽I(yè)(CoxNewspapers)要求聯邦政府總務局(GSA)公開政府擁有的非軍用飛行器的總數、機型等明細,該局提供了上千頁的打印信息,考克斯報業(yè)堅持索要電子版的數據,最后也將總務局告上了法庭。一番糾纏之后,雙方在庭內達成和解,總務局最終向考克斯提供了電子版的數據。類似的官司頻頻出現。1985年,國會對于政府機關是否應該公開電子數據召開了第一次聽證會。聽證會的結論是:由于無法可依,行政機關對于其電子數據的控制,近乎壟斷。但即便事實清楚、道理淺顯,國會也無法立刻除舊布新。又是一番兜兜轉轉,終于在1991年11月,民主黨參議員帕利希(PatrickLeahy)提出了《電子信息自由法》,要求聯邦政府將存儲在計算機內的數據信息與資料柜中的文件一視同仁,納入公開的范圍。長江后浪推前浪,世上新人換舊人。1990年代,約翰遜已經作古,摩斯已經退休,拉姆斯菲爾德也離開了白宮,但隨后發(fā)生的事情卻驚人的相似:就像50年代全部的聯邦政府機構反對《信息自由法》一樣,絕大部分的聯邦機構對《電子信息自由法》表示了強烈的反對,一致聲稱如果將信息自由擴大到電子數據,信息查詢的要求和費用都將大幅攀升,行政部門將無法承受。還有機構提出,他們沒有義務去改造自己的信息系統,來滿足公眾的查詢要求。歷史的進步總是一波三折。又經過5年的聽證和談判,1996年,美國國會通過了《電子信息自由法》\h\h19\h。該法規(guī)定,所有政府數據庫的電子記錄都屬于信息公開的范圍,行政部門必須按照信息查詢方要求的格式提供信息。此外,該法還建議聯邦政府將公民經常查詢的信息發(fā)布在互聯網上,以減少公民重復查詢產生的負擔。2007年,美國國會又通過了《開放政府法》(OpenGovernmentActof2007),明確了聯邦政府信息公開的范圍:不僅僅是其本身收集的信息,還包括政府委托私營機構、非營利組織收集的信息。該法還規(guī)定,如果行政部門不能在法定的時間內提供信息,則不能收取費用;司法部作為聯邦政府各部門落實《信息自由法》的監(jiān)督機關,其部長必須每年向國會報告有多少信息公開的要求被拒絕,并說明拒絕的原因。從1955年摩斯著手信息自由的立法工作以來,經過了半個多世紀,一系列的法律層層疊加、不斷完善,美國的信息自由最終形成了一個體系。這個體系,規(guī)定得很細致,考慮得也比較周全。例如,它甚至注意到了信息的可分割性,它規(guī)定:一份文件需要保密,并不是其中所有的信息都需要保密,凡是可以從保密信息中抽離出來的非保密信息,都應提供給查閱信息的普通公民。此外,即使是居住在美國的外國人,也可以像美國公民一樣向政府查閱、索要相關的文件和信息。這個體系,也成了世界上許多國家制定《信息自由法》的模板。截至2006年,全世界已經有60多個國家制定、實施了類似的《信息自由法》。本書還將在后續(xù)章節(jié),陸續(xù)介紹更多關于公民或組織向聯邦政府提請信息公開的故事和案例。第二章數據帝國的興起數據正在呈指數級增長。之所以增長速度如此之快,背后有許多原因?,F在幾乎所有數據的產生形式,都是數字化的。各種傳感器的劇增,高清晰度的圖像和視頻,都是數據爆炸的原因。如何收集、管理和分析數據正在日漸成為我們網絡信息技術研究的重中之重。以機器學習\h\h01\h、數據挖掘為基礎的高級數據分析技術,將促進從數據到知識的轉化、從知識到行動的跨越。聯邦政府的每一個機構和部門,都需要制定一個應對“大數據”(BigData)的戰(zhàn)略。\h\h02\h——《規(guī)劃數字化的未來:美國總統科學技術顧問委員會給總統和國會的報告》2010年如果說《信息自由法》在法律的層面上規(guī)定了政府機關的文件可以公開,其后的《陽光政府法》規(guī)定政府機關的會議必須公開,《電子信息自由法》又規(guī)定了計算機內的數據也不能例外,那么奧巴馬繼續(xù)開拓的空間似乎已經不大了。他所謂的“要建設一個前所未有的開放政府”,究竟指的是什么呢?奧巴馬是哈佛大學法學院的高才生,他在就讀期間,就擔任了久負盛名的《哈佛法律評論》的主編;博士畢業(yè)之后,曾在律師行從業(yè)多年,還長期在哥倫比亞大學講授《憲法學》。嚴謹的科班訓練加上律師實務生涯,他的邏輯思維是非常嚴密的。他用“前所未有”(unprecedented)來形容他將要開創(chuàng)的事業(yè),是因為,他清楚地知道:透明無止盡。對政府而言,只有更透明,沒有最透明。雖然聯邦政府的文件、會議甚至數據都規(guī)定了可以公開,但近年來信息技術突飛猛進的發(fā)展,特別是互聯網的興起,不僅給信息公開的內容、也給公開的方式帶來了新的機遇和挑戰(zhàn)。這是個技術奔騰、信息爆炸的時代。奧巴馬領導的聯邦政府,正是美國社會的信息中樞。他的雄心,有廣袤的用武空間。摩爾定律:全世界半個世紀的發(fā)展規(guī)律摩爾定律已經成為工業(yè)界一切呈指數型增長事物的代名詞?!乱粋€十年,摩爾定律可能還將有效……可以肯定的是,創(chuàng)新無止境。\h\h03\h——戈登·摩爾,英特爾公司創(chuàng)始人,2003年聯邦政府是美國最大的雇主,共雇用了約200萬名工作人員。\h\h04\h聯邦政府主要由三大塊組成:一是總統行政辦公室(TheExecutiveOfficeofthePresident),二是15個內閣部門(CabinetDepartment),三是70多個獨立的聯邦機構(IndependentAgency)。總統行政辦公室的結構總統行政辦公室是直接為總統服務的中樞部門。其下轄白宮辦公廳(TheWhiteHouseOffice)、行政管理預算局(OMB)、經濟顧問委員會(CouncilofEconomicAdvisers)、科學技術顧問委員會(PCAST)等機構。其中,最重要、最大的機構當屬白宮辦公廳和行政管理預算局,它們控制了信息、掌握了財權,是15個內閣部門和70多個獨立機構的管理和協調單位,可謂中樞中的中樞。鑒于這兩個機構的重要性,本書將會多次提及。作為全美最龐大的組織和機構,聯邦政府也一直號稱他們是美國最大的信息生產、收集、使用和發(fā)布的單位。\h\h05\h數據和信息的區(qū)別很多情況下,“數據”和“信息”兩個詞經常替換使用。但嚴格地說,數據和信息這兩個概念有很大的區(qū)別:數據是對信息數字化的記錄,其本身并無意義;信息是指把數據放置到一定的背景下,對數字進行解釋、賦予意義。例如:“1.85”是個數據,“奧巴馬身高1.85米”則是一則信息。但進入信息時代之后,人們趨向把所有存儲在計算機上的信息,無論是數字還是音樂、視頻,都統稱為數據。如果要考察信息的多少,就必須以物理存儲器上保存的數據量作為度量。因為所有的信息,都是以數據的形式保存在物理存儲器上的。由于人類的數據量不斷增多,近幾十年來,科學家也相應定義了一些新的名詞,來表示新的存儲單位,以方便對客觀世界的描述。美國聯邦政府到底收集了多少數據,其總量無從得知,但我們可以從現有的一些研究資料中窺見一斑。理解數據的存儲單位(部分例子參照了Alltoomuch,TheEconomist,2010年2月25日)2009年美國各行業(yè)數據存儲量對比(數據來源:InternationalDataCorporation)2011年5月,麥肯錫公司下屬的全球研究所(McKinseyGlobalInstitute)出版了一份專門的研究報告《大數據:下一個創(chuàng)新、競爭和生產率的前沿》。\h\h06\h該報告對美國政府目前擁有的數據量進行了估算,在制造業(yè)、新聞業(yè)、銀行業(yè)、零售業(yè)等17個行業(yè)當中,美國政府共擁有848拍字節(jié)(Petabyte)的數據總量,僅次于離散式制造業(yè)\h\h07\h的966拍,居第二位;居第三位的是新聞傳媒業(yè),共有715拍字節(jié)。這是美國政府作為一個行業(yè)的總體情況,下面我們來考察聯邦政府中具體的單個組織。以商務部下屬的美國普查局(USCB)為例,它目前擁有2560太字節(jié)(Terabyte)的數據。“太”,代表2的40次方,它的大小,已經大大超出了人類的直接感知能力,只能通過形象的比喻來描述:如果把這些數據全部打印出來,用4個門的文件柜來裝,需要5000萬個才能裝得下。沃爾瑪是世界上最大的零售王國,它每小時要處理100多萬筆電子交易記錄,可謂每分每秒都在源源不斷地生產數據;2010年,其數據庫大小為2500太字節(jié)左右,還沒有趕上美國普查局。除了美國普查局,國家安全局(NSA)和中央情報局(CIA)都擁有超級巨大的數據庫。2011年5月,歷經十年,美國人終于在巴基斯坦將本·拉登擊斃,報了“9·11”的一箭之仇。帕拉契尼(JohnParachini)是蘭德(Rand)公司情報政策研究中心的主任,他在接受《巴爾的摩太陽報》的采訪時介紹說,國家安全局是從電話監(jiān)控的記錄當中發(fā)現了本·拉登的蛛絲馬跡。\h\h08\h該局對全美的電話進行監(jiān)控,所收集的數據量是驚人的,它每6小時產生的數據量就相當于美國國會圖書館所有印刷體藏書的信息總量。而美國國會圖書館,是世界上館藏量最大的圖書館。再說中情局,其本職工作就是收集情報信息。業(yè)內專家普遍認為,其數據庫比普查局、國安局的還要大,很可能擁有全世界最大的數據庫。普查局、國安局、中情局只是聯邦政府數百個機構當中的幾個例子,還有財政部、衛(wèi)生部、勞工部,這些都是數據密集型的行政管理部門。即以財政部為例,根據行政管理預算局的信息收集年度報告,2009年,財政部因為收集信息產生的社會負擔為76億小時,占全部聯邦政府收集信息社會負擔總數的78%,\h\h09\h之所以如此,是因為收稅和退稅的過程極為繁瑣,但76億小時收集工作會產生多少數據量,其大小也難以想象。再換一個角度,我們來看看這個聯邦政府的硬件資產。1998年,聯邦政府共擁有432所數據中心,專門負責各類數據的存儲和維護工作。2010年,數據中心的總數躍升到2094所,翻了幾倍。龐大的數據資產,是需要經費來支持的。1996年,聯邦政府的年度IT預算是180億美元,十多年來不斷地上升,2010年,已經高達784億美元;由于連年巨額的投資,聯邦政府已經聲稱,他們是全世界范圍之內最大的信息技術消費者。而據報道,這些投資中的一半以上,都用在了購買存儲數據的硬件設備上。這是一個不折不扣的數據帝國。帝國形成的原因,已經有很好的解釋,這就是摩爾定律(Moore'sLaw)。1965年,英特爾(Intel)的創(chuàng)始人之一戈登·摩爾(GordonMoore)考察了計算機硬件的發(fā)展規(guī)律,提出了著名的摩爾定律。該定律認為,同一個面積集成電路上可容納的晶體管數目,一到兩年將增加一倍,\h\h10\h也就是說,其性能將提升一倍。換句話說,計算機硬件的處理速度和存儲能力,一到兩年將提升一倍。1971年至2011年不同中央處理器上的晶體管數量和摩爾定律說明:縱坐標為晶體管數量,橫坐標為年份。圖中圓點表示不同品牌的中央處理器。該曲線表明,從1971年至2011年,大概每兩年同一面積大小中央處理器集成電路上的晶體管就增加了一倍。(圖表來源:維基百科)回顧這近半個世紀的歷史,硬件技術的發(fā)展,基本符合摩爾定律。摩爾定律的一個重要結果,是推動了全世界對物理存儲器的消費;其消費量增加的速度,有學者認為,甚至比摩爾總結的硬件發(fā)展速度還要快,從1990年代起,全世界的物理存儲器,每9個月就增加一倍。\h\h11\h戈登·摩爾出生于1929年,至今健在,他于1956獲得加州理工學院的博士,1968年成為英特爾的創(chuàng)始人之一,也是摩爾定律的首創(chuàng)人。(圖片來源:英特爾公司網頁)其中的原因,是因為物理存儲器的性能不斷提高,同時價格還不斷下降。1955年,IBM推出了第一款商用硬盤存儲器,每兆字節(jié)的存儲量需要6000多美元。此后,硬盤存儲器的價格以越來越大的加速度下降。1993年,購買1兆字節(jié)的存儲量只需大概1美元;2010年,這個價格下降到不足1美分。多數專家都相信,計算機硬件的技術將持續(xù)發(fā)展,價格還將下跌,直到2020年,摩爾定律還將仍然有效。計算機硬件這種令人“瞠目結舌”的發(fā)展速度,使全世界的數據處理和存儲不僅越來越快、越來越方便,還越來越便宜,海量數據的積累最終成為可能。但像盛水的杯子一樣,存儲器畢竟只是容器。關鍵的問題在于,帝國的數據從何而來?海量數據的源頭在哪里?美國聯邦政府的數據來源,當然首先緣于它各個部門的業(yè)務工作,也就是業(yè)務數據。作為社會管理和公共服務的提供部門,收集數據、使用數據,是自古以來全世界的政府都在普遍采用的做法。但政府開始大規(guī)模、系統地收集數據,其歷史并不久遠。在美國聯邦政府的發(fā)展歷史上,業(yè)務數據的收集,有一個重要的里程碑,這就是“最小數據集”。最小數據集:上升到立法高度的開路先鋒一個好的數據結構和一個糟糕的代碼,比一個糟糕的數據結構和好的代碼要強多了。\h\h12\h——埃里克·雷蒙美國軟件開源運動的領導者,1999年最小數據集的概念起源于美國的醫(yī)療領域。1973年,在國家生命健康統計委員會(NCVHS)的主導下,為了規(guī)范出院病人的信息收集工作,美國第一次制定了統一的出院病人最小數據集,既然是出院,核心的環(huán)節(jié)就是付錢,所以這些數據不久后又被用于創(chuàng)建統一的醫(yī)療賬單(UniformBill,UB)。1975年,美國醫(yī)院協會(AHA)成立了國家統一賬單委員會。經過了幾年的討論,1982年,該委員會出臺了UB-82的數據格式,統一了全國的醫(yī)療賬單格式。1992年,UB-82又被修改升級到UB-92,并被擴大應用到了醫(yī)療保險和索賠的領域。由于其實用性,最小數據集的概念在醫(yī)療領域被迅速推廣。近幾十年以來,幾乎每年都有新的最小數據集被定義、開發(fā)和推廣。目前,已經被應用到眼科、牙科、皮膚科、婦科以及體檢、護理、急救、住院等醫(yī)療服務的方方面面,衍生出各種各樣的、特定的最小數據集。隨著時間的推移,“最小數據集”在美國已經演變成了一個一般性的概念,它指代國家的管理層面針對某個業(yè)務管理領域強制收集的數據指標。不少領域的“最小數據集”甚至被上升到立法的高度。例如,對于養(yǎng)老院的管理,美國國會就規(guī)定,每個養(yǎng)老院都必須提交一系列關于老人健康指標的最小數據集給州政府的醫(yī)療管理部門,該部門匯總之后,再提交聯邦政府的管理部門。當然,何為“最小”,政府的管理者、決策者和公共服務的提供方、接受方都有不同的需求和看法,很難達成一致。某一特定的數據指標是否應該納入,不同的立場、視角、環(huán)境和管理水平都會導致不同的意見。而且,各個最小數據集本身可能是完整的、有效的,但當各行各業(yè)的最小數據集越來越多之后,從全局出發(fā),它卻不一定是合理的,因為可能存在更好的劃分方法,使各個最小數據集之間具有更明確的邊界和更少的重疊。最小數據集(MinimumDataSet,MDS)最小數據集是指通過收集最少的數據,最好地掌握一個研究對象所具有的特點或一件事情、一份工作所處的狀態(tài),其核心是針對被觀察的對象建立一套精簡實用的數據指標。因此,每一個“最小數據集”的出臺,都意味著多年的紛爭和詳盡的論證。最小數據集的出現,最早是因為不同組織之間信息交換的需要,例如,兩個醫(yī)院之間,醫(yī)院和政府醫(yī)療管理部門,醫(yī)院和保險公司之間以及一些社會福利部門之間,都有交換信息的需要。隨著最小數據集的推廣,越來越多的社會組織、地方政府和聯邦政府的業(yè)務部門之間都建立了標準的“數據接口”,從此彼此“數據”相連。但到了1980年代,一場新的技術浪潮又把最小數據集的應用推上了新的高點。這就是信息管理系統的興起。1975年,比爾·蓋茨創(chuàng)辦了微軟。次年,史蒂夫·喬布斯成立了蘋果電腦公司。之后,個人電腦、商業(yè)軟件開始得到大面積普及,開發(fā)新的信息管理系統開始成為各行各業(yè)邁向信息化的主要措施。所謂的“信息管理系統”,也就是實現某一特定業(yè)務管理功能的軟件。軟件的構成,主要有兩部分,一是程序(也可稱為代碼),二是數據(或稱為數據庫)。程序和數據的關系,就好像發(fā)動機和燃料,所有的程序,都是靠數據驅動的;數據之于程序,又好比血液之于人體,一旦血液停止流動,人就失去了生命,代碼也將停止運行。數據的生命力,甚至比程序更持久。程序可以不停地升級、換代甚至退出使用,但保存數據的數據庫卻會繼續(xù)存在,其價值很可能與日俱增、歷久彌新。世界萬維網之父蒂姆·伯納斯-李,曾經在2006年這樣論述說:“數據是寶貴的,它的生命力,比收集它的軟件系統還要持久?!盶h\h13\h對于軟件開發(fā)而言,數據庫的設計甚至比程序的設計還要重要。埃里克·雷蒙,是美國軟件開源運動的領袖,他在談到代碼和數據時曾表示:“一個好的數據結構和一個糟糕的代碼,比一個糟糕的數據結構和好的代碼要強多了。”最小數據集,其實就是一個業(yè)務管理過程當中最重要的數據指標。它在各個公共領域的定義和推廣,成了這些部門在開發(fā)設計信息管理系統時最重要的一個參考,因為一旦核心的數據收集指標被確定,數據庫的結構設計就成為一個水到渠成的過程。有些最小數據集,甚至直接就被引用,成為信息管理系統的數據結構。就好像開路先鋒,最小數據集為信息管理系統的開發(fā)和設計起了重要的鋪墊作用。1970年代以來,隨著計算機的普及,美國產生了越來越多的最小數據集,各種信息管理系統也開始大幅增加。截至2011年,美國的聯邦政府已經擁有1萬多個獨立的信息管理系統。\h\h14\h幾乎每一項業(yè)務,每一個新的立法、新的計劃,都會有一個數據庫和信息管理系統與之對應。因為,沒有任何一項工作,不涉及收集信息,而這些都離不開數據。如今,聯邦政府可謂事無巨細,都有一個信息系統在管理,其背后的數據庫可謂五花八門,多不勝舉。例如,美國現在債臺高筑、不斷沖擊上限,聯邦政府甚至一度產生財務危機,奧巴馬也為此頭痛不已。聯邦政府財政部下屬的公共債務局(BPD)是國家債務的主管部門,要追蹤這樣一筆龐大國債的來龍去脈,該局自然擁有不少信息管理系統,其中,有一個是專門用來記錄“捐款”的。“欠債”和“捐款”,聽起來似乎風馬牛不相及。但在美國,兩者還是拉上了關系,這是因為有些美國人試圖通過自己的捐助來緩解國家的財政負擔。公共債務局就為此專門建了一個信息系統,來記錄美國公民為減少國債作出的個人捐贈。數據表明,2010財政年度,該局共收到2840466.75美元的捐款,2009年的捐款曾突破300萬元,為3063057.05美元。捐款數量的下降,表明了人們的可支配收入在減少,也從另外一個側面證明了美國經濟確實在衰退。歷史上最大的一筆個人捐贈來自于2006年,一位俄亥俄州的老人在去世之后將自己價值110萬美元的財產捐贈給了聯邦政府公共債務局。當然,這些捐款,對于美國14.6萬億的債務來說,只是杯水車薪。但系統的管理,不僅筆筆在案、賬目清晰,便于統計分析,也體現了對捐贈者的尊重。民意幾時有:選票催生的創(chuàng)新我想要成就的事情,就是我的人民想要做的事情;我的任務,就是要準確地發(fā)現人民的需要。\h\h15\h——亞伯拉罕·林肯,第16任美國總統一般來說,業(yè)務數據都由下級部門和各類社會組織通過“數據接口”上報給聯邦政府。但作為一個中央政府,只接受數據是遠遠不夠的,聯邦政府也需要走出去,主動收集數據,了解全社會對某項政策的評價、單個公民對某個問題的看法,這就是所謂的民意調查、社會調查。民意調查(PublicOpinionPoll)民意調查是指通過對一小群、有代表性人口的調查和訪談,預測社會全體公眾對一些政治、經濟和社會問題的態(tài)度和看法。其本質是“觀一斑而知全豹”、“觀一葉而知秋”。美國的各種調查(Survey)之多,可謂鋪天蓋地,這些調查的直接目的,就是收集、掌握、分析反映民意和社情的第一手數據。1948年,喬治·蓋洛普登上《時代》雜志的封面。這一年,杜威和杜魯門競選總統,蓋洛普預測杜威將勝出。開票結果出來的當晚,《紐約時報》、《生活》、《芝加哥論壇報》等報刊都印刷好了杜威的照片,并題為“美國新總統”,但最終杜魯門勝出。這次預測失敗,又引起了人們對民意調查的質疑。蓋洛普總結原因說:因為兩人的民調一直相差太大,他們在大選前3周就提前結束了調查。此后,蓋洛普持續(xù)改進調查的方法,最終在美國乃至在全世界都贏得了巨大的聲譽?,F在,蓋洛普的品牌已經成為民意調查的代名詞。美國的民意調查最早源于對總統大選投票結果的預測。1824年,位于賓夕法尼亞州的一家報紙HarrisburgPennsylvanian第一次發(fā)布了關于誰能當選總統的預測。雖然其預測最后被證明是錯誤的,但卻被大眾一再津津樂道。此后,各大報紙雜志都不想錯過這個“搶眼球、聚人氣”的話題,爭相開展民意調查,以期準確地預測到底誰能當選總統,這開啟了民意調查的時代。蜂擁而上的結果,就是競爭。競爭的結果,就是民意調查的科學性不斷提高,范圍不斷擴大;在20世紀30年代的美國,最終形成了一個社會調查的產業(yè)。其中的轉折點,是1936年。這一年,第32任美國總統富蘭克林·羅斯福為了爭取連任,與共和黨的蘭登(AlfredLandon)對壘,打響了選戰(zhàn)。這時候,一本叫做《文學文摘》(LiteraryDigest)的雜志風頭正勁?!段膶W文摘》成立于1890年,其暢銷的主要原因,是因為它準確地預測了1920、1924、1928、1932年等4屆總統大選的結果,隨著該雜志銷售量的年年攀升,民意調查的熱度和可信度也不斷上升。1936年,《文學文摘》在對240萬普通公眾進行了調查之后,把“寶”壓在了蘭登的身上。這個時候,一家剛剛成立不久的研究所,只對5000人進行了調查,卻宣布羅斯福會勝出。這家研究所就是1935年成立的美國輿論研究所(AIPO),它的奠基人,是美國民意調查科學化的先驅:喬治·蓋洛普(GeorgeGallup)。羅斯福最終以大比分擊敗蘭登,成功連任;蓋洛普也取代了《文學文摘》,成了新的行業(yè)領袖。這一仗,成了《文學文摘》的“滑鐵盧”,該雜志次年就宣布破產、退出市場。5000人的問卷擊敗了240萬人的調查,蓋洛普領導的美國輿論研究所當然隨之身價倍增、名揚全國。蓋洛普的成功,根本原因在于他掌握了一套科學的人群抽樣方法,而不是盲目的大面積訪談。此后,一大批新的、專業(yè)化的民意調查機構應運而生,調查方法的科學性不斷增強。從1936年到2008年,共舉行了18次總統選舉,蓋洛普民調(Gallup)成功地預測了16次。\h\h16\h報紙舉辦民意調查,其目的是為了一“鳴”驚人,制造新聞效應,擴大報紙的聲譽和銷量。但對總統候選人來說,他們也要參考民意調查的結果,因為他們對民意的掌握,往往關系到選舉的最終成敗。這是因為,在民主社會,誰上誰下,人民的選票有最終的話語權。票多,則勝。作為候選人,爭取選票的唯一方法就是爭取民意。要爭取民意,首先就要了解民意?,F代政治學中,有一個“中間選民理論”很好地解釋了其中的奧秘。中間選民理論(MedianVoterTheory)該理論也是在1940年代提出的。在選舉中,所有的選民都有自己的個人偏好,這個偏好對應于平面坐標上的一點,全部選民的偏好將呈正態(tài)分布,也就是一個鐘形曲線,這個曲線就是民意分布圖。每個選民最終都會把自己的選票投給與自己意見最接近的候選人。在多個候選人競爭的情況下,候選人想要勝出,就要爭取最多的選票,他就必須找準民意最集中的地方,為最多的民眾說話,這一點,就是民意的“中值”。中間選民理論提出,民意有一個“中值”,而民意調查,正是幫助候選人找準民意“中值”的“阿拉丁神燈”。羅斯福雖然在當選總統前就半身癱瘓,長期坐在輪椅上,但后世卻常常把他和華盛頓、林肯相提并論,公認為美國歷史上最偉大的總統之一。作為唯一一位連任過4屆的總統,他深諳民意調查的作用和潛力。他不僅在競選中應用民意調查,1940年,他還正式將民意調查的方法引進到了聯邦政府的政策制定過程當中,成為美國歷史上第一位將民意調查和公共政策相結合的總統。這些成就,使他成為美國歷屆總統當中至今無人超越的“民意大師”。民意的“中值”和選票多少的關系說明:圖中的鐘形曲線即代表民意的分布,左邊淺色和右邊深色的區(qū)域面積大小,分別代表候選人A和候選人B可以預期得到的選票多少。M代表民意的中值點,候選人A和B,誰能確定M點,不斷向M點靠攏,誰就能獲得更多的選票。上圖表明:候選人A比候選人B更接近民意的中值,將獲得更多的選票。羅斯福之后,幾乎每一位美國總統,不論是競選還是執(zhí)政,都大規(guī)模地采用民意調查的方法。隨著計算機技術的不斷發(fā)展、統計分析水平的提高,民意調查逐漸成了聯邦政府了解社會、掌握民情最有效的工具和方法。調查的范圍也不斷擴大,從普通公民的觀點和看法,慢慢延伸到個人的行為、事實和社會現象,最后發(fā)展成了更廣泛意義上的社會調查。到今天,可以說,聯邦政府的各個職能部門都在開展社會調查。其中,有兩個機構堪稱聯邦政府社會調查的“航空母艦”,它們每年開展無數大大小小的社會調查,其他機構都望塵莫及。這兩艘“航空母艦”,一是勞工部下轄的勞工統計局(BLS),一是商務部下屬的普查局(BC)。富蘭克林·羅斯福(1882-1945)羅斯福從1921年起下半身全部癱瘓,但這位殘疾人卻在1933年至1945年連續(xù)4次當選總統,帶領美國人走過了第二次世界大戰(zhàn)的艱難時段。對于民意,他強調:不僅要掌握民意,還要領先民意一小步,才是民主政治中的勝選之道。(圖片來源:維基百科)勞工統計局對就業(yè)市場開展很多專業(yè)調查,其中最大的一種被稱為“國家縱向調查”(NationalLongitudinalSurvey)。所謂“縱向”,是指以時間軸為單位,在確定調查對象之后,對其進行長期的跟蹤、反復的問卷,收集大量的數據,然后進行統計分析。1966年,勞工統計局開展了美國歷史上第一個國家縱向調查。調查對象是全國的男性,分為青年和老年兩組,該局在全國范圍內鎖定了10245名男性,進行了長達24年的全方位跟蹤調查,直到部分老人撒手歸西為止。類似的國家縱向調查項目一共有4個。1997年最新鋪開的一個,調查對象是1980年至1984年出生的青少年,簡稱為NLSY97(NationalLongitudinalSurveyofYouth1997),該局在全國范圍內確定了約9000名青少年,每年都進行一次特定話題的跟蹤問卷調查,至今還沒有結束。以1997年的青少年縱向調查為例,它跟蹤調查的對象雖然是青少年本身,但受訪人、問卷人卻可以是家長、老師、雇主等等和該青少年密切相關的個人和群體,每次問卷都有數十個問題,需要受訪人1小時左右才能完成。因為付出了時間,受訪人在完成問卷之后,能獲得8到20美元不等的報酬。同樣的問題,也可能在不同的年份、在相同受訪人員的問卷中重復出現,以測試受訪人態(tài)度的變化。NLSY97雖然是由勞工統計局負責實施,但卻是一個綜合項目,涉及青少年生活的方方面面,該局邀請了多個政府部門參與問卷的設計。例如,青少年犯罪預防辦公室(OJJDP)隸屬于美國司法部,是青少年犯罪問題的國家主管部門,他們幫助勞工統計局設計了有關青少年犯罪方面的問卷。就青少年犯罪而言,問題可能包括輕度違法記錄、毒品濫用情況、酗酒情況、性行為、家庭成員的構成及背景、收入、教育、家庭關系、和父母的關系、青春期情況、約會情況、戀愛情況、生育情況、職業(yè)培訓情況、接受社會福利項目的援助情況、個人時間管理、生活目標的變化、學習成績、宗教活動、所住社區(qū)的人口特點、所在城市的經濟特點,等等。隨著數據的積累,一幅以個人成長為中心、越來越大的社會畫卷也開始展開。這種以一個國家為單位的大型社會調查,是研究一個社會長期變遷不可或缺的重要資源,也為政策的制定、調整和評價提供了重要的參考和依據。另一艘“航母”是普查局。和勞工統計局相比,它的社會調查名目更多、范圍更廣。除了負責十年一次的人口普查之外,該局每年還在全國范圍之內開展系統的行業(yè)調查,其中最著名的有:全國社區(qū)調查、全國消費者開支調查、全國醫(yī)院調查、全國建筑調查、全國房屋調查,等等。除了掌握民情、了解社會,問卷調查還是聯邦政府評估資金使用績效的主要工具。聯邦政府每年都要下撥大量的專項資金,資金的使用效果和好壞,往往是來年是否繼續(xù)撥款的決定性因素,聯邦政府目前最重要的衡量手段,也是社會調查。以衛(wèi)生部下屬的藥物濫用和精神健康管理局(SAMHSA)為例,每年,該局都有專項基金,用于社區(qū)的毒品防治工作,全國的基層政府、公益組織都可以申請。但這筆錢也很“燙手”,拿了之后,有大量的問卷調查工作要開展、要上報。社區(qū)的毒品防治工作主要是政策宣講和培訓。申領了專項資金的單位,就要開展培訓,每個參加培訓的人都要參加4次問卷調查,分別在培訓開始前一次、培訓中間一次、培訓結束時一次,三個月以后還有一次。這些問卷調查的數據,基本都是通過互聯網匯總上報。該局通過對比分析4次調查結果的具體指標,評估該單位的資金使用效果,再決定下期資金是否下撥。聯邦政府的這些調查,雖然目的不同、性質不同、方式不同,但最后產生的結果,無一例外,都同樣是數據。普適計算:計算機本身將從人們的視線中消失最高深的技術是那些令人無法覺察的技術,這些技術不停地把它們自己編織進日常生活,直到你無從發(fā)現為止。\h\h17\h——馬克·韋澤,普適計算之父,1991年1988年,互聯網的概念剛剛興起。這種新的信息共享方式,令全世界都興奮不已。當時,絕大部分科學家,都還在品味和研究網絡帶來的巨大便利,沉浸在欣喜當中。這時候,美國施樂公司(Xerox)的一名計算機科學家,卻開創(chuàng)性地提出了“普適計算”(UbiquitousComputing)的理論,為網絡在人類未來生活中的作用以及計算方式的改變作出了前瞻性的預測。他就是馬克·韋澤(MarkWeiser)。韋澤是密歇根大學畢業(yè)的計算機博士,青年時代就表現出杰出的天才。他畢業(yè)之后,曾經在馬里蘭大學任教8年,其后加入了施樂公司的帕羅奧多研究中心(PARC)。帕羅奧多研究中心是全世界著名的創(chuàng)新中心,鼠標、激光打印機、以太網、語音壓縮技術等等偉大的發(fā)明都在這里誕生。韋澤領導了帕羅奧多研究中心計算機科學實驗室的發(fā)展,1996年又擔任了該中心的首席技術官。韋澤認為,自從計算機發(fā)明以后,人類的計算方式,先后經歷了兩個階段:一是主機型計算階段(MainframeComputing),指的是很多人共享一臺大型機;二是個人型計算階段(PersonalComputing),指的是每一個人都可以擁有一臺電腦。韋澤預測,由于網絡技術的興起,特別是無線網絡技術的發(fā)展,計算機本身將從人們的視線中消失,計算將最終和環(huán)境融為一體。人們能夠在任何時間和任何地點獲取、處理信息,這就是普適計算的階段,人類正在向這第三波計算浪潮邁進。普適計算通過在日常環(huán)境中廣泛部署微小的計算設備,人們能夠在任何時間和任何地點獲取并處理信息,計算將最終和環(huán)境融為一體。這就是普適計算,是人類的第三波計算浪潮。一句話:萬事萬物,凡存在,皆聯網,凡聯網,皆計算。馬克·韋澤(1952-1999)曾為帕羅奧多研究中心首席技術官,被稱為普適計算之父。韋澤還是一名搖滾樂隊的鼓手,在他的策劃下,其樂隊在1993年實現了美國互聯網歷史上的首次現場直播。他因此得名“搖滾樂隊當中最聰明的鼓手”。(圖片來源:維基百科)實現普適計算的根本,是在人類生活的物理環(huán)境當中廣泛部署微小的計算設備。無處不在的微小計算設備和無處不在的互聯網相結合,實現無處不在的信息自動采集、傳遞和計算。這種微小的計算設備,就是傳感器。近年來流行的物聯網概念就是普適計算的最佳例子。對于傳感器及其網絡的最早研究,始于美國國防部一個軍事項目的研究,后來技術日臻成熟,傳感器的應用逐漸從軍事領域擴大到民用領域。這可以追溯到20世紀60年代。1962年,一場代號為“圣灰星期三”(AshWednesday)的風暴席卷了美國東海岸600多英里的海岸線,這場風暴持續(xù)了3天,影響了全美6個州,最后造成了40人死亡、1000多人受傷,導致了幾億美元的經濟損失,被后人評為20世紀美國最嚴重的十大風暴之一。由于損失慘重,美國國會對救災防災工作召開了專門的聽證會,最后促成了軍民聯手的“海浪監(jiān)測計劃”:美國陸軍工程部和美國國家海洋與大氣管理局(NOAA)共同建設一個傳感器監(jiān)測系統,對興風作浪的海洋進行監(jiān)測。這項計劃的實施結果,是在全美海岸線和五大湖區(qū)建立了一個定點的、連續(xù)的、實時的傳感器網絡,對海浪的大小進行監(jiān)控。受限于當時的技術,最早的傳感器只能監(jiān)測海浪的能量。從2005年起,美國國家海洋與大氣管理局在浮標上裝備了更高端的傳感器,開始監(jiān)測海浪的方向。2009年,系統再次升級。該局開始著手建立一個覆蓋全美海岸線、從淺水到深水的、精確的海浪監(jiān)測網絡。這個網絡總共在近海、外大陸架、內大陸架和沿海設置了296個傳感器。新的傳感器不僅能監(jiān)測海浪的能量和方向,還能計算它的傳播速度、偏度和峰度。\h\h18\h這些傳感器以分秒為單位,將數據源源不斷地實時傳回到國家海洋數據中心(DODC)。對海浪的監(jiān)測,不僅能提高沿海地區(qū)對海嘯、風暴等自然災害的應急能力,還能極大地改善海上的交通安全。根據美國疾病防控中心(CDC)的統計,捕魚業(yè)是美國最危險的職業(yè)之一,全美所有行業(yè)的平均致死率為0.004%,而捕魚業(yè)的平均致死率高達0.155%,其中79%的死亡是天氣變化的原因導致的。\h\h19\h除了安全,海浪的監(jiān)測還能為利用大海能量進行發(fā)電提供關鍵的分析型數據。海浪監(jiān)測只是聯邦政府利用傳感器網絡自動采集數據、邁向普適計算的一個例子。事實上,由于無線傳感器的快速發(fā)展,普適計算已經在美國的農業(yè)、運輸、能源和建筑等領域逐步鋪開。2011年10月,聯邦政府商務部下屬的國家氣象局(NWS)宣布,該局已經在全國2000輛客運大巴上裝備了傳感器,隨著巴士的移動,這些傳感器可以收集沿途所有地點的溫度、濕度、露水、光照度等數據,并立刻傳回國家氣象局的數據中心。數據采集是每10秒鐘一次,每天傳感器要采集10萬次以上的數據。這些數據是實時的、高精度的,這意味著,天氣預報將不再僅僅是“預”報,將逐漸走向“實”報、“精”報。此外,聯邦政府國家郵政局(USPS)也宣布,他們正規(guī)劃在全部郵車上安裝傳感器,在郵車投遞郵件的同時,實時采集社區(qū)的空氣質量、污染指數和噪聲等數據指標。有評論家感嘆道:誰也沒想到,汽車,這個工業(yè)時代的標志和先鋒,如今又成為信息時代普適計算的“排頭兵”。近年來,傳感器的發(fā)展可謂突飛猛進。一種新的無線傳感器:射頻識別標簽(RadioFrequencyIdentification,RFID),正異軍突起,也在美國聯邦政府得到了大規(guī)模的應用。薄如紙張的RFIDRFID動物耳標更小更薄的RFID(圖片來源:網絡)RFID精巧輕便,既可以薄如紙張,也可以小如豆粒,卻能無線存儲、發(fā)送、讀寫數據,目前的應用主要集中在身份標識領域。以農牧業(yè)為例,1990年以來,全球各地陸續(xù)爆發(fā)動物疫情,2003年12月,美國發(fā)現了第一宗瘋牛病病例。2004年起,聯邦政府農業(yè)部啟動了“全國動物身份識別系統”(NationalAnimalIdentificationSystem)的項目,為全國的新生牲畜建檔立戶、配置射頻識別耳標。通過這個移動傳感器,對牲畜進行連續(xù)跟蹤,一旦家畜疫情爆發(fā),就能通過數據庫追蹤溯源,快速確定傳染源和傳播范圍。美國現在已經裝備
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 石棉制品在航空航天材料的選擇考核試卷
- 信托與醫(yī)療健康產業(yè)園區(qū)發(fā)展規(guī)劃考核試卷
- 礦山水土保持與水資源管理考核試卷
- 糖果與巧克力戰(zhàn)略決策考核試卷
- 纖維素纖維在食品包裝的安全性與可持續(xù)性考核試卷
- 2025物業(yè)管理勞務派遣合同模板
- 2025年商家協議參考范本之《團購商品合同樣本 商家協議參考模板》
- 2025員工借用合同格式樣本
- 2025杭州市建設科技攻關項目合同書范本
- 2025授權代銷印花稅票合同
- 2025年廣東省深圳高級中學高中園高考數學三模試卷(含答案)
- 上海2025年上海市衛(wèi)生健康技術評價中心上半年招聘16人筆試歷年參考題庫附帶答案詳解
- 建設分包合同保證金協議
- 2025年甘肅西北永新集團招聘11人筆試參考題庫附帶答案詳解
- 江蘇省鎮(zhèn)江市2024-2025學年下學期七年級數學期中試卷(原卷版+解析版)
- 學校崗位安全手冊指南
- 2025-2030體外診斷儀器行業(yè)市場深度分析及發(fā)展策略研究報告
- 五方股權投資合作協議書合同協議范本模板8篇
- 幼兒園大班建構游戲中幼兒自主學習行為的研究
- 《特斯拉汽車供應鏈管理》課件
- 無人機操控 教學設計公開課教案教學設計課件
評論
0/150
提交評論