21世紀(jì)統(tǒng)計(jì)學(xué)的回顧與展望_第1頁
21世紀(jì)統(tǒng)計(jì)學(xué)的回顧與展望_第2頁
21世紀(jì)統(tǒng)計(jì)學(xué)的回顧與展望_第3頁
21世紀(jì)統(tǒng)計(jì)學(xué)的回顧與展望_第4頁
21世紀(jì)統(tǒng)計(jì)學(xué)的回顧與展望_第5頁
已閱讀5頁,還剩9頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、20世紀(jì)統(tǒng)計(jì)學(xué)的回顧與展望作者:張 南關(guān)鍵詞:統(tǒng)計(jì)學(xué);信息科學(xué);金融工程;極值統(tǒng)計(jì)學(xué)一、20世紀(jì)統(tǒng)計(jì)學(xué)的發(fā)展按照統(tǒng)計(jì)學(xué)科體系的基本原理與應(yīng)用的不同,統(tǒng)計(jì)學(xué)可分為理論統(tǒng)計(jì)學(xué)與應(yīng)用統(tǒng)計(jì)學(xué)兩大類。理論統(tǒng)計(jì)學(xué)指的是統(tǒng)計(jì)學(xué)的數(shù)學(xué)性原理,也就是數(shù)理統(tǒng)計(jì)學(xué),具有通用方法論的理學(xué)性質(zhì)。應(yīng)用統(tǒng)計(jì)學(xué)指的是基于理論統(tǒng)計(jì)學(xué)的基本原理,應(yīng)用于各個(gè)領(lǐng)域的數(shù)據(jù)處理方法,統(tǒng)計(jì)解析方法及統(tǒng)計(jì)推測(cè)方法。其特征有二:一是其數(shù)理性原理為各研究領(lǐng)域通用;二是具有對(duì)應(yīng)于某特定領(lǐng)域的特有的分析方法。比如經(jīng)濟(jì)統(tǒng)計(jì)學(xué)中的指數(shù)分析法,醫(yī)藥統(tǒng)計(jì)學(xué)中的生存解析法等。理論統(tǒng)計(jì)學(xué)的基礎(chǔ)理論在20世紀(jì)的20-30年代已經(jīng)基本完成。其中由英國統(tǒng)計(jì)學(xué)家費(fèi)舍(

2、R.A.Fisher,1890-1962)所確立的統(tǒng)計(jì)推測(cè)理論,樣本分布理論,試驗(yàn)計(jì)劃法及F分布理論對(duì)奠定20世紀(jì)統(tǒng)計(jì)學(xué)的基礎(chǔ)理論作出了很大的貢獻(xiàn)。40-50年代對(duì)統(tǒng)計(jì)學(xué)來說是分布理論的時(shí)代。以概率分布的形式成功地將各種隨機(jī)現(xiàn)象的數(shù)量特征、性質(zhì)加以歸納、描述。60年代是分布偏差有效(Robust)推定理論盛行的時(shí)代。即采用古典的方法論成功地解決了概率分布的假定與實(shí)際數(shù)據(jù)分布偏離的問題。但是,其研究所假定的概率模型側(cè)重于數(shù)學(xué)形式的完整可能,而對(duì)數(shù)據(jù)所遵從的概率分布的擬合準(zhǔn)確性的考慮尚有欠缺。在以后的系統(tǒng)控制論中,分布偏差有效理論起到了很大的作用。70年代可以認(rèn)為是規(guī)范化線性模型的時(shí)代。自德國統(tǒng)計(jì)

3、學(xué)家高斯(C.F.Gauss,1777一1855)創(chuàng)立誤差與正態(tài)分布理論及最小二乘法以來,在70年代,從正態(tài)分布的假定,發(fā)展到將共變量的條件分布線性模型化。其方法論的核心是剔除正態(tài)性的假定,實(shí)現(xiàn)了包括從二項(xiàng)分布到咖碼分布的規(guī)范線性化。此理論與概率隨機(jī)過程理論相結(jié)合,促成了對(duì)醫(yī)學(xué)數(shù)據(jù)可進(jìn)行深入考察的生存解析法的產(chǎn)生。從分布的假定與數(shù)據(jù)的偏差這種關(guān)系來看,規(guī)范化線性模型理論與60年代的分布偏差有效理論是從不同的角度對(duì)推定統(tǒng)計(jì)量進(jìn)行的研究。80年代的前期側(cè)重于漸進(jìn)理論的研究,高次漸進(jìn)性理論運(yùn)用高等數(shù)學(xué)公式推導(dǎo)出了復(fù)雜的展開式,對(duì)高次漸進(jìn)的有效性與充分性進(jìn)行了探討。以往很多都是固定模型的次元,在樣本容

4、量極限的條件下研究其確定的變動(dòng),結(jié)果失去了許多有用的信息。之后作為改進(jìn),在決定理論的結(jié)構(gòu)中用有限的樣本進(jìn)行更為嚴(yán)密的考察。但由于理論設(shè)計(jì)忽視了分布模型與數(shù)據(jù)的吻合,出現(xiàn)了即使模型與實(shí)際的擬合受到影響也要一味追求模型近似的精確度等問題,使得為此所進(jìn)行的較嚴(yán)密的計(jì)算并沒有多大的實(shí)際意義。由此可見,如果數(shù)據(jù)的分布是在模型之外,單純依靠數(shù)學(xué)性的推導(dǎo)是不能指望這種理論會(huì)有何應(yīng)用價(jià)值的。在這一方面理論統(tǒng)計(jì)學(xué)有它的局限性,數(shù)理統(tǒng)計(jì)學(xué)所具有的本質(zhì)弱點(diǎn)也正在于此。80年代后期統(tǒng)計(jì)學(xué)對(duì)計(jì)算機(jī)的利用引人矚目,如數(shù)據(jù)模擬(Bootstrap),回歸變量的推定等非參數(shù)估計(jì)的方法應(yīng)運(yùn)而生。與此同期可稱為統(tǒng)計(jì)學(xué)一大成果的,

5、還有通過運(yùn)用在70年代開發(fā)出來的標(biāo)準(zhǔn)信息量,交差檢驗(yàn)法,縮小法等,使得平滑化法的擬合有了很大的改進(jìn)。90年代對(duì)復(fù)雜性研究較為矚目。這對(duì)90年代的一些技術(shù)性方法的研究起到了理論先導(dǎo)的作用。其中,特別是對(duì)馬爾可夫鏈蒙特卡爾理論(Markov chain Monte Carlo:MCMC)的研究對(duì)建立可實(shí)際應(yīng)用的統(tǒng)計(jì)模型開辟了廣闊的前景。90年代以來,很多應(yīng)用問題都存在著分析對(duì)象比較復(fù)雜與正確識(shí)別模型結(jié)構(gòu)的困難?,F(xiàn)在根據(jù)MCMC理論,通過使用專用統(tǒng)計(jì)軟件進(jìn)行MCMC模擬,可解決許多復(fù)雜性問題。此外,得益于MCMC理論的運(yùn)用,使得貝葉斯(Bayes)統(tǒng)計(jì)得到了再度復(fù)興,以往被認(rèn)為不可能實(shí)施計(jì)算的統(tǒng)計(jì)方

6、法變得是很輕而易舉了。另外,按照統(tǒng)計(jì)數(shù)據(jù)整理分析的不同階段,統(tǒng)計(jì)學(xué)還區(qū)分為記述統(tǒng)計(jì)學(xué)(descriptive statistics)與推測(cè)統(tǒng)計(jì)學(xué)(inferential statistics)。從統(tǒng)計(jì)數(shù)據(jù)的收集整理這一統(tǒng)計(jì)記述過程來看,20世紀(jì)中記述統(tǒng)計(jì)學(xué)的最大功績首推1953年創(chuàng)立的國際通用的國民收入帳戶(A System of National Accounts and Supporting Tables,國民帳戶體系及輔助表),及1968年的以國民收入帳戶為主,包括了投入產(chǎn)出表,資金循環(huán)表,國民資產(chǎn)負(fù)債表,國際收支表的新SNA體系,以及1993年的更新概念,擴(kuò)大兼容性,完善記述功能的改訂

7、SNA體系。作為統(tǒng)計(jì)學(xué)源流的17世紀(jì)德國國勢(shì)學(xué)及英國政治算術(shù)的統(tǒng)計(jì)學(xué)思想在20世紀(jì)得到了極大的發(fā)展。在20世紀(jì),如同經(jīng)濟(jì)統(tǒng)計(jì)學(xué)中產(chǎn)生了羅倫斯(Lorenz)曲線的計(jì)測(cè)方法,經(jīng)濟(jì)的時(shí)間序列分析方法,經(jīng)濟(jì)預(yù)測(cè)方法一樣,應(yīng)用于各個(gè)領(lǐng)域的應(yīng)用統(tǒng)計(jì)學(xué)也有了長足的發(fā)展。但是,自90年代以來,隨著信息科學(xué)的發(fā)展,統(tǒng)計(jì)學(xué)的應(yīng)用環(huán)境發(fā)生了很大的變化,統(tǒng)計(jì)學(xué)受到了信息科學(xué)發(fā)展的影響,出現(xiàn)了許多依靠以往的統(tǒng)計(jì)學(xué)的理論所不能解決的新問題。比如,與遺傳基因,環(huán)境,氣象,金融等相關(guān)聯(lián)的龐大數(shù)據(jù)的處理(將龐大數(shù)據(jù)壓縮收集后取出有用信息的方法);信息社會(huì)中有關(guān)個(gè)人隱私的數(shù)據(jù)收集與個(gè)人隱私保護(hù);計(jì)算機(jī)互連網(wǎng)的使用使得數(shù)據(jù)取得方

8、式的改變;統(tǒng)計(jì)軟件的普及所帶來的對(duì)數(shù)據(jù)含意的不求甚解,導(dǎo)致脫離現(xiàn)實(shí)的統(tǒng)計(jì)模型的濫用等。值得注意的是這些新出現(xiàn)的問題都是統(tǒng)計(jì)學(xué)外部環(huán)境發(fā)生了變化所帶來的問題。這些問題并不能通過以往的統(tǒng)計(jì)學(xué)的理論框架解決,并不能通過單純地設(shè)定數(shù)學(xué)假定,修改概率模型就可以得到數(shù)學(xué)性的解決。因此,20世紀(jì)以來基本成型的統(tǒng)計(jì)學(xué)的理論框架受到了新的挑戰(zhàn)。二、統(tǒng)計(jì)學(xué)與信息科學(xué)統(tǒng)計(jì)學(xué)是處理數(shù)據(jù)的科學(xué)。教科書中的記述統(tǒng)計(jì)側(cè)重?cái)?shù)據(jù)的收集加工整理,而數(shù)理統(tǒng)計(jì)側(cè)重?cái)?shù)據(jù)處理的科學(xué)性。一般而言科學(xué)要求有客觀性,再觀性,普遍性。為表現(xiàn)這種科學(xué)性,研究者常喜歡用數(shù)學(xué)模型。因?yàn)閿?shù)學(xué)比較簡明,嚴(yán)謹(jǐn),比較抽象。數(shù)理統(tǒng)計(jì)就運(yùn)用數(shù)學(xué)工具,記述數(shù)據(jù)產(chǎn)生

9、的過程,描述概率分布,進(jìn)行推定,作假定檢驗(yàn),形成了一個(gè)比較完整的理論體系。但是如上所述,數(shù)理統(tǒng)計(jì)學(xué)的基本理論框架產(chǎn)生于20世紀(jì)的20-30年代。當(dāng)時(shí)所處理的數(shù)據(jù)也就是一張統(tǒng)計(jì)表上的少量數(shù)據(jù)。其目的在于如何從較少的數(shù)據(jù)中得到反映現(xiàn)象的數(shù)量特征。其后數(shù)理統(tǒng)計(jì)學(xué)急速發(fā)展,愈加嚴(yán)謹(jǐn)系統(tǒng),愈加數(shù)學(xué)化了。但主要的作用還是處理數(shù)據(jù)。計(jì)算機(jī)的發(fā)展使得比較復(fù)雜的數(shù)據(jù)計(jì)算變的簡便了,成為統(tǒng)計(jì)計(jì)算的重要工具。當(dāng)今,微機(jī)的普及,英特網(wǎng)的使用,使社會(huì)產(chǎn)生了很大的變革,使信息傳遞的質(zhì)和量都發(fā)生了飛躍的變化。同時(shí),由英特網(wǎng)所聯(lián)接起來的微機(jī),使得個(gè)人也能處理以往僅由國家和企業(yè)所控制的信息。計(jì)算機(jī)的功能已經(jīng)大大超出了計(jì)算,更重

10、要的是可以廣泛大量地進(jìn)行各種數(shù)據(jù)信息的檢索處理。在這種狀況下對(duì)統(tǒng)計(jì)學(xué)的應(yīng)用而言,一個(gè)常見的問題就是可利用數(shù)據(jù)量的顯著增大。在有自動(dòng)計(jì)測(cè)的計(jì)算機(jī)的地方,從工場(chǎng)的流水線到超級(jí)市場(chǎng)的收款機(jī),都是直接連續(xù)地記錄數(shù)據(jù),數(shù)據(jù)的單位有時(shí)會(huì)超過兆億,甚至兆兆億。這與費(fèi)舍時(shí)代的數(shù)據(jù)處理量相比較,原有統(tǒng)計(jì)學(xué)教科書的理論框架就不太適用了。比如在固定的模型中對(duì)超大樣本條件下所進(jìn)行的假設(shè)檢驗(yàn),都會(huì)得出被拒絕的結(jié)果。從計(jì)算機(jī)中出現(xiàn)的大量數(shù)據(jù)中取得有用的信息被稱之為數(shù)據(jù)挖掘(data mining)。在數(shù)據(jù)采集挖掘階段,具有盡可能簡捷地記述現(xiàn)象本質(zhì)這種功能的模型還尚未被開發(fā)。更多的則是使用計(jì)算機(jī)運(yùn)用各種手段進(jìn)行大量的數(shù)據(jù)計(jì)

11、算,從而取得有價(jià)值的信息。但是按照計(jì)算機(jī)的信息處理能力,除去計(jì)算功能之外,應(yīng)該是可以將各種信息進(jìn)行再分類的。這將是一個(gè)還有待開發(fā)的領(lǐng)域。數(shù)據(jù)挖掘可認(rèn)為是對(duì)迄今為止的非常精確化的統(tǒng)計(jì)模型的一個(gè)啟示。作為一種語言,數(shù)學(xué)語言的缺陷在于過于抽象,很難記述比較復(fù)雜的社會(huì)現(xiàn)象。對(duì)用數(shù)學(xué)公式可以簡捷地記述物理性的規(guī)律來說,處理人類社會(huì)這種較復(fù)雜的社會(huì)科學(xué)則多使用帶有豐富含意的自然語言來記述。現(xiàn)在我們看到的社會(huì)經(jīng)濟(jì)現(xiàn)象的復(fù)雜性的因素越多,越是難以用數(shù)學(xué)模型近似描述,數(shù)學(xué)的用途是廣泛有效的,但絕不是萬能的。因此,數(shù)據(jù)挖掘既然也是數(shù)據(jù)處理,統(tǒng)計(jì)學(xué)也就應(yīng)該積極借鑒。借鑒的形式之一就是將以往的統(tǒng)計(jì)學(xué)數(shù)據(jù)處理的經(jīng)驗(yàn)方法

12、與數(shù)據(jù)采集挖掘相結(jié)合;另一種形式就是將計(jì)算機(jī)作為統(tǒng)計(jì)學(xué)的新的工具來使用,象在統(tǒng)計(jì)學(xué)中使用數(shù)學(xué)一樣,要將以往只作為超級(jí)算盤使用的計(jì)算機(jī),更加注意發(fā)揮其作為模式化(modeling)工具的作用。最近一些統(tǒng)計(jì)方法及數(shù)據(jù)挖掘的手法以算法(algorithm)形式明確得以表現(xiàn),具備客觀性,再現(xiàn)性的特點(diǎn)。但還存在著普遍性的問題,以往的計(jì)算機(jī)程序并未考慮到這一點(diǎn)。在最近的軟件設(shè)計(jì)工程學(xué)中已經(jīng)考慮到將文字信息與數(shù)據(jù)處理一體化(object oriented),力圖使其具有普遍性的模式。通過這些新方法的研究使用,計(jì)算機(jī)在統(tǒng)計(jì)學(xué)中將成為僅次于數(shù)學(xué)的基本工具。在以計(jì)算機(jī)為主體的信息產(chǎn)業(yè)發(fā)展中特別值得統(tǒng)計(jì)學(xué)注目的方法

13、技術(shù)有,圖形,畫像的操作及人機(jī)對(duì)話(user interface),專家咨詢系統(tǒng)(expert system),英特網(wǎng)的使用等。這些與統(tǒng)計(jì)學(xué)的研究有著密切的聯(lián)系,具有未來科學(xué)的普遍性。其中,特別是英特網(wǎng)的使用。在以往的統(tǒng)計(jì)軟件包中,數(shù)據(jù)解析的程序,執(zhí)行程序的控制裝置(CPU),解析的數(shù)據(jù)都是在同一計(jì)算機(jī)上實(shí)行。但現(xiàn)在由于英特網(wǎng)的使用,這些都是在不同的計(jì)算機(jī)上實(shí)行,而且有時(shí)它們散布在世界各個(gè)地方。在這種環(huán)境下,統(tǒng)計(jì)解析的軟件包也要與英特網(wǎng)的使用相適應(yīng),要?jiǎng)?chuàng)造出積極利用英特網(wǎng)的統(tǒng)計(jì)解析環(huán)境。在21世紀(jì)的信息社會(huì)中,統(tǒng)計(jì)學(xué)將以新的形式得到更廣泛的應(yīng)用,而作為與信息社會(huì)相適應(yīng)的統(tǒng)計(jì)解析環(huán)境的研究,將以

14、數(shù)據(jù)處理科學(xué)的形式成為統(tǒng)計(jì)學(xué)的一個(gè)新的領(lǐng)域。三、統(tǒng)計(jì)學(xué)與金融工程金融工程屬于交叉性學(xué)科,包括以下3個(gè)領(lǐng)域:(1)投資分析;(2)風(fēng)險(xiǎn)管理;(3)期貨交易。其中投資分析與風(fēng)險(xiǎn)管理兩個(gè)領(lǐng)域直接涉及到統(tǒng)計(jì)數(shù)據(jù)描述及推測(cè)統(tǒng)計(jì)學(xué),期貨交易部分主要是與數(shù)學(xué)有關(guān)的應(yīng)用概率過程,應(yīng)用概率微分方程式的研究領(lǐng)域,有時(shí)被稱為數(shù)理金融,不論哪個(gè)領(lǐng)域,對(duì)各種分析對(duì)象都需要有與之相應(yīng)的理論框架。從這種意義說,金融工程還需要經(jīng)濟(jì)學(xué),傳統(tǒng)的金融理論,金融制度的知識(shí)。1投資分析投資分析的目的在于盡可能地提高投資收益,為此從可選擇的投資資產(chǎn)中(股票,債權(quán),包括外匯在內(nèi)的外國證券),進(jìn)行資產(chǎn)選擇操作,在控制風(fēng)險(xiǎn)的同時(shí)追求收益的最大

15、化。因此要用到運(yùn)籌學(xué)中的最優(yōu)化理論。在股價(jià),匯率,利息等金融資產(chǎn)的變動(dòng)現(xiàn)象大多是多次元的,統(tǒng)計(jì)學(xué)的方法應(yīng)用很重要,其要點(diǎn)是:大量經(jīng)過分組的數(shù)據(jù);反復(fù)試驗(yàn),尋找數(shù)據(jù)出現(xiàn)的頻率。但股價(jià),匯率等的變動(dòng)結(jié)構(gòu),由于追求收益及經(jīng)濟(jì)緊縮的變化,在分析期間一般都是不穩(wěn)定的。2風(fēng)險(xiǎn)管理風(fēng)險(xiǎn)管理的領(lǐng)域正是基于統(tǒng)計(jì)學(xué)的質(zhì)量管理的思想建立起來的。企業(yè)或銀行的財(cái)務(wù)結(jié)構(gòu)受匯率,利息,股價(jià)的變動(dòng)其資產(chǎn)價(jià)值也在不斷變化,這就構(gòu)成了市場(chǎng)風(fēng)險(xiǎn)。為了根據(jù)市場(chǎng)風(fēng)險(xiǎn)考察企業(yè)資產(chǎn)的價(jià)值變化,將企業(yè)的價(jià)值變化看作風(fēng)險(xiǎn)要素股價(jià),匯率等變化的函數(shù),描述其概率樣本分布,推定其下限5損失可能的金額。其中,即可用有關(guān)股價(jià),匯率變化的模型,也可考慮因

16、素相關(guān)的變化。最近,最大虧損值的概率分布研究受到關(guān)注,其中也在應(yīng)用極端價(jià)格分布理論(extreme value)。有關(guān)銀行的不良債權(quán)問題經(jīng)常涉及到的BIS(國際結(jié)算銀行)規(guī)定中,也要求按照上述方法計(jì)算企業(yè)資產(chǎn)價(jià)值變化下限5的金額,規(guī)定企業(yè)要保留一定程度的自有資本。從這種意義而言,BIS的規(guī)定非常依賴于模型。由于企業(yè)資產(chǎn)價(jià)值的評(píng)估也必須以現(xiàn)價(jià)評(píng)估,所以不帶價(jià)格的資產(chǎn)也要依靠模型評(píng)估。模型的應(yīng)用越來越具有現(xiàn)實(shí)性,今后會(huì)計(jì)審計(jì)也要求助于統(tǒng)計(jì)學(xué)的知識(shí)。最近,包括作為價(jià)格變動(dòng)風(fēng)險(xiǎn)的市場(chǎng)風(fēng)險(xiǎn)在內(nèi),對(duì)信用風(fēng)險(xiǎn)的研究很活躍。其中,不僅是破產(chǎn)風(fēng)險(xiǎn),由于信用降級(jí)變化所引起的債權(quán)等的價(jià)格變化或信貸利息的變化也成為分

17、析的對(duì)象。上述的投資分析及風(fēng)險(xiǎn)管理的統(tǒng)計(jì)性特點(diǎn)可概括為:第一,將價(jià)格,利息等不確定因素?cái)?shù)理模型化,這可使用伊藤的概率微分建立微分方程式求解。第二,上述數(shù)理模型是概率隨機(jī)過程,所以從數(shù)學(xué)角度作嚴(yán)密論證,且對(duì)金融的數(shù)理性結(jié)構(gòu)加以數(shù)學(xué)性的整理(mathematical finance)。這與統(tǒng)計(jì)決策論相似。第三,市場(chǎng)風(fēng)險(xiǎn)與信用風(fēng)險(xiǎn)的預(yù)測(cè)及管理。預(yù)測(cè)的結(jié)果不僅用來管理市場(chǎng),而且用于投資的戰(zhàn)略選擇。為此需要建立數(shù)據(jù)庫,數(shù)據(jù)取得的時(shí)效也變得很重要。這與統(tǒng)計(jì)的質(zhì)量管理有相同點(diǎn)。3.期貨交易期貨交易的領(lǐng)域是理論水平較高并富于挑戰(zhàn)性的領(lǐng)域,它包括金融資產(chǎn)組合理論與資產(chǎn)組合的實(shí)踐(financial engine

18、ering)。許多問題常被從數(shù)學(xué)角度程序化。其領(lǐng)域的數(shù)學(xué)結(jié)構(gòu)包括連續(xù)時(shí)間的馬琴戈?duì)?Martinggales)概率過程,概率微分方程式,概率測(cè)度的變換公式,馬琴戈?duì)?Martinggales)的表現(xiàn)定理等。其核心概念為無風(fēng)險(xiǎn)即無收益的所謂的無裁定性理論(nofreGlunch)。期貨交易理論以1973年發(fā)表的布拉克與舒爾斯(Black Scholes)的論文與莫頓(Merton)的論文為基礎(chǔ)發(fā)展起來,以1981年的哈理蓀與皮萊斯卡(Harrison pliska)的概率程序理論得以規(guī)范,以1994年的斯卡舍米葉與德巴思(Scachermeiyer Debbaen)的論文完成了其基礎(chǔ)理論。在19

19、97年莫頓(Merton)與舒爾斯(Scholes)獲得諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。在此領(lǐng)域中也有實(shí)用模型的規(guī)范化,假定模型的檢驗(yàn),參數(shù)推定等統(tǒng)計(jì)問題?,F(xiàn)在金融工程對(duì)統(tǒng)計(jì)學(xué)提出了許多新的問題。大量的數(shù)據(jù)解析,數(shù)據(jù)采集挖掘,風(fēng)險(xiǎn)預(yù)測(cè)及決策分析會(huì)成為統(tǒng)計(jì)學(xué)的新的領(lǐng)域。統(tǒng)計(jì)學(xué)者觀察數(shù)據(jù),建立概率統(tǒng)計(jì)模型,推導(dǎo)出統(tǒng)計(jì)量,求出統(tǒng)計(jì)量的概率分布。這些方法應(yīng)用到金融資產(chǎn)交易的操作中,則構(gòu)成了金融工程方法論的基礎(chǔ)。四、極值統(tǒng)計(jì)學(xué)統(tǒng)計(jì)學(xué)者中有研究總體中心分布(middle man)與邊緣分布(tail man)這兩類研究者。通常,統(tǒng)計(jì)學(xué)者主要研究母總體分布的中心部分。但極值統(tǒng)計(jì)學(xué)研究其分布兩側(cè)的山腳處(tail),只研究數(shù)

20、據(jù)分布較少的上位與下位,探討邊緣分布向某點(diǎn)收斂的速度(heavy tail)。所涉及到的典型問題主要有:例如要建設(shè)較強(qiáng)固的防坡堤,為此從可利用的過去百年間的潮位觀測(cè)數(shù)據(jù),推測(cè)今后1萬年間的最高潮位。還有要建造6米高的防坡堤時(shí),需推測(cè)發(fā)生超過其高度的大潮的概率,根據(jù)其結(jié)果決定防坡堤的高度等。此類問題就是使用被給定數(shù)據(jù)的一部分,預(yù)測(cè)全體或某范圍的數(shù)據(jù)的最大值。在工程學(xué)方面還可舉出如下的例子。在水文學(xué)中預(yù)測(cè)今后100年最大的降水量;在腐蝕工程學(xué)中機(jī)器整體有可能發(fā)生的最大腐蝕程度;建筑工程學(xué)中的今后50年中的最大的風(fēng)速,最大的地震強(qiáng)度。在保險(xiǎn)學(xué)方面有預(yù)測(cè)發(fā)生支付最大的保險(xiǎn)金額;環(huán)境問題中的污染物質(zhì)的集

21、中程度;從證券,匯率,利息的時(shí)間序列的變化進(jìn)行分析平均收益及風(fēng)險(xiǎn)的金融工程等等。在歐美日有許多出色的學(xué)者在從事這方面的研究。這些問題用統(tǒng)計(jì)學(xué)的語言表述即為:從未知母總體中抽取部分?jǐn)?shù)據(jù)推測(cè)其母總體分布非常接近1的概率分位點(diǎn)(quantile)。而要推定這個(gè)概率分位點(diǎn)必須進(jìn)行數(shù)據(jù)的外插計(jì)算,這將是較困難的。為了解決這個(gè)問題,在極值統(tǒng)計(jì)學(xué)中設(shè)定了未知母總體分布屬于某極值分布的吸引區(qū)域。在20世紀(jì)30年代由費(fèi)舍與逛皮特(Tippett,1928年)曾對(duì)獨(dú)立同分布概率變量的最大值(極值統(tǒng)計(jì)量)的漸近分布(極值分布)進(jìn)行過理論研究,發(fā)現(xiàn)了在極值分布中有逆威布爾分布(Weibull distribution

22、,逆正態(tài)函數(shù)分布,常用于擬合機(jī)器及系統(tǒng)的壽命分布),康拜爾分布(Gumbel distribution,雙重指數(shù)分布,遵從于同一分布的n個(gè)獨(dú)立連續(xù)概率變量中最大值x的極限公布),及弗來舍分布(Frecher distribution,連續(xù)變量在某點(diǎn)收斂的分布)這三種等形式,以及觀察到了屬于正態(tài)分布的極值統(tǒng)計(jì)量向極值分布的收斂相當(dāng)緩慢。其后由von Mises(1936)給出了分布函數(shù)屬于極值分布吸引區(qū)域的充分條件。由此得知統(tǒng)計(jì)學(xué)教科書中常出現(xiàn)的連續(xù)型分布幾乎都屬于極值分布的吸引區(qū)域。比如均勻分布,貝塔分布屬于逆威布爾分布的吸引區(qū)域;正態(tài)分布,威布爾分布,咖碼分布,對(duì)數(shù)正態(tài)分布等屬于康拜爾分布的

23、吸引區(qū)域;而t分布,帕熱圖分布(Vilfredo Pareto,法國經(jīng)濟(jì)學(xué)家,提出極限收入分布)等則屬于弗來舍分布吸引區(qū)域。50年代極值理論的研究有了很大的進(jìn)展。通常是選取一年中某時(shí)期或某領(lǐng)域的最大值進(jìn)行研究,將取得的極值數(shù)據(jù)按照上述三種極值分布模式擬合,推測(cè)其參數(shù)。但極值數(shù)據(jù)適合于何種形式的極值分布事先很難確定,因此在1950年以英國的統(tǒng)計(jì)學(xué)者為主展開了以一種形式表現(xiàn)三種類型極值分布的一般極值分布的數(shù)據(jù)解析研究。60年代開始了2變量的極值分布研究以及對(duì)具有從屬性概率過程的極值統(tǒng)計(jì)量的漸進(jìn)分布研究。但是,從大量數(shù)據(jù)中僅選用極值會(huì)舍棄掉其他數(shù)據(jù)所具有的有價(jià)值的信息。因此,在水文學(xué)中出現(xiàn)了不是使用

24、極值而是選取某界限以上的數(shù)據(jù)分析的方法。此方法稱為POT(peaks over threshold)手法。根據(jù)指數(shù)分布可近似知道某界限值以上的數(shù)據(jù)分布。對(duì)此加以理論證明的是由巴克曼與哈曼(BalkemanHaan,1974),還有皮堪德(Pickands,1975)所發(fā)現(xiàn)的一般帕熱圖分布。即分布函數(shù)之所以屬于一般極值分布(逆威布爾分布,康拜爾分布,弗來舍分布)的吸引區(qū)域,就在于分布兩側(cè)的山腳部分的數(shù)值可用一般帕熱圖分布(貝塔分布,指數(shù)分布,帕熱圖分布)近似取得。以后,根據(jù)一般帕熱圖分布所進(jìn)行的數(shù)據(jù)解析就成為極值理論的主流。在70年代末期至80年代中期,一般多變量極值分布的結(jié)構(gòu)也得以明確。另外,由Galambos(1978,1987)與Leadbetter等(1983)的著作對(duì)極值理論的概率論方面作了介紹,理論方面的研究引人注目。但遺憾的是,由于大多數(shù)統(tǒng)計(jì)學(xué)者的注意力集中在對(duì)研究總體中央分布的研究,以及少數(shù)統(tǒng)計(jì)學(xué)者往往側(cè)重在對(duì)極值統(tǒng)計(jì)學(xué)的理論研究,所以極值理論在應(yīng)用方面的研究還是很不夠的。目前以歐美的學(xué)者為主組成各個(gè)研究小組,正在運(yùn)用極值理論對(duì)水文學(xué),環(huán)境保護(hù),自然災(zāi)害,異常氣象,可靠性工程,保險(xiǎn)數(shù)學(xué),金融工程等有特色的應(yīng)用領(lǐng)域展開研究。五、對(duì)21世紀(jì)統(tǒng)計(jì)學(xué)的展望面向21世紀(jì)的信

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論