




下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
統(tǒng)計(jì)學(xué)Statistics
共享郵箱:
什么是統(tǒng)計(jì)學(xué)?什么是統(tǒng)計(jì)學(xué)?
(statistics)統(tǒng)計(jì)學(xué)是收集、分析、表述和解釋數(shù)據(jù)的科學(xué)(不列顛百科全書)統(tǒng)計(jì)是一門收集、分析、解釋和提供數(shù)據(jù)的科學(xué)(韋伯斯特國際辭典第3版)統(tǒng)計(jì)指的是一組方法,用來設(shè)計(jì)實(shí)驗(yàn)、獲得數(shù)據(jù),然后在這些數(shù)據(jù)的基礎(chǔ)上組織、概括、演示、分析、解釋和得出結(jié)論(MarioF.Triola,《初級統(tǒng)計(jì)學(xué)》)
統(tǒng)計(jì)是一套有關(guān)收集、處理、分析、解釋和從數(shù)據(jù)中得出的結(jié)論的方法(教材)應(yīng)用案例:制定宏觀經(jīng)濟(jì)政策
例如:政府制定各項(xiàng)經(jīng)濟(jì)政策要知道:未來的就業(yè)形勢?經(jīng)濟(jì)增長前景?物價(jià)形勢?國際收支狀況?這些信息都需要大量的統(tǒng)計(jì)支持(數(shù)據(jù)收集、趨勢預(yù)測、政策效果的評價(jià)等等)。
應(yīng)用案例:抽樣調(diào)查2008年11月2日各民意調(diào)查機(jī)構(gòu)對美國大選的兩位候選人的支持率調(diào)查結(jié)果(選民票得票率)
馬里斯特:奧巴馬50,麥凱恩43.
拉斯馬森:奧巴馬51,
麥凱恩47.
蓋洛普:奧巴馬52,麥凱恩43.
佐格比:奧巴馬50,麥凱恩43.
迪亞喬:奧巴馬48,麥凱恩41.
戰(zhàn)場:
奧巴馬49,
麥凱恩45.
IBD:
奧巴馬48,
麥凱恩44.實(shí)際結(jié)果:奧巴馬和麥凱恩的選民票得票率分別為52%和46%。統(tǒng)計(jì)數(shù)據(jù)無處不在舉例1:統(tǒng)計(jì)局:今年5月份CPI同比增長5.5%
舉例2:期末全班同學(xué)的高等代數(shù)的平均分為75,最高分為92,最低分為40,不及格率為5%舉例3:挪威公共衛(wèi)生研究所的科學(xué)家調(diào)查表明,每天吸煙1到4支的人罹患缺血性心臟病的幾率是不吸煙者的3倍,少量吸煙的男性罹患肺癌的風(fēng)險(xiǎn)比不吸煙男性高2倍,女性少量吸煙則會使罹患肺癌的風(fēng)險(xiǎn)增加4倍。
統(tǒng)計(jì)數(shù)據(jù)無處不在舉例4:1981年,首屆國際《紅樓夢》研討會在美國召開,威斯康星大學(xué)講師陳炳藻獨(dú)樹一幟,宣讀了題為《從詞匯上的統(tǒng)計(jì)論〈紅樓夢〉作者的問題》的論文。他從字、詞出現(xiàn)頻率入手,通過計(jì)算機(jī)進(jìn)行統(tǒng)計(jì)、處理、分析,對《紅樓夢》后40回系高鶚?biāo)鬟@一流行看法提出異議,認(rèn)為120回均系曹雪芹所作。統(tǒng)計(jì)學(xué)是一系列從數(shù)據(jù)中獲取有用信息以幫助決策的原理和方法。統(tǒng)計(jì)的各步驟
(statistics)1.收集數(shù)據(jù):取得數(shù)據(jù)2.處理數(shù)據(jù):整理與圖表展示分析數(shù)據(jù):利用統(tǒng)計(jì)方法研究數(shù)據(jù)數(shù)據(jù)解釋:統(tǒng)計(jì)結(jié)果的說明得到結(jié)論:從數(shù)據(jù)中提取有用的信息得出結(jié)論收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學(xué)
統(tǒng)計(jì)方法數(shù)據(jù)分析的統(tǒng)計(jì)方法描述統(tǒng)計(jì)推斷統(tǒng)計(jì)參數(shù)估計(jì)假設(shè)檢驗(yàn)描述統(tǒng)計(jì)
(descriptivestatistics)描述統(tǒng)計(jì)
—用表格、圖形和數(shù)字來概括、顯示數(shù)據(jù)特征的統(tǒng)計(jì)方法內(nèi)容整理數(shù)據(jù)展示數(shù)據(jù)描述性分析目的描述數(shù)據(jù)特征找出數(shù)據(jù)的基本規(guī)律02550Q1Q2Q3Q4¥x=30s2=105描述統(tǒng)計(jì)舉例例1:2005年我國出生人口性別比(男:女)已經(jīng)升高到119.92,與正常值106相比有嚴(yán)重的偏離。例2:中國經(jīng)濟(jì)增長的起伏推斷統(tǒng)計(jì)
(inferentialstatistics)推斷統(tǒng)計(jì)—研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計(jì)方法內(nèi)容參數(shù)估計(jì)假設(shè)檢驗(yàn)?zāi)康膶傮w特征作出推斷樣本總體推斷統(tǒng)計(jì)舉例例1:2003年人口變動抽樣調(diào)查以全國為總體,在全國抽取了990個縣(市、區(qū))、3734個鄉(xiāng)(鎮(zhèn)、街道)、6544個調(diào)查小區(qū)的126萬人。根據(jù)調(diào)查結(jié)果推算,2003年末全國總?cè)丝跒?29227萬人,出生人口為1599萬人,死亡人口為825萬人,凈增人口為774萬人。例2:一家大公司的會計(jì)部門會從所有的發(fā)票中選擇一部分來檢查公司所有發(fā)票的準(zhǔn)確性。描述統(tǒng)計(jì)與推斷統(tǒng)計(jì)的關(guān)系總體內(nèi)在的數(shù)量規(guī)律性推斷
統(tǒng)計(jì)概率論與數(shù)理統(tǒng)計(jì)描述
統(tǒng)計(jì)
總體數(shù)據(jù)樣本數(shù)據(jù)統(tǒng)計(jì)的應(yīng)用領(lǐng)域經(jīng)濟(jì)學(xué)管理學(xué)醫(yī)學(xué)工程學(xué)社會學(xué)…
統(tǒng)計(jì)學(xué)
由于大部分學(xué)科都涉及數(shù)據(jù)分析工作,因此統(tǒng)計(jì)學(xué)幾乎可以與任何一個學(xué)科結(jié)合起來……統(tǒng)計(jì)的應(yīng)用領(lǐng)域actuarialwork
(精算)
agriculture
(農(nóng)業(yè))animalscience
(動物學(xué))
anthropology
(人類學(xué))archaeology(考古學(xué))
auditing(審計(jì)學(xué))crystallography(晶體學(xué))
demography(人口統(tǒng)計(jì)學(xué))dentistry(牙醫(yī)學(xué))
ecology
(生態(tài)學(xué))econometrics(經(jīng)濟(jì)計(jì)量學(xué))
education(教育學(xué))electionforecastingandprojection
(選舉預(yù)測和策劃)engineering(工程)
epidemiology(流行病學(xué))finance(金融)fisheriesresearch
(水產(chǎn)漁業(yè)研究)gambling(賭博)
genetics(遺傳學(xué))geography(地理學(xué))
geology(地質(zhì)學(xué))historicalresearch
(歷史研究)
humangenetics
(人類遺傳學(xué))統(tǒng)計(jì)的應(yīng)用領(lǐng)域hydrology(水文學(xué))
industry
(工業(yè))linguistics
(語言學(xué))
literature(文學(xué))manpowerplanning
(勞動力計(jì)劃)managementscience
(管理科學(xué))marketing(市場營銷學(xué))
medicaldiagnosis
(醫(yī)學(xué)診斷)meteorology(氣象學(xué))
militaryscience
(軍事科學(xué))nuclearmaterialsafeguards
(核材料安全管理)ophthalmology(眼科學(xué))
pharmaceutics(制藥學(xué))physics
(物理學(xué))
politicalscience
(政治學(xué))psychology(心理學(xué))
psychophysics(心理物理學(xué))qualitycontrol
(質(zhì)量控制)
religiousstudies
(宗教研究)sociology
(社會學(xué))
surveysampling
(調(diào)查抽樣)taxonomy(分類學(xué))
weathermodification
(氣象改善)統(tǒng)計(jì)無處不在見教材P3:統(tǒng)計(jì)在工商管理中的應(yīng)用。
統(tǒng)計(jì)學(xué)的分支理論統(tǒng)計(jì)學(xué)
—把研究對象一般化、抽象化,以數(shù)學(xué)中的概率論為基礎(chǔ),從純理論的角度,對統(tǒng)計(jì)方法加以推導(dǎo)論證。應(yīng)用統(tǒng)計(jì)學(xué)—從所研究的領(lǐng)域或?qū)iT問題出發(fā),視研究對象的性質(zhì)采用適當(dāng)?shù)慕y(tǒng)計(jì)方法,解決所需研究的問題。應(yīng)用統(tǒng)計(jì)學(xué)通常具有邊緣交叉學(xué)科的性質(zhì)第1章導(dǎo)論1.1
統(tǒng)計(jì)及其應(yīng)用領(lǐng)域1.2統(tǒng)計(jì)數(shù)據(jù)的類型1.3統(tǒng)計(jì)中的幾個基本概念1.1統(tǒng)計(jì)及其應(yīng)用領(lǐng)域1.1.1什么是統(tǒng)計(jì)學(xué)1.1.2統(tǒng)計(jì)的應(yīng)用領(lǐng)域“數(shù)據(jù)!數(shù)據(jù)!數(shù)據(jù)!”他不耐煩地喊道,“我不能做無米之炊!”
—Sherlock·福爾摩斯數(shù)據(jù)是做統(tǒng)計(jì)分析的基礎(chǔ)1.2.1分類數(shù)據(jù)、順序數(shù)據(jù)、數(shù)值型數(shù)據(jù)1.2.2觀測數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù)1.2.3截面數(shù)據(jù)和時間序列數(shù)據(jù)1.2統(tǒng)計(jì)數(shù)據(jù)的類型統(tǒng)計(jì)數(shù)據(jù)的分類統(tǒng)計(jì)數(shù)據(jù)的分類按計(jì)量尺度分類的數(shù)據(jù)順序的數(shù)據(jù)數(shù)值型數(shù)據(jù)按時間狀況截面的數(shù)據(jù)時序的數(shù)據(jù)按收集方法觀察的數(shù)據(jù)實(shí)驗(yàn)的數(shù)據(jù)統(tǒng)計(jì)數(shù)據(jù)的分類
(按計(jì)量尺度分)分類數(shù)據(jù)(categoricaldata)
(定類尺度/名義尺度)定義:只能歸于某一類別的數(shù)據(jù),可用文字來表述或用數(shù)字代碼表示(教材P5描述有誤)特征:各類別無順序,比率和差運(yùn)算均無意義例如,性別(男、女)、民族、職業(yè)
順序數(shù)據(jù)(rankdata)
(定序尺度/序數(shù)尺度)定義:只能歸于某一有序類別的數(shù)據(jù),可用文字來表述或數(shù)字代碼表示特征:數(shù)據(jù)有順序,但比率和差運(yùn)算均無意義例如,質(zhì)量等級(一等品、二等品、三等品、次品等),收入級別(高、中、低)。統(tǒng)計(jì)數(shù)據(jù)的分類
(按計(jì)量尺度分)數(shù)值型數(shù)據(jù)(metricdata)
(比率尺度)定義:按數(shù)字尺度測量的觀察值,特點(diǎn):數(shù)據(jù)存在自然順序,且比率和差運(yùn)算(加減乘除)均有意義,0值代表“沒有”或”不存在“例如:身高為175cm、168cm、183cm間距數(shù)據(jù)(intervaldata)
(定距尺度)定義:對現(xiàn)象類別或次序之間間距測度的數(shù)值型數(shù)據(jù)。特點(diǎn):數(shù)據(jù)存在自然順序,差運(yùn)算有意義,比率運(yùn)算無意義。0值只是尺度上的一個點(diǎn),不代表”不存在“例如:溫度間距數(shù)據(jù)與數(shù)值數(shù)據(jù)區(qū)別間距數(shù)據(jù)中“0”表示一個具體數(shù)值,不表示“沒有”或“不存在”,定比尺度中“0”表示“沒有”或“不存在”。間距數(shù)據(jù)
0℃
-
273.15℃-123.15℃26.85℃數(shù)值數(shù)據(jù)
0K
150K300K
定距尺度與定比尺度區(qū)別(續(xù))
在實(shí)際應(yīng)用中間距數(shù)據(jù)與數(shù)值型差別不大,往往不作區(qū)分。例如在某些統(tǒng)計(jì)軟件中(SPSSStatistics軟件),數(shù)據(jù)的計(jì)量尺度被分為3類(本教材也如此):分類(Nominal)順序(Ordinal)數(shù)值型(Scale
)四種計(jì)量尺度的比較1、四種尺度所包含的信息量是依次遞增的,級別由低到高。2、根據(jù)較高層次的計(jì)量尺度可以獲得較低層次的計(jì)量尺度。3、不同的尺度數(shù)據(jù)對應(yīng)著不同數(shù)據(jù)顯示方法和分析方法。低高分類順序間距數(shù)值型數(shù)據(jù)類型:例子分類數(shù)據(jù)順序數(shù)據(jù)間距數(shù)據(jù)數(shù)值數(shù)據(jù)精確程度良好1980134公斤中國國籍:健康狀況:出生年份:體重:練習(xí)P11:二練習(xí)題1.1(講)統(tǒng)計(jì)數(shù)據(jù)的分類
(按收集方法分)觀測的數(shù)據(jù)(observationaldata)
定義:在沒有對事物人為控制的條件下,通過調(diào)查或觀測而收集到的數(shù)據(jù)例如:2010年城鎮(zhèn)居民消費(fèi)支出和可支配收入數(shù)據(jù)有關(guān)社會經(jīng)濟(jì)現(xiàn)象的統(tǒng)計(jì)數(shù)據(jù)幾乎都是觀測數(shù)據(jù)實(shí)驗(yàn)的數(shù)據(jù)(experimentaldata)
定義:在實(shí)驗(yàn)中控制實(shí)驗(yàn)對象而收集到的數(shù)據(jù)例如:對一種新藥療效的實(shí)驗(yàn),對一種新的農(nóng)作物品種的實(shí)驗(yàn)等自然科學(xué)領(lǐng)域的數(shù)據(jù)大多數(shù)都為實(shí)驗(yàn)數(shù)據(jù)統(tǒng)計(jì)數(shù)據(jù)的分類
(按時間狀況分)截面數(shù)據(jù)(cross-sectionaldata)
定義:多個事物在相同或近似相同的時間點(diǎn)上收集的數(shù)據(jù)描述不同事物在某一時刻的變化情況舉例:2005年我國各省份的國內(nèi)生產(chǎn)總值數(shù)據(jù)
2006年各地區(qū)城鎮(zhèn)居民家庭人均全年可支配收入和消費(fèi)支出數(shù)據(jù)(見下表)統(tǒng)計(jì)數(shù)據(jù)的分類
(按時間狀況分)時間序列數(shù)據(jù)(timeseriesdata)
定義:同一個事物在不同時期或時間點(diǎn)上收集到的數(shù)據(jù)描述事物隨時間變化的情況舉例:2000年至2005年國內(nèi)生產(chǎn)總值數(shù)據(jù)
1990~2006年中國居民總量消費(fèi)支出數(shù)據(jù)。統(tǒng)計(jì)數(shù)據(jù)的分類
(按時間狀況分)面板數(shù)據(jù)(PanelData)定義:多個事物在某不同時期或時間點(diǎn)上進(jìn)行測量得到的數(shù)據(jù)兼有時間序列和截面數(shù)據(jù)舉例:2005-2006年各地區(qū)城鎮(zhèn)居民家庭人均全年消費(fèi)支出
1.3統(tǒng)計(jì)中的幾個基本概念1.3.1總體和樣本1.3.2參數(shù)和統(tǒng)計(jì)量1.3.3變量總體總體(population)定義:所研究的全部個體(數(shù)據(jù))的集合,其中的每一個個體也稱為元素舉例:(1)要研究臺灣選民對當(dāng)前兩位候選領(lǐng)導(dǎo)人馬英九和蔡英文的支持度。則總體是臺灣所有選民對兩人的支持情況。(2)要檢測某批產(chǎn)品的合格率,則該批次所有產(chǎn)品就是總體。總體分類總體(population)分為有限總體和無限總體有限總體的范圍能夠明確確定,且元素的數(shù)目是有限的無限總體所包括的元素是無限的,不可數(shù)的區(qū)分有限和無限總體主要是為了判別在抽樣中每次抽取是否獨(dú)立,對無限總體,每次抽取一個單位并不影響下一次的抽樣結(jié)果,而對有限總體,每次抽取是不獨(dú)立的。(但當(dāng)總體數(shù)量較大時,常將有限總體中的抽樣也看作是獨(dú)立的。)總體通常可以看作是一個隨機(jī)變量,統(tǒng)計(jì)推斷中通常是針對無限總體。樣本樣本(sample)定義:從總體中抽取的一部分元素的集合構(gòu)成樣本的元素的數(shù)目稱為樣本容量或樣本量(samplesize)舉例:(1)從臺灣所有選民中抽取出500位進(jìn)行民意調(diào)查,則這500位選民是一個樣本(2)從所有要檢測批次的產(chǎn)品中抽出100件進(jìn)行檢測,則這100件產(chǎn)品就是一個樣本。參數(shù)參數(shù)(parameter)定義:描述總體特征的概括性數(shù)字度量,是研究者想要了解的總體的某種特征值總體參數(shù)通常用希臘字母表示所關(guān)心的參數(shù)主要有總體均值()、標(biāo)準(zhǔn)差()、總體比例()等總體數(shù)據(jù)常常是未知的,總體參數(shù)也是未知的,因此需要根據(jù)樣本來估計(jì)總體參數(shù)。統(tǒng)計(jì)量統(tǒng)計(jì)量(statistic)定義:用來描述樣本特征的概括性數(shù)字度量,它是根據(jù)樣本數(shù)據(jù)計(jì)算出來的一些量,是樣本的函數(shù)所關(guān)心的樣本統(tǒng)計(jì)量有樣本均值(x)、樣本標(biāo)準(zhǔn)差(s)、樣本比例(p)等基本樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量通常用小寫英文字母來表示還有一些為統(tǒng)計(jì)分析而構(gòu)造的統(tǒng)計(jì)量:z統(tǒng)計(jì)量、t統(tǒng)計(jì)量、x2統(tǒng)計(jì)量、F統(tǒng)計(jì)量等。變量
(variable)
變量—說明現(xiàn)象某種特征的概念例如:商品銷售額、受教育程度、產(chǎn)品的質(zhì)量等級等特點(diǎn):從一次觀察到下一次觀察結(jié)果會呈現(xiàn)出差別或變化變量的具體表現(xiàn)稱為變量值,即數(shù)據(jù)變量
(基本分類)
分類變量(categoricalvariable)
:用于表示事物類別的名稱如:性別、行業(yè)等變量順序變量(rankvariable):用于表示事物有序類別的名稱如:產(chǎn)品等級、受教育程度變量數(shù)值型變量(metricv
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 計(jì)算機(jī)二級VB考試經(jīng)典題型試題及答案
- 用戶界面設(shè)計(jì)原則與實(shí)現(xiàn)試題及答案
- 機(jī)器學(xué)習(xí)在商業(yè)決策中的價(jià)值試題及答案
- 疼痛護(hù)理實(shí)踐指南
- 企業(yè)QA與測試策略研究試題及答案
- 校招教師筆試題目大全及答案
- 校招高中物理面試題目及答案
- 有效風(fēng)險(xiǎn)應(yīng)對策略試題及答案
- 網(wǎng)絡(luò)管理員考試技能提升策略試題及答案
- 高效團(tuán)隊(duì)合作的開發(fā)流程試題及答案
- 137案例黑色三分鐘生死一瞬間事故案例文字版
- 高中英語外研版 單詞表 必修1
- 臨床流行病學(xué)與循證醫(yī)學(xué)-臨床實(shí)踐指南的制定與評價(jià)
- 【魔鏡洞察】2024藥食同源保健品滋補(bǔ)品行業(yè)分析報(bào)告
- 2023屆高考地理一輪復(fù)習(xí)跟蹤訓(xùn)練-石油資源與國家安全
- 14.有趣的光影(課件)-美術(shù)六年級下冊
- 中央2024年商務(wù)部中國國際電子商務(wù)中心招聘筆試歷年典型考題及考點(diǎn)附答案解析
- 2024年四川省南充市名校中考物理模擬試卷
- JBT 14682-2024 多關(guān)節(jié)機(jī)器人用伺服電動機(jī)技術(shù)規(guī)范(正式版)
- 改進(jìn)工作作風(fēng)自查報(bào)告(11篇)
- 24春國家開放大學(xué)《機(jī)械CADCAM》形考任務(wù)1-3參考答案
評論
0/150
提交評論