版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
板塊板塊二.頻率直方圖學問內容學問內容一.隨機抽樣1.隨機抽樣:滿足每個個體被抽到的機會是均等的抽樣,共有三種經常接受的隨機抽樣方法:⑴簡潔隨機抽樣:從元素個數為的總體中不放回地抽取容量為的樣本,假如每一次抽取時總體中的各個個體有相同的可能性被抽到,這種抽樣方法叫做簡潔隨機抽樣.抽出方法:①抽簽法:用紙片或小球分別標號后抽簽的方法.②隨機數表法:隨機數表是使用計算器或計算機的應用程序生成隨機數的功能生成的一張數表.表中每一位置毀滅各個數字的可能性相同.隨機數表法是對樣本進行編號后,依據確定的規(guī)律從隨機數表中讀數,并取出相應的樣本的方法.簡潔隨機抽樣是最簡潔、最基本的抽樣方法.⑵系統抽樣:將總體分成均衡的若干部分,然后依據預先制定的規(guī)章,從每一部分抽取一個個體,得到所需要的樣本的抽樣方法.抽出方法:從元素個數為的總體中抽取容量為的樣本,假如總體容量能被樣本容量整除,設,先對總體進行編號,號碼從到,再從數字到中隨機抽取一個數作為起始數,然后順次抽取第個數,這樣就得到容量為的樣本.假如總體容量不能被樣本容量整除,可隨機地從總體中剔除余數,然后再按系統抽樣方法進行抽樣.系統抽樣適用于大規(guī)模的抽樣調查,由于抽樣間隔相等,又被稱為等距抽樣.⑶分層抽樣:當總體有明顯差別的幾部分組成時,要反映總體狀況,常接受分層抽樣,使總體中各個個體按某種特征分成若干個互不重疊的幾部分,每一部分叫做層,在各層中按層在總體中所占比例進行簡潔隨機抽樣,這種抽樣方法叫做分層抽樣.分層抽樣的樣本具有較強的代表性,而且各層抽樣時,可機敏選用不同的抽樣方法,應用廣泛.2.簡潔隨機抽樣必需具備下列特點:⑴簡潔隨機抽樣要求被抽取的樣本的總體個數是有限的.⑵簡潔隨機樣本數小于等于樣本總體的個數.⑶簡潔隨機樣本是從總體中逐個抽取的.⑷簡潔隨機抽樣是一種不放回的抽樣.⑸簡潔隨機抽樣的每個個體入樣的可能性均為.3.系統抽樣時,當總體個數恰好是樣本容量的整數倍時,?。蝗舨皇钦麛禃r,先從總體中隨機地剔除幾個個體,使得總體中剩余的個體數能被樣本容量整除.由于每個個體被剔除的機會相等,因而整個抽樣過程中每個個體被抽取的機會照舊相等,為.二.頻率直方圖列出樣本數據的頻率分布表和頻率分布直方圖的步驟:①計算極差:找出數據的最大值與最小值,計算它們的差;②打算組距與組數:取組距,用打算組數;③打算分點:打算起點,進行分組;④列頻率分布直方圖:對落入各小組的數據累計,算出各小數的頻數,除以樣本容量,得到各小組的頻率.⑤繪制頻率分布直方圖:以數據的值為橫坐標,以的值為縱坐標繪制直方圖,知小長方形的面積=組距×=頻率.頻率分布折線圖:將頻率分布直方圖各個長方形上邊的中點用線段連接起來,就得到頻率分布折線圖,一般把折線圖畫成與橫軸相連,所以橫軸左右兩端點沒有實際意義.總體密度曲線:樣本容量不斷增大時,所分組數不斷增加,分組的組距不斷縮小,頻率分布直方圖可以用一條光滑曲線來描繪,這條光滑曲線就叫做總體密度曲線.總體密度曲線精確地反映了一個總體在各個區(qū)域內取值的規(guī)律.三.莖葉圖制作莖葉圖的步驟:①將數據分為“莖”、“葉”兩部分;②將最大莖與最小莖之間的數字按大小挨次排成一列,并畫上豎線作為分隔線;③將各個數據的“葉”在分界線的一側對應莖處同行列出.四.統計數據的數字特征用樣本平均數估量總體平均數;用樣本標準差估量總體標準差.數據的離散程序可以用極差、方差或標準差來描述.極差又叫全距,是一組數據的最大值和最小值之差,反映一組數據的變動幅度;樣本方差描述了一組數據平均數波動的大小,樣本的標準差是方差的算術平方根.一般地,設樣本的元素為樣本的平均數為,定義樣本方差為,樣本標準差簡化公式:.五.獨立性檢驗1.兩個變量之間的關系;常見的有兩類:一類是確定性的函數關系;另一類是變量間存在關系,但又不具備函數關系所要求的確定性,它們的關系是帶有確定隨機性的.當一個變量取值確定時,另一個變量的取值帶有確定隨機性的兩個變量之間的關系叫做相關關系.2.散點圖:將樣本中的個數據點描在平面直角坐標系中,就得到了散點圖.散點圖形象地反映了各個數據的親熱程度,依據散點圖的分布趨勢可以直觀地推斷分析兩個變量的關系.3.假如當一個變量的值變大時,另一個變量的值也在變大,則這種相關稱為正相關;此時,散點圖中的點在從左下角到右上角的區(qū)域.反之,一個變量的值變大時,另一個變量的值由大變小,這種相關稱為負相關.此時,散點圖中的點在從左上角到右下角的區(qū)域.散點圖可以推斷兩個變量之間有沒有相關關系.4.統計假設:假如大事與獨立,這時應當有,用字母表示此式,即,稱之為統計假設.5.(讀作“卡方”)統計量:統計學中有一個格外有用的統計量,它的表達式為,用它的大小可以用來打算是否拒絕原來的統計假設.假如的值較大,就拒絕,即認為與是有關的.統計量的兩個臨界值:、;當時,有的把握說大事與有關;當時,有的把握說大事與有關;當時,認為大事與是無關的.獨立性檢驗的基本思想與反證法類似,由結論不成立時推出有利于結論成立的小概率大事發(fā)生,而小概率大事在一次試驗中通常是不會發(fā)生的,所以認為結論在很大程度上是成立的.1.獨立性檢驗的步驟:統計假設:;列出聯表;計算統計量;查對臨界值表,作出推斷.2.幾個臨界值:.聯表的獨立性檢驗:假如對于某個群體有兩種狀態(tài),對于每種狀態(tài)又有兩個狀況,這樣排成一張的表,如下:狀態(tài)狀態(tài)合計狀態(tài)狀態(tài)假如有調查得來的四個數據,并期望依據這樣的個數據來檢驗上述的兩種狀態(tài)與是否有關,就稱之為聯表的獨立性檢驗.六.回歸分析1.回歸分析:對于具有相關關系的兩個變量進行統計分析的方法叫做回歸分析,即回歸分析就是查找相關關系中這種非確定關系的某種確定性.回歸直線:假如散點圖中的各點都大致分布在一條直線四周,就稱這兩個變量之間具有線性相關關系,這條直線叫做回歸直線.2.最小二乘法:記回歸直線方程為:,稱為變量對變量的回歸直線方程,其中叫做回歸系數.是為了區(qū)分的實際值,當取值時,變量的相應觀看值為,而直線上對應于的縱坐標是.設的一組觀看值為,,且回歸直線方程為,當取值時,的相應觀看值為,差刻畫了實際觀看值與回歸直線上相應點的縱坐標之間的偏離程度,稱這些值為離差.我們期望這個離差構成的總離差越小越好,這樣才能使所找的直線很貼近已知點.記,回歸直線就是全部直線中取最小值的那條.這種使“離差平方和為最小”的方法,叫做最小二乘法.用最小二乘法求回歸系數有如下的公式:,,其中上方加“”,表示是由觀看值按最小二乘法求得的回歸系數.3.線性回歸模型:將用于估量值的線性函數作為確定性函數;的實際值與估量值之間的誤差記為,稱之為隨機誤差;將稱為線性回歸模型.產生隨機誤差的主要緣由有:①所用的確定性函數不恰當即模型近似引起的誤差;②忽視了某些因素的影響,通常這些影響都比較?。虎塾捎跍y量工具等緣由,存在觀測誤差.4.線性回歸系數的最佳估量值:利用最小二乘法可以得到的計算公式為,,其中,由此得到的直線就稱為回歸直線,此直線方程即為線性回歸方程.其中,分別為,的估量值,稱為回歸截距,稱為回歸系數,稱為回歸值.5.相關系數:6.相關系數的性質:⑴;⑵越接近于1,的線性相關程度越強;⑶越接近于0,的線性相關程度越弱.可見,一條回歸直線有多大的猜想功能,和變量間的相關系數親熱相關.7.轉化思想:依據專業(yè)學問或散點圖,對某些特殊的非線性關系,選擇適當的變量代換,把非線性方程轉化為線性回歸方程,從而確定未知參數.8.一些備案①回歸(regression)一詞的來歷:“回歸”這個詞英國統計學家FrancilsGalton提出來的.1889年,他在爭辯祖先與后代的身高之間的關系時發(fā)覺,身材較高的父母,他們的孩子也較高,但這些孩子的平均身高并沒有他們父母的平均身高高;身材較矮的父母,他們的孩子也較矮,但這些孩子的平均身高卻比他們父母的平均身高高.Galton把這種后代的身高向中間值靠近的趨勢稱為“回歸現象”.后來,人們把由一個變量的變化去推想另一個變量的變化的方法稱為回歸分析.②回歸系數的推導過程:,把上式看成的二次函數,的系數,因此當時取最小值.同理,把的開放式按的降冪排列,看成的二次函數,當時取最小值.解得:,,其中,是樣本平均數.9.對相關系數進行相關性檢驗的步驟:①提出統計假設:變量不具有線性相關關系;②假如以的把握作出推斷,那么可以依據與(是樣本容量)在相關性檢驗的臨界值表中查出一個的臨界值(其中稱為檢驗水平);③計算樣本相關系數;④作出統計推斷:若,則否定,表明有的把握認為變量與之間具有線性相關關系;若,則沒有理由拒絕,即就目前數據而言,沒有充分理由認為變量與之間具有線性相關關系.說明:⑴對相關系數進行顯著性檢驗,一般取檢驗水平,即牢靠程度為.⑵這里的指的是線性相關系數,的確定值很小,只是說明線性相關程度低,不愿定不相關,可能是非線性相關的某種關系.⑶這里的是對抽樣數據而言的.有時即使,兩者也不愿定是線性相關的.故在統計分析時,不能就數據論數據,要結合實際狀況進行合理解釋.典例分析典例分析題型一頻率分布直方圖(2010西城二模)某區(qū)高二班級的一次數學統考中,隨機抽取名同學的成果,成果全部在分至分之間,將成果按如下方式分成組:第一組,成果大于等于分且小于分;其次組,成果大于等于分且小于分;……第五組,成果大于等于分且小于等于分,據此繪制了如圖所示的頻率分布直方圖.則這名同學中成果大于等于分且小于分的同學有______名.(2010東城二模)已知一個樣本容量為的樣本數據的頻率分布直方圖如圖所示,樣本數據落在內的樣本頻數為,樣本數據落在內的頻率為.(2010北京)從某學校隨機抽取100名同學,將他們的身高(單位:厘米)數據繪制成頻率分布直方圖(如圖).由圖中數據可知.若要從身高在,,三組內的同學中,用分層抽樣的方法選取18人參與一項活動,則從身高在內的同學中選取的人數應為.(2010江蘇高考)某棉紡廠為了了解一批棉花的質量,從中隨機抽取了根棉花纖維的長度(棉花纖維的長度是棉花質量的重要指標),所得數據都在區(qū)間中,其頻率分布直方圖如圖所示,則其抽樣的根中,有____根在棉花纖維的長度小于.(2009湖北15)下圖是樣本容量為的頻率分布直方圖.依據樣本的頻率分布直方圖估量,樣本數據落在內的頻數為,數據落在內的概率約為.(2009福建3)一個容量為的樣本,其數據的分組與各組的頻數如下:組別頻數則樣本數據落在上的頻率為()A. B. C. D.某校為了了解同學的課外閱讀狀況,隨機調查了50名同學,得到他們在某一天各自課外閱讀所用時間的數據,結果用下面的條形圖表示,依據條形圖可得這50名同學這一天平均每人的課外閱讀時間為()A. B. C. D.為了調查某廠工人生產某種產品的力氣,隨機抽查了位工人某天生產該產品的數量.產品數量的分組區(qū)間為,,,,由此得到頻率分布直方圖如圖,則這名工人中一天生產該產品數量在的人數是.(2009山東8)某工廠對一批產品進行了抽樣檢測.右圖是依據抽樣檢測后的產品凈重(單位:克)數據繪制的頻率分布直方圖,其中產品凈重的范圍是,樣本數據分組為,,,,.已知樣本中產品凈重小于克的個數是,則樣本中凈重大于或等于克并且小于克的產品的個數是()A.B.C.D.某路段檢查站監(jiān)控錄象顯示,在某時段內,有輛汽車通過該站,現在隨機抽取其中的輛汽車進行車速分析,分析的結果表示為右圖的頻率分布直方圖,則估量在這一時段內通過該站的汽車中速度不小于km/h的車輛數為()A. B.C. D.(2006年全國II)一個社會調查機構就某地居民的月收入調查了人,并依據所得數據畫了樣本頻率分布直方圖,為了分析居民的收入與年齡、學歷、職業(yè)等方面的聯系,要從這人中用分層抽樣的方法抽出人做進一步調查,則在(元)月收入段應抽出_____人.如圖為某樣本數據的頻率分布直方圖,則下列說法不正確的是()A.的頻率為B.若樣本容量為,則的頻數為C.若樣本容量為,則的頻數為D.由頻率分布布直方圖可得出結論:估量總體大約有分布在(2006北京模擬)下面是某學校同學日睡眠時間的抽樣頻率分布表:睡眠時間人數頻率合計畫出頻率分布直方圖,估量該校同學的日平均睡眠時間.(2010崇文一模)為了調查某廠2000名工人生產某種產品的力氣,隨機抽查了位工人某天生產該產品的數量,產品數量的分組區(qū)間為,QUOTE,QUOTE,,QUOTE,頻率分布直方圖如圖所示.已知生產的產品數量在QUOTE之間的工人有6位.⑴求;⑵工廠規(guī)定從各組中任選1人進行再培訓,則選取5人不在同一組的概率是多少?考查某校高三班級男生的身高,隨機抽取名高三男生,實測身高數據(單位:)如下:⑴作出頻率分布表;⑵畫出頻率分布直方圖.(2010陜西卷高考)為了解同學身高狀況,某校以的比例對全校700名同學按性別進行出樣檢查,測得身高狀況的統計圖如下:⑴估量該小男生的人數;⑵估量該校同學身高在之間的概率;⑶從樣本中身高在之間的女生中任選2人,求至少有1人身高在之間的概率.從某校高一班級的名新生中用系統抽樣的方法抽取一個容量為的身高樣本,如下(單位:).作出該樣本的頻率分布表,畫出頻率分布直方圖及折線圖,并依據作出的頻率分布直方圖估量身高不小于的同學的人數.168165171167170165170152175174165170168169171166164155164158170155166158155160160164156162160170168164174170165179163172180174173159163172167160164169151168158168176155165165169162177158175165169151163166163167178165158170169159155163153155167163164158168167161162167168161165174156167166162161164166為了了解學校生的體能狀況,抽取了某學校同班級部分同學進行跳繩測試,將所得的數據整
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 油氣儲運安全課程設計
- 2025年度電力行業(yè)運維人員派遣合同樣本2篇
- 二零二五年度導購員服務質量監(jiān)控與提升合同3篇
- 2025年度知識產權質押合同標的與質押物描述3篇
- 2025年度藥品銷售工作總結(2篇)
- 幼兒園后勤園長崗位職責模版(2篇)
- 蛙泳動作插畫課程設計
- 中學督導自評制度模版(2篇)
- 研學旅行行前課程設計
- 系統uml課程設計
- 2024年慶陽市人民醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫頻考點附帶答案
- 車間現場防錯培訓課件
- 數字媒體技術基礎知識單選題100道及答案解析
- 全國職業(yè)院校技能大賽高職組(生產事故應急救援賽項)選拔賽考試題庫500題(含答案)
- 無痛分娩與鎮(zhèn)痛管理制度
- 2025屆中考英語復習課件(外研版廣西專用)13-八年級(下)Modules 1-2
- 2024-2025學年年八年級數學人教版下冊專題整合復習卷第11章 全等三角形單元試卷(含答案)
- 華電考試初級理論復習試題及答案
- 紅色簡約2025蛇年介紹
- 專題3-6 雙曲線的離心率與常用二級結論【12類題型】(解析版)-A4
- 光伏電站運維課件
評論
0/150
提交評論