版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
資料整理【淘寶店鋪:向陽百分百】專題13統(tǒng)計易錯點一:統(tǒng)計用表中概念不清、識圖不準致誤(頻率分布直方圖、總體取值規(guī)律)頻率分布直方圖作頻率分布直方圖的步驟①求極差:極差為一組數(shù)據(jù)中最大值與最小值的差.②決定組距與組數(shù)將數(shù)據(jù)分組時,一般取等長組距,并且組距應(yīng)力求“取整”,組數(shù)應(yīng)力求合適,以使數(shù)據(jù)的分布規(guī)律能較清楚地呈現(xiàn)出來.③將數(shù)據(jù)分組④列頻率分布表各小組的頻率=eq\f(小組頻數(shù),樣本容量).⑤畫頻率分布直方圖縱軸表示eq\f(頻率,組距),eq\f(頻率,組距)實際上就是頻率分布直方圖中各小長方形的高度,小長方形的面積=組距×eq\f(頻率,組距)=頻率.頻率分布直方圖的性質(zhì)①因為小矩形的面積=組距×eq\f(頻率,組距)=頻率,所以各小矩形的面積表示相應(yīng)各組的頻率.這樣,頻率分布直方圖就以面積的形式反映了數(shù)據(jù)落在各個小組內(nèi)的頻率大小.②在頻率分布直方圖中,各小矩形的面積之和等于1.③eq\f(頻數(shù),相應(yīng)的頻率)=樣本容量.④頻率分布直方圖反映了樣本在各個范圍內(nèi)取值的可能性,由抽樣的代表性利用樣本在某一范圍內(nèi)的頻率,可近似地估計總體在這一范圍內(nèi)的可能性.易錯提醒:頻率分布條形圖和頻率分布直方圖是兩個完全不同的概念,考生應(yīng)注意兩者之間的區(qū)別.雖然它們的橫軸表示的內(nèi)容是相同的,但是頻率分布條形圖的縱軸表示頻率;頻率分布直方圖的縱軸表示頻率與組距的比值,其各小組的頻率等于該小組上的矩形的面積.例:如圖所示是某公司(共有員工300人)2021年員工年薪情況的頻率分布直方圖,由此可知,員工中年薪在1.4萬元~1.6萬元之間的共有______人.易錯分析:解本題容易出現(xiàn)的錯誤是審題不細,對所給圖形觀察不細心,認為員工中年薪在1.4萬元~1.6萬元之間的頻率為,從而得到員工中年薪在1.4萬元~1.6萬元之間的共有(人)的錯誤結(jié)論.正解:由所給圖形,可知員工中年薪在1.4萬元~1.6萬元之間的頻率為,所以員工中年薪在1.4萬元~1.6萬元之間的共有(人).故72.易錯警示:考生誤認為頻率分布直方圖中縱軸表示的是頻率,這是錯誤的,而是“頻率/組距”,所以頻率對應(yīng)的是各矩形的面積.變式1:某大學有男生名.為了解該校男生的身體體重情況,隨機抽查了該校名男生的體重,并將這名男生的體重(單位:)分成以下六組:、、、、、,繪制成如下的頻率分布直方圖:該校體重(單位:)在區(qū)間上的男生大約有人.【詳解】由頻率分布直方圖可知,該校體重(單位:)在區(qū)間上的男生的人數(shù)為.故答案為:.變式2:現(xiàn)對某類文物進行某種物性指標檢測,從件中隨機抽取了件,測量物性指標值,得到如下頻率分布直方圖,據(jù)此估計這件文物中物性指標值不小于的件數(shù)為.【詳解】抽取的件文物中,物性指標值不小于的頻率為,由此估計出件文物中,物性指標值不小于的頻率約為,∴估計這件文物中物性指標值不小于的有件.故答案為:.變式3:如圖是根據(jù)我國部分城市某年6月份的平均氣溫數(shù)據(jù)得到的樣本頻率分布直方圖,其中平均氣溫的范圍是[20,26],樣本數(shù)據(jù)的分組為[20,21),[21,22),[22,23),[23,24),[24,25),[25,26].已知樣本中平均氣溫低于22°C的城市個數(shù)為11,樣本中平均氣溫不低于25°C的城市個數(shù)是.【詳解】由題意可得:平均氣溫低于22°C的頻率為,平均氣溫不低于25°C的頻率為,∴樣本中平均氣溫低于22°C的城市個數(shù)為11,則樣本容量為,故樣本中平均氣溫不低于25°C的城市的個數(shù)為.故答案為:9.1.已知某班全體學生在某次數(shù)學考試中的成績(單位:分)的頻率分布直方圖如圖所示,則圖中a所代表的數(shù)值是.【答案】0.015【分析】根據(jù)頻率分布直方圖結(jié)合頻率和為1運算求解.【詳解】由頻率分布直方圖可知每組頻率依次為:,則,解得.故答案為:0.015.2.某校共有400名學生參加了趣味知識競賽(滿分:150分),且每位學生的競賽成績均不低于90分.將這400名學生的競賽成績分組如下:,得到的頻率分布直方圖如圖所示,則這400名學生中競賽成績不低于120分的人數(shù)為.【答案】【分析】由頻率分布直方圖的面積和為求出,再計算出結(jié)果即可.【詳解】由頻率分布直方圖可知,解得,這400名學生中競賽成績不低于120分的人數(shù)為,故答案為:3.從某小學所有學生中隨機抽取100名學生,將他們的身高(單位:)數(shù)據(jù)繪制成頻率分布直方圖(如圖),其中樣本數(shù)據(jù)分組,則=.
【答案】【分析】根據(jù)頻率和為,結(jié)合圖表中數(shù)據(jù),列式計算即可.【詳解】根據(jù)圖表數(shù)據(jù)可得:,即,.故答案為:.4.某工廠抽取100件產(chǎn)品測其重量(單位:).其中每件產(chǎn)品的重量范圍是.數(shù)據(jù)的分組依次為,據(jù)此繪制出如圖所示的頻率分布直方圖,則重量在內(nèi)的產(chǎn)品件數(shù)為.
【答案】40【分析】根據(jù)直方圖確定各組的頻率,進而求出的頻率,最后估算出對應(yīng)的產(chǎn)品件數(shù).【詳解】由題設(shè)對應(yīng)頻率依次為,所以的頻率為,故重量在內(nèi)的產(chǎn)品件數(shù)為.故答案為:405.某研究小組經(jīng)過研究發(fā)現(xiàn)某種疾病的患病者與未患病者的某項醫(yī)學指標有明顯差異,經(jīng)過大量調(diào)查,得到如下的患病者和未患病者該指標的頻率分布直方圖:
利用該指標制定一個檢測標準,需要確定臨界值,將該指標大于的人判定為陽性,小于或等于的人判定為陰性,此檢測標準的漏診率是將患病者判定為陰性的概率,記為;誤診率是將未患病者判定為陽性的概率,記為.假設(shè)數(shù)據(jù)在組內(nèi)均勻分布,以事件發(fā)生的頻率作為相應(yīng)事件發(fā)生的概率.設(shè)函數(shù),則函數(shù)在區(qū)間取得最小值時.【答案】100【分析】根據(jù)題意結(jié)合頻率分布直方圖求出函數(shù)的解析式,然后利用函數(shù)的性質(zhì)求出最小值時的自變量的值即可.【詳解】當時,,有函數(shù)在單調(diào)遞減,所以,當時,,有函數(shù)在單調(diào)遞增,所以,所以,所以在上有最小值0.02,當時取到最小值.故答案為:100.6.某大學有男生10000名.為了解該校男生的身體體重情況,隨機抽查了該校100名男生的體重,并將這100名男生的體重(單位:kg)分成以下六組:、、、、、,繪制成如圖所示的頻率分布直方圖,該校體重(單位:)在區(qū)間上的男生大約有人.
【答案】【分析】由頻率分布直方圖求得體重在區(qū)間上男生的頻率,由此求得正確答案.【詳解】體重在區(qū)間上男生的頻率為,所以在區(qū)間上的男生大約有人.故答案為:7.某中學為了解高三男生的體能情況,通過隨機抽樣,獲得了200名男生的100米體能測試成績(單位:秒),將數(shù)據(jù)按照,,…,分成9組,制成了如圖所示的頻率分布直方圖.由直方圖估計本校高三男生100米體能測試成績大于13.25秒的頻率是.
【答案】0.63/【分析】根據(jù)頻率分布直方圖中各矩形面積之和為1,可求得a的值,再結(jié)合頻率分布直方圖即可求得答案.【詳解】由頻率分布直方圖中各矩形面積之和為1,可得,解得,故體能測試成績大于13.25秒的頻率是,故答案為:0.638.某工廠對一批產(chǎn)品的長度(單位:)進行檢驗,將抽查的產(chǎn)品所得數(shù)據(jù)分為五組,整理后得到的頻率分布直方圖如圖所示,若長度在以下的產(chǎn)品有30個,則長度在區(qū)間內(nèi)的產(chǎn)品個數(shù)為.
【答案】55【分析】先根據(jù)頻率分布直方圖求出長度在區(qū)間內(nèi)的頻率,根據(jù)頻率分布直方圖求出長度在以下的頻率,后用比例相等即可得答案.【詳解】由頻率分布直方圖可知,長度在區(qū)間內(nèi)的頻率為,長度在以下的頻率為則長度在區(qū)間內(nèi)的產(chǎn)品個數(shù)為,故答案為:55.9.某中學為了解學生的數(shù)學學習情況,在全體學生中隨機抽取200名,統(tǒng)計這200名學生某次數(shù)學考試的成績,將所得的數(shù)據(jù)分為7組:,,…,,,并整理得到如下頻率分布直方圖,則在被抽取的學生中,該次數(shù)學考試成績不低于80分的人數(shù)為.
【答案】【分析】由頻率分布直方圖求出在被抽取的學生中,該次數(shù)學考試成績不低于80分的頻率,再由頻率與頻數(shù)的關(guān)系數(shù)學考試成績不低于80分的人數(shù).【詳解】由頻率分布直方圖可得在被抽取的學生中,該次數(shù)學考試成績不低于80分的頻率為,所以在被抽取的學生中,該次數(shù)學考試成績不低于80分的人數(shù)為,故答案為:.10.某區(qū)為了解全區(qū)名高二學生的體能素質(zhì)情況,在全區(qū)高二學生中隨機抽取了名學生進行體能測試,并將這名的體能測試成績整理成如下頻率分布直方圖.根據(jù)此頻率分布直方圖,這名學生平均成績的估計值為.
【答案】【分析】根據(jù)所有矩形面積之和為求出的值,將每個矩形底邊的中點值乘以對應(yīng)矩形的面積,相加可得這名學生平均成績.【詳解】由于頻率分布直方圖中所有矩形面積之和為,可得,解得,由頻率分布直方圖可知,這名學生平均成績的估計值為分.故答案為:.11.將一個容量為100的樣本數(shù)據(jù),按照從小到大的順序分為8個組,如下表:組號12345678頻數(shù)10161815119若第6組的頻率是第3組頻率的2倍,則第6組的頻率是.【答案】/【分析】求出第6組的頻數(shù)即得解.【詳解】由題得第3組和第6組的頻數(shù)和為,所以第6組的頻數(shù)為.所以第6組的頻率是.故答案為:12.節(jié)約用水是中華民族的傳統(tǒng)美德,某市政府希望在本市試行居民生活用水定額管理,即確定一個合理的居民月用水量標準(噸),用水量不超過的部分按平價收費,超過的部分按議價收費.為此希望已經(jīng)學習過統(tǒng)計的小明,來給出建議.為了了解全市居民用水量的分布情況,小明通過隨機走訪,獲得了100位居民某年的月均用水量(單位:噸),將數(shù)據(jù)按照分成9組,制成了如圖所示的頻率分布直方圖.若該市政府希望使的居民每月的用水量不超過標準(噸),如果你是小明,你覺得的估計值為(精確到小數(shù)點后1位)【答案】2.9【分析】由頻率分布直方圖解得值,估計的居民每月的用水量所在區(qū)間后可計算的.【詳解】由頻率分布直方圖知,,解得;計算月均用水量小于2.5噸的居民人數(shù)所占的百分比為,即71%的居民月均用水量小于2.5噸;計算月均用水量小于3噸的居民人數(shù)所占的百分比為,即88%的居民月均用水量小于3噸;故,假設(shè)月均用水量平均分布,則(噸),即的居民每月用水量不超過標準為噸.故答案為:2.9.易錯點二:統(tǒng)計中的數(shù)字特征的實際意義理解不清楚致誤(頻率分布直方圖特征數(shù)考查)眾數(shù)、中位數(shù)、平均數(shù)①眾數(shù):一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù).②中位數(shù):把一組數(shù)據(jù)按從小到大(或從大到小)的順序排列,處在中間位置的數(shù)(或中間兩個數(shù)的平均數(shù))叫做這組數(shù)據(jù)的中位數(shù).③平均數(shù):如果n個數(shù)x1,x2,…,xn,那么叫做這n個數(shù)的平均數(shù).總體集中趨勢的估計①平均數(shù)、中位數(shù)和眾數(shù)等都是刻畫“中心位置”的量,它們從不同角度刻畫了一組數(shù)據(jù)的集中趨勢.②一般地,對數(shù)值型數(shù)據(jù)(如用水量、身高、收入、產(chǎn)量等)集中趨勢的描述,可以用平均數(shù)、中位數(shù);而對分類型數(shù)據(jù)(如校服規(guī)格、性別、產(chǎn)品質(zhì)量等級等)集中趨勢的描述,可以用眾數(shù).頻率分布直方圖中平均數(shù)、中位數(shù)、眾數(shù)的求法①樣本平均數(shù):可以用每個小矩形底邊中點的橫坐標與小矩形面積的乘積之和近似代替.②在頻率分布直方圖中,中位數(shù)左邊和右邊的直方圖的面積應(yīng)相等.③將最高小矩形所在的區(qū)間中點作為眾數(shù)的估計值.易錯提醒:利用頻率分布直方圖求眾數(shù)、中位數(shù)與平均數(shù)時,易出錯,應(yīng)注意區(qū)分這三者.在頻率分布直方圖中:(1)最高的小長方形底邊中點的橫坐標即是眾數(shù);(2)中位數(shù)左邊和右邊的小長方形的面積和是相等的;(3)平均數(shù)是頻率分布直方圖的“重心”,等于頻率分布直方圖中每個小長方形的面積乘以小長方形底邊中點的橫坐標之和.例.某班名學生期中考試數(shù)學成績的頻率分布直方圖如圖所示.根據(jù)頻率分布直方圖,估計該班本次測試眾數(shù)為.解:由題意,因為眾數(shù)的估計值是頻率分布直方圖中最高矩形底邊的中點的橫坐標,∴眾數(shù)為.故答案為:.變式1:為響應(yīng)自己城市倡導的低碳出行,小李上班可以選擇自行車,他記錄了次騎車所用時間(單位:分鐘),得到頻率分布直方圖,則騎車時間的眾數(shù)的估計值是分鐘
【詳解】由頻率分布直方圖可知,騎車時間的眾數(shù)的估計值是分鐘.故答案為:.變式2:數(shù)學興趣小組的四名同學各自拋擲骰子5次,分別記錄每次骰子出現(xiàn)的點數(shù),四名同學的部分統(tǒng)計結(jié)果如下:甲同學:中位數(shù)為3,方差為2.8;
乙同學:平均數(shù)為3.4,方差為1.04;丙同學:中位數(shù)為3,眾數(shù)為3;
丁同學:平均數(shù)為3,中位數(shù)為2.根據(jù)統(tǒng)計結(jié)果,數(shù)據(jù)中肯定沒有出現(xiàn)點數(shù)6的是同學.【詳解】對于甲同學,當投擲骰子出現(xiàn)結(jié)果為1,2,3,3,6時,滿足中位數(shù)為3,平均數(shù)為:,方差為,可以出現(xiàn)點數(shù)6;對于乙同學,若平均數(shù)為3.4,且出現(xiàn)點數(shù)6,則方差,所以當平均數(shù)為3.4,方差為1.04時,一定不會出現(xiàn)點數(shù)6;對于丙同學,當擲骰子出現(xiàn)的結(jié)果為1,2,3,3,6時,滿足中位數(shù)為3,眾數(shù)為3,可以出現(xiàn)點數(shù)6;對于丁同學,當投擲骰子出現(xiàn)的結(jié)果為時,滿足平均數(shù)為,中位數(shù)為,可以出現(xiàn)點數(shù).綜上,根據(jù)統(tǒng)計結(jié)果,數(shù)據(jù)中肯定沒有出現(xiàn)點數(shù)6的是乙同學.故答案為:乙變式3:以下5個命題中真命題的序號有.①樣本數(shù)據(jù)的數(shù)字特征中,與眾數(shù)、中位數(shù)比較起來,平均數(shù)可以反映出更多的關(guān)于樣本數(shù)據(jù)全體的信息;②若數(shù)據(jù),,,…,的標準差為S,則數(shù)據(jù),,,…,的標準差為aS;③將二進制數(shù)轉(zhuǎn)化成十進制數(shù)是200;④x是區(qū)間[0,5]內(nèi)任意一個整數(shù),則滿足“”的概率是.【詳解】對于命題①,平均數(shù)與每一個樣本的數(shù)據(jù)有關(guān),任何一個樣本數(shù)據(jù)的改變都會引起平均數(shù)的改變,這是眾數(shù)、中位數(shù)都不具有的性質(zhì),故與眾數(shù)、中位數(shù)比較起來,平均數(shù)可以反映出更多的關(guān)于樣本數(shù)據(jù)全體的信息,命題①是真命題;對于命題②,數(shù)據(jù),,,…,的平均數(shù),,而數(shù)據(jù),,,…,的平均數(shù)為,方差為,所以,命題②是真命題;對于命題③,,命題③是真命題;對于命題④,x是區(qū)間[0,5]內(nèi)任意一個整數(shù),則x可取0、1、2、3、4、5共6種結(jié)果,滿足“”的有0、1、2共3種結(jié)果,故概率為,命題④不是真命題.故答案為:①②③.1.2022年11月卡塔爾世界杯如期舉行,這是世界足球的一場盛宴.為了了解全民對足球的熱愛程度,組委會在某場比賽結(jié)束后,隨機抽取了1000名觀眾進行對足球“喜愛度”的調(diào)查評分,將得到的分數(shù)分成6段:,,,,,,得到如圖所示的頻率分布直方圖.圖中部分數(shù)據(jù)丟失,若已知這1000名觀眾評分的中位數(shù)估計值為87.5,則m=.
【答案】/【分析】根據(jù)中位數(shù)之前的矩形面積之和對于列方程求解即可.【詳解】由題可知,,解得.故答案為:2.為了普及環(huán)保知識,增強環(huán)保意識,某中學隨機抽取30名學生參加環(huán)保知識測試,得分(十分制)如圖所示,假設(shè)得分值的中位數(shù)為,眾數(shù)為,平均數(shù)為,則的大小關(guān)系是.【答案】【分析】根據(jù)題意求中位數(shù)、眾數(shù)和平均數(shù),進而可對結(jié)果.【詳解】由條形統(tǒng)計圖可知,30名學生的得分為得分345678910頻數(shù)231063222因為中位數(shù)為第15,16個數(shù)(分別為5,6)的平均數(shù),所以,且5出現(xiàn)次數(shù)最多,故,平均數(shù),因為,即.故答案為:.3.《中國居民膳食指南()》數(shù)據(jù)顯示,歲至歲兒童青少年超重肥胖率高達.為了解某地中學生的體重情況,某機構(gòu)從該地中學生中隨機抽取名學生,測量他們的體重(單位:千克),根據(jù)測量數(shù)據(jù),按,,,,,分成六組,得到的頻率分布直方圖如圖所示.根據(jù)調(diào)查的數(shù)據(jù),估計該地中學生體重的中位數(shù)是.【答案】【分析】根據(jù)頻率分布直方圖估計中位數(shù)的方法直接計算即可.【詳解】,,該地中學生體重的中位數(shù)位于內(nèi),設(shè)中位數(shù)為,則,解得:.故答案為:.4.為了解某校高三學生的數(shù)學成績,隨機地抽查了該校100名高三學生的期中考試數(shù)學成績,得到頻率分布直方圖如圖所示.請根據(jù)以上信息,估計該校高三學生數(shù)學成績的中位數(shù)為.(結(jié)果保留到小數(shù)點后兩位)【答案】【分析】依據(jù)頻率分布直方圖,計算時對應(yīng)的數(shù)值,即為中位數(shù).【詳解】解:,,所以中位數(shù)在之間,設(shè)中位數(shù)為,則有,所以故答案為:.5.2021年某省高考體育百米測試中,成績?nèi)拷橛?2秒與18秒之間,抽取其中100個樣本,將測試結(jié)果按如下方式分成六組:第一組,第二組,…,第六組,得到如下頻率分布直方圖.則該100名考生的成績的中位數(shù)(保留一位小數(shù))是.【答案】15.3【分析】由頻率分布直方圖估計樣本的中位數(shù)時,可知中位數(shù)出現(xiàn)在概率為的地方,即可求解.【詳解】因為前三組頻率直方圖面積和為,前四組頻率直方圖面積和為,所以中位數(shù)位于第四組內(nèi),設(shè)中位數(shù)為,則,解得,故答案為:15.3.6.200輛汽車通過某一段公路時的時速的頻率分布直方圖如圖所示,則時速的眾數(shù)、中位數(shù)的估計值分別為.
【答案】65,62.5.【分析】根據(jù)矩形的高確定眾數(shù),先計算面積確定中位數(shù)所在的區(qū)間,再利用公式求出中位數(shù).【詳解】解:∵最高的矩形為第三個矩形,∴時速的眾數(shù)的估計值為.前兩個矩形的面積為(0.01+0.03)×10=0.4<,前三個矩形的面積為(0.01+0.03+0.04)×10=0.8>,所以中位數(shù)在區(qū)間,設(shè)中位數(shù)為,由題得,解之得.∴中位數(shù)的估計值為62.5.故答案為:65,62.5.7.某快遞驛站統(tǒng)計了近期每天代收快件的數(shù)量,并制成如下圖所示的頻率分布直方圖.則該快遞驛站每天代收包裹數(shù)量的中位數(shù)為.【答案】260【分析】先確定中位數(shù)在區(qū)間內(nèi),設(shè)其為,解方程即得解.【詳解】解:左邊第一個矩形的面積為,左邊第二個矩形的面積為,左邊第三個矩形的面積為,因為,所以中位數(shù)在區(qū)間內(nèi),設(shè)其為,所以,所以.故答案為:2608.某質(zhì)檢部門對某新產(chǎn)品的質(zhì)量指標隨機抽取100件檢測,由檢測結(jié)果得到如圖所示的頻率分布直方圖.由頻率分布直方圖可以認為,該產(chǎn)品的質(zhì)量指標值服從正態(tài)分布,其中近似為樣本平均數(shù)近似為樣本方差.設(shè)表示從該種產(chǎn)品中隨機抽取10件,其質(zhì)量指標值位于的件數(shù),則的數(shù)學期望=.(精確到)注:①同一組數(shù)據(jù)用該區(qū)間的中點值作代表,計算得樣本標準差;②若,則,.【答案】【分析】先求出的近似值即樣本平均數(shù),然后結(jié)合條件以及注釋即可求解.【詳解】計算得,由條件,從而.故從該種產(chǎn)品中隨機抽取1件,其質(zhì)量指標值位于的概率是,所以抽取10件的期望值為.故答案為:9.由于受到網(wǎng)絡(luò)電商的沖擊,某品牌的洗衣機在線下的銷售受到影響,承受了一定的經(jīng)濟損失,現(xiàn)將地區(qū)200家實體店該品牌洗衣機的月經(jīng)濟損失統(tǒng)計如圖所示,估算月經(jīng)濟損失的平均數(shù)為,中位數(shù)為n,則.【答案】360【解析】先計算第一塊小矩形的面積,第二塊小矩形的面積,,面積和超過0.5,所以中位數(shù)在第二塊求解,然后再求得平均數(shù)作差即可.【詳解】第一塊小矩形的面積,第二塊小矩形的面積,故;而,故.故答案為:360.【點睛】本題考查頻率分布直方圖、樣本的數(shù)字特征,考查運算求解能力以及數(shù)形結(jié)合思想,屬于基礎(chǔ)題.10.某大學天文臺隨機調(diào)查了該校100位天文愛好者的年齡,得到如下樣本數(shù)據(jù)頻率分布直方圖,則估計該校100名天文愛好者的平均歲數(shù)為.
【答案】21.4【分析】根據(jù)頻率分布直方圖的平均數(shù)的計算公式,準確計算,即求解.【詳解】根據(jù)頻率分布直方圖的平均數(shù)的計算公式,可得估計該校100名天文愛好者的平均歲數(shù)為:.故答案為:.11.眾數(shù)?平均數(shù)和中位數(shù)都描述了數(shù)據(jù)的集中趨勢,它們的大小關(guān)系和數(shù)據(jù)分布的形態(tài)有關(guān).在如圖的分布形態(tài)中,分別表示眾數(shù)?平均數(shù)?中位數(shù),則中最小值為.
【答案】【分析】將所給的直方圖近似看作為一個梯形,再根據(jù)眾數(shù),平均數(shù)和中位數(shù)的定義求解.【詳解】將所給的直方圖近似看作為一個梯形,則眾數(shù)m出現(xiàn)在最大的矩形(即從左邊數(shù)第6個矩形)內(nèi),平均數(shù)n出現(xiàn)在從左邊數(shù)第4個矩形內(nèi),中位數(shù)p必須保證中位數(shù)p兩邊矩形面積相等,所以出現(xiàn)在從左邊數(shù)第5個矩形內(nèi),所以n最??;故答案為:n.12.如圖為某工廠工人生產(chǎn)能力頻率分布直方圖,則估計此工廠工人生產(chǎn)能力的平均值為.
【答案】/【分析】先根據(jù)面積之和為1求x,然后根據(jù)直方圖估計平均值的計算方法求解即可.【詳解】由解得,所以.故答案為:易錯點三:運用數(shù)字特征作評價時考慮不周(方差、標準差的求算)方差、標準差①假設(shè)一組數(shù)據(jù)為,則這組數(shù)據(jù)的平均數(shù),方差為,標準差②若假設(shè)一組數(shù)據(jù)為,它的平均數(shù)為,方差為,則一組數(shù)據(jù)為,的平均數(shù)為,方差為。③標準差刻畫了數(shù)據(jù)的離散程度或波動幅度,標準差越大,數(shù)據(jù)的離散程度越大;標準差越小,數(shù)據(jù)的離散程度越小.易錯提醒:方差(標準差)越大,說明數(shù)據(jù)的離散性越大;方差(標準差)越小,說明數(shù)據(jù)的離散性越小,數(shù)據(jù)越集中、穩(wěn)定.用樣本的數(shù)字特征估計總體的數(shù)字特征時,如果抽樣的方法比較合理,那么樣本可以反映總體的信息,但從樣本得到的信息會有偏差,這些偏差是由樣本的隨機性引起的.雖然樣本的數(shù)字特征并不是總體真正的數(shù)字特征,而是總體的一個估計,但這種估計是合理的,特別是當樣本容量很大時,樣本的數(shù)字特征穩(wěn)定于總體的數(shù)字特征.例、若甲、乙兩臺機床同時加工直徑為100mm的零件,為了檢驗產(chǎn)品的質(zhì)量,從產(chǎn)品中隨機抽取6件進行測量,測得數(shù)據(jù)如下:(單位:mm):甲:99,100,98,100,103;乙:99,100,102,99,100,100.通過計算,請你說明哪一臺機床加工的零件更符合要求.【錯解】==100,==100,因為兩個機床所加工零件的平均數(shù)相等,平均數(shù)描繪了數(shù)據(jù)的平均水平,所以兩臺機床加工的零件都符合要求.【錯因】平均數(shù)對數(shù)據(jù)有“取齊”作用,它描述了一組數(shù)據(jù)的平均水平,定量地反映了數(shù)據(jù)的集中趨勢,因此平均數(shù)是與樣本數(shù)據(jù)最接近、最理想的近似值,但由于樣本選取的隨機性,有時用平均數(shù)衡量總體的特征會失之偏頗,因此應(yīng)進一步計算方差或標準差來比較它們的波動大小.【正解】==100,==100,s=×[(99-100)2+3×(100-100)2+(98-100)2+(103-100)2]=,s=×[2×(99-100)2+3×(100-100)2+(102-100)2]=1.s>s,說明甲機床加工的零件波動比較大.故乙機床加工的零件更符合要求.變式1:泉州,作為古代海上絲綢之路的起點,具有深厚的歷史文化底蘊,是全國同時擁有聯(lián)合國三大類非遺項目的唯一城市.為高效統(tǒng)籌整合優(yōu)質(zhì)文旅資源,文旅局在“五一”假期精心策劃文旅活動,使得來泉旅游人數(shù)突破了萬人次.某數(shù)學興趣小組為了解來泉游客的旅游體驗滿意度,用問卷的方式隨機調(diào)查了名來泉旅游的游客,被抽到的游客根據(jù)旅游體驗給出滿意度分值(滿分分),該興趣小組將收集到的數(shù)據(jù)分成五段:,,,,,處理后繪制了如下頻率分布直方圖.
(1)求圖中的值并估計名游客滿意度分值的中位數(shù)(結(jié)果用分數(shù)表示);(2)已知在的平均數(shù)為,方差為,在的平均數(shù)為,方差為,試求被調(diào)查的名游客的滿意度分值的平均數(shù)及方差.【詳解】(1)由頻率分布直方圖可得:,解得
由頻率分布直方圖,
因此,中位數(shù)落在區(qū)間內(nèi),
可以估計名游客滿意度分值的中位數(shù)為(2)把在的平均數(shù)記為,方差記為;在的平均數(shù)記為,方差記為;在的平均數(shù)記為,方差記為
由題得,,,,,在的頻率為,在的頻率為則
由
可得
即被調(diào)查的名游客的滿意度分值的方差為變式2:拔尖創(chuàng)新人才是21世紀社會經(jīng)濟發(fā)展的巨大動力,培養(yǎng)拔尖創(chuàng)新人才也成為世界各國教育的主要任務(wù).某市為了解市民對拔尖人才培養(yǎng)理念的關(guān)注程度,舉辦了“拔尖人才素養(yǎng)必備”知識普及競賽,從所有答卷中隨機抽取100份作為樣本,將樣本的成績(滿分100分,成績均為不低于40分的整數(shù))分成六段:,得到如圖所示的頻率分布直方圖.(1)求頻率分布直方圖中的值,并估計該市這次競賽成績的眾數(shù);(2)已知落在的平均成績,方差,落在的平均成績,方差,求這兩組成績的總平均數(shù)和總方差.【詳解】(1)由頻率分布直方圖可知,,該市這次競賽成績的眾數(shù)為75分.(2)落在與的人數(shù)比為.所以,.變式3:為了研究網(wǎng)民的上網(wǎng)習慣,某機構(gòu)隨機抽取了年齡在10歲到60歲的網(wǎng)民進行問卷調(diào)查,按年齡分為5組,即,,,,,并繪制出頻率分布直方圖,如圖所示.
(1)若按分層抽樣的方法,從上述網(wǎng)民中抽取n人做采訪,其中年齡在中被抽取的人數(shù)為7,求n;(2)若各區(qū)間的值以該區(qū)間的中點值作代表,求上述網(wǎng)民年齡的方差的估計值.【詳解】(1)由題意得,,解得,年齡在中人數(shù)所占比例為則.(2),,,,五組的頻率分別為,若各區(qū)間的值以該區(qū)間的中點值作代表,則上述網(wǎng)民年齡的平均值的估計值為(歲)方差的估計值為1.已知甲、乙兩位同學在一次射擊練習中各射靶10次,射中環(huán)數(shù)頻率分布如圖所示:
令,分別表示甲、乙射中環(huán)數(shù)的均值;,分別表示甲、乙射中環(huán)數(shù)的方差,則(
)A., B.,C., D.,【答案】D【分析】根據(jù)頻率分布圖分別計算,,比較大小可得.【詳解】由圖可知,,,所以,.故選:D.2.某學校組織學生參加數(shù)學測試,某班成績的頻率分布直方圖如圖,數(shù)據(jù)的分組依次為.若不低于分的人數(shù)是人,且同一組中的數(shù)據(jù)用該組區(qū)間的中點值代表,則下列說法中正確的是()
A.該班的學生人數(shù)是B.成績在的學生人數(shù)是C.估計該班成績的眾數(shù)是分D.估計該班成績的方差為【答案】ACD【分析】根據(jù)頻率與總數(shù)關(guān)系、頻率和為、頻率分布直方圖估計眾數(shù)、平均數(shù)和方差的方法依次判斷各個選項即可.【詳解】對于A,不低于分對應(yīng)的頻率為,該班的學生人數(shù)為,A正確;對于B,,,成績在的學生人數(shù)為,B錯誤;對于C,成績在對應(yīng)的矩形面積最大,估計該班成績的眾數(shù)為分,C正確;對于D,估計該班成績的平均數(shù)為,方差為,D正確.故選:ACD.3.從某企業(yè)生產(chǎn)的某種產(chǎn)品中抽取500件,測量這些產(chǎn)品的一項質(zhì)量指標值,由測量結(jié)果得頻率分布直方圖,則這500件產(chǎn)品質(zhì)量指標值的樣本方差是(同一組中的數(shù)據(jù)用該組區(qū)間的中點值作代表).【答案】110【分析】由頻率分布直方圖可得數(shù)據(jù)的平均值,再由方差的公式運算即可得解.【詳解】由頻率分布直方圖得抽取產(chǎn)品的質(zhì)量指標值的樣本平均值為:,∴樣本方差.故答案為:110.【點睛】本題考查了利用頻率分布直方圖求數(shù)據(jù)的方差,考查了運算求解能力,屬于基礎(chǔ)題.4.在一次區(qū)域統(tǒng)考中,為了了解各學科的成績情況,從所有考生成績中隨機抽出20位考生的成績進行統(tǒng)計分析,其中數(shù)學學科的頻率分布直方圖如圖所示,據(jù)此估計,在本次考試中數(shù)學成績的方差為.(同一組中的數(shù)據(jù)用該組區(qū)間的中點值作代表)【答案】110【解析】根據(jù)頻率分布直方圖,直接利用平均數(shù)與方差的公式,即可得到本題答案.【詳解】由題,得,方差.故答案為:110【點睛】本題主要考查利用頻率分布圖求數(shù)據(jù)平均數(shù)與方差的問題.5.為了解本市居民的生活成本,甲?乙?丙三名同學利用假期分別對三個社區(qū)進行了“家庭每月日常消費額”的調(diào)查.他們將調(diào)查所得的數(shù)據(jù)分別繪制成頻率分布直方圖(如圖所示),記甲?乙?丙所調(diào)查數(shù)據(jù)的標準差分別為,,,則它們的大小關(guān)系為.【答案】【解析】第二組數(shù)據(jù)是單峰的每一個小長方形的差別比較小,數(shù)字數(shù)據(jù)較分散,各個段內(nèi)分布均勻,第一組數(shù)據(jù)的兩端數(shù)字較多,絕大部分數(shù)字都處在兩端最分散,而第三組數(shù)據(jù)絕大部分數(shù)字都在平均數(shù)左右,是集中,由此得到結(jié)果.【詳解】解:根據(jù)三個頻率分步直方圖知,第一組數(shù)據(jù)的兩端數(shù)字較多,絕大部分數(shù)字都處在兩端數(shù)據(jù)偏離平均數(shù)遠,最分散,其方差最大;第二組數(shù)據(jù)絕大部分數(shù)字都在平均數(shù)左右,數(shù)據(jù)最集中,故其方差最小,而第三組數(shù)據(jù)是單峰的每一個小長方形的差別比較小,數(shù)字分布均勻,數(shù)據(jù)不如第一組偏離平均數(shù)大,方差比第一組中數(shù)據(jù)中的方差小,總上可知,故答案為:,【點睛】本題考查頻率分步直方圖,考查三組數(shù)據(jù)的標準差,考查標準差的意義,是比較幾組數(shù)據(jù)的波動大小的量,屬于基礎(chǔ)題.6.某工廠從生產(chǎn)的一批產(chǎn)品中隨機抽出一部分,對這些產(chǎn)品的一項質(zhì)量指標進行了檢測,整理檢測結(jié)果得到如下頻率分布表:質(zhì)量指標分組頻率0.10.60.3據(jù)此可估計這批產(chǎn)品的此項質(zhì)量指標的方差為.【答案】144【分析】由每組數(shù)據(jù)中點值代替這組數(shù)據(jù)值,乘以頻率相加得平均值,再由方差公式計算方差.【詳解】由題意得這批產(chǎn)品的此項質(zhì)量指標的平均數(shù)為,故方差為.故答案為:144.7.2023年10月22日,漢江生態(tài)城2023襄陽馬拉松在湖北省襄陽市成功舉行,志愿者的服務(wù)工作是馬拉松成功舉辦的重要保障,襄陽市新時代文明實踐中心承辦了志愿者選拔的面試工作.現(xiàn)隨機抽取了100名候選者的面試成績,并分成五組:第一組,第二組,第三組,第四組,第五組,繪制成如圖所示的頻率分布直方圖.已知第一、二組的頻率之和為0.3,第一組和第五組的頻率相同.
(1)估計這100名候選者面試成績的平均數(shù)和第25百分位數(shù);(2)現(xiàn)從以上各組中用分層隨機抽樣的方法選取20人,擔任本市的宣傳者.①現(xiàn)計劃從第一組和第二組抽取的人中,再隨機抽取2名作為組長.求選出的兩人來自不同組的概率.②若本市宣傳者中第二組面試者的面試成績的平均數(shù)和方差分別為62和40,第四組面試者的面試成績的平均數(shù)和方差分別為80和70,據(jù)此估計這次第二組和第四組面試者所有人的方差.【答案】(1)平均數(shù)為,第25百分位數(shù)為63(2)①;②【分析】(1)由頻率分布直方圖列出方程組解出,然后分別計算出平均數(shù)和百分位數(shù)即可;(2)①先利用分層抽樣的方法計算樣本,然后利用古典概型概率求解,然后根據(jù)題意計算方差即可.【詳解】(1)由題意可知:,解得,可知每組的頻率依次為:,所以平均數(shù)等于,因為,設(shè)第25百分位數(shù)為,則,解得,第25百分位數(shù)為63.(2)①根據(jù)分層抽樣,和的頻率比為,故在和中分別選取1人和5人,分別編號為A和1,2,3,4,5,則在這6人中隨機抽取兩個的樣本空間包含的樣本點有:,,,,A5,12,13,14,15,23,24,25,34,35,45,共15個,即,記事件B“兩人來自不同組”,則B包含的樣本點有,,,,共5個,即,所以②設(shè)第二組、第四組的平均數(shù)與方差分別為,,,,且兩組頻率之比為,成績在第二組、第四組的平均數(shù)成績在第二組、第四組的方差,故估計成績在第二組、第四組的方差是.8.古人云“民以食為天”,某校為了了解學生食堂服務(wù)的整體情況,進一步提高食堂的服務(wù)質(zhì)量,營造和諧的就餐環(huán)境,使同學們能夠獲得更好的飲食服務(wù)為此做了一次全校的問卷調(diào)查,問卷所涉及的問題均量化成對應(yīng)的分數(shù)(滿分100分),從所有答卷中隨機抽取100份分數(shù)作為樣本,將樣本的分數(shù)(成績均為不低于40分的整數(shù))分成六段:,得到如圖所示的頻數(shù)分布表.樣本分數(shù)段頻數(shù)51020a2510頻率0.050.10.2b0.250.1(1)求頻數(shù)分布表中a和b的值,并求樣本成績的中位數(shù)和平均數(shù);(2)已知落在的分數(shù)的平均值為56,方差是7;落在的分數(shù)的平均值為65,方差是4,求兩組成績的總平均數(shù)和總方差.【答案】(1),,,(2)兩組市民成績的總平均數(shù)是,總方差是【分析】(1)根據(jù)頻率分布直方圖的性質(zhì),求得,結(jié)合中位數(shù)、平均數(shù)的計算公式,即可求解;(2)根據(jù)分層抽樣的分法,得到分數(shù)在和的人數(shù),結(jié)合分層抽樣的方差的計算方法,即可求解.【詳解】(1)解:(1)由,解得,則,由,所以,由成績在的頻率為,所以中位數(shù)為,平均數(shù)為.(2)解:由表可知,分數(shù)在的市民人數(shù)為10人,成績在的市民人數(shù)為20人,故,則,所以兩組市民成績的總平均數(shù)是,總方差是.9.某電信運營公司為響應(yīng)國家5G網(wǎng)絡(luò)建設(shè)政策,擬實行5G網(wǎng)絡(luò)流量階梯定價,每人月用流量中不超過一種流量計算單位的部分按元收費,超過kGB的部分按2元收費,從用戶群中隨機調(diào)查了10000位用戶,獲得了他們某月的流量使用數(shù)據(jù),整理得到如下的頻率分布直方圖.已知用戶月使用流量的中位數(shù)為(1)求表中的(2)若k為整數(shù),依據(jù)本次調(diào)查為使以上用戶在該月的流量價格為元,則k至少定為多少?(3)為了進一步了解用戶使用5G流量與年齡的相關(guān)關(guān)系,由頻率分布直方圖中流量在和兩組用戶中,按人數(shù)比例分配的分層抽樣方法中抽取了100名用戶,已知組用戶平均年齡為30,方差為36,流量在組用戶的平均年齡為20,方差為16,求抽取的100名用戶年齡的方差.【答案】(1)(2)(3)48【分析】(1)根據(jù)頻率分布直方圖的特征即可求解;(2)根據(jù)頻率分布直方圖,結(jié)合百分位數(shù)的求法即可求解;(3)根據(jù)頻率分布直方圖,結(jié)合方差的計算公式即可求解.【詳解】(1),,(2)通過直方圖可知第85百分位數(shù)落在第組,,解得,,;(3)按分層抽樣在組抽取40人記為,,,,則,,在組抽取60人,記為,,同理可得,平均值為,抽取的100名用戶的方差10.為建立健全國家學生體質(zhì)健康監(jiān)測評價機制,激勵學生積極參加身體鍛煉,教育部印發(fā)《國家學生體質(zhì)健康標準》,要求各學校每學年開展覆蓋本校各年級學生的《標準》測試工作.為做好全省的迎檢工作,成都市在高三年級開展了一次體質(zhì)健康模擬測試,并從中隨機抽取了200名學生的數(shù)據(jù),根據(jù)他們的健康指數(shù)繪制了如圖所示的頻率分布直方圖.
(1)估計這200名學生健康指數(shù)的平均數(shù)和樣本方差(同一組數(shù)據(jù)用該組區(qū)間的中點值作代表);(2)從健康指數(shù)在的兩組中利用分層抽樣抽出7人進行電話回訪,并再隨機抽出2人贈送獎品,求從7人中抽出的2人來自不同組的概率.【答案】(1)平均數(shù)為60,方差為86(2)【分析】(1)根據(jù)頻率分布直方圖求各組頻率,結(jié)合平均數(shù)、方差公式運算求解;(2)根據(jù)分層抽樣求分層人數(shù),利用列舉法結(jié)合古典概型運算求解.【詳解】(1)由頻率分布直方圖可知分組的頻率依次為:,所以平均數(shù),方差,所以這200名學生體重的平均數(shù)為60,方差為86.(2)由(1)可知健康指數(shù)在的兩組的頻率之比為,所以抽取的7人中,有人,記為;有人,記為.隨機試驗的所有可能結(jié)果有:,,,,,,,,,,,,,,,,,,,,共21個基本事件,其中來自不同組的結(jié)果有:,,,,,,,,,,,,共12個基本事件,所以所求概率為.11.年入冬以來,為進一步做好疫情防控工作,避免疫情的再度爆發(fā),地區(qū)規(guī)定居民出行或者出席公共場合均需佩戴口罩,現(xiàn)將地區(qū)個居民一周的口罩使用個數(shù)統(tǒng)計如下表所示,其中每周的口罩使用個數(shù)在以上(含)的有人.口罩使用數(shù)量頻率
(1)求的值,根據(jù)表中數(shù)據(jù),完善上面的頻率分布直方圖;(只畫圖,不要過程)(2)根據(jù)頻率分布直方圖估計地區(qū)居民一周口罩使用個數(shù)的分位數(shù)和中位數(shù);(四舍五入,精確到)(3)根據(jù)頻率分布直方圖估計地區(qū)居民一周口罩使用個數(shù)的平均數(shù)以及方差.(每組數(shù)據(jù)用每組中點值代替)【答案】(1),;頻率分布直方圖見解析(2)分位數(shù)為個,中位數(shù)為個(3)平均數(shù)為個,方差為.【分析】(1)根據(jù)頻數(shù)與頻率關(guān)系可構(gòu)造方程求得,由此可補全頻率分布直方圖;(2)由頻率分布直方圖估計百分位數(shù)和中位數(shù)的方法直接求解即可;(3)由頻率分布直方圖估計平均數(shù)和方差的方法直接求解即可.【詳解】(1)由每周的口罩使用個數(shù)在以上(含)的有人得:,解得:,,則頻率分布直方圖如下:
(2),,分位數(shù)位于,設(shè)其為,則,解得:,即估計分位數(shù)為個;,,中位數(shù)位于,設(shè)其為,則,解得:,即估計中位數(shù)為個.(3)由頻率分布直方圖得一周內(nèi)使用口罩的平均數(shù)為:(個),方差為,則所求平均數(shù)估計為個,方差估計為.12.某市為了制定合理的節(jié)水方案,對居民用水情況進行了調(diào)查.通過抽樣,獲得了某年100戶居民每人的月均用水量(單位:噸).將數(shù)據(jù)按照,,…,分成9組,制成了如下圖所示的頻率分布直方圖.
(1)求直方圖中a的值;(2)用每組區(qū)間的中點作為每組用水量的平均值,這9組居民每人的月均用水量前四組的方差都為0.3,后5組的方差都為0.4,求這100戶居民月均用水量的方差.【答案】(1)0.30;(2)1.1136.【分析】(1)根據(jù)給定的頻率分布直方圖,利用各小矩形面積和為1求出a值作答.(2)求出100戶居民月均用水量的平均數(shù),再列式計算方差作答.【詳解】(1)由頻率分布直方圖知,數(shù)據(jù)在的頻率依次,則由,解得,所以直方圖中a的值為0.30.(2)由頻率分布直方圖得100戶居民月均用水量的平均數(shù)為:,所以這100戶居民月均用水量的方差為:.13.亞洲運動會簡稱亞運會,是亞洲規(guī)模最大的綜合性運動會,由亞洲奧林匹克理事會的成員國輪流主辦,每四年舉辦一屆.1951年第1屆亞運會在印度首都新德里舉行,七十多年來亞洲運動員已成為世界體壇上一支不可忽視的力量,而中國更是世界的體育大國和亞洲的體育霸主.第19屆杭州2022年亞運會將于2023年9月23日至10月8日舉辦,為普及體育知識,增強群眾體育鍛煉意識,某地舉辦了亞運知識競賽活動.活動分為男子組和女子組進行,最終決賽男女各有40名選手參加,右圖是其中男子組成績的頻率分布直方圖(成績介于85到145之間),
(1)求圖中缺失部分的直方圖的高度,并估算男子組成績排名第10的選手分數(shù);(2)若計劃從男子組中105分以下的選手中隨機抽樣調(diào)查2個同學的答題狀況,則抽到的選手中至少有1位是95分以下選手的概率是多少?(3)若女子組40位選手的平均分為117,標準差為12,試求所有選手的平均分和方差.【答案】(1),(2)(3)平均分為,方差為【分析】(1)先求出所有矩形的面積,再用1減去這個面積可得缺失部分的面積,除以10可得其高度,可求得第10名的成績是第75百分位數(shù),然后利用百分位數(shù)的定義可求得結(jié)果;(2)求得105以下合計6個人,對這6人編號后,利用列舉法求解;(3)利用平均數(shù)和方差的定義求解即可.【詳解】(1)因為已有矩形的面積和為,所以缺失的矩形面積為,所以高度為,由于,所以第10名記為第75百分位數(shù),設(shè)第10名的成績?yōu)?,則位于第5組,且,解得,所以成績排名第10的選手分數(shù)為129;(2)105以下合計6個人,將6人依次編號為1,2,3,4,5,6(95分以下的人編號為1,2),任選2個人的方法數(shù),列舉出所有樣本點:12,13,14,15,16,23,24,25,26,34,35,36,45,46,56共計15種,包含1,2的有9種,故概率為;(3)男子組選手的平均分,男子組得分的方差所有選手的平均得分為,所以所有選手得分的方差.14.某中學組織了數(shù)學知識競賽,從參加考試的學生中抽出40名學生,將其成績(均為整數(shù))分成六組,其部分頻率分布直方圖如圖所示.觀察圖形,回答下列問題.(1)求成績在的頻率,并補全這個頻率分布直方圖;(2)估計這次考試成績的眾數(shù),平均分和方差.【答案】(1)0.3,直方圖見解析(2)眾數(shù)為75,平均分為71分,方差194.【分析】(1)根據(jù)各組的頻率和為1可求出的頻率,從而可補全頻率分布直方圖;(2)根據(jù)眾數(shù),平均分和方差的定義結(jié)合頻率分布直方圖求解.【詳解】(1)因為各組的頻率之和等于1,所以成績在的頻率為補全頻率分布直方圖如圖所示:
(2)由頻率分布直方圖可得,這次考試成績在區(qū)間內(nèi)的最多,因此這次考試成績的眾數(shù)為75利用中值估算學生成績的平均分:,方差:,所以本次考試的眾數(shù)為75,平均分為71分,方差194.15.某學校為了了解高二年級學生數(shù)學運算能力,對高二年級的300名學生進行了一次測試.已知參加此次測試的學生的分數(shù)全部介于45分到95分之間,該校將所有分數(shù)分成5組:,整理得到如下頻率分布直方圖(同組數(shù)據(jù)以這組數(shù)據(jù)的中間值作為代表).
(1)求的值,并估計此次校內(nèi)測試分數(shù)的平均值;(2)學校要求按照分數(shù)從高到低選拔前30名的學生進行培訓,試估計這30名學生的最低分數(shù);(3)試估計這300名學生的分數(shù)的方差,并判斷此次得分為52分和94分的兩名同學的成績是否進入到了范圍內(nèi)?(參考公式:,其中為各組頻數(shù);參考數(shù)據(jù):)【答案】(1),75分(2)90分(3)答案見解析【分析】(1)先由各組的頻率和為1,求出,然后利用平均數(shù)的定義可求出,(2)先求出這30名學生的最低分數(shù)就是該次校內(nèi)測試分數(shù)的90%分位數(shù),然后利用百分位的定義求解即可,(3)先利用方差公式求出方差后再判斷即可【詳解】(1),所以,所以該次校內(nèi)考試測試分數(shù)的平均數(shù)的估計值為:分.(2)因為,所以這30名學生的最低分數(shù)就是該次校內(nèi)測試分數(shù)的分位數(shù).該次校內(nèi)考試測試分數(shù)的分位數(shù)為這30名學生的最低分數(shù)的估計值為90分.(3),,得分為52分的同學的成績沒有進入到內(nèi),得分為94分的同學的成績進入到了內(nèi).即:得分為52分的同學的成績沒有進入到范圍,得分為94分的同學的成績進入到范圍了.易錯點四:忽略百分位數(shù)兩種情況的選取(百分位數(shù)的考查)百分位數(shù)①百分位數(shù)定義:一般地,一組數(shù)據(jù)的第p百分位數(shù)是這樣一個值,它使得這組數(shù)據(jù)中至少有p%的數(shù)據(jù)小于或等于這個值,且至少有(100-p)%的數(shù)據(jù)大于或等于這個值.②常用的百分位數(shù)1.四分位數(shù):第25百分位數(shù),第50百分位數(shù),第75百分位數(shù).2.其它常用的百分位數(shù):第1百分位數(shù),第5百分位數(shù),第95百分位數(shù),第99百分位數(shù).③計算一組n個數(shù)據(jù)的第p百分位數(shù)的一般步驟如下:第一步:按從小到大排列原始數(shù)據(jù);第二步:計算i=n×p%;第三步:若i不是整數(shù),而大于i的比鄰整數(shù)為j,則第p百分位數(shù)為第j項數(shù)據(jù);若i是整數(shù),則第p百分位數(shù)為第i項與第(i+1)項數(shù)據(jù)的平均數(shù).易錯提醒:若i不是整數(shù),而大于i的比鄰整數(shù)為j,則第p百分位數(shù)為第j項數(shù)據(jù);若i是整數(shù),則第p百分位數(shù)為第i項與第(i+1)項數(shù)據(jù)的平均數(shù).例.某高校承辦了杭州亞運會志愿者選拔的面試工作.現(xiàn)隨機抽取了100名候選者的面試成績,并分成五組:第一組,第二組,第三組,第四組,第五組,繪制成如圖所示的頻率分布直方圖.已知第三、四、五組的頻率之和為0.7,第一組和第五組的頻率相同.
(1)求,的值;(2)估計這100名候選者面試成績的第65百分位數(shù)(分位數(shù)精確到0.1);(3)在第四,第五兩組志愿者中,采用分層抽樣的方法從中抽取5人,然后再從這5人中選出2人,以確定組長人選,求選出的兩人來自同一組的概率.【詳解】(1)因為第三、四、五組的頻率之和為0.7,所以,解得,所以前兩組的頻率之和為,即,所以;(2)前兩個分組頻率之和為0.3,前三個分組頻率之和為0.75,所以第65百分位數(shù)在65和75之間,即為;(3)第四、第五兩組志愿者分別有20人,5人,故按照分層抽樣抽得的第四組志愿者人數(shù)為4,分別設(shè)為,,,,第五組志愿者人數(shù)為1,設(shè)為,這5人中選出2人,所有情況有,,,,,,,,,共有10種情況,其中選出的兩人來自同一組的有,,,,,,共6種情況,故選出的兩人來自同一組的概率為.變式1.某市政府為了倡議市民節(jié)約用電,計劃對居民生活用電費用實施階梯式電價制度,即確定一戶居民月均用電量標準a,用電量不超過a的部分按照平價收費,超出部分按議價收費.為了確定一個合理的標準,從某小區(qū)抽取了100戶居民進行用電量調(diào)查單位,并繪制了如圖所示的頻率分布直方圖:(1)求x的值:(2)求被調(diào)查用戶的月用電量平均值:同一組數(shù)據(jù)用該區(qū)間的中點值作代表(3)若使居民用戶的水費支出不受影響,應(yīng)確定a值為多少?【詳解】(1),解得;(2);(3);;故分位數(shù)在之間,設(shè)為,,解得.變式2.長沙市某中學近幾年加大了對學生奧賽的培訓,為了選擇培訓的對象,2023年5月該中學進行一次數(shù)學競賽,從參加競賽的同學中,選取50名同學將其成績(百分制,均為整數(shù))分成六組:第1組,第2組,第3組,第4組,第5組,第6組,得到頻率分布直方圖(如圖),觀察圖中信息,回答下列問題:
(1)根據(jù)頻率分布直方圖,估計本次考試成績的平均數(shù)和第71百分位數(shù)(同一組中的數(shù)據(jù)用該組區(qū)間的中點值作代表);(2)已知學生成績評定等級有優(yōu)秀、良好、一般三個等級,其中成績不小于90分時為優(yōu)秀等級,若從成績在第5組和第6組的學生中,隨機抽取2人,求所抽取的2人中至少有1人成績優(yōu)秀的概率.【詳解】(1),所以本次考試成績的平均分約為66.8;因為成績在的頻率為,成績在的頻率為,所以第71百分位數(shù)位于,設(shè)其為,則,解得,所以第71百分位數(shù)為75;(2)第5組的人數(shù)為:人,可記為,,,;第6組的人數(shù)為:人,可記為,,;則從中任取2人,有,,,,,,,,,,,,,,,,,,,,,共21種情況,其中至少有1人成績優(yōu)秀的情況有,,,,,,,,,,,,,,共15種情況.所以至少有1人成績優(yōu)秀的概率.變式3.一個容量為20的樣本,其數(shù)據(jù)按從小到大的順序排列為:1,2,2,3,5,6,6,7,8,8,9,10,13,13,14,15,17,17,18,18,則該組數(shù)據(jù)的第75百分位數(shù)為,第86百分位數(shù)為.【詳解】,第75百分位數(shù)為;,第86百分位數(shù)為第18個數(shù)據(jù)17.故答案為:;17.1.以下數(shù)據(jù)為某學校參加學科節(jié)數(shù)學競賽決賽的10人的成績:(單位:分)72,78,79,80,81,83,84,86,88,90.這10人成績的第百分位數(shù)是85,則(
)A.65 B.70 C.75 D.80【答案】B【分析】由樣本數(shù)據(jù)第百分位的定義求解即可得出答案.【詳解】因為人成績的第百分位數(shù)是,而,即第位與第位的平均值,所以是這人成績的第百分為數(shù).故選:B.2.某校排球社的同學為訓練動作組織了墊排球比賽,以下為根據(jù)排球社位同學的墊球個數(shù)畫的頻率分布直方圖,所有同學墊球數(shù)都在之間.估計墊球數(shù)的樣本數(shù)據(jù)的第百分位數(shù)是(
)A. B. C. D.【答案】D【分析】根據(jù)頻率分布直方圖可計算得到第百分位數(shù)位于區(qū)間內(nèi),根據(jù)百分位數(shù)估算的方法可求得結(jié)果.【詳解】墊球數(shù)在區(qū)間內(nèi)的人數(shù)占總數(shù)的;墊球數(shù)在區(qū)間內(nèi)的人數(shù)占總數(shù)的;第百分位數(shù)位于區(qū)間內(nèi),且,估計墊球數(shù)的樣本數(shù)據(jù)的第百分位數(shù)是.故選:D.3.“幸福感指數(shù)”是指人們主觀地評價自己目前生活狀態(tài)的滿意程度的指標,常用區(qū)間內(nèi)的一個數(shù)來表示,該數(shù)越接近10表示滿意程度越高.現(xiàn)隨機抽取10位某小區(qū)居民,他們的幸福感指數(shù)分別為3,4,5,5,6,6,7,8,9,10,則這組數(shù)據(jù)的第80百分位數(shù)是(
)A.7.5 B.8 C.8.5 D.9【答案】C【分析】計算得,然后由第8個數(shù)據(jù)和第9個數(shù)據(jù)求平均數(shù)可得.【詳解】因為,所以第80百分位數(shù)是.故選:C4.為了進一步學習貫徹黨的二十大精神,推進科普宣傳教育,激發(fā)學生的學習熱情,營造良好的學習氛圍,不斷提高學生對科學?法律?健康等知識的了解,某學校組織全校班級開展“紅色百年路?科普萬里行”知識競賽.現(xiàn)抽取10個班級的平均成績:,據(jù)此估計該校各個班級平均成績的第40百分位數(shù)為(
)A.77 B.78 C.76 D.80【答案】A【分析】由第p百分位數(shù)計算公式可得答案.【詳解】因共10個數(shù)據(jù),則,故該組數(shù)據(jù)的第40百分位數(shù)為從小到大排列第4個數(shù)據(jù)與第5個數(shù)據(jù)的平均數(shù),即.故選:A5.某地一年之內(nèi)12個月的月降水量分別為:46,51,48,53,56,53,56,64,58,56,66,71,則下列說法正確的是(
)A.該地區(qū)的月降水量20%分位數(shù)為51B.該地區(qū)的月降水量50%分位數(shù)為53C.該地區(qū)的月降水量75%分位數(shù)為61D.該地區(qū)的月降水量80%分位數(shù)為64【答案】ACD【分析】把12個月的月降水量數(shù)據(jù)從小到大排列,利用百分位數(shù)的定義求解即得.【詳解】12個月的月降水量數(shù)據(jù)從小到大排列為:46,48,51,53,53,56,56,56,58,64,66,71,由,該地區(qū)的月降水量20%分位數(shù)為51,A正確;由,該地區(qū)的月降水量50%分位數(shù)為,B錯誤;由,該地區(qū)的月降水量75%分位數(shù)為,C正確;由,該地區(qū)的月降水量80%分位數(shù)為64,D正確.故選:ACD6.習近平總書記強調(diào),要堅持健康第一的教育理念,加強學校體育工作,推動青少年文化學習和體育鍛煉協(xié)調(diào)發(fā)展.某學校對高一年級學生每周在校體育鍛煉時長(單位:小時)進行了統(tǒng)計,得到如下頻率分布表:分組頻率0.250.300.200.25則下列關(guān)于高一年級學生每周體育鍛煉時長的說法中正確的是(
)A.眾數(shù)約為2.5B.中位數(shù)約為3.83C.平均數(shù)為3.95D.第80百分位數(shù)約為5.2【答案】BCD【分析】根據(jù)眾數(shù)的定義,中位數(shù)的定義,平均數(shù)的定義,百分位數(shù)的定義即可求解.【詳解】對A,因為最大頻率的組的中點值為3.5,則眾數(shù)大約為3.5,故A錯誤;對B,由表可知,中位數(shù)在第二組中,設(shè)其為,則,解得,故B正確;對C,因為平均數(shù)為,故C正確;對D,因為前三組的頻率和為0.75,則第80百分位數(shù)位于第4組,設(shè)其為,可得,解得,故D正確.故選:BCD.7.某公司為了解用戶對其產(chǎn)品的滿意度,隨機調(diào)查了10個用戶,得到用戶對產(chǎn)品的滿意度評分如表所示,評分用區(qū)間內(nèi)的一個數(shù)來表示,該數(shù)越接近10表示滿意度越高,則下列說法正確的(
)78975410947A.這組數(shù)據(jù)的平均數(shù)為0B.這組數(shù)據(jù)的眾數(shù)為7C.這組數(shù)據(jù)的極差為6D.這組數(shù)據(jù)的第75百分位數(shù)為9【答案】BCD【分析】先將這組數(shù)據(jù)從小到大依次排列,然后根據(jù)平均數(shù)、眾數(shù)、極差、百分位數(shù)的概念,計算求解,即可得出答案.【詳解】將這組數(shù)據(jù)從小到大依次排列,為4,4,5,7,7,7,8,9,9,10.對于A項,這組數(shù)據(jù)的平均數(shù)為,選項A錯誤;對于B項,這組數(shù)據(jù)的眾數(shù)是7,選項B正確;對于C項,這組數(shù)據(jù)的極差是,選項C正確;對于D項,因為,且第8個數(shù)是9,所以這組數(shù)據(jù)的第75百分位數(shù)為9,選項D正確.故選:BCD.8.人均國內(nèi)生產(chǎn)總值是人們了解和把握一個國家或地區(qū)的宏觀經(jīng)濟運行狀況的有效工具,即“人均GDP”,常作為發(fā)展經(jīng)濟學中衡量經(jīng)濟發(fā)展狀況的指標,是最重要的宏觀經(jīng)濟指標之一.在國家統(tǒng)計局的官網(wǎng)上可以查詢到我國2013年至2022年人均國內(nèi)生產(chǎn)總值(單位:元)的數(shù)據(jù),如圖所示,則(
)A.2013年至2022年人均國內(nèi)生產(chǎn)總值逐年遞增B.2013年至2022年人均國內(nèi)生產(chǎn)總值的極差為42201C.這10年的人均國內(nèi)生產(chǎn)總值的80%分位數(shù)是71828D.這10年的人均國內(nèi)生產(chǎn)總值的增長量最小的是2020年【答案】ABD【分析】根據(jù)圖中數(shù)據(jù)和極差、百分位數(shù)、增長量的定義判斷.【詳解】由圖可知,2013年至2022年人均國內(nèi)生產(chǎn)總值逐年遞增,A正確;2013年至2022年人均國內(nèi)生產(chǎn)總值的極差為85698-43497=42201,B正確;因為10×80%=8,所以這10年的人均國內(nèi)生產(chǎn)總值的80%分位數(shù)是.C不正確;由圖中數(shù)據(jù)分析可知,2020年人均同內(nèi)生產(chǎn)總值的增長為71828-70078=1750(元),是這10年中增長量最小的,D正確.故選:ABD.9.已知互不相同的30個樣本數(shù)據(jù),若去掉其中最大和最小的數(shù)據(jù),設(shè)剩下的28個樣本數(shù)據(jù)的方差為,平均數(shù)為;去掉的兩個數(shù)據(jù)的方差為,平均數(shù)為﹔原樣本數(shù)據(jù)的方差為,平均數(shù)為,若=,則下列說法正確的是()A.B.C.剩下28個數(shù)據(jù)的中位數(shù)大于原樣本數(shù)據(jù)的中位數(shù)D.剩下28個數(shù)據(jù)的22%分位數(shù)不等于原樣本數(shù)據(jù)的22%分位數(shù)【答案】ABD【分析】對于A選項,求出剩下的28個樣本數(shù)據(jù)的和、去掉的兩個數(shù)據(jù)和、原樣本數(shù)據(jù)和,列出方程即可;對于B選項,寫出和的表達式即可;對于C選項,根據(jù)中位數(shù)定義判斷即可;對于D選項,根據(jù)分位數(shù)定義判斷即可.【詳解】A.剩下的28個樣本數(shù)據(jù)的和為,去掉的兩個數(shù)據(jù)和為,原樣本數(shù)據(jù)和為,所以,因為=,所以,故A選項正確;B.設(shè),,因為,所以,所以,所以,故B選項正確;C.剩下28個數(shù)據(jù)的中位數(shù)等于原樣本數(shù)據(jù)的中位數(shù),故C選項錯誤;D.去掉2個數(shù)據(jù),則剩下28個數(shù)據(jù)的22%分位數(shù)不等于原樣本數(shù)據(jù)的22%分位數(shù),故D正確.故選:ABD.10.8名學生參加跑的成績(單位:s)分別為13.10,12.99,13.01,13.20,13.01,13.20,12.91,13.01,則(
)A.極差為0.29 B.眾數(shù)為13.01C.平均數(shù)近似為13.05 D.第75百分位數(shù)為13.10【答案】ABC【分析】根據(jù)極差,眾數(shù),平均數(shù),百分位數(shù)的概念逐項分析.【詳解】將該組數(shù)據(jù)從小到大排列為:12.91,12.99,13.01,13.01,13.01,13.10,13.20,13.20.對于A:極差為,故A正確;對于B:這組數(shù)據(jù)中13.01出現(xiàn)3次,眾數(shù)為13.01,故B正確;對于C:平均數(shù)為,故C正確;對于D:因為共有8個數(shù)據(jù),所以,則第75百分位數(shù)為.所以D錯誤.故選:ABC.11.黨的二十大報告提出,要加快發(fā)展數(shù)字經(jīng)濟,促進數(shù)字經(jīng)濟與實體經(jīng)濟的深度融合,數(shù)字化構(gòu)建社區(qū)服務(wù)新模式成為一種時尚.某社區(qū)為優(yōu)化數(shù)字化社區(qū)服務(wù),問卷調(diào)查調(diào)研數(shù)字化社區(qū)服務(wù)的滿意度,滿意度采用計分制(滿分100分),統(tǒng)計滿意度繪制成如下頻率分布直方圖,圖中.則下列結(jié)論正確的是(
)A.B.滿意度計分的眾數(shù)為80分C.滿意度計分的分位數(shù)是85分D.滿意度計分的平均分是76.5【答案】ACD【分析】根據(jù)頻率之和為1即可求解A,根據(jù)眾數(shù),中位數(shù)以及平均數(shù)的計算即可分別求解BCD.【詳解】由頻率分布直方圖可知,即,又,所以,所以選項正確;滿意度計分的眾數(shù)為75分,所以選項錯誤;前三組的頻率之和為0.75,前四組的頻率之和為,則分位數(shù),故,滿意度計分的分位數(shù)為85,所以選項正確;滿意度計分的平均分為:分,所以選項D正確.故選:ACD.12.某校1500名學生參加數(shù)學競賽,隨機抽取了40名學生的競賽成績(單位:分),成績的頻率分布直方圖如圖所示,則(
)
A.頻率分布直方圖中a的值為0.005 B.估計這40名學生的競賽成績的第60百分位數(shù)為75C.估計這40名學生的競賽成績的眾數(shù)為80 D.估計總體中成績落在內(nèi)的學生人數(shù)為225【答案】AD【分析】先根據(jù)頻率之和為1可得,進而可求每組的頻率,再結(jié)合統(tǒng)計相關(guān)知識逐項分析判斷即可.【詳解】由,可得,故A正確;前三個矩形的面積和為,所以這名學生的競賽成績的第百分位數(shù)為,故B錯誤;由成績的頻率分布直方圖易知,這名學生的競賽成績的眾數(shù)為,故C錯誤;總體中成績落在內(nèi)的學生人數(shù)為,故D正確.故選:AD13.甘肅省2017到2022年常住人口變化圖如圖所示:
則(
)A.甘肅省2017到2020年這4年的常住人口呈遞增趨勢B.甘肅省2017到2022年這6年的常住人口的第40百分位數(shù)為2501.98萬C.甘肅省2017到2022年這6年的常住人口的極差為156.41萬D.從2017到2022年這6年中任選1年,則該年的甘肅省常住人口大于2500萬的概率為【答案】BD【分析】A.由條形圖判斷;B.利用第百分位數(shù)的定義求解判斷;C.利用極差的定義求解判斷;D.利用古典概型的概率求解判斷.【詳解】由圖可知,A錯誤.甘肅省2017到2022年這6年的常住人口(單位:萬)按照從小到大的順序排列為2490.02,2492.42,2501.98,2625.71,2637.26,2647.43,因為,所以這6年的常住人口的第40百分位數(shù)為2501.98萬,B正確.甘肅省2017到2022年這6年的常住人口的極差為萬,C錯誤.從2017到2022年這6年中任選1年,則該年的甘肅省常住人口大于2500萬的概率為,D正確.故選:BD14.下表是某公司的月固定工資統(tǒng)計表:總工程師工程師技術(shù)員A技術(shù)員B技術(shù)員C技術(shù)員D技術(shù)員E見習技術(shù)員固定工資(元)90007000400032002600200015001000由該表能判斷出該公司職工固定工資的75%分位數(shù)是元.【答案】5500【分析】利用百分位數(shù)的定義求解即可.【詳解】由,所以該公司職工固定工資的75%分位數(shù)為表中從右到左的第6個數(shù)與第7個數(shù)的平均數(shù),即為.故答案為:5500.15.某城市30天的空氣質(zhì)量指數(shù)如下:29,26,28,29,38,29,26,26,40,31,35,44,33,28,80,86,65,53,70,34,36,,31,38,63,60,56,34,74,34.則這組數(shù)據(jù)的第75百分位數(shù)為.【答案】56【分析】把給定數(shù)據(jù)按由小到大的順序排列,再根據(jù)第p百分位數(shù)的定義求解即得.【詳解】顯然,30個數(shù)據(jù)由小到大排列為:26,26,26,28,28,29,29,29,31,31,33,34,34,34,35,36,38,38,40,44,,53,56,60,63,65,70,74,80,86,或者26,26,26,28,28,29,29,29,31,31,33,34,34,34,35,36,38,38,40,,44,53,56,60,63,65,70,74,80,86,由,得這組數(shù)據(jù)的第75百分位數(shù)為上述排列后的從小到大的第23個數(shù)56.故答案為:56易錯點五:忽略相關(guān)性檢驗而出錯(統(tǒng)計案例)Ⅰ:變量間的相關(guān)關(guān)系1.變量之間的相關(guān)關(guān)系當自變量取值一定時,因變量的取值帶有一定的隨機性,則這兩個變量之間的關(guān)系叫相關(guān)關(guān)系.由于相關(guān)關(guān)系的不確定性,在尋找變量之間相關(guān)關(guān)系的過程中,統(tǒng)計發(fā)揮著非常重要的作用.我們可以通過收集大量的數(shù)據(jù),在對數(shù)據(jù)進行統(tǒng)計分析的基礎(chǔ)上,發(fā)現(xiàn)其中的規(guī)律,對它們的關(guān)系作出判斷.注意:相關(guān)關(guān)系與函數(shù)關(guān)系是不同的,相關(guān)關(guān)系是一種非確定的關(guān)系,函數(shù)關(guān)系是一種確定的關(guān)系,而且函數(shù)關(guān)系是一種因果關(guān)系,但相關(guān)關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系.2.散點圖將樣本中的個數(shù)據(jù)點描在平面直角坐標系中,所得圖形叫做散點圖.根據(jù)散點圖中點的分布可以直觀地判斷兩個變量之間的關(guān)系.(1)如果散點圖中的點散布在從左下角到右上角的區(qū)域內(nèi),對于兩個變量的這種相關(guān)關(guān)系,我們將它稱為正相關(guān),如圖(1)所示;(2)如果散點圖中的點散布在從左上角到右下角的區(qū)域內(nèi),對于兩個變量的這種相關(guān)關(guān)系,我們將它稱為負相關(guān),如圖(2)所示.3.相關(guān)系數(shù)若相應(yīng)于變量的取值,變量的觀測值為,則變量與的相關(guān)系數(shù),通常用來衡量與之間的線性關(guān)系的強弱,的范圍為.(1)當時,表示兩個變量正相關(guān);當時,表示兩個變量負相關(guān).(2)越接近,表示兩個變量的線性相關(guān)性越強;越接近,表示兩個變量間幾乎不存在線性相關(guān)關(guān)系.當時,所有數(shù)據(jù)點都在一條直線上.(3)通常當時,認為兩個變量具有很強的線性相關(guān)關(guān)系.Ⅱ:線性回歸1.線性回歸線性回歸是研究不具備確定的函數(shù)關(guān)系的兩個變量之間的關(guān)系(相關(guān)關(guān)系)的方法.對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn),其回歸方程的求法為其中,,,(,)稱為樣本點的中心.2.殘差分析對于預(yù)報變量,通過觀測得到的數(shù)據(jù)稱為觀測值,通過回歸方程得到的稱為預(yù)測值,觀測值減去預(yù)測值等于殘差,稱為相應(yīng)于點的殘差,即有.殘差是隨機誤差的估計結(jié)果,通過對殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差分析.(1)殘差圖通過殘差分析,殘差點比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適,其中這樣的帶狀區(qū)域的寬度越窄,說明模型擬合精確度越高;反之,不合適.(2)通過殘差平方和分析,如果殘差平方和越小,則說明選用的模型的擬合效果越好;反之,不合適.(3)相關(guān)指數(shù)用相關(guān)指數(shù)來刻畫回歸的效果,其計算公式是:.越接近于,說明殘差的平方和越小,也表示回歸的效果越好.Ⅲ:非線性回歸解答非線性擬合問題,要先根據(jù)散點圖選擇合適的函數(shù)類型,設(shè)出回歸方程,通過換元將陌生的非線性回歸方程化歸轉(zhuǎn)化為我們熟悉的線性回歸方程.求出樣本數(shù)據(jù)換元后的值,然后根據(jù)線性回歸方程的計算方法計算變換后的線性回歸方程系數(shù),還原后即可求出非線性回歸方程,再利用回歸方程進行預(yù)報預(yù)測,注意計算要細心,避免計算錯誤.1.建立非線性回歸模型的基本步驟:(1)確定研究對象,明確哪個是解釋變量,哪個是預(yù)報變量;(2)畫出確定好的解釋變量和預(yù)報變量的散點圖,觀察它們之間的關(guān)系(是否存在非線性關(guān)系);(3)由經(jīng)驗確定非線性回歸方程的類型(如我們觀察到數(shù)據(jù)呈非線性關(guān)系,一般選用反比例函數(shù)、二次函數(shù)、指數(shù)函數(shù)、對數(shù)函數(shù)、冪函數(shù)模型等);(4)通過換元,將非線性回歸方程模型轉(zhuǎn)化為線性回歸方程模型;(5)按照公式計算線性回歸方程中的參數(shù)(如最小二乘法),得到線性回歸方程;(6)消去新元,得到非線性回歸方程;(7)得出結(jié)果后分析殘差圖是否有異常.若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等.Ⅳ:獨立性檢驗1.分類變量和列聯(lián)表(1)分類變量:變量的不同“值”表示個體所屬的不同類別,像這樣的變量稱為分類變量.(2)列聯(lián)表:①定義:列出的兩個分類變量的頻數(shù)表稱為列聯(lián)表.②2×2列聯(lián)表.一般地,假設(shè)有兩個分類變量X和Y,它們的取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為總計總計從列表中,依據(jù)與的值可直觀得出結(jié)論:兩個變量是否有關(guān)系.2.等高條形圖(1)等高條形圖和表格相比,更能直觀地反映出兩個分類變量間是否相互影響,常用等高條形圖表示列聯(lián)表數(shù)據(jù)的頻率特征.(2)觀察等高條形圖發(fā)現(xiàn)與相差很大,就判斷兩個分類變量之間有關(guān)系.3.獨立性檢驗(1)定義:利用獨立性假設(shè)、隨機變量來確定是否有一定把握認為“兩個分類變量有關(guān)系”的方法稱為兩個分類變量的獨立性檢驗.(2)公式:,其中為樣本容量.(3)獨立性檢驗的具體步驟如下:①計算隨機變量的觀測值,查下表確定臨界值:0.50.400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.8415.0246.6357.87910.828②如果,就推斷“與有關(guān)系”,這種推斷犯錯誤的概率不超過;否則,就認為在犯錯誤的概率不超過的前提下不能推斷“與有關(guān)系”.【常用結(jié)論】常見的非線性回歸模型(1)指數(shù)函數(shù)型(且,)兩邊取自然對數(shù),,即,令,原方程變?yōu)椋缓蟀淳€性回歸模型求出,.(2)對數(shù)函數(shù)型令,原方程變?yōu)?,然后按線性回歸模型求出,.(3)冪函數(shù)型兩邊取常用對數(shù),,即,令,原方程變?yōu)椋缓蟀淳€性回歸模型求出,.(4)二次函數(shù)型令,原方程變?yōu)?,然后按線性回歸模型求出,.(5)反比例函數(shù)型型令,原方程變?yōu)?,然后按線性回歸模型求出,.易錯提醒:已知數(shù)據(jù)求回歸直線方程,應(yīng)根據(jù)散點圖分析變量之間是否滿足線性關(guān)系,或求相關(guān)系數(shù)r進行線性相關(guān)性的檢驗,如是非線性的關(guān)系,應(yīng)轉(zhuǎn)化為線性關(guān)系,再求解.例.某鄉(xiāng)政府為提高當?shù)剞r(nóng)民收入,指導農(nóng)民種植藥材,取得較好的效果.以下是某農(nóng)戶近5年種植藥材的平均收入的統(tǒng)計數(shù)據(jù):年份20182019202020212022年份代碼x12345平均收入y(千元)5961646873(1)根據(jù)表中數(shù)據(jù),現(xiàn)有與兩種模型可以擬合y與x之間的關(guān)系,請分別求出兩種模型的回歸方程;(結(jié)果保留一位小數(shù))(2)統(tǒng)計學中常通過比較殘差的平方和來比較兩個模型的擬合效果,已知的殘差平方和是3.5,請根據(jù)殘差平方和說明上述兩個方程哪一個擬合效果更好,并據(jù)此預(yù)測2023年該農(nóng)戶種植藥材的平均收入.參考數(shù)據(jù)及公式:,,其中.,.【詳解】(1)根據(jù)農(nóng)戶近5年種植藥材的平均收入情況的統(tǒng)計數(shù)據(jù)可得:,,所以,,則,.設(shè),則,所以,則,.所以,兩種模型的回歸方程分別為,.(2)回歸方程為時,將值代入可得估計值分別為59,60.8,63.8,68,73.4,則殘差平方和為.而的殘差平方和是3.5,則,所以回歸方程擬合效果更好,應(yīng)選擇該方程進行擬合.當時,故預(yù)測2023年該農(nóng)戶種植藥材的平均收入為80千元,即8萬元.變式1.國務(wù)院印發(fā)《新時期促進集成電路產(chǎn)業(yè)和軟件產(chǎn)業(yè)高質(zhì)量發(fā)展的若干政策》.某科技公司響應(yīng)國家號召,加大了芯片研究投入力度.從2022年起,芯片的經(jīng)濟收入逐月攀升,該公司在2022年的第一月份至第六月份的月經(jīng)濟收入(單位:百萬元)關(guān)于月份的數(shù)據(jù)如下表所示:時間(月份)123456月收入(百萬元)6915223347(1)請你根據(jù)提供數(shù)據(jù),判斷與(均為常數(shù))哪一個適宜作為該公司月經(jīng)濟收入關(guān)于月份的回歸方程類型?(給出判斷即可,不必說明理由)(2)根據(jù)(1)的結(jié)果及表中的數(shù)據(jù),求出關(guān)于的回歸方程;(3)從這6個月中抽取3個,記月收入超過16百萬的個數(shù)為,求的分布列和數(shù)學期望.參考數(shù)據(jù):2.8617.501427.29其中設(shè)參考公式和數(shù)據(jù):對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù),其回歸直線的斜率和截距的最小二乘估計公式分別為:.【詳解】(1)根據(jù)數(shù)據(jù)判斷知適宜作為該公司月經(jīng)濟收人關(guān)于月份的回歸方程類型.(2)由,得到,令,則,所以,又,所以,故,即.(3)易知在前6個月的收入中,月收入超過16佰萬的有3個,故服從的超幾何分布,又的所有取值為,又,,,,所以的分布列為0123則(或).變式2.2020年11月,國務(wù)院辦公廳印發(fā)《新能源汽車產(chǎn)業(yè)發(fā)展規(guī)劃(2021-2035年)》,要求深入實施發(fā)展新能源汽車國家戰(zhàn)略,推動中國新能源汽車產(chǎn)業(yè)高質(zhì)量可持續(xù)發(fā)展,加快建設(shè)汽車強國.同時為了推廣新能源替代傳統(tǒng)非綠色能源,除了財政補貼、稅收優(yōu)惠等激勵性政策外,可間接通過前期技術(shù)研發(fā)支持等政策引導能源發(fā)展方向.某企業(yè)多年前就開始進行新能源汽車方面的研發(fā),現(xiàn)對近10年的年技術(shù)創(chuàng)新投入和每件產(chǎn)品成本(,2,3,…,10)的數(shù)據(jù)進行分析,得到如下散點圖,
并計算得:,,,,.(1)根據(jù)散點圖可知,可用函數(shù)模型擬合y與x的關(guān)系,試建立y關(guān)于x的回歸方程;(2)已知該產(chǎn)品的年銷售額m(單
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度特殊物品運輸車輛外包安全合同3篇
- 2024版加盟合同:深入剖析加盟權(quán)益
- 2024煤炭產(chǎn)業(yè)運輸基礎(chǔ)設(shè)施建設(shè)與運營合同3篇
- 二零二五年度新型設(shè)備反擔保合同范本3篇
- 二零二五年度文化創(chuàng)意產(chǎn)品出口合同附中文翻譯3篇
- 2024版產(chǎn)品銷售代表權(quán)合同版B版
- 2025版跨境電商運營專家聘用合同3篇
- 二零二五年度涉密項目保密協(xié)議起草與安全評估3篇
- 二零二五年度生態(tài)旅游區(qū)場攤位租賃及環(huán)保服務(wù)合同2篇
- 《氣體中的沿面放電》課件
- 強基計劃模擬卷化學
- 2022年江蘇省南京市中考歷史試題(含答案)
- 商務(wù)溝通第二版第6章管理溝通
- 培訓課件-核電質(zhì)保要求
- 過敏原檢測方法分析
- TSG_R0004-2009固定式壓力容器安全技術(shù)監(jiān)察規(guī)程
- 室外給水排水和燃氣熱力工程抗震設(shè)計規(guī)范
- 《三國演義》整本書閱讀任務(wù)單
- 外觀GRR考核表
- 大型平板車安全管理規(guī)定.doc
- 企業(yè)信用管理制度
評論
0/150
提交評論