常考题型大通关:第19题统计概率
1、2018年10月17日是我国第5个扶贫日,也是第26个国际消除贫困日。射洪某企业员工共500人参加“精准扶贫”活动,按年龄分组:第一组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如图所示.
(1)下表是年龄的频数分布表,求正整数a,b的值;
(2)根据频率分布直方图,估算该企业员工的平均年龄及年龄的中位数;
(3)现在要从年龄较小的第1,2,3组中用分层抽样的方法抽取6人,从这6人中随机抽取2人参加社区宣传交流活动,求至少有1人年龄在第3组的概率.
2、某高校在2014年的自主招生考试成绩中随机抽取100名学生的笔试成绩,按成绩分组,得到的频率分布表如下左图所示.
(1)请先求出频率分布表中①、②、③、④位置相应的数据,再在答题纸上完成下列频率分布直方图;
(2)为了能选拔出最优秀的学生,高校决定在笔试成绩高的第3、4、5组中用分层抽样抽取6名学生进入第二轮面试,求第3、4、5组每组各抽取多少名学生进入第二轮面试?
3、随着生活水平的提高,人们对空气质量的要求越来越高,某机构为了解公众对“车辆限行”的态度,随机抽查40人,并将调查情况进行整理后制成下表:
年龄(岁) [15,25) [25,35) [35,45) [45,55) [55,60]
频数 5 10 10 5 10
赞成人数 4 6 8 4 9
1.完成被调查人员年龄的频率分布直方图,并求被调查人员中持赞成态度人员的平均年龄约为多少岁?
15,25,45,55的被调查人员中各随机选取1人进行调查.请写出所有的基2.若从年龄在[)[)
本亊件,并求选取2人中恰有1人持不赞成态度的概率.
4、某中学为弘扬优良传统,展示80年来的办学成果,特举办“建校80周年教育成果展示月”活动。现在需要招募活动开幕式的志愿者,在众多候选人中选取100名志愿者,为了在志愿者
.
组号分组频数频率
160,165 5 0.05
第1组[)
第2组[165,170)0.35
第3组[170,175)
第4组[175,180)20 0.20
第5组[180,185)10
合计100 1.00
1.请补充频率分布表中空白位置相应数据,再完成下列频率分布直方图;
2.为选拔出主持人,决定在第3、4、5组中用分层抽样抽取6人上台,求第3、4、5组每组各抽取多少人?
3.在2的前提下,主持人会在上台的6人中随机抽取2人表演诗歌朗诵,求第3组至少有一人被抽取的概率?
5、某中学组织了一次高三学生数学学业水平模拟测试,学校从测试合格的男、女生中各随机抽取100人的成绩进行统计分析,分别制成了如图所示的男生和女生数学成绩的频率分布直方图.
1.若所得分数大于等于80分认定为优秀,求男、女生优秀人数各有多少人?
2.在1中的优秀学生中用分层抽样的方法抽取5人,从这5人中任意选取2人,求至少有一名男生的概率.
6、某乡镇根据中央文件精神,在2014年通过精准识别确定建档立卡的贫困户共有473户,结合当地实际情况采取多项精准扶贫措施,从2015年至2018年该乡镇每年脱贫户数见下表:年份2015 2016 2017 2018 年份代码x 1 2 3 4
脱贫户数y55 69 71 85
(1)根据2015-2018年的数据,求出y关于x的线性回归方程$$
y bx a
=
$;
(2)利用(1)中求出的线性回归方程,试判断到2020年底该乡镇的473户贫困户能否全部脱贫.
附:$$
1
2
2
1
,
n
i i
i
n
i
i
x y nxy
b a y bx
x nx
=
=
-
==-
-
∑
∑
$$
7、某农科所对冬季昼夜温差大小与某反季节大豆新品种种子发芽数之间的关系进行分析研究,他们分别记录了12月1日至12月5日每天昼夜温差大小与实验室每天每100颗种子中的发芽数,得到如下数据:
该农科所确定的研究方案是:先从这5组数据中随机选取2组,用剩下的
3组数据求线性回归方程,再对被选取的2组数据进行检验。
(1)求随机选取的2组数据恰好是不相邻的2天数据的概率;
(2)若选取的是12月l 日与12月5日的两组数据,请根据12月2日至12月4日的数据,求y 关于x 的线性回归方程$
$;y bx a = $ (3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠.
参考公式:$1
2
2
1
,.i
n
i i
i n
i x y
nxy b
a
y bx x
nx
==-==--∑∑$$ 8、在一次抽样调查中测得样本的5个样本点,数值如下表:
x
0.25 0.5 1 2 4 y 16
12
5
2
1
(1).根据散点图判断,y a bx = 与k y c x = 哪一个适宜作为y 关于x 的回归方程类型?(给出
判断即可,不必说明理由)
(2).根据(1)的判断结果试建立y 与x 之间的回归方程.(注意,a b 或,c k 计算结果保留整数) (3).由(2)中所得设z y x = 且[)4,x ∈∞,试求z 的最小值。 参考数据及公式如下:
5
1
23i i
i x y
==∑,55
2
2
1
1
21.3125,430i i i i x y ====∑∑,()()
()1
12
2
2
1
1
n
n
i
i
i i
i i n
n
i
i
i i x x y
y x y
nxy
b x x x
nx ∧
====---=
=
--∑∑∑∑
9、某校的研究性学习小组为了研究中学生的身高与性别情况,在该校随机抽出80名17至18周岁的学生,其中身高170≥的男生有30人,女生4人;身高<170的男生有10人。 (1)根据以上数据建立一个22?列联表:
(2)请问在犯错误的概率不超过0.001的前提下,该校17至18周岁的学生的身高与性别是否有关?
参考公式: 2
2
()()()()()
n ad bc k a b c d a c b d -=
参考数据:
10、随着共享单车的成
功
运
营,更多的共享产品逐步走入大家的世界,共
享汽车、共享篮
球、共享充电宝等各种共享产品层出不穷.某公司随机抽取1000人对共享产品对共享产品是否对日常生活有益进行了问卷调查,并对参与调查的1000人中的性别以及意见进行了分类,得到的数据如下表所示:
(ⅰ)根据表中的数据,能否在犯错的概率不超过
0.1%的前提下,认为对共享产品的态度
与性别有关系?
(ⅱ)现按照分层抽样从认为共享产品增多对生活无益的人员中随机抽取6人,再从6人中随机抽取2人赠送超市购物券作为答谢,求恰有1人是女性的概率.
参考公式:
()
()()()()
2
2
n ad bc
k
a b c d a c b d
-
=
.
临界值表:
答案以及解析
1答案及解析:
答案:(1)由题设可知,0.085500200a =??=,0.02550050b =??=. (2)根据频率分布直方图可得,平均年龄为
(27.50.0232.50.0237.50.0842.50.0647.50.02)538.5x =? ? ? ? ??=&
估计中位数:0.3
35538.750.4
?
=. ` (3)因为第1,2,3组共有50 50 200=300人,
利用分层抽样在300名学生中抽取6名学生,每组抽取的人数分别为: 第1组的人数为50
61300?= 第2组的人数为50
61300?= 第3组的人数为200
64300
?
= 设第1组的1位同学为a ,第2组的1位同学为b ,第3组的4位同学为1234,,,c c c c , 则从六位同学中抽两位同学有:
(,)a b ,1(,)a c ,2(,)a c ,3(,)a c ,4(,)a c ,1(,)b c ,2(,)b c ,3(,)b c ,4(,)b c ,12(,)c c ,13(,)c c ,14(,)c c ,23(,)c c ,24(,)c c ,34(,)c c ,共15种可能。
其中2人年龄都不在第3组的有:(,)a b ,共1种可能, 所以至少有1人年龄在第3组的概率为114
11515
-=. 解析:
2答案及解析:
答案:(1) ①35②0.300③100④1.000 频率分布直方图如下:
(2)因为第3、4、5组共有60名学生,所以利用分层抽样在60名学生中抽取6名学生,每组分别为: 第3组:
306360?=人, 第4组:206260?=人, 第5组:10
6160
?=人, 所以第3、4、5组分别抽取3人、2人、1人。 解析:
3答案及解析:
答案:1.被调查人员年龄的频率分布直方图如图所示:
被调查人员持赞成态度人的平均年龄约为
420630840450960
42.646849
x ? ? ? ? ?=
≈ (岁).
2.设[
)15,25中赞成的4人分别为1234,,,a a a a ,不赞成的1人为a ,[
)45,55中赞成的4人分别为1234,,,b b b b ,不赞成的1人为b . 基本事件为:
()()()()()111213141,,,,,,,,,,a b a b a b a b a b ()()()()()
212223242,,,,,,,,,a b a b a b a b a b
,()()()()31323334,,,,,,,,
a b a b a b a b ()()()()()()3414243444,,,,,,,,,,,a b a b a b a b a b a b ,
()()()()()1234,,,,,,,,,a b a b a b a b a b 基本事件共有55?
25?=个,其中恰有1人持不赞成态度的基本事件为111148 =个.据古典概型知:恰有1人持不赞成态度的概率
8
25
p =
. 解析:
4答案及解析: 答案:1.第二组的频数为1000.35? 35?=,故第三组的频数为100535201030----=,故第三组的频率为,第五组的频率为,补全后频率分布表为:
频率分布直方图为:
2.第三组、第四组、第五组的频率之比3:2:1,故第三组、第四组、第五组抽取的人数分别为3,2,1.
3.设第三组中抽取的三人为123,,,a a a ,第四组中抽取的两人为12,b b ,第五组中抽取的一人为 c ,则6人中任意抽取两人,所有的基本事件如下:
12132312212231321212312,,,,,,,,,,,,,a a a a a a a b a b a b a b a b b b ac a c a c b c b c ,
故第三组中至少有1人被抽取的概率为124155
p ==. 解析:
5答案及解析:
答案:1.由题可得,男生优秀人数为100(0.010.02)1030? ?=人, 女生优秀人数为100(0.0150.03)1045? ?=人. 2.因为样本容量与总体中的个体数的比是51
304515
= ,
所以样本中包含男生人数为130215?
=人,女生人数为1
45315
?=人. 设两名男生为1a ,2a ,三名女生为1b ,2b ,3b .
则从5人中任意选取2人构成的所有基本事件为: {}{}{}{}12111213,,,,,,,,a a a b a b a b
{}{}{}{}{}{}212223121323,,,,,,,,,,,a b a b a b b b b b b b 共10个,
每个样本被抽到的机会均等,因此这些基本事件的出现是等可能的.
记事件 c :“选取的2人中至少有一名男生”,则事件 c 包含的基本事件有:
{}{}1211,,,,a a a b
{}{}{}{}{}1213212223,,,,,,,,,a b a b a b a b a b 共7个.
所以7()10
p c =
, 即选取的2人中至少有一名男生的概率为
710
. 解析:1.由频率分布直方图可分别得到男生,女生优秀的频率,再乘以总人数100,即可得到男、女生优秀人数;
2.构建有序实数对,用枚举法列举所有可能的情形和满足题意的情形,再利用古典概型的计算公式求解即可.
6答案及解析: 答案:(1)因为1234 2.54x =
=,556971 85
704
у ==,4
1
155 269371 485746i i
i x y
==? ? ? ?=∑,421
1491630i i x == =∑,所以
2
7464 2.5709.2304 2.5b -??==-?$,$$709.2 2.547a y bx =-=-?=$. 因此,所求线性回归方程为$
9.247y x = 。 (2)根据(1)中求得的线性回归方程可估算出 2019年脱贫户数:$
19.254793y =? =, 2020年脱贫户数:$
29.2647102y =? ≈. 因为2015-2018年实际脱贫280户,2019年和2020年估计共脱贫195户,
280 195 475 47 =>,所以到2020年底该乡镇的473户贫困户估计能够全部脱贫.
解析:
7答案及解析:
答案:解:(1)记选取到不相邻两组数据为事件a .
因为从5组数据中随机选取2组数据共有10种情况,每种情况是等可能出现的,其中选取到相邻两组数据的情况有4种, 所以43
()1,105
p a =-
= 故选取的2组数据恰好是不相邻的2天数据的概率是3
.5
(2)1
(111312)12,3x =? =
1
(253026)27,3
y =? =
3972,
x y ?=1
112513*********,n
i i
i x y
==? ? ?=∑
22221
111312434,i n
i x == =∑2
23312432,x =?=
所以3
1
32
21
39779725,4344322
3i i i
i i x y
xy
b
x x
==--==
=--∑∑$$3,a y bx =-=-$ 所以y 关于x 的线性回归方程为$5
3.2y x =-
(3)当10x =时,$5
10322,2223 2.2y =?-=-<
当8x =时,$5
8317,17162,2y =?-=-<
所以该研究所得到的线性回归方程是可靠的。 解析:
8答案及解析:
答案:(1).由散点图可以判断,k
y c x = 适宜作为y 关于x 的回归方程;
(2).根据散点图可知y 与x 近似地呈反比例函数关系,设k y c x = ,令1
t x =
则y c kt = ,原数据变为:
由散点图可以看出y 与t 呈近似的线性相关关系. 所以 1.55,7.2t y ==, 4.1344b ∧
≈≈,1a y bt ∧
=-≈ 所以41y t ∧
=
所以y 关于x 的回归方程是41y x
∧
= (3).由(2)得41z y x x x
= = .
易知在[)4,x ∈∞z 是关于x 的单调递增函数所以最小值为6.. 解析:
9答案及解析:
答案:(1)22?列联表如下:
(2).22
80(3036104)34.5810.82840403446
k ??-?=≈>???
2(10.82)0.001p k >≈q
所以,在犯错误的概率不超过0.10的前提下,认为该校17至18周岁的学生身高与性别有关
解析:
10答案及解析:
答案: (ⅰ)依题意,在本次的实验中, 2
k 的观测值()
2
2
1000400200300100700300500500
k ??-?=
???
47.61910.828≈>,
故可以在犯错误的概率不超过0.1%的前提下,认为对共享产品的态度与性别有关系. (ⅱ)依题意,应该认为共享产品增多对生活无益的女性中抽取4人,记为,,,a b c d ,从认为共享产品增多对生活无益的男性中抽取2人,记为,a b ,
从以上6人中随机抽取2人,所有的情况为: (),a b , (),a c , (),a d , (),a a , (),a b ,
(),b c , (),b d , (),b a , (),b b , (),c d , (),c a , (),c b , (),d a , (),d b , ()
,a b 共15种,其中满足条件的为(),a a , (),a b , (),b a , (),b b , (),c a , (),c b , (),d a ,
(),d b 共8种情况.
故所求概率
8
15
p .
解析: