专题15 概率与统计(解答题)
1.【2019年高考全国ⅰ卷文数】某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
(1)分别估计男、女顾客对该商场服务满意的概率;
(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异
附:
2
2
()
()()()()
n ad bc
k
a b c d a c b d
-
=
.
【答案】(1)男、女顾客对该商场服务满意的概率的估计值分别为0.8,0.6;(2)有95%的把握认为男、女顾客对该商场服务的评价有差异.
【解析】(1)由调查数据,男顾客中对该商场服务满意的比率为40
0.8 50
=,
因此男顾客对该商场服务满意的概率的估计值为0.8.
女顾客中对该商场服务满意的比率为30
0.6 50
=,
因此女顾客对该商场服务满意的概率的估计值为0.6.
(2)由题可得
2
2
100(40203010)
4.762
50507030
k
??-?
=≈
???
.
由于4.762 3.841
>,
故有95%的把握认为男、女顾客对该商场服务的评价有差异.
2.【2019年高考全国ⅱ卷文数】某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用
该组区间的中点值为代表).(精确到)
8.602≈.
【答案】(1)产值增长率不低于40%的企业比例为21%,产值负增长的企业比
例为2%;(2)这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.
【解析】(1)根据产值增长率频数分布表得,
所调查的100个企业中产值增长率不低于40%的企业频率为
1470.21100
=. 产值负增长的企业频率为20.02100=. 用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.
(2)1(0.1020.10240.30530.50140.707)0.30100
y =-? ? ? ? ?=, ()522
11100i i i s n y y ==-∑ 222221(0.40)2(0.20)240530.20140.407100??=-? -? ? ? ??
? =0.0296,
0.020.17s ==≈,
所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.
3.【2019年高考全国ⅲ卷文数】为了解甲、乙两种离子在小鼠体内的残留程度,
进行如下试验:将200只小鼠随机分成a,b两组,每组100只,其中a组小鼠给服甲离子溶液,b组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记c为事件:“乙离子残留在体内的百分比不低于”,根据直方图得到p(c)的估计值为.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
【答案】(1)0.35
b=;(2)甲、乙离子残留百分比的平均值的估计值a=,0.10
分别为4.05,6.00.
【解析】(1)由已知得0.700.200.15
a=.
a
= ,故0.35
b=---=.
10.050.150.700.10
(2)甲离子残留百分比的平均值的估计值为
20.1530.2040.3050.2060.1070.05 4.05
? ? ? ? ? ?=.
乙离子残留百分比的平均值的估计值为
? ? ? ? ? ?=.
30.0540.1050.1560.3570.2080.15 6.00
4.【2019年高考天津卷文数】2019年,我国施行个人所得税专项附加扣除办法,涉及子女教育、继续教育、大病医疗、住房贷款利息或者住房租金、赡养老人等六项专项附加扣除.某单位老、中、青员工分别有72,108,120人,现采用分层抽样的方法,从该单位上述员工中抽取25人调查专项附加扣除的享受情况.
(1)应从老、中、青员工中分别抽取多少人
(2)抽取的25人中,享受至少两项专项附加扣除的员工有6人,分别记为,,,,,
a b c d e f.享受情况如下表,其中“○”表示享受,“×”表示不享受.现
从这6人中随机抽取2人接受采访.
(i)试用所给字母列举出所有可能的抽取结果;
(ii)设m为事件“抽取的2人享受的专项附加扣除至少有一项相同”,求事件m发生的概率.
【答案】(1)应从老、中、青员工中分别抽取6人,9人,10人;(2)(i)见
解析,(ii)11 15
.
【分析】本题主要考查随机抽样、用列举法计算随机事件所含的基本事件数、古典概型及其概率计算公式等基本知识,考查运用概率知识解决简单实际问题的能力.
【解析】(1)由已知,老、中、青员工人数之比为6 : 9 : 10,
由于采用分层抽样的方法从中抽取25位员工,
因此应从老、中、青员工中分别抽取6人,9人,10人.
(2)(i)从已知的6人中随机抽取2人的所有可能结果为
c f
},,
b d b e b f
c
d c e{,},
a b a c a d a e a f b c{, },{, },{, },{, {,}
{, },{, },{, },{, },{, },{, },
d e d f e f,共15种.
{,},{,},{,}
(ii)由表格知,符合题意的所有可能结果为
a b a d a e a f b d b c
e b
f e c f d f e f,共11种.
},} {, },{, },{, },{, },{, },{, },{, {,},{,},{,},{,
所以,事件m发生的概率11
p m .
()
15
5.【2019年高考北京卷文数】改革开放以来,人们的尊龙人生就是博首页的支付方式发生了巨大转变.近年来,移动支付已成为主要尊龙人生就是博首页的支付方式之一.为了解某校学生上个月a,b两种移动尊龙人生就是博首页的支付方式的使用情况,从全校所有的1000名学生中随机抽取了100人,发现样本中a,b两种尊龙人生就是博首页的支付方式都不使用的有5人,样本中仅使用a和仅使用b的学生的支付金额分布情况如下:
(1)估计该校学生中上个月a,b两种尊龙人生就是博首页的支付方式都使用的人数;
(2)从样本仅使用b的学生中随机抽取1人,求该学生上个月支付金额大于2 000元的概率;
(3)已知上个月样本学生的尊龙人生就是博首页的支付方式在本月没有变化.现从样本仅使用b的学生中随机抽查1人,发现他本月的支付金额大于2 000元.结合(2)的结果,能否认为样本仅使用b的学生中本月支付金额大于2 000元的人数有变化说明理由.
【答案】(1)该校学生中上个月a,b两种尊龙人生就是博首页的支付方式都使用的人数约为400;(2)0.04;(3)见解析.
【解析】(1)由题知,样本中仅使用a的学生有27 3=30人,
仅使用b的学生有24 1=25人,
a,b两种尊龙人生就是博首页的支付方式都不使用的学生有5人.
故样本中a,b两种尊龙人生就是博首页的支付方式都使用的学生有100–30–25–5=40人.
估计该校学生中上个月a,b两种尊龙人生就是博首页的支付方式都使用的人数为
40
1000400 100
?=.
(2)记事件c为“从样本仅使用b的学生中随机抽取1人,该学生上个月的支付金额大于2 000元”,
则1()0.0425
p c ==. (3)记事件e 为“从样本仅使用b 的学生中随机抽查1人,该学生本月的支付金额大于2 000元”.
假设样本仅使用b 的学生中,本月支付金额大于2 000元的人数没有变化, 则由(2)知,4(0)0.p e =.
答案示例1:可以认为有变化.理由如下:
()p e 比较小,概率比较小的事件一般不容易发生,
一旦发生,就有理由认为本月支付金额大于2 000元的人数发生了变化, 所以可以认为有变化.
答案示例2:无法确定有没有变化.理由如下:
事件e 是随机事件,()p e 比较小,一般不容易发生,但还是有可能发生的, 所以无法确定有没有变化.
6.【2018年高考全国ⅱ卷文数】下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,,17)建立模型①:?30.413.5
y t
=- ;根据2010年至2016年的数据(时间变量t的值依次为1,2,,7)建立模型②:?9917.5
= .
y t
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠并说明理由.
【答案】(1)模型①:亿元,模型②:亿元;(2)模型②得到的预测值更可靠,理由见解析.
【解析】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为y=– ×19=(亿元).
利用模型②,该地区2018年的环境基础设施投资额的预测值为
y=99 ×9=(亿元).
(2)利用模型②得到的预测值更可靠.
理由如下:
(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=– 上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y=99 可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.
以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分.7.【2018年高考全国ⅰ卷文数】某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
量
频数13249265使用了节水龙头50天的日用水量频数分布表
日用水量[)
00.1
,[)
0.10.2
,[)
0.20.3
,[)
0.30.4
,[)
0.40.5
,[)
0.50.6
,
频数151310165
(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:
(2)估计该家庭使用节水龙头后,日用水量小于 m3的概率;
(3)估计该家庭使用节水龙头后,一年能节省多少水(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)
【答案】(1)见解析;(2);(3)3
47.45m.
【解析】(1)频率分布直方图如下:
(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于的频率为
× 1× × 2×=,
因此该家庭使用节水龙头后日用水量小于的概率的估计值为.
(3)该家庭未使用节水龙头50天日用水量的平均数为
11
(0.0510.1530.2520.3540.4590.55260.655)0.48 50
x=? ? ? ? ? ? ?=.该家庭使用了节水龙头后50天日用水量的平均数为
21
(0.0510.1550.25130.35100.45160.555)0.35 50
x=? ? ? ? ? ?=.
估计使用节水龙头后,一年可节省水3
(0.480.35)36547.45(m)
-?=.
8.【2018年高考全国ⅲ卷文数】某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高并说明理由;
(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:
超过m不超过m
第一种生产方
式
第二种生产方
(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异
附:
2
2
()
()()()()
n ad bc
k
a b c d a c b d
-
=
,
2
()0.0500.0100.001
3.8416.63510.828
p k k
k
≥
.
【答案】(1)第二种生产方式的效率更高,理由见解析;(2)列联表见解析;(3)有99%的把握认为两种生产方式的效率有差异.
【解析】(1)第二种生产方式的效率更高.
理由如下:
(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.
(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为分钟.因此第二种生产方式的效率更高.
(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.
(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.
以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.
(2)由茎叶图知
7981
80
2
m
==.
列联表如下:
(3)由于
2
2
40(151555)
10 6.635
20202020
k
?-?
==>
???
,所以有99%的把握认为两种生产方式
的效率有差异.
9.【2018年高考北京卷文数】电影公司随机收集了电影的有关数据,经分类整理得到下表:
好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.
(1)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;
(2)随机选取1部电影,估计这部电影没有获得好评的概率;
(3)电影公司为增加投资回报,拟改变投资策略,这将导致不同类型电影的好评率发生变化.假设表格中只有两类电影的好评率数据发生变化,那么哪类电影的好评率增加,哪类电影的好评率减少,使得获得好评的电影总部数与样本中的电影总部数的比值达到最大(只需写出结论)
【答案】(1)0.025;(2)0.814;(3)增加第五类电影的好评率,减少第二类电影的好评率.
【解析】(1)由题意知,样本中电影的总部数是140 50 300 200 800 510=2000.
第四类电影中获得好评的电影部数是200×=50,
故所求概率为
50
0.025 2000
=.
(2)方法1:由题意知,样本中获得好评的电影部数是140× 50× 300× 200× 800× 510×
=56 10 45 50 160 51
=372.
故所求概率估计为
372
10.814
2000
-=.
方法2:设“随机选取1部电影,这部电影没有获得好评”为事件b.
没有获得好评的电影共有140× 50× 300× 200× 800× 510×=1628部.
由古典概型概率公式得
1628
0.814
2
)
00
(
p b==.
(3)增加第五类电影的好评率,减少第二类电影的好评率.
10.【2018年高考天津卷文数】已知某校甲、乙、丙三个年级的学生志愿者人数分别为240,160,160.现采用分层抽样的方法从中抽取7名同学去某敬老院参加献爱心活动.
(1)应从甲、乙、丙三个年级的学生志愿者中分别抽取多少人
(2)设抽出的7名同学分别用a,b,c,d,e,f,g表示,现从中随机抽取
2名同学承担敬老院的卫生工作.
(i)试用所给字母列举出所有可能的抽取结果;
(ii)设m为事件“抽取的2名同学来自同一年级”,求事件m发生的概率.
.
【答案】(1)分别抽取3人,2人,2人;(2)(i)见解析,(ii)5
21
【分析】本小题主要考查随机抽样、用列举法计算随机事件所含的基本事件数、古典概型及其概率计算公式等基本知识,考查运用概率知识解决简单实际问题的能力.
【解析】(1)由已知,甲、乙、丙三个年级的学生志愿者人数之比为3∶2∶2,由于采用分层抽样的方法从中抽取7名同学,
因此应从甲、乙、丙三个年级的学生志愿者中分别抽取3人,2人,2人.(2)(i)从抽出的7名同学中随机抽取2名同学的所有可能结果为
{a,b},{a,c},{a,d},{a,e},{a,f},{a,g},{b,c},{b,d},{b,e},{b,f},{b,g},{c,d},{c,e},{c,f},{c,g},{d,e},{d,f},{d,g},{e,f},{e,g},{f,g},共21种.
(ii)由(1),不妨设抽出的7名同学中,来自甲年级的是a,b,c,来自乙年级的是d,e,来自丙年级的是f,g,
则从抽出的7名同学中随机抽取的2名同学来自同一年级的所有可能结果为