某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:
日期 |
12月1日 |
12月2日 |
12月3日 |
12月4日 |
12月5日 |
温差x/℃ |
10 |
11 |
13 |
12 |
8 |
发芽数y /颗 |
23 |
25 |
30 |
26 |
16 |
该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.
(1)求选取的2组数据恰好是不相邻2天数据的概率;
(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y关于x的线性回归方程=bx+a;
(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?
为了对新产品进行合理定价,对该产品进行了试销试验,以观察需求量Y(单位:千件)对于价格x(单位:千元)的反应,得数据如下:
x/千元 |
50 |
70 |
80 |
40 |
30 |
90 |
95 |
97 |
y/千件 |
100 |
80 |
60 |
120 |
135 |
55 |
50 |
48 |
(1)若y与x之间具有线性相关关系,求y对x的回归直线方程;
(2)若成本x=y+500,试求:
①在盈亏平衡条件下(利润为零)的价格;
②在利润为最大的条件下,定价为多少?
在某种产品表面进行腐蚀性刻线实验,得到腐蚀深度y与腐蚀时间x之间相应的一组观察值,如下表:
x/s |
5 |
10 |
15 |
20 |
30 |
40 |
50 |
60 |
70 |
90 |
120 |
y/μm |
6 |
10 |
10 |
13 |
16 |
17 |
19 |
23 |
25 |
29 |
46 |
用散点图及相关系数两种方法判断x与y的相关性.
某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:
该兴趣小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验。
(1)求选取的2组数据恰好是相邻两个月的概率;
(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y关于x的线
性回归方程;
(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?
从某居民区随机抽取10个家庭,获得第个家庭的月收入(单位:千元)与月储蓄(单位:千元)的数据资料,算得
,,,.
(1)求家庭的月储蓄对月收入的线性回归方程;
(2)判断变量与之间是正相关还是负相关;
(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
其中,为样本平均值,线性回归方程也可写为
附:线性回归方程中,,,
某旅行社为调查市民喜欢“人文景观”景点是否与年龄有关,随机抽取了55名市民,得到数据如下表:
|
喜欢 |
不喜欢 |
合计 |
大于40岁 |
20 |
5 |
25 |
20岁至40岁 |
10 |
20 |
30 |
合计 |
30 |
25 |
55 |
(1)判断是否有99.5%的把握认为喜欢“人文景观”景点与年龄有关?
(2)用分层抽样的方法从喜欢“人文景观”景点的市民中随机抽取6人作进一步调查,将这6位市民作为一个样本,从中任选2人,求恰有1位“大于40岁”的市民和1位“20岁至40岁”的市民的概率.
下面的临界值表供参考:
0.15 |
0.10 |
0.05 |
0.025 |
0.010 |
0.005 |
0.001 |
|
2.072 |
2.706 |
3.841 |
5.024 |
6.635 |
7.879 |
10.828 |
(参考公式:,其中)
下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.
x |
3 |
4 |
5 |
6 |
y |
2.5 |
3 |
4 |
4.5 |
(1)请画出上表数据的散点图.
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程=bx+a.
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
某班主任对全班50名学生进行了作业量多少的调查,喜欢玩电脑游戏的同学认为作业多的有18人,认为作业不多的有9人,不喜欢玩电脑游戏的同学认为作业多的有8人,认为作业不多的有15人.
(1)根据以上数据建立一个2×2的列联表.
(2)有多大的把握认为“喜欢玩电脑游戏与认为作业多有关系”?
(参考数值:≈5.059)
设三组实验数据(x1,y1),(x2,y2),(x3,y3)的回归直线方程是:=x+,使代数式[y1-(x1+)]2+[y2-(x2+)]2+[y3-(x3+)]2的值最小时,=-,=(,分别是这三组数据的横、纵坐标的平均数),
若有7组数据列表如下:
x |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
y |
4 |
6 |
5 |
6.2 |
8 |
7.1 |
8.6 |
(1)求上表中前3组数据的回归直线方程.
(2)若|yi-(xi+)|≤0.2,即称(xi,yi)为(1)中回归直线的拟合“好点”,求后4组数据中拟合“好点”的概率.
某地粮食需求量逐年上升,下表是部分统计数据:
年份(年) |
2002 |
2004 |
2006 |
2008 |
2010 |
需求量 (万吨) |
236 |
246 |
257 |
276 |
286 |
(1)利用所给数据求年需求量与年份之间的回归直线方程=x+.
(2)利用(1)中所求出的直线方程预测该地2014年的粮食需求量.
为了解高二某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表:
已知在全部50人中随机抽取1人抽到喜爱打篮球的学生的概率为.
(1)请将上面的列联表补充完整;
(2)是否有99.5%的把握认为喜爱打篮球与性别有关?说明你的理由;
下面的临界值表供参考:
(参考公式K2=,其中n=a+b+c+d)
一家商场为了确定营销策略,进行了投入促销费用x和商场实际销售额y的试验,得到如下四组数据.
投入促销费用x(万元) |
2 |
3 |
5 |
6 |
商场实际营销额y(万元) |
100 |
200 |
300 |
400 |
(1)在下面的直角坐标系中,画出上述数据的散点图,并据此判断两个变量是否具有较好的线性相关性;
(2)求出x,y之间的回归直线方程=x+;
(3)若该商场计划营销额不低于600万元,则至少要投入多少万元的促销费用?
为了解某班关注NBA是否与性别有关,对本班48人进行了问卷调查得到如下的列联表:
|
关注NBA |
不关注NBA |
合计 |
男生 |
|
6 |
|
女生 |
10 |
|
|
合计 |
|
|
48 |
已知在全班48人中随机抽取1人,抽到关注NBA的学生的概率为.
(1)请将上面的表补充完整(不用写计算过程),并判断是否有95%的把握认为关注NBA与性别有关?说明你的理由.
(2)现记不关注NBA的6名男生中某两人为a,b,关注NBA的10名女生中某3人为c,d,e,从这5人中选取2人进行调查,求:至少有一人不关注NBA的被选取的概率。
下面的临界值表,供参考
P(K2≥k) |
0.10 |
0.05 |
0.010 |
0.005 |
K |
2.706 |
3.841 |
60635 |
7.879 |
(参考公式:)其中n=a+b+c+d
由某种设备的使用年限(年)与所支出的维修费(万元)的数据资料,算得,,, .
(Ⅰ)求所支出的维修费对使用年限的线性回归方程;
(Ⅱ)判断变量与之间是正相关还是负相关;
(Ⅲ)估计使用年限为8年时,支出的维修费约是多少.
附:在线性回归方程中,,,其中,为
样本平均值,线性回归方程也可写为.
2013年9月20日是第25个全国爱牙日。某区卫生部门成立了调查小组,调查 “常吃零食与患龋齿的关系”,对该区六年级800名学生进行检查,按患龋齿和不患龋齿分类,得汇总数据:不常吃零食且不患龋齿的学生有60名,常吃零食但不患龋齿的学生有100名,不常吃零食但患龋齿的学生有140名.
0.010 |
0.005 |
0.001 |
|
6.635 |
7.879 |
10.828 |
(1)能否在犯错概率不超过0.001的前提下,认为该区学生的常吃零食与患龋齿有关系?
(2)4名区卫生部门的工作人员随机分成两组,每组2人,一组负责数据收集,另一组负责数据处理.求工作人员甲分到负责收集数据组,工作人员乙分到负责数据处理组的概率.
附: