从某寄宿制中学高三学生中随机抽取100名男生的身高、体重、和体育成绩如下表,现要求
(1)给出这些数据的直观描述;
(2)根据这些数据估计全校学生的平均身高和体重;
(3)若普通中学同龄男生平均身高为168.3m,平均体重56.2kg,能否认为该中学男生身高比普通中学显著高?
(4)身高和体重对体育成绩是否有影响?
学号身高体重成绩学号身高体重成绩
1 167 50 85 51 180 73 83
2 179 6
3 93 52 170 58 83
3 168 5
4 78 53 17
5 68 86
4 187 79 91 54 158 5
5 80
5 179 69 8
6 55 174 6
7 82
6 172 59 84 56 162 50 83
7 169 59 81 57 172 63 63
8 167 56 83 58 166 50 86
9 174 61 67 59 162 62 73
10 166 48 76 60 182 70 84
11 167 55 67 61 171 60 87
12 177 65 67 62 175 58 75
13 174 61 65 63 179 66 71
14 173 65 76 64 172 61 85
15 159 48 72 65 174 61 85
16 170 68 82 66 160 45 70
17 173 62 68 67 164 57 70
18 176 70 86 68 176 60 75
19 170 57 81 69 182 73 80
20 170 57 76 70 173 59 73
21 162 53 71 71 169 51 92
22 177 67 67 72 171 54 84
23 179 68 75 73 175 63 70
24 172 61 83 74 173 65 81
25 170 58 84 75 175 72 68
26 177 67 79 76 162 47 63
27 172 62 87 77 172 62 89
28 166 53 81 78 170 63 70
29 174 62 83 79 171 68 80
30 171 63 63 80 179 66 96
31 169 56 76 81 167 51 87
32 167 64 85 82 174 65 70
33 169 64 71 83 170 52 62
34 166 53 79 84 175 66 84
35 163 50 80 85 168 55 76
36 175 66 74 86 163 57 88
37 173 66 91 87 170 63 71
38 163 51 66 88 177 62 79
39 158 44 70 89 172 58 85
40 175 69 69 90 167 58 87
41 174 61 86 91 169 59 88
42 159 53 79 92 171 63 80
43 160 47 88 93 179 65 79
44 168 63 88 94 168 58 70
45 169 53 81 95 160 45 83
46 171 63 85 96 165 52 63
47 160 51 81 97 167 53 75
48 165 53 67 98 164 56 89
49 174 63 87 99 156 45 72
50 164 53 64 100 166 50 69 解答:
首先将所给数据保存文件,然后用MA TLAB作图以及计算各统计量。(1)利用hist()画出直方图,程序如下:
>> h=data(:,1);w=data(:,2);s=data(:,3);
>> subplot(1,3,1);hist(h);title('身高');
>> subplot(1,3,2);hist(w);title('体重');
>> subplot(1,3,3);hist(s);title('体育成绩');
解释说明:
hist(Y):把Y中的元素等间距分为10个区段,并且在每一个区段中
把元素的数目作为行向量返回。
subplot(m,n,p):把一个图形窗口分隔成m*n个小窗口,并在第p个小窗口创建一个坐标轴,该坐标为当前坐标轴。
作频数表:
程序如下:
>> [N,X]=hist(h);
>> N
N=
5 8 8 1
6 20 20 13
7 2 1
>> X
X =
157.5500 160.6500 163.7500 166.8500 169.9500 173.0500 176.1500 179.2500 182.3500 185.4500
>> [N,X]=hist(w);
>> N
N=6 11 12 16 12 23 12 5 2 1
>> X
X =
45.7500 49.2500 52.7500 56.2500 59.7500 63.2500
66.7500 70.2500 73.7500 77.2500
>> [N,X]=hist(s);
>> N
N=7 8 15 7 11 13 18 16 3 2
>> X
X = 63.7000 67.1000 70.5000 73.9000 77.3000
80.7000 84.1000 87.5000 90.9000 94.3000
解释说明:[N,X]=hist(data,k)数组data的频数表,它将区间等分为k 份(缺省时k设为10),N返回为k个小区间的频数,X
返回为k个小区间的中点。
表一为身高的频数表:
表二为体重的频数表:
表三为成绩的频数表:
计算相关的统计量:
程序如下:
>> datamean=mean(data);
>> datamean
datamean =
170.1100 59.2300 78.2800
>> datastd=std(data);
>> datastd
datastd =
6.0834
7.2235
8.2095 >> datavar=var(data);
>> datavar
datavar =
37.0080 52.1789 67.3956 >> datarange=range(data);
>> datarange
datarange =
31 35 34
>> dataskewness=skewness(data);
>> dataskewness
dataskewness =
-0.0659 -0.0340 -0.2252
>> datakurtosis=kurtosis(data);
>> datakurtosis
datakurtosis =
2.7839 2.5443 2.0565
对以上计算结果,可得表四:
(2)先假设身高和体重服从正态分布,可以用normplot()函数检验。
程序如下:
>> normplot(h);
>> hold on;
>> normplot(w);
由图像可知,身高和体重近似服从正态分布。则可进行正态分布的参数估计,程序如下:
>> [h_hat,temp,h_ci]=normfit(h,0.05);
>> h_hat=h_hat,h_ci=h_ci;
h_hat = %身高估计值
170.1100
>> h_ci %身高95%置信区间
h_ci =
168.9029
171.3171
>> [w_hat,temp,w_ci]=normfit(w,0.05);
>> w_hat=w_hat,w_ci=w_ci;
w_hat = %体重估计值
59.2300
w_ci %体重95%置信区间
w_ci=
57.7967
60.6633
由以上计算结果可得,身高的均值170.11cm,均值的95%的置信区间为[168.9029, 171.3171],体重的均值为59.23kg,均值的95%的置
信区间为[ 57.7967,60.6633]。
(3)假设检验。
H0:h=168.3 H1:h>168.3
用ttest检验,程序如下:
>> [h_reply,h_sig]=ttest(h,168.3,0.05,1);
>> h_reply
h_reply =
1 %拒绝H0,即身高显著高于普通中学>> h_sig
h_sig =
0.0018 % 值很小,结论有把握
解释说明:
[h,sig]=ttest(x,m,alpha,tail) 正态总体N均值t检验。检验列状样本数据x的均值是否为m,alpha为显著水平,参数tail为0,表示双边检验,1表示右边检验,-1表示左边检验;h返回0表示接受H0,返回1表示拒绝H0;sig返回临界值拒绝概率sig (4)计算相关系数,程序如下: >> datacor=corrcoef(data); >> datacor datacor = 1.0000 0.8492 0.1826 0.8492 1.0000 0.1696 0.1826 0.1696 1.0000 可见,身高与体重相关性明显(相关系数为0.85),而成绩与身高或体重相关系数都很小,说明身高或体重对体育成绩几乎没有影响。进一步分析,做出散点图: 程序如下: >> figure; >> subplot(1,3,1);plot(h,w,'o');title('身高-体重'); >> subplot(1,3,2);plot(h,s,'o');title('身高-成绩'); >> subplot(1,3,3);plot(w,s,'o');title('体重-成绩'); 由图像可知,相关系数与散点图吻合。 没有经历过地狱般的磨炼, 怎能有创造天堂的力量? 没有流过血的手指, 怎能弹出世间的绝唱? 数学应用软件作业 王云詹天佑102班 沈天驹车辆动车102班 李阔江车辆城轨101班 2011/11/23