统计学
费宇石磊(主编)
第2章练习题参考答案
2.1解:(1)首先将顾客态度分别用代码1、2、3表示,然后在数据文件的Varible View窗口Values栏定义变量值标签:1代表“喜欢并愿意购买”;2代表“不喜欢”,3代表“喜欢并愿意购买”。操作步骤:
依次点击File→点击open→点击Data→打开数据文件ex2.1→点击Analyze→点击Descriptive Statistics→点击Frequencies→将“态度”选入Variable框→点击OK。输出结果如表2.1所示:
(2)根据表2.1频数分布表资料建立的数据文件为ex2.1.1。
绘制条形图操作步骤:依次点击File→点击open→点击Data→打开数据文件ex2.1.1→Graphs→点击Bar→选中Simple,选中Summaries for groups of cases→单击Define→选中Other Summary function→将“人数”选入Variable(纵轴),将“态度分类”选入Category Axis(横轴)→点击OK。输出结果如图2.1所示:
图2.1 30名顾客满意程度分布条形图
绘制饼图操作步骤:依次点击File→点击open→点击Data→打开数据文件ex2.1.1→点击Graphs→点击Pie→选中Values
of individual cases→点击Define →将“人数”选入 Slices Represent 栏,将“态度分类”选入Variable 栏→点击OK 。输出结果如图2.2所示:
2.2解:首先列计算表如表2.2所示:
表2.2 120名学生英语成绩的均值、中位数、众数、偏态系数、峰度系数计算表
(1)均值151
872072.67120
i
i
i i
i x
f x f
===
=
=∑∑(分) 表2.2中,分布次数最多的组是“40~50”组,这就是众数所在组;2
N
=60,中位数大约在第60位,可确定中位数也在“40~50”组。
众数10124230
701073.333018M L i ?-=+
?=+?=?+?-+-(分)
(42)(42)
中位数11204922701072.6242
m e m N S M L i f ---=+?=+?=(分) (2)首先计算标准差:11.65s =
=(分)
3
1
1
3
3
()
/38389.64/120
0.202311.65k
k
i i
i i x x f f SK s ==-=
=
=∑∑
由计算结果可看出,偏态系数为正值,但与零的差距不大,说明120名大学生英语成绩为轻微右偏分布,成绩较低的同学占有一定的比例,但偏斜程度不大。
4
1
1
4
4
()
/5108282.61/120
330.689111.65k
k
i i
i i x x f f K s ==-=
-=
-=-∑∑
由计算结果可看出,峰度系数为负值,说明120名大学生英语成绩为平峰分布,成绩较低的同学占一定比例,但低成绩区域的集中程度并不很高。
2.3解(1)整理的组距数列如表2.
3.1所示:
表2.3.1 连续60天计算机销售量频数分布表
(2) 下面使用SPSS16.0绘制图形:
绘制直方图操作步骤:点击File→点击open→点击Data→读取数据文件ex2.3→点击Graphs→点击Histogram→将“销售量”选入Variable栏→点击OK。若选中Display normal curve选项,则在生成的直方图上还显示正态曲线。输出
2.3.1所示:
结果如图
从图2.3.1可以看出,连续60天中,销售量为40~50台的天数较多。
绘制简单箱线图操作步骤:点击File→点击open→点击Data→读取数据文件ex2.3→点击Graphs→点击Boxplot→选中simple,选中summaries of separate Variables→点击Define→将“销售量”选入Boxes Represent栏→点击Ok。输出结果如图2.3.2所示:
图2.3.2 连续60天计算机销售量箱线图
从图2.3.2可看出,下横线之外有两个点,它们分别是第59和第60个观测值,原始数据中可查到,这两天的销售量分别为19台和18台,它们是离总体观测数据较远的离群点。
绘制茎叶图操作步骤:点击File→点击open→点击Data→读取数据文件ex2.3→点击Analyze→点击Descriptive Statistics-Explore→将“销售量”选入“Dependent List”栏→点击Ok。输出结果如图2.3.3所示:
销售量(台) Stem-and-Leaf Plot
Frequency Stem & Leaf
2.00 Extremes (=<19)
1.00 2 . 2
5.00 2 . 56899
8.00 3 . 00223344
15.00 3 . 555666677788899
19.00 4 . 0001222222333344444
10.00 4 . 5555666789
Stem width: 10
Each leaf: 1 case(s)
图2.3.3 连续60天计算机销售量茎叶图
(3)描述统计分析操作步骤:点击File→点击open→点击Data→读取数据文件ex2.3→点击Analyze→点击Descriptive Statistics→Descriptives→将“销售量”选入Variable栏→点击Options,选中Mean(均值)、Std.(标准差)、Minimum (最小值)、Maximum(最大值)、Kurtosis(峰态系数)、Skwness(偏态系数),选中Variable list(变量顺序排列显示输出结果)→点击Continue→点击Ok。输出结果如表2.3.2所示:
表2.3.2 连续60天计算机销售量的描述统计量
Descriptive Statistics
表2.3.2显示,连续60天中计算机销售量的最小值为18台,最大值为49台,平均销售量为37.88台,标准差为7.14台;偏态系数为-0.879,表明计算机销售量为左偏分布,在连续60天中,销售量较高的天数占一定比例,具有一定的偏斜度;峰态系数为0.608,表明计算机销售量为尖峰分布,销售量较高的天数具有一定的集中度。
第3章练习题参考答案
3.1 解:
操作步骤:
Analyze→Descriptive Statistics→Explore,将x选入Dependent List,在Statistics中选中Descriptives
结果分析:
由表3-1可知,该超市每位顾客的平均花费金额的点估计180.0500,可信度为95%的区间估计为(156.8678,203.2322)(保留两位小数)。
3.2 解:
(1)先估计每位顾客平时的平均花费金额和周末的平均花费金额的置信区间操作步骤:
Analyze→Descriptive Statistics→Explore,将x选入Dependent List,将顾客总体选入Factor List,在Statistics中选中Descriptives;
操作步骤:
Analyze→Compare means→Independent—Samples T test,将x选入Test Variable(s),将顾客总体选入Grouping Variable(s),在Define Groups中分别定义总体一和总体二。
结果分析:
表3-2-1是探索性分析的结果,可知每位顾客平时的平均花费金额的置信区间为(124.5854,195.0146),周末的平均花费金额的置信区间为(169.9718,230.6282)。表3-2-2是独立样本t检验的结果,Levene's Test for Equality of Variances为方差检验的结果,F=1.312,其P值为0.255<0.05,拒绝方差相等的原假设,认为两总体的方差不等,因此两总体的差的置信区间为(-86.40631,5.40631)
3.3 解:
操作步骤:
Analyze→Descriptive Statistics→Explore,将x选入Dependent List,在Statistics中选中Descriptives;
输出结果:
结果分析:
表3-3是探索性分析的结果,由分析结果可知,该市成年男子体重置信度为95%的区间估计为(64.4538,71.9212)。 3.4 解:
nX 近似的服从(0,1)N 分布,于是有
/2/21X P z z ααα????
-<
<≈-??????
(3.4) 该市所有家庭中安装了宽带上网的家庭的百分比为p 是(0,1)分布的参数,
200n =,192/2000.96x ==,10.95α-=,/2 1.96z α=,代入式(3.4)求得p 的
置信水平为95%的置信区间为(0.92,0.98)
第4章 练习题参考答案
4.1 解:
操作步骤:
进行单样本T 检验,Analyze →Compare means →One —Samples T test ,将x 选入Test Variable(s),在Test Value 中输入0.618。
输出结果:
结果分析:
根据表4-1中单样本T 检验的结果,0.0110.05P =<,按显著性水平0.05
α=无法拒绝0.618x =的原假设,认为该厂生产的工艺品框架宽与长的比值符合黄金比率。
4.2 解:
H0:p>=50% H1:p<50% p=160/360=44.44% Z=
=-2.11
这是一个单侧检验,-2
z α=-1.645 拒绝原假设,这个专家的论断不成立。
4.3 解:
0H :030000X X ≥=,即该厂家广告可信 1H :030000X X <=,即该厂家广告不可信 操作步骤:
进行单样本T 检验,Analyze →Compare means →One —Samples T test ,将x 选入Test Variable(s),在Test Value 中输入0.618。
输出结果:
结果分析:
由表4-3-1可知,样本均值为30905.8333,表4-3-2是单样本双侧T 检验的结果,可知平均寿命95%的置信区间为(-293.9818,2105.6485),根据平均寿命大于0以及双侧检验和单侧检验的关系,95%的单侧置信区间应为(0,2105.6485),该置信区间与显著性水平0.05的本题的左边检验问题相对应,而X 0=30000并不在置信区间(0,2105.6485)内,因此拒绝H 0,认为该厂家的广告不可信。
4.4 解: 操作步骤:
进行独立样本T 检验,Analyze →Compare means →
Independent —Samples T test ,将x 选入Test Variable(s),将顾客总体选入Grouping Variable(s),在Define Groups 中分别定义总体一和总体二。
输出结果:
结果分析:
表4-4是单样本T 检验的结果。首先根据该表方差齐性检验的结果,
1.312F =,.0.255Sig =,即0.05P >,无法拒绝方差齐性的原假设,认为两个总
体的方差相等。在方差齐性的假设下,独立样本t 检验结果为: 1.751t =-,
.(2)0.083Sig tailed -=,0.05P >,无法拒绝两个总体的平均花费金额相同的原
假设,认为该超市每位顾客平时(周一至周五)的平均花费金额与周末(周六和周日)的平均花费金额是相同的()0.05α=
。 4.5 解:
操作步骤:
进行配对样本T 检验,Analyze →Compare means →Paired —Samples T test ,将X1选入Test Variable1,将X2选入Variable2。
结果分析:
由表4-5-1可知,促销前的平均销售量为34.9000,促销后的平均销售量为38.6000。由表4-5-2可知促销前后的相关系数为0.954,P=0.000<0.05,两者相关性显著。根据表4-5-3中配对样本t 检验的结果,得到7.829t =-,
.(2)0.000Sig tailed -=,0.05P <,在0.05α=水平下,拒绝原假设,认为促销后
销售量有明显的提高。
第8章 练习题参考答案
8.1解:(1)0.79x μ=
=
= (2)2 1.960.79 1.55x x Z αμ?==?= 8.2(数据文件为ex8.2)
解:(1) 3.32x x n
=
=∑(小时)
(2) 1.61s =
= (小时)
0.27x μ=
==(小时) 8.3解: 2.98%p μ=
== ∴当置信度为90%时 2 1.645 2.98% 4.90%p p Z αμ?==?=
当置信度为95%时 2 1.96 2.98% 5.84%p p Z αμ?==?=
8.4解: 222222
2
1.96120138.3013920
x x
Z n ασ
?=
==≈?(人) 8.5解: 11(1)2%98% 1.96%P P -=?= 22(1)3%97% 2.91%P P -=?= 33(1)4%96% 3.84%P P -=?=
∴2
223322
(1)
1.964%(14%)
92.20934%
p p
Z P P n α-??-=
==≈? 第9章练习题参考答案
9.1解:(1)三种商品的销售量个体指数分别为:
A :
880%10=;B :7100%7=;C 、20
133.33%15= 三种商品的销售价格个体指数分别为:
A :40133.33%30=;
B :20100%20=;
C 、5083.33%60= (2)三种商品的销售量总指数为:
01
00
30820760201580
117.91%301020760151340q p q L p q
?+?+?=
=
==?+?+?∑∑
或11
10
40820750201460
113.18%401020750151290
q p q P p q
?+?+?=
=
==?+?+?∑∑
三种商品的销售价格总指数为:
1000
129096.27%1340p p q L p q
=
=
=∑∑;或1101146092.41%1580
p p q P p q ===∑∑
比较:由于拉氏指数与帕氏指数的同度量因素固定时期不同,因而对同一指数的计算结果也就不同。本题中,拉氏指数的计算结果大于帕氏指数。
9.2解:销售额指数11
00
123754695
139.71%102852468
p q
V p q
?+?+?=
=
==?+?+?∑∑
销售额变动绝对额:1100956827p q p q -=-=∑∑(万元) 销售量指数01
00
103852682
120.59%6868
q
p q L p q
?+?+?=
=
==∑∑
销售量变动对销售额的影响额:010*******p q p q -=-=∑∑(万元)
销售价格指数1101
95
115.85%82
p p q P p q
=
=
=∑∑ 销售价格变动对销售额的影响额:1101958213p q p q -=-=∑∑(万元) 以上三个指数之间的关系为:
相对数方面:139.71%=120.59%×115.85% 绝对数方面:27(万元)=14(万元)+13(万元)
计算结果表明:报告期与基期相比,由于三种商品的销售量增长20.59%,使销售额增加了14万元;又由于三种商品的销售价格上涨15.85%,使销售额增加了13万元。两个因素共同作用的结果,使销售额最终增长39.71%,共增加了27万元。
第3章 案例分析
1.两个社区的家庭月平均收入和购物月平均支出基本服从正态分布。设家庭月
平均收入211~(,)X N μσ,购物月平均支出2
22~(,)Y N μσ。
当2σ未知时,μ的置信水平为1α-的置信区间
2
2
[((x t n x t n αα--+-
而2σ的置信水平为1α-的置信区间为
22
2212
2
(1)(1)[,](1)(1)
n s n s n n ααχχ----- 查表知,0.025(49) 2.009t =,20.025(49)71.42χ=,2
0.975(49)32.357χ=
(1) 对于社区A ,家庭月平均收入95%的置信区间:
用SPSS 打开数据case-study 3,选择Analyze →Descriptive Statistics →Explore,将社区A 家庭月平均收入(x1)选入Dependent List,在左下角Display 中点击Both,然后在中下方Statistics 中选Descriptives 和置信度(默认值为95%),最后点击Continue →OK,可以输出如下表3.5,
所以,家庭月平均收入期望值的置信水平为95%的置信区间[4934.15,5785.85],而经过计算可得,标准差95%的置信区间为[776.27,1153.28]。
同理,购物月平均支出使用SPSS软件操作如上,只是将社区A家庭购物月平均支出(y1)选入Dependent List,输出以下表3.6,
表3.6 社区A家庭月平均支出95%的置信区间
Skewness .090 .337
Kurtosis -.648 .662 所以,购物月平均支出期望值的置信水平为95%的置信区间[1094.28,1257.72],
而经过计算可得,标准差95%的置信区间为[155.47,230.97]。
(2)对于社区B,家庭月平均收入95%的置信区间:
用SPSS打开数据case-study 3,选择Analyze→Descriptive Statistics→Explore,将社区B家庭月平均收入(x2)选入Dependent List,在左下角Display
中点击Both,然后在中下方Statistics中选Descriptives和置信度(默认值为95%),最后点击Continue→OK,可以输出如下表3.7,
所以,家庭月平均收入期望值的置信水平为95%的置信区间[4883.90,5756.10],
而经过计算可得,标准差95%的置信区间为[774.3,1150.36]。
同理,购物月平均支出用SPSS软件操作如上,只是将社区B家庭购物月平
均支出(y2)选入Dependent List,可以输出如下表3.8,
表3.8 社区B家庭月平均支出95%的置信区间
所以,购物月平均支出期望值的置信水平为95%的置信区间 [1100.16,1283.84],而经过计算可得,标准差95%的置信区间为[156.43,232.41]。 2.大样本条件下,总体比例p 的置信度近似为1α-的置信区间为
??[p
Z p Z αα-+ 由于,5%α=,查表知,0.025 1.96Z =。
(1)对于社区A ,购物月平均支出占月平均收入的比例1111176
?0.21945360
y p
x === 所以,1p 置信度为95%的置信区间为[0.1047,0.3341]。
(2)对于社区B ,购物月平均支出占月平均收入的比例2221192
?0.22415320
y p
x === 所以,2p 置信度为95%的置信区间为[0.1085,0.3396].
3.大样本条件下,总体比例之差12p p -的置信度近似为1α-的置信区间为
12??()p
p Z α-±
所以,两个社区购物月平均支出占月平均收入的比例之差置信度为95%的置信区间为[0.1675,0.1581]
。
4.综上,两个社区家庭的月平均收入和用于购物的月平均支出都比较接近,而且购物占收入的比例基本上在20%左右,比较稳定,说明可以考虑在两个社区附近建立一个方便人们日常生活的小规模购物中心。如果经过一段时间重新进行调查,发现社区居民购物占收入的比例持续上升,则可以考虑扩大购物中心的规模,增加销售商品的种类。