文档库 最新最全的文档下载
当前位置:文档库 › spss的数据分析报告

spss的数据分析报告

spss的数据分析报告
spss的数据分析报告

关于某地区361个人旅游情况统计分析报告

一、数据介绍:

本次分析的数据为某地区361个人旅游情况状况统计表,其中共包含七变量,分别是:年龄, 为三类变量;性别,为二类变量(0代表女,1代表男);收入,为一类变量;旅游花费,为一类变量;通道,为二类变量(0代表没走通道,1代表走通道);旅游的积极性,为三类变量(0代表积极性差,1代表积极性一般,2代表积极性比较好,3代表积极性好4代表积极性非常好);额外收入,一类变量。通过运用SPSS统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析、。。。以了解该地区上述方面的综合状况,并分析个变量的分布特点及相互间的关系。

二、数据分析

1、频数分析。基本的统计分析往往从频数分析开始。通过频数分地区359个人旅游基本状

况的统计数据表,在性别、旅游的积极性不同的状况下的频数分析,从而了解该地区的男女职工数量、不同积极性况的基本分布。

首先,对该地区的男女性别分布进行频数分析,结果如下

表说明,在该地区被调查的359个人中,有198名女性,161名男性,男女比例分别为44.8%

和55.2%,该公司职工男女数量差距不大,女性略多于男性。

其次对原有数据中的旅游的积极性进行频数分析,结果如下表

枳极性

其次对原有数据中的是否进通道进行频数分析,结果如下表

朽圧俯丼=1 055

表说明,在该地区被调查的359个人中,有没走通道的占81.6%,占绝大多数。

上表及其直方图说明,被调查的359个人中,对与旅游积极性差的组频数最高的,为171人数的47.6%,其次为积极性一般和比较好的,占比例都为22.0%,积性为好的和非常好的比例

比较低,分别为24人和6人,占总体的比例为6.7%和1.7%。

2、探索性数据分析

(1)交叉分析。

通过频数分析能够掌握单个变量的数据分布情况,但是在实际分析中,不仅要了解单个变量

的分布特征,还要分析多个变量不同取值下的分布,掌握多个变量的联合分布特征,进而分析变量之间的相互影响和关系。就本数据而言,需要了解现工资与性别、年龄、受教育水平、起始工资、本单位工作经历、以前工作经历、职务等级的交叉分析。现以现工资与职务等级

的列联表分析为例,读取数据(下面数据分析表为截取的一部分):

Count

性别*积极性交叉制表

税极性

■差

■悬

□比壮好

■蚱

□非揄好

上联表及Bar Chart涉及

两个变量,即性别与积极

性的二维交叉,反映了在

不同的性别对于旅游积极性分布情况。上表中,性别成为行向量,积极性列向量。

(2)性别与收入的探索性分析

性别

Case Process ing Summary

性别

Cases

Valid Missi ng Total

N Perce nt N Perce nt N Perce nt

收入女198 100.0%

.0% 198 100.0%

161 100.0%

.0%

161

100.0% Descriptives

性别Statistic Std. Error

收入女Mea n

95% Con fide nee In terval Lower Bound for Mean Upper Bou nd 1005.28562

907.63853

1102.93272

49.514796

性别

5% Trimmed Mea n 957.92011

Media n 937.50000

Varia nee 485439.577

Std. Deviation 696.734940

Minimum 7.426

Maximum 3125.000

Ran ge 3117.574

In terquartile Range 937.563

Skew ness .896 .173

Kurtosis .310 .344

Mea n 1066.92791 65.993219

95% Con fide nee In terval Lower Bound 936.59779

for Mea n

Upper Bound 1197.25802

5% Trimmed Mea n 986.95497

Media n 937.50000

Varia nee 701171.907

Std. Deviation 837.360082

Minimum 58.630

Maximum 6250.000

Ran ge 6191.370

In terquartile Range 718.750

Skew ness 2.370 .191

Kurtosis 10.166 .380 (3) p-p图分析

Age的正誉P-P图

观测的靈枳概率Age

Age 的曲降止态图

结果分析

年龄在正态p-p 图的散点近似成一条直线,无趋势正态

p-p 图的散点均匀分布在直线

y=0的上下,故可认为本资料服从正态分布

3、相关分析。相关分析是分析客观事物之间关系的数量分析法,明确客观事 之间有怎样的关系对理解和运用相

关分析是极其重要的。

函数关系是指两事物之间的一种—对应的关系,

即当一个变量X 取一定值时,另一个变量

函数Y 可以根据确定的函数取一定的值。 另一种普遍存在的关系是统计关系。 统计关系是指 两事物之间的一种非 对应的关系,

即当一个变量X 取一定值时,另一个变量Y 无法根据

确定的函数取一定的值。统计关系可分为线性关系和非线性关系。

事物之间的函数关系比较容易分析和测度,

而事物之间的统计关系却不像函数关系那样

直接,但确实普遍存在,并且有的关系强有的关系弱,程度各有差异。

如何测度事物之间的

统计关系的强弱是人们关注的问题。相关分析正是一种简单易行的测度事物之间统计关系的 有效工具。

0 08-

D.W-

0.04

0.02-

DQ0-

-D.02-

4J.04-

4)06-

Q0 0 2 0.4 Q6 0 8

1.0

观測购劉积槪事

8

%

上表是对本次分析数据中,旅游花费、收入、、额外收入的相关分析,表中相关系数旁边有

两个星号(** )的,表示显著性水平为0.01时,仍拒绝原假设。一个星号(*)表示显著性水平为0.05是仍拒绝原假设。先以现旅游花费这一变量与其他变量的相

关性为例分析,由上表可知,旅游花费与额外收入的相关性最大,

5.回归分析

有相关性分析可得收入,旅游花费呈线性相关,因此作回归分析

a. All requested variables en tered.

b. Depe ndent Variable: 旅游花费

b

b. Depe ndent Variable: 旅游花费

Coefficie nts

a. Depe ndent

旅游花费Variable:

Charts

Regression Standardized Predicted Value

由上图可知回归方程:

y=91.563+ 0.024 (x1) , (P(Sig=0.000)<0.01)

即 旅游花费=91.563+0.024* 收入 (p<0.01) 6单样本T 检验 首先对现工资的分布做正态性检验,结果如下:

Scatterplot

Dependent Variable:勰游崔费

"OOO-

BOO -

600-

AW-

200

0-

o

o o

o Q 00 o °o o

由上图可知,现工资的分布可近似看作符合正态分布,现推断现工资变量的平均值是否为 $3,000,0,因此可采取单样本

t 检验来进行分析。分析如下:

On e-Sample Statistics

由One-Sample Statistics 可知,359个被调查的人中收入平均值 1032.93021

,标准差为 762.523942,均值标准误差为 40.244474。图表 One-Sample Test 中,第二列

是t 统计量的观测值为 25.666 ;第三列是自由度为 358( n-1);第四列是t 统计量观测值的

标棊偽签,=76?. 524

N 曲§

收入

双尾概率值;第五列是样本均值和检验值的差;第六列和第七列是总体均值与原假设值差的95%勺置信区间为(953.78493,1112.07550 )。该问题的t值等于25.666对应的临界置信

水平为0,远远小于设置的0.05 ,因此拒绝原假设,表明该地区被调查的359名人中收入与1032.93021存在显著差异。

7,独立样本t检验

T-Test

得到两组的均数(mear)分别为198和161

独立样本t检验,取的t值1.559与Sig为0.120 p>0..05

旅游花费不成显著性差异,由图中可知旅行的旅游花费较高。

相关文档