文档库 最新最全的文档下载
当前位置:文档库 › spss卫生统计学实习课程3

spss卫生统计学实习课程3

实习三

数值变量资料的统计推断(一)

第185~199页

一、均数的抽样误差及总体均数可信区间的估计

(一)均数的抽样误差

1.定义

在抽样研究中,由于抽样造成的样本均数与总体均数之间的差异或者样本均数之间的差异,称

为均数的抽样误差(sampling error)。抽样误差

是不可避免的,造成抽样误差的根本原因是个体变

异的客观存在。

(一)均数的抽样误差

2.计算

一、均数的抽样误差及总体均数置信区间的估计

3.性质

(1)抽样误差的大小,即标准误,与标准差

成正比,与样本含量的平方根成反比。

(2)在实际工作中,减小抽样误差的有效方

法是增大样本含量。

标准误的

精确值标准误的估计值

(二)t

分布

一、均数的抽样误差及总体均数置信区间的估计

(二)t分布

2.性质

一组与自由度ν有关的曲线,随着自由度ν的增大接近标准正态分布。

一、均数的抽样误差及总体均数置信区间的估计(三)总体均数95%置信区间的估计

二、数值变量资料的假设检验(t 检验和z 检验)(一)假设检验的目的

推断两个总体均数是否相等(双侧检验:μ

1=

μ

2?,单侧检验:μ

1

>μ2?或者μ1< μ2?)

(二)假设检验方法的选择

?根据σ是否已知以及n的大小,选择t检验或z检验。?根据不同的研究设计类型,选择不同的方法。

?注意单侧、双侧检验的选择

*资料中σ已知时,可以用σ代替公式中相应的s 。

t 检验和z

检验的应用条件和计算公式

(二)假设检验方法的选择

二、数值变量资料的假设检验(t 检验和z 检验)

二、数值变量资料的假设检验(t 检验和z 检验)(二)假设检验方法的选择

完全随机设计的两样本均数的t检验

?假设检验的P 值不能反映总体均数差别的大小。

P 值越小,越有理由(越有把握)认为两总体均数不相等。

?假设检验的结论具有概率性。

H 0原本正确, 但P ≤0.05,拒绝H 0:第一类错误(α)H 0原本不正确,但P >0.05,不拒绝H 0:第二类错误(β)α为事先指定的检验水平(一般取0.05),β未知;α越小,β越大;α越大,β越小;增大样本量n ,可以同时减小α和β。

(三)假设检验的注意事项

二、数值变量资料的假设检验(t 检验和z 检验)

注:在临床或者基础科研中,可能会由于样本量不足,从而增大了第二类错误的概率,导致“差别无统计学意义”的错误结论。

均数

标准差

标准误

(二)完全随机设计的两样本均数比较(两独立样本t检验)

方差齐性检验

(三)配对设计的两样本均数比较

配对差值

三、SPSS13.0软件操作(t 检验)

(四)练习

将20名某病患者随机分为两组,分别用甲、乙两药治疗,测得治疗前后的血沉(mm/hr),数据如下表(第538页第2题)。

问:1.甲、乙两药是否均有效?

2.甲、乙两药疗效是否相同?

SPSS软件在医学科研中的应用-Logistic回归分析

SPSS软件在医学科研中的应用计算机实习(SPSS10.0) 何平平 北大医学部流行病与卫生统计学系

实习六Logistic回归分析

(一)Logistic回归分析的任务 影响因素分析在流行病学研究中,logistic回归常用于疾病 的危险 因素分析,logistic回归分析可以提供一个重要的指标: OR。 (二)Logistic回归分析的基本原理 1.变量特点因变量:二分类变量,若令因变量为y,则常 用y=1表 示“发病”,y=0表示“不发病”(在病例对照研究中,分别表示病例组和对照组)。 自变量:可以为分类变量,也可以为连续变量。

2.Logistic模型 Log P 1 P = ? +? 1 x 1 + ? 2 x 2 + ...... + ? m x m P=P(y=1|x),为发病概率;1-P=P(y=0|x),为不发病概率。?0为常数项,?1 ,?2 ….. ?m分别为m个自变量的回归系数。 模型估计方法:最大似然法(Maximum Likelihood Method)。构造似然函数(L ikelihood function )L= P(y=1|x) P(y=0|x),通过迭代法估计一组参数(?0,?1 ,?2 ….. ?m)使L达到最大。

3.自变量的相对重要性分析 衡量变量相对重要性的指标 (1)Wald值:(?i /SE(?i ))2,近似?2分布,用于检验自变量的显著性。 (2)对自变量作显著性检验的概率P值。当Wald值越大,P值越小时,自变量的影响就越大。 4.自变量的筛选与多元线性回归分析类似,有Forward法(实际上是逐 步向前法)、Backward法(默认方法为Enter,即所有自变量一次全部进入方程)。

卫生统计学习题软件分析教程习题SPSS03

第三篇常用推断方法 二、综合分析题 1.略 2.略 3.为了解某校本科学生体质合格率的性别差异,随机抽查了本科男生 110人和女生 130 人,其中男生有 100 人合格,女生有 70 人合格,请问该校本科男女生体质合格率是否不同? 表3-1某校本科学生体质合格率 体质状况合格不合格合计 男100 10 110 女70 60 130 合计170 160 240 【操作】 (1)数据准备 1)定义变量:性别(Value定义:1=男,2=女)、结果(Value定义:0=合格,1=不合格)、频数。输入数据,如图3-1所示。 图3-1 SPSS的Date View窗口 2)频数加权:点击Data菜单下的Weigh Cases选项,弹出Weigh Cases对话框,如图3-2,选择Weigh cases by,选中变量“频数”将其送入Frequency Variable框中,如图3-3所示,单击OK。

图3-2 Data→Weigh Cases 图3-3 Weigh Cases对话框 (2)统计分析 1)点击Analyze菜单下的Descriptive Statistics子菜单,选择Crosstabs选项,如图3-4所示,系统弹出Crosstabs主对话框,选择变量“性别”将其送入Row(s)框内,选择变量“体质状况”将其送入Column(s)框中,如图3-5所示。

图3-4Analyze→DescriptiveStatistics→Crosstabs 图3-5 Crosstabs主对话框 2)单击右侧的Statistics,弹出Statistics子对话框,选择Chi-square,如图3-6所示,单击Continue返回。 图3-6 Statistics子对话框图9-13 Cells子对话框

spss卫生统计学实习课程2

实习二 统计描述第164~180页

实习二统计描述 医学统计资料类型 ?数值变量资料:又称为计量资料。变量值是定量的,有单位的,表示为数值的大小。 ?无序分类资料:又称为计数资料。变量值是定性的,没有单位,表示为相互独立的类别。 ?有序分类资料:又称为等级资料。变量值是定性的,没有单位,各类别具有程度上的差异。 注:不同类型的资料,统计方法不同;各种类型的资料之间是可以相互转化的。

一、数值变量资料的统计描述 统计描述包括两个方面:集中趋势的描述和离散趋势的描述

一、数值变量资料的统计描述 (一)数值变量资料的频数表 频数表(frequency table):当变量值或者观测值较多时,将变量值分为适当的组段,统计各组段中相应的频数(或者人数),以描述数值变量资料的分布特征和分布类型。

一、数值变量资料的统计描述 (一)数值变量资料的频数表 频数表的用途 1.描述数值变量资料的分布特征 集中趋势(central tendency):频数最多的组段代表了中心位置(平均水平),从两侧到中心,频数分布是逐渐增加的。 离散趋势(tendency of dispersion):从中心到两侧,频数分布是逐渐减少的。反映了数据的离散程度或者变异程度。

一、数值变量资料的统计描述 (一)数值变量资料的频数表 频数表的用途 2.描述数值变量资料的分布类型 正态分布:集中位置居中,左右两侧频数基本对称。常见近似正态分布。 偏态分布:集中位置偏向一侧,频数分布不对称。 正偏态分布:集中位置偏向数值小的一侧或者左侧,有较长的右尾部。 负偏态分布:集中位置偏向数值大的一侧或者右侧,有较长的左尾部。

统计分析与SPSS课后习题课后习题答案汇总

《统计分析与SPSS的应用(第五版)》课后练习答案 第一章练习题答案 1、SPSS的中文全名是:社会科学统计软件包(后改名为:统计产品与服务解决方案) 英文全名是:Statistical Package for the Social Science.(Statistical Product and Service Solutions) 2、SPSS的两个主要窗口是数据编辑器窗口和结果查看器窗口。 数据编辑器窗口的主要功能是定义SPSS数据的结构、录入编辑和管理待分析的数据; 结果查看器窗口的主要功能是现实管理SPSS统计分析结果、报表及图形。 3、SPSS的数据集: SPSS运行时可同时打开多个数据编辑器窗口。每个数据编辑器窗口分别显示不同 的数据集合(简称数据集)。 活动数据集:其中只有一个数据集为当前数据集。SPSS只对某时刻的当前数据集 中的数据进行分析。 4、SPSS的三种基本运行方式: 完全窗口菜单方式、程序运行方式、混合运行方式。 完全窗口菜单方式:是指在使用SPSS的过程中,所有的分析操作都通过菜单、按 钮、输入对话框等方式来完成,是一种最常见和最普遍的使用方式,最大优点是简 洁和直观。 程序运行方式:是指在使用SPSS的过程中,统计分析人员根据自己的需要,手工 编写SPSS命令程序,然后将编写好的程序一次性提交给计算机执行。该方式适用 于大规模的统计分析工作。 混合运行方式:是前两者的综合。 5、.sav是数据编辑器窗口中的SPSS数据文件的扩展名 .spv是结果查看器窗口中的SPSS分析结果文件的扩展名 .sps是语法窗口中的SPSS程序 6、SPSS的数据加工和管理功能主要集中在编辑、数据等菜单中;统计分析和绘图功能主要集中在分析、图形等菜单中。 7、概率抽样(probability sampling):也称随机抽样,是指按一定的概率以随机原则抽取样本,抽取样本时每个单位都有一定的机会被抽中,每个单位被抽中的概率是已知的,或是可以计算出来的。概率抽样包括简单随机抽样、系统抽样(等距抽样)、分层抽样(类型抽样)、整群抽样、多阶段抽样等。 简单随机抽样(simple random sampling):从包括总体N个单位的抽样框中随机地 抽取n个单位作为样本,每个单位抽入样本的概率是相等的。是最基本的抽样方法,是其它抽样方法的基础。优点:简单、直观,在抽样框完整时,可直接从中抽取样 本,用样本统计量对总体参数进行估计比较方便。局限性:当N很大时,不易构造 抽样框,抽出的单位很分散,给实施调查增加了困难。 分层抽样(stratified sampling):将抽样单位按某种特征或某种规则划分为不同 的层,然后从不同的层中独立、随机地抽取样本。优点:保证样本的结构与总体的 结构比较相近,从而提高估计的精度,组织实施调查方便(当层是以行业或行政区 划分时),既可以对总体参数进行估计,也可以对各层的参数进行估计。 整群抽样(cluster sampling):将总体中若干个单位合并为组(群),抽样时直接抽 取群,然后对选中群中的所有单位全部实施调查。优点:抽样时只需群的抽样框, 可简化工作量;调查的地点相对集中,节省调查费用,方便调查的实施。缺点:估

卫生统计习题软件分析教程习题SPSS01

第一篇认识数据 二、综合分析题 1.(1)编制生命质量评分数据的频数分布表并绘制直方图,概括描述其分布特征。 【操作】 1)建立数据库:激活SPSS的数据编辑窗口,单击窗口左下角的Variable View,定义变量名score,如图1-1-1所示。点击菜单File→Save as,以“综合分析1-1.sav”文件名保存。 图1-1-1 SPSS的Variable View窗口 2)输入数据:点击数据编辑窗口左下角的Date View,按顺序输入数据,如图1-1-2所示。 图1-1-2 SPSS的Date View窗口 3)重新分段编码:点击Transform菜单下的Recode into Different Variables,如图1-1-3所示,

系统弹出Recode主对话框,将变量“score”选入Input Variable →Output Variable框中,在Output Variable框中输入新变量名“subscore”,在Lable栏中输入“分组”,单击Change,如图1-1-4所示。 图1-1-3 Transform → Recode into Different Variables操作 图1-1-4 Recode 主对话框 单击Old and New Values,系统弹出Old and New Values子对话框。根据手工分组,最小值为27,最大值为189,极差为162,分为9组,组距为10,第一组为20~39,第二组为40~59,依此类推。在Old Value的Range栏中输入组下限,在through栏中输入组上限,在New Value的Value栏输入对应的新变量值,单击Add,Old→New框中就会加入赋值的内容,如图1-1-5所示,完成后单击Continue,再单击OK,系统就会按要求生成新变量“subscore”。

卫生统计学spss操作

个人总结 星期二,2017年6月20日 07:20 1、卡方检验、涉及到等级资料的需要加权 2、卡方检验列数参照标目来定 1、t检验:analyze--compare mean 2、方差分析: 完全随机设计:analyze--compare means--one-way ANOVA 随机区组、交叉设计、析因设计:Analyze--general linear model(一般线性模型)--univariate(单因素) 重复测量设计的方差分析:Analyze--general linear model(一般线性模型)--repeated measures 3、卡方检验:加权 完全随机设计、配对设计、行乘列表:analyze--descriptive statistics--crosstabs(交叉表) 4、秩和检验: 配对设计、单一样本:Analyze--nonparametric tests--legacy dialogs(旧对话 框)--2 related samples 完全随机设计两样本:Analyze--nonparametric tests--legacy dialogs(旧对话 框)--2 independent samples 完全随机设计多样本:Analyze--nonparametric tests--legacy dialogs(旧对话框)--K independent samples 随机区组设计:Analyze--nonparametric tests--legacy dialogs(旧对话框)--K related samples 完全随机(成组)设计两两比较:analyze--nonparametric tests--K independent samples 随机区组设计的两两比较:analyze--nonparametric tests--K related samples 分区个人经验的第1 页

相关文档
相关文档 最新文档