文档库 最新最全的文档下载
当前位置:文档库 › 关于两个班成绩差异显著性的研究

关于两个班成绩差异显著性的研究

关于两个班成绩差异显著性的研究
关于两个班成绩差异显著性的研究

校名:赣南教育学院

姓名:许艺韦

学号:360113300704

专业:教育管理

课程名称:《教育统计与测量方法》

关于两个班成绩差异显著性的研究

针对两班英语成绩进行研究,挖掘数据对两班成绩进行比较。基于非参数统计中的秩和检验原理对样本数据进行正态检验;因检验出数据不符合正态分布且不是来自于同一个正态总体,所以对样本数据基于Wilcoxon秩和的检验。对其成绩集中度和分布情况做出分析,得出两个班的英语成绩显著不同且甲班成绩显著高于乙班成绩的结论。

关键词:成绩,显著,假设,p值,符号质检验,臵信度,总体。

一、引言

在初等统计学中,总体的分布形式或分布族往往是给定的或是假定了的,并且很大一部分内容是和正态分布相关的。而实际生活中,对总体分布的假定并不是能随便做出的。有时,数据并不是来自所假定的分布的总体;或者,数据根本不是来自一个总体。所以在对数据进行分析的时候,首先应检验其服从的分布函数情况;否则我们对其建立的统计分析可能产生很大的偏差,甚至得出完全相反的结论。

二、数据说明

某校对甲乙两班的一个与成绩进行抽样调查,各从两班中随机抽取15名学生,

三、问题分析与提出假设

从得到的数据样本可以看到,甲班的高分人数较多(90分以上),而乙班在成绩中等水平的人数较多;所以我们并不能一下确定甲乙两班的同学的英语成绩是否有显著性的差异,从而提出以下的问题假设来对数据进行较为精确的分析。假设一:两个样本来源于同一个总体,

两个正态总体不是来源于同一个总体

假设二:两个样本分别都服从正态分布,

两个样本都不服从正态分布

假设三:

原假设和备选假设分别为:

:甲班的英语成绩与乙班的英语成绩趋于一致;

:甲班的英语成绩显著高于乙班。

四、R软件计算及分析

1、首先应用茎叶图对甲乙两班的英语成绩作初步认识,分别如图(1)和(2)从茎叶图可以得出两个班的英语成绩都不完全是正态分布的。而且,对

比图.1与图.2,可以看到甲班同学的英语成绩80分以上的人数较多;乙班的同学的英语成绩集中在70-90分的人数较多。所以可初步估计甲班同学的英语成绩比乙班较好,但并不能判断甲班的英语成绩显著高于乙班。

2、对数据进行全面探索性分析

利用R语言的探索性分析的图形函数整合成一个函数,来对数据进行全面的探索分析,如图(3),图(4)。

甲班同学英语成绩的综合图(3)。从Q-Q图可以看出,甲班的英语成绩的样本数据有比较严重的偏离正态性,所以在对其进行精确度较高的分析时应当首先考虑运用非参数统计的分析方法。综合图中的直方图,散点图,以及箱线图可以看出甲班同学的英语成绩水平应该是上偏的,即成绩高分的同学人数比较多。

乙班同学的英语成绩综合图,从图(4)的Q-Q图可以看到,乙班同学的英语成绩数据也是有比较严重的偏离正态性,所以应该首先考虑运用非参数的统计分析方法。综合图(4)的直方图,点图以及箱线图可以判断出,乙班同学的英语水平比较均匀,基本集中在中等水平,有略微的下偏趋势,即英语成绩在中60-70分的同学比较多。

五、结果分析

1、从可以检验样本是否来自同一总体的R命令ks.test(x,y)及其输出结果和箱线图,可以得到:p-value = 0.009033<0.05,所以对于第一个假设,应该拒绝认为样本是来源于同一个总体。

2、从可以检验样本是否服从正态分布的R语言命令ks.test(p,"pnorm")与ks.test(r,"pnorm")及其结果(见附录)输出得到:p-value = 2.220e-16<0.05,所以对于第二个假设,可以拒绝认为样本数据服从正态分布的特性,即样本的正态性不是很好,从而用基于符号秩和的检验是正确的。

3、对于第三个假设,由R语言程序分析结果(见附录)可以知道:

P值=0.004711,在臵信水平=0.05的条件下,p<0.05,所以拒绝原假设。

甲班学生英语成绩的平均分为85,乙班学生的英语成绩平均分为78,从总体上看甲乙两班的学生英语成绩的水平相差不是很大,平均都是在中等水平。但从甲乙两个班的学生英语成绩波动范围来看,甲班的学生的英语水平波动比乙班的学生英语水平大;因此可以初略分析出甲班学生的英语水平可能出现两级分化显现,而乙班的学生同学英语成绩大部分在中等水平。

六、结论:

甲班平均分为85,乙班平均分为78,且甲班的成绩主要集中77.6分和92.4分之间摆动;而乙班的成绩则主要集中在72.38分和83.62分之间。甲班成绩较乙

班分散,乙班成绩较为集中。在从总体上看甲乙两班的学生英语成绩的水平相差不是很大,平均都是在中等水平;最后经过对两个班的Wilcoxon符号秩检验可以得出,对于臵信水平0.05的条件下,拒绝认为甲乙两个班的学生的英语成绩趋于一致,也就是说可以认为甲乙两个班的同学英语成绩有显著的不同。

所以综上可以认为甲班的英语成绩显著高于乙班。

Duncan法进行多组样本间差异显著性分析

在SPSS里用Duncan's multiple range test进行多组样本间差异显著性分析 1. 软件SPSS v17.0 2. 方法Duncan's multiple range test 3. 适用范围 比较两组以上样本均数的差别,这时不能使用t检验方法作两两间的比较(如有人对四组均数的比较,作6次两两间的t检验),这势必增加两类错误的可能性(如原先a定为0.05,这样作多次的t检验将使最终推断时的a>0.05)。故对于两组以上的均数比较,必须使用方差分析的方法,当然方差分析方法亦适用于两组均数的比较。方差分析可调用此过程可完成。本过程只能进行单因素方差分析,即完全随机设计资料的方差分析。 4. 数据格式 X是每组实验每次重复的数值,factor是实验分组

5. 实现方法 Analyze->Compare Means->One-Way ANOVA

点击PostHoc...选择方法,设置显著水平

6. 查看结果 看Post Hoc Tests部分的表格 按照显著性水平P<0.05分成3列,三者之间有着显著性差异(factor1,factor2,factor3和factor4),factor3和factor4之间差异不显著。

7.在表格中标明差异显著性 根据这一结果即可做表格,四组分别以a,b,c,c标明其显著性差异。 小写字母代表是在0.05水平下比较,差异显著;大写字母代表在0.01水平下比较,差异极显著。 26.24±3.07a 表示:26.24代表这一组数据的平均值,3.07代表这一组数据的方差(excel中用STDEV公式得出) 先做0.05水平下的显著性分析,用小写字母,如果都不显著,可以不用标示,在文字里面有说明即可;在做0.01水平下的显著性分析,如果不显著,可以不用标示,在文字里面有说明即可。 上图标注有误,abcd的标注由值的大小决定,a表示最大,因此从上到下应为:cbaa 参考资料 SPSS FOR WINDOWS简明教程

显著性分析用SPSS进行统计检验

用SPSS进行统计检验 在教育技术研究中,经常需要利用不同的教学媒体或教学资源对不同的对象进行教学改革试验,但教学试验的总体往往都有较大数量,限于人力、物力与时间,通常都采用抽取一定的样本作为研究对象,这样,就存在样本的特征数量能否反映总体特征的问题,也存在着两种不同的样本的数量标志的参数是否存在差异的问题,这就必需对样本量数进行定量分析与推断,在教育统计学中称为“统计检验”。 一、统计检验的基本原理 统计检验是先对总体的分布规律作出某种假说,然后根据样本提供的数据,通过统计运算,根据运算结果,对假说作出肯定或否定的决策。如果现要检验实验组和对照组的平均数(μ1和μ2)有没有差异,其步骤为: 1.建立虚无假设,即先认为两者没有差异,用表示; 2.通过统计运算,确定假设成立的概率P。 ⒊根据P 的大小,判断假设是否成立。如表6-12所示。 二、大样本平均数差异的显著性检验——Z检验 Z检验法适用于大样本(样本容量小于30)的两平均数之间差异显著性检验的方法。它是通过计算两个平均数之间差的Z分数来与规定的理论Z值相比较,看是否大于规定的理论Z值,从而判定两平均数的差异是否显著的一种差异显著性检验方法。其一般步骤: 第一步,建立虚无假设,即先假定两个平均数之间没有显著差异。 第二步,计算统计量Z值,对于不同类型的问题选用不同的统计量计算方法。 (1)如果检验一个样本平均数()与一个已知的总体平均数()的差异是否显著。其Z值计算公式为: 其中是检验样本的平均数; 是已知总体的平均数; S是样本的方差; n是样本容量。 (2)如果检验来自两个的两组样本平均数的差异性,从而判断它们各自代表的总体的差异是否显著。其Z值计算公式为:

网站分析中数据的统计学显著性检验

网站分析中数据的统计学显著性检验 在网站分析中,经常会做网站优化测试,就会比较不同方案的转换率,例如跳出率,订单购买率,按钮点击率等;也会记录访客或者客户的详细数据表现。但很多时候差异都很小,究竟是保持现状还是全面采用新方案的内容,很难有结论,于是两者差异在统计学的意义是否显著就变得很重要。 这篇文章主要讲解两种检验数据的方法:分别是在Excel中使用已经写好函数的数据显著性计算器,和使用SPSS对详细客户数据进行显著性检验。 一、Excel-数据显著性计算器 假设有下列的数据: 那么我们可以使用Avinash Kaushik介绍的Excel-数据显著性计算器来检验,详细请查看https://www.wendangku.net/doc/943355942.html,/avinash/excellent-analytics-tip1-statistical-significance/ Excel文件可从此处下载:https://www.wendangku.net/doc/943355942.html,/s/cz9E6 输入数据后计算得知(Number of Test Participants是分母,Number of Conversions是分子),差异是显著的,因为方框中显示了”Yes”

以上方法的原理是两组数据的差异超过了数据置信区间的话,那么就会出现数据显著性差异的结果。 以上的方法适用于简单的两个比率之间的对比,接下来要说说高级点的内容,SPSS中的假设检验问题来比较两个样本的均值。 二、两独立样本T检验 SPSS中比较均值的方法包括: 在介绍两独立样本T检验之前,先说下均值的比较情况,由浅入深。 1.均值的检验 假设检验的步骤一般分为以下几步: 1)确定原假设和备选假设(原假设就的意思是对总体的比例、均值或分布做出某种假设)2)选择检验统计量 3)计算检验统计量观测值发生的概率,P值 4)给定显著性水平α,如果P<α,即小概率事件发生,即原假设发生的概率很小,那么推翻原假设,如果P>α,那么原假设成立。 假设有以下两种情况: 1)工厂的质量管理员说:产品缺陷率只有1/1000,然后你开始抽查,抽了5件,就有2件是有问题的,那么问题就大单了。 因为1000件中最大缺陷数是1件,现在有2件,也就是概率极小的事情发生。 2)工厂的质量管理员说:产品缺陷率只有1/100,然后你开始抽查,抽了5件,就有2件是有问题的,那么问题也挺大单。 1000件中最大缺陷数是10,现在有2件,接下来还有995件要查,那么有两种可能: *产品缺陷率远远高于1%,质量管理员忽悠人; *碰巧抽到有缺陷的产品,接下来的995件很少有缺陷的了。 概率计算: 原假设:也就是假设产品缺陷率是1/100,前面抽了5件,就有2件次品的概率是0.088%; 抽5件中2件,后续抽查产品缺陷率小于1/100的的概率为0.088%;抽5件中2件,后续

使用SPSS 进行两组独立样本的t检验、F检验、显著性差异、计算p值

使用SPSS 进行两组独立样本的t检验、F检验、显著性差异、计算p值 SPSS版本为SPSS 20. 如有以下两组独立的数据,名称分别为“111”,“222”。 111组:4、5、6、6、4 222组:1、2、3、7、7 首先打开SPSS,输入数据,命名分组,体重和组名要对应,111组的就不要输入到222组了。数据视图如下: 变量视图如下,名称可以改成“分组嗷嗷嗷”“体重喵喵喵”等

点击“分析”-“比较均值”-“独立样本T检验” 来到这里,分组变量为“分组嗷嗷嗷”,检验变量为“体重喵喵喵”。

【关键的一步】点击分组嗷嗷嗷,进行“定义组”

【关键的一步】输入对应的两组数据的组名:“111”和“222” 点击确定,可见数据与组名对应上了。

点击“确定”,生成T检验的报告,即将大功告成!

第一个表都知道什么回事就不缩了,excel都能实现的。 第二个表才是重点,不然用SPSS干嘛。 F检验:在两样本t检验中要用到F检验,F检验又叫方差齐性检验,用于判断两总体方差是否相等,即方差齐性。 如图:F旁边的Sig的值为.007 即0.007,<0.01, 即两组数据的方差显著性差异! 看到“假设方差相等”和“假设方差不相等”了么? 此时由于F检验得出Sig <0.01,即认为假设方差不相等!因此只关注红框中的数据即可。 如图,红框内,Sig(双侧),为.490即0.490,也就是你们要求的P值啦, Sig ( 也就是P值) >0.05,所以两组数据无显著性差异。 PS:同理,如果F检验的Sig >.05(即>0.05),则认为两个样本的假设方差相等。 所以相应的t检验的结果就看上面那行。 by 20150120 深大医学院FG

T检验、F检验和统计学意义,想了解显著性差异的也可以来看

一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。 通过把所得到的统计检定值,与统计学家建立了一些随机变量的概率分布(probability distribution)进行比较,我们可以知道在多少%的机会下会得到目前的结果。倘若经比较后发现,出现这结果的机率很少,亦即是说,是在机会很少、很罕有的情况下才出现;那我们便可以有信心的说,这不是巧合,是具有统计学上的意义的(用统计学的话讲,就是能够拒绝虚无假设null hypothesis,Ho)。相反,若比较后发现,出现的机率很高,并不罕见;那我们便不能很有信心的直指这不是巧合,也许是巧合,也许不是,但我们没能确定。 F值和t值就是这些统计检定值,与它们相对应的概率分布,就是F分布和t分布。统计显著性(sig)就是出现目前样本这结果的机率。 2,统计学意义(P值或sig值) 结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。专业上,p值为结果可信程度的一个递减指标,p值越大,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。p值是将观察结果认为有效即具有总体代表性的犯错概率。如p=提示样本中变量关联有5%的可能是由于偶然性造成的。即假设总体中任意变量间均无关联,我们重复类似实验,会发现约20个实验中有一个实验,我们所研究的变量关联将等于或强于我们的实验结果。(这并不是说如果变量间存在关联,我们可得到5%或95%次数的相同结果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。)在许多研究领域,的p值通常被认为是可接受错误的边界水平。 3,T检验和F检验

浅谈考试成绩的差异显著性分析

浅谈考试成绩的差异显著性分析 【摘要】本文尝试运用数理统计学中的显著性检验的基本思想和常用的excel软件简单介绍了考试成绩中班级之间、校际之间的平均分、优秀率、及格率的差异显著性检验,即U检验的计算方法与主要步骤;以及教改结题报告的成绩分析涉及各种检验方法——T检验、Z检验的区别及计算方法、主要步骤。简单而言,本文是用统计学中的检验方法科学地分析什么情况下两个平均分、优秀率、及格率“差别不大”,“差别明显”,“差很多”,希望能更加科学客观地分析两个均值间的差异,对有需要的老师有所帮助。 【关键词】成绩差异;U检验;T检验;excel软件 一、引言 在每次考试成绩统计中,平均分、及格率、优秀率依然是一个班级教学的主要考核指标,但由于这样或那样的原因,可能会有些学生缺考。特别是近年我市实行了中职技校春季招生政策,某些学校分流人数也许过半。如何才能科学地公平地进行统计分析,也是许多从事成绩分析与管理的老师面临的难题。 另外,在教改结题报告或阶段性小结中,总要会对教改效果进行分析,也就难免对对比班与实验班的考试成绩中平均分、及格率、优秀率等数据作显著性检验,来比较教改的效果是否明显或不明显。看了不少结题报告,其中涉及到的检验方法如U检验,Z检验,T检验等等,不一而足,让人摸不着头脑。即便是数学教师,由于在大学就读时的教学内容侧重点有所不同,或许对数理统计方面知识掌握不强,也很难明白这些检验方法孰是孰非,孰优孰劣,更别说非专业其它科目的教师。在作成绩对比分析时,通常无从下手,或是委托统计能力强的老师帮忙,或是随意给些似是而非的数据,抑或罗列考试成绩,直接对比,不作任何检验,也就缺乏科学严谨性。 二、班、级考试成绩差异显著性分析 有些学校以班和年级考试人数与注册人数比值作为相对系数对实考的分数进行了调整,其大致算法是:年级在册人数为N,缺考R人,某班在册人数为n,缺考r人,则相对系数为[(n-r)/n]/[(N-R)/N],用此系数乘以该班实际考试成绩,即为相对成绩,然后再以各班的相对成绩进行对比。这或许是一种方法,但这种调整,会对实考的成绩进行了放大或缩小,个人认为没有多少益处。事实上,一个班级本身或许也有人缺考,只不过没别班那么多,但平均分调整后可能偏离很多。 例1:一所学校九年级4个班,每个班注册人数均为50,在一次考试中,某班平均分60,缺考20人,全级缺考100人,按上述方法折算该班平均分。解:=60*[(50-20)/50]/[(200-100)/200]=72,这是不科学的,也没有什么意义。 1、样本均值与总体均值差异显著性检验(U检验) 要检查班级之间成绩是否相差太大,目的并不是要排出名次,可以采用U 检验(有些文章也称Z检验,在ecxel软件中,相应的变量也是Z。为避免与下文混淆,只有总体方差未知,本文方用Z检验,且二者计算不同,故此不用此名称)。U检验的条件是:已知(或可以求出)样本均值、样本容量与总体均值、总体的标准差,可能采用U检验进行两均值异显著性检验。 统计学认为,不论x变量(考试分数)是连续型还是离散型,也无论x服从何种分布,一般只要样本容量(考试人数)n>20,就可认为平均值的分布是正

相关文档
相关文档 最新文档