文档库 最新最全的文档下载
当前位置:文档库 › 卡方分布

卡方分布

卡方分布
卡方分布

卡方分布

(重定向自卡方分布(Chi-square Distribution))

卡方分布(Chi-square Distribution)

[编辑]

什么是卡方分布

卡方分布(χ2分布)是概率论与统计学中常用的一种概率分布。k 个独立的标准正态分布变量的平方和服从自由度为k 的卡方分布。卡方分布常用于假设检验和置信区间的计算。

[编辑]

卡方分布的数学定义

若k 个随机变量Z1、……、Zk 相互独立,且数学期望为0、方差为1(即服从标准正态分布),则随机变量X

被称为服从自由度为k 的卡方分布,记作

[编辑]

卡方分布的特征

卡方分布的概率密度函数为:

其中x≥0, 当x≤0时fk(x) = 0。这里Γ代表Gamma 函数。

卡方分布的累积分布函数为:

其中γ(k,z)为不完全Gamma函数

在大多数涉及卡方分布的书中都会提供它的累积分布函数的对照表。此外许多表格计算软件如https://www.wendangku.net/doc/5814698609.html, Calc和Microsoft Excel中都包括卡方分布函数。

卡方分布可以用来测试随机变量之间是否相互独立,也可用来检测统计模型是否符合实际要求。

自由度为k 的卡方变量的平均值是k,方差是2k。卡方分布是伽玛分布的一个特例,它的熵为:

其中ψ(x) 是Digamma function。

[编辑]

卡方变数与Gamma变数的关系

当Gamma变数频率(λ)为1/2 时,α 的2倍为卡方变数之自由度(Degree of freedom)

即:

卡方变数之期望值=自由度卡方变数之方差=两倍自由度

卡方分布

,

,

,

k-2, if,

,

,

χ2分布临界值表

2χ分布临界值表 ()(){}2P n n αχχα=2 1-> n 0.995 0.99 0.975 0.95 0.90 0.75 0.25 0.10 0.05 0.025 0.01 0.005 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 38 40 41 42 43 44 45 __ 0.010 0.072 0.207 0.412 0.676 0.989 1.344 1.735 2.156 2.603 3.074 3.565 4.075 4.601 5.142 5.697 6.265 6.844 7.434 8.034 8.643 9.260 9.886 10.520 11.160 11.808 12.461 13.121 13.787 14.458 15.134 15.815 16.501 17.192 17.887 18.586 19.289 19.996 20.707 21.421 22.138 22.859 23.584 24.311 __ 0.020 0.115 0.297 0.554 0.872 1.239 1.646 2.088 2.558 3.053 3.571 4.107 4.660 5.229 5.812 6.408 7.015 7.633 8.260 8.897 9.542 10.196 10.856 11.524 12.198 12.879 13.565 14.257 14.954 15.655 16.362 17.074 17.789 18.509 19.233 19.960 20.691 21.426 22.164 22.906 23.650 24.398 25.148 25.901 0.001 0.051 0.216 0.484 0.831 1.237 1.690 2.180 2.700 3.247 3.816 4.404 5.009 5.629 6.262 6.908 7.564 8.231 8.907 9.591 10.283 10.982 11.689 12.401 13.120 13.844 14.573 15.308 16.047 16.791 17.539 18.291 19.047 19.806 20.569 21.336 22.106 22.878 23.654 24.433 25.215 25.999 26.785 27.575 28.366 0.004 0.103 0.352 0.711 1.145 1.635 2.167 2.733 3.325 3.940 4.575 5.226 5.892 6.571 7.261 7.962 8.672 9.390 10.117 10.851 11.591 12.338 13.091 13.848 14.611 15.379 16.151 16.928 17.708 18.493 19.281 20.072 20.867 21.664 22.465 23.269 24.075 24.884 25.695 26.509 27.326 28.144 28.965 29.987 30.612 0.016 0.211 0.584 1.064 1.610 2.204 2.833 3.490 4.168 4.865 5.578 6.304 7.042 7.790 8.547 9.312 10.085 10.865 11.651 12.443 13.240 14.042 14.848 15.659 16.473 17.292 18.114 18.939 19.768 20.599 21.434 22.271 23..100 23.952 24.797 25.643 26.492 27.343 28.196 29.051 29.907 30.765 31.625 32.487 33.350 0.102 0.575 1.213 1.923 2.675 3.455 4.255 5.071 5.899 6.737 7.584 8.438 9.299 10.165 11.037 11.912 12.792 13.675 14.562 15.452 16.344 17.240 18.137 19.037 19.939 20.843 21.749 22.657 23.567 24.478 25.390 26.304 27.219 28.136 29.054 29.973 30.893 31.815 32.737 33.660 34.585 35.510 36.436 37.363 38.291 1.323 2.773 4.108 5.385 6.626 7.841 9.037 10.219 11.389 12.549 1 3.701 1 4.845 1 5.984 17.117 18.245 19.369 20.489 21.605 22.718 23.828 24.935 2 6.039 2 7.141 2 8.241 2 9.339 30.435 31.528 32.620 33.711 34.800 35.887 36.973 38.058 39.141 40.223 41.304 42.383 43.462 44.539 45.616 46.692 47.766 48.840 49.913 50.985 2.706 4.605 6.251 7.779 9.236 10.645 12.017 1 3.362 1 4.684 1 5.987 17275 18.549 19.812 21.064 22.307 23.542 24.769 25.989 27.204 28.412 29.615 30.813 32.007 33.196 34.382 35.563 3 6.741 3 7.916 39.087 40.256 41.422 42.585 43.745 44.903 46.059 47.212 4 8.363 4 9.513 50.660 51.805 52.949 54.090 55.230 56.369 57.505 3.841 5.991 7.815 9.488 11.071 12.592 1 4.067 1 5.507 1 6.919 18.307 19.675 21.026 22.362 23.685 24.966 26.296 2 7.587 2 8.869 30.144 31.410 32.671 33.924 35.172 36.415 37.652 38.885 40.113 41.337 42.557 43.773 44.985 46.194 47.400 48.602 4 9.802 50.998 52.192 53.384 54.572 55.758 56.942 58.124 59.304 60.481 61.656 5.024 7.378 9.348 11.143 12.833 14.449 1 6.013 1 7.535 19.023 20.483 21.920 23.337 24.736 16.119 27.488 2 8.845 30.191 31.526 32.852 34.170 35.479 36.781 38.076 3 9.364 40.646 41.923 43.194 44.461 45.722 46.979 48.232 49.480 50.725 51.966 53.203 54.437 55.668 56.896 58.120 59.342 60.561 61.777 62.990 64.201 65.410 6.635 9.210 11.345 13.277 15.086 16.812 18.475 20.090 21.666 23.209 24.725 26.217 2 7.688 29.141 30.578 32.000 33.409 34.805 36.191 37.566 3 8.932 40.289 41.638 42.980 44.314 45.642 46.963 48.278 4 9.588 50.892 52.191 53.486 54.776 56.061 57.342 58.619 59.892 61.162 62.428 63.691 64.950 66.206 67.459 68.710 69.957 7.879 10.597 12.838 14.860 16.750 18.548 20.278 21.955 23.589 25.188 26.757 28.299 29.819 31.319 32.801 34.267 35.718 37.156 38.582 39.997 41.401 42.796 44.181 45.559 46.928 48.290 49.645 50.993 52.336 53.672 55.003 56.328 57.648 58.964 60.275 61.581 62.883 64.181 65.476 66.766 68.053 69.336 70.616 71.893 73.166

卡方分布表

WORD格式 x 2 分布临界值表(卡方分布) P n' 0.995 0.99 0.975 0.95 0.9 0.75 0.5 0.25 0.1 0.05 0.025 0.01 0.005 1 ????0.0 2 0.1 0.45 1.32 2.71 3.84 5.02 6.6 3 7.88 2 0.01 0.02 0.02 0.1 0.21 0.58 1.39 2.77 4.61 5.99 7.38 9.21 10.6 3 0.07 0.11 0.22 0.35 0.58 1.21 2.37 4.11 6.25 7.81 9.35 11.3 4 12.84 4 0.21 0.3 0.48 0.71 1.06 1.92 3.36 5.39 7.78 9.49 11.14 13.28 14.86 5 0.41 0.55 0.83 1.15 1.61 2.67 4.35 6.63 9.24 11.07 12.83 15.09 16.75 6 0.68 0.8 7 1.24 1.64 2.2 3.45 5.35 7.84 10.64 12.59 14.45 16.81 18.55 7 0.99 1.24 1.69 2.17 2.83 4.25 6.35 9.04 12.02 14.07 16.01 18.48 20.28 8 1.34 1.65 2.18 2.73 3.4 5.07 7.34 10.22 13.36 15.51 17.53 20.09 21.96 9 1.73 2.09 2.7 3.33 4.17 5.9 8.34 11.39 14.68 16.92 19.02 21.67 23.59 10 2.16 2.56 3.25 3.94 4.87 6.74 9.34 12.55 15.99 18.31 20.48 23.21 25.19 11 2.6 3.05 3.82 4.57 5.58 7.58 10.34 13.7 17.28 19.68 21.92 24.72 26.76 12 3.07 3.57 4.4 5.23 6.3 8.44 11.34 14.85 18.55 21.03 23.34 26.22 28.3 13 3.57 4.11 5.01 5.89 7.04 9.3 12.34 15.98 19.81 22.36 24.74 27.69 29.82 14 4.07 4.66 5.63 6.57 7.79 10.17 13.34 17.12 21.06 23.68 26.12 29.14 31.32 15 4.6 5.23 6.27 7.26 8.55 11.04 14.34 18.25 22.31 25 27.49 30.58 32.8 16 5.14 5.81 6.91 7.96 9.31 11.91 15.34 19.37 23.54 26.3 28.85 32 34.27 17 5.7 6.41 7.56 8.67 10.09 12.79 16.34 20.49 24.77 27.59 30.19 33.41 35.72 18 6.26 7.01 8.23 9.39 10.86 13.68 17.34 21.6 25.99 28.87 31.53 34.81 37.16 19 6.84 7.63 8.91 10.12 11.65 14.56 18.34 22.72 27.2 30.14 32.85 36.19 38.58 20 7.43 8.26 9.59 10.85 12.44 15.45 19.34 23.83 28.41 31.41 34.17 37.57 40 21 8.03 8.9 10.28 11.59 13.24 16.34 20.34 24.93 29.62 32.67 35.48 38.93 41.4 22 8.64 9.54 10.98 12.34 14.04 17.24 21.34 26.04 30.81 33.92 36.78 40.29 42.8 23 9.26 10.2 11.69 13.09 14.85 18.14 22.34 27.14 32.01 35.17 38.08 41.64 44.18 24 9.89 10.86 12.4 13.85 15.66 19.04 23.34 28.24 33.2 36.42 39.36 42.98 45.56 25 10.52 11.52 13.12 14.61 16.47 19.94 24.34 29.34 34.38 37.65 40.65 44.31 46.93 26 11.16 12.2 13.84 15.38 17.29 20.84 25.34 30.43 35.56 38.89 41.92 45.64 48.29 27 11.81 12.88 14.57 16.15 18.11 21.75 26.34 31.53 36.74 40.11 43.19 46.96 49.64 28 12.46 13.56 15.31 16.93 18.94 22.66 27.34 32.62 37.92 41.34 44.46 48.28 50.99 29 13.12 14.26 16.05 17.71 19.77 23.57 28.34 33.71 39.09 42.56 45.72 49.59 52.34 30 13.79 14.95 16.79 18.49 20.6 24.48 29.34 34.8 40.26 43.77 46.98 50.89 53.67 40 20.71 22.16 24.43 26.51 29.05 33.66 39.34 45.62 51.8 55.76 59.34 63.69 66.77 50 27.99 29.71 32.36 34.76 37.69 42.94 49.33 56.33 63.17 67.5 71.42 76.15 79.49 60 35.53 37.48 40.48 43.19 46.46 52.29 59.33 66.98 74.4 79.08 83.3 88.38 91.95 70 43.28 45.44 48.76 51.74 55.33 61.7 69.33 77.58 85.53 90.53 95.02 100.42 104.22 80 51.17 53.54 57.15 60.39 64.28 71.14 79.33 88.13 96.58 101.88 106.63 112.33 116.32 90 59.2 61.75 65.65 69.13 73.29 80.62 89.33 98.64 107.56 113.14 118.14 124.12 128.3 100 67.33 70.06 74.22 77.93 82.36 90.13 99.33 109.14 118.5 124.34 129.56 135.81 140.17 专业资料

SPSS非参数检验之一卡方检验

SPSS 中非参数检验之一:总体分布的卡方(Chi-square )检验 在得到一批样本数据后,人们往往希望从中得到样本所来自的总体的分布形态是否和某种特定分布相拟合。这可以通过绘制样本数据直方图的方法来进行粗略的判断。如果需要进行比较准确的判断,则需要使用非参数检验的方法。其中总体分布的卡方检验(也记为χ2检验)就是一种比较好的方法。 一、定义 总体分布的卡方检验适用于配合度检验,是根据样本数据的实际频数推断总 体分布与期望分布或理论分布是否有显著差异。它的零假设H0:样本来自的总体分布形态和期望分布或某一理论分布没有显著差异。 总体分布的卡方检验的原理是:如果从一个随机变量尤中随机抽取若干个观察样本,这些观察样本落在X 的k 个互不相交的子集中的观察频数服从一个多项分布,这个多项分布当k 趋于无穷时,就近似服从X 的总体分布。 因此,假设样本来自的总体服从某个期望分布或理论分布集的实际观察频数同时获得样本数据各子集的实际观察频数,并依据下面的公式计算统计量Q () 2 1 k i i i i O E Q E =-=∑ 其中,Oi 表示观察频数;Ei 表示期望频数或理论频数。可见Q 值越大,表示观察频数和理论频数越不接近;Q 值越小,说明观察频数和理论频数越接近。SPSS 将自动计算Q 统计量,由于Q 统计量服从K-1个自由度的X 平方分布,因此SPSS 将根据X 平方分布表给出Q 统计量所对应的相伴概率值。 如果相伴概率小于或等于用户的显著性水平,则应拒绝零假设H0,认为样本来自的总体分布形态与期望分布或理论分布存在显著差异;如果相伴概率值大

于显著性水平,则不能拒绝零假设HO,认为样本来自的总体分布形态与期望分布或理论分布不存在显著差异。

卡方检验及校正卡方检验的计算

2X 检验或卡方检验和校正卡方检验的计算 私立广厦学校 郭捷思 在教育学量的研究中,各种各样的统计方法已经被广泛的应用,特别是由于统计软件(如:SPSS )的不断成熟,给教育研究者提供了多种量的研究方法。但是,这并不是无论什么量的研究都要通过统计软件来实现,也不是所有量的研究一定要运用统计软件才能快捷,简便的实现。本文将教给大家几种简便的方法来实现卡方检验。 2X 检验(chi-square test )或称卡方检验方法可以根据 样本数据,推断总体分布与期望分布或某一理论分布是否存在显著差异,是一种吻合性检验,通常适于对有多项分类值的总体分布的分析。它的零假设是样本来自的总体分布与期望分布或某一理论分布无显著差异。根据卡方检验基本思想的理论依据,对变量总体分布的检验就可以从对各个观察频数的分析入手。为检验实际分布与理论分布(期望分布)之间是否存在显著差异,可采用卡方检验统计量。典型的卡方统计量是pearson 卡方,其基本公式为: ∑=-=k i o i e i o i f f f X 12)( 式中k 为子集个数,o f 为观察频数,e f 为期望频数,2X 服从k —1个自由度的卡方分布。如果2X 值较大,则说明观测频数分布与期望频数分布差距较大;反之,如果2X 值较小,

则说明观测频数分布与期望频数分布较接近。我们将通过代入数据运算这条公式,计算出2X 统计量的观测值,并依据卡方分布表计算观测值对应的概率p 值。下面,将通过几个实际例子来探究如何进行卡方检验。 一、四格表资料的卡方检验 例1:某学校分别运用传统教学和多媒体教学在两个平行班的数学课上进行试验,目的为了检测两种教学方法对学生的成绩影响是否有差异。本实验把学生的成绩划分为优秀人数(80分以上)和非优秀人数。 表1: 两种教学方法学生成绩优秀率的比较 表内这四个数据(斜体)是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table ),或称2行2列表(2×2 contingency table )从该资料算出的;两种教学的优秀率分别为40%和68.6%,两者的差别可能是抽样误差所致,亦可能是两种教学效果确有所不同。这里可通过卡方检验来区别其差异有无统计学意义, 检验步骤: 组别 优秀人数 非优秀人数 合计 优秀率(%) 传统教学班 20 30 50 40 多媒体教学班 35 16 51 68.6 合计 55 46 101 52.5

卡方分布概念及表和查表方法

卡方分布概念及表和查表方法 若n个相互独立的随机变量ξ?,ξ?,...,ξn,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution)。 中文名卡方分布外文名chi-square distribution 别称西格玛分布提出者Friedrich Robert Helmert 提出时间1863应用学科统计学 目录 1 简介 2 定义 3 性质 4 概率表 简介 分布在数理统计中具有重要意义。分布是由阿贝(Abbe)于1863年首先提出的,后来由海尔墨特(Hermert)和现代统计学的奠基人之一的卡·皮尔逊(C K·Pearson)分别于1875年和1900年推导出来,是统计学中的一个非常有用的著名分布。 定义 若n个相互独立的随机变量ξ?、ξ?、……、ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和

构成一新的随机变量,其分布规律称为分布(chi-square distribution), 卡方分布 其中参数称为自由度,正如正态分布中均数或方差不同就是另一个正态分布一样,自由度不同就是另一个分布。记 为或者(其中,为限制条件数)。 卡方分布是由正态分布构造而成的一个新的分布,当自由 度很大时,分布近似为正态分布。 对于任意正整数x,自由度为的卡方分布是一个随机变量X的机率分布。 性质 1) 分布在第一象限内,卡方值都是正值,呈正偏态(右偏态),随着参数 的增大,分布趋近于正态分布;卡方分布密度曲线下的面积都是1。 2) 分布的均值与方差可以看出,随着自由度的增大,分布向正无穷方向延伸(因为均值越来越大),分布曲线也越来越低阔(因为方差越来越大)。 3)不同的自由度决定不同的卡方分布,自由度越小,分布越偏斜。 4) 若互相独立,则:服 从分布,自由度为 。 5) 分布的均数为自由度,记为 E( ) = 。

x2检验或卡方检验和校正卡方检验的计算

x2检验或卡方检验和校正卡方检验的计算 x2检验(chi-square test)或称卡方检验 x2检验(chi-square test)或称卡方检验,是一种用途较广的假设检验方法。可以分为成组比较(不配对资料)和个别比较(配对,或同一对象两种处理的比较)两类。 一、四格表资料的x2检验 例20.7某医院分别用化学疗法和化疗结合放射治疗卵巢癌肿患者,结果如表 20-11,问两种疗法有无差别? 表20-11 两种疗法治疗卵巢癌的疗效比较 表内用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。这里可通过x2检验来区别其差异有无统计学意义,检验的基本公式为: 式中A为实际数,以上四格表的四个数据就是实际数。T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。兹以表20-11资料为例检验如下。

检验步骤: 1.建立检验假设: H0:π1=π2 H1:π1≠π2 α=0.05 2.计算理论数(TRC),计算公式为: TRC=nR.nc/n 公式(20.13) 式中TRC是表示第R行C列格子的理论数,nR为理论数同行的合计数,nC为与理论数同列的合计数,n为总例数。 第1行1列: 43×53/87=26.2 第1行2列: 43×34/87=16.8 第2行1列: 44×53/87=26.8 第2行2列: 4×34/87=17.2 以推算结果,可与原四项实际数并列成表20-12: 表20-12 两种疗法治疗卵巢癌的疗效比较

卡方检验

第八章记数数据统计法—卡方检验法 知识引入 在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、……,教师职称又分为教授、副教授、……。有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。 卡方检验是专用于解决计数数据统计分析的假设检验法。本章主要介绍卡方检验的两个应用:拟合性检验和独立性检验。拟合性检验是用于分析实际次数与理论次数是否相同,适用于单个因素分类的计数数据。独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否有关联或是否独立的问题。 在计数数据进行统计分析时要特别注意取样的代表性。我们知道,统计分析就是依据样本所提供的信息,正确推论总体的情况。在这一过程中,最根本的一环是确保样本的代表性及对实验的良好控制。在心理与教育研究中,所搜集到的有些数据属于定性资料,它们常常是通过调查、访问或问卷获得,除了少数实验可以事先计划外,大部分收集数据的过程是难于控制的。例如,某研究者关于某项教育措施的问卷调查,由于有一部分教师和学生对该项措施存有意见,或对问卷本身有偏见,根本就不填写问卷。这样该研究所能收回的问卷只能代表一部分观点,所以它是一个有偏样本,若据此对总体进行推论,就会产生一定的偏差,势必不能真实地反映出教师与学生对这项教育措施的意见。因此应用计数资料进行统计推断时,要特别小心谨慎,防止样本的偏倚性,只有具有代表性的样本才能作出正确的推论。 第一节卡方拟合性检验 一、卡方检验的一般问题 卡方检验应用于计数数据的分析,对于总体的分布不作任何假设,因此它又是非参数检验法中的一种。它由统计学家皮尔逊推导。理论证明,实际观察次数(f o)与理论次数(f e),又称期望次数)之差的平方再除以理论次数所得的统计量,近似服从卡方分布,可表示为: 这是卡方检验的原始公式,其中当f e越大(f e≥5),近似得越好。显然f o与f e相差越大,卡方值就越大;f o与f e相差越小,卡方值就越小;因此它能够用来表示f o与f e相差的程度。根据这个公式,可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异。它主要应用于两种情况: 卡方检验能检验单个多项分类名义型变量各分类间的实际观测次数与理论次数之间是否一致的问题,这里的观测次数是根据样本数据得多的实计数,理论次数则是根据理论或经验得到的期望次数。这一类检验称为拟合性检验。

卡方分布标准表格.doc

文地址 x2分布界表(卡方分布) P n' 0.995 0.99 0.975 0.95 0.9 0.75 0.5 0.25 0.1 0.05 0.025 0.01 0.005 1 ????0.0 2 0.1 0.45 1.32 2.71 3.84 5.02 6.6 3 7.88 2 0.01 0.02 0.02 0.1 0.21 0.58 1.39 2.77 4.61 5.99 7.38 9.21 10.6 3 0.07 0.11 0.22 0.35 0.58 1.21 2.37 4.11 6.25 7.81 9.35 11.3 4 12.84 4 0.21 0.3 0.48 0.71 1.06 1.92 3.36 5.39 7.78 9.49 11.14 13.28 14.86 5 0.41 0.55 0.83 1.15 1.61 2.67 4.35 6.63 9.24 11.07 12.83 15.09 16.75 6 0.68 0.8 7 1.24 1.64 2.2 3.45 5.35 7.84 10.64 12.59 14.45 16.81 18.55 7 0.99 1.24 1.69 2.17 2.83 4.25 6.35 9.04 12.02 14.07 16.01 18.48 20.28 8 1.34 1.65 2.18 2.73 3.4 5.07 7.34 10.22 13.36 15.51 17.53 20.09 21.96

9 1.73 2.09 2.7 3.33 4.17 5.9 8.34 11.39 14.68 16.92 19.02 21.67 23.59 10 2.16 2.56 3.25 3.94 4.87 6.74 9.34 12.55 15.99 18.31 20.48 23.21 25.19 11 2.6 3.05 3.82 4.57 5.58 7.58 10.34 13.7 17.28 19.68 21.92 24.72 26.76 12 3.07 3.57 4.4 5.23 6.3 8.44 11.34 14.85 18.55 21.03 23.34 26.22 28.3 13 3.57 4.11 5.01 5.89 7.04 9.3 12.34 15.98 19.81 22.36 24.74 27.69 29.82 14 4.07 4.66 5.63 6.57 7.79 10.17 13.34 17.12 21.06 23.68 26.12 29.14 31.32 15 4.6 5.23 6.27 7.26 8.55 11.04 14.34 18.25 22.31 25 27.49 30.58 32.8 16 5.14 5.81 6.91 7.96 9.31 11.91 15.34 19.37 23.54 26.3 28.85 32 34.27 17 5.7 6.41 7.56 8.67 10.09 12.79 16.34 20.49 24.77 27.59 30.19 33.41 35.72 18 6.26 7.01 8.23 9.39 10.86 13.68 17.34 21.6 25.99 28.87 31.53 34.81 37.16 19 6.84 7.63 8.91 10.12 11.65 14.56 18.34 22.72 27.2 30.14 32.85 36.19 38.58

卡方检验正态分布

卡方拟和检验的编程实现 摘要 针对一些总体分布的检验不能用现成的软件实现这一问题,本文论述了怎样应用matlab实现总体分布的检验,这里我们以正态分布为例,这里我们选用了总体分布的卡方检验,卡方检验是在总体分布未知的情况下,根据来自总体的样本,检验关于总体分布的假设的一种检验方法。 关键词:分布的检验 matlab 总体样本。 使用卡方检验分布时在总体X 的分布未知时,根据来自总体的样本,检验关于总体分布的假设的一种检验方法. 使用卡方检验对总体分布进行检验时,我们先提出原假设: H0:总体X的分布函数为F(x) 然后根据样本的经验分布和所假设的理论分布之间的吻合程度来决定是否接受原假设. 这种检验通常称作拟合优度检验,它是一种非参数检验. 在用卡方检验假设H0时,若在H0下分布类型已知,但其参数未知,这时需要先用极大似然估计法估计参数,然后作检验. 分布拟合的卡方检验的基本原理和步骤如下: 1.将总体X的取值范围分成k个互不重迭的小区间,记作A1, A2, …,

Ak . 2. 把落入第i 个小区间Ai 的样本值的个数记作fi , 称为实测频数. 所有实测频数之和f1+ f2+ …+ fk 等于样本容量n. 3. 根据所假设的理论分布,可以算出总体X 的值落入每个Ai 的概率pi,于是npi 就是落入Ai 的样本值的理论频数. 皮尔逊引进如下统计量表示经验分布与理论分布之间的差异: 卡方统计量2 χ=∑=-r k k k k np np n 12)( 用上述原理检验是否服从分布: 以下为一个筛子投掷四十次的数据:1 4 4 6 3 4 5 2 4 6 3 4 4 2 3 6 3 1 3 4 4 5 2 2 3 3 3 1 5 1 2 2 4 5 5 5 1 3 2 5 程序如下: 输入数据: 运行结果:

附表四卡方分布表

αdf 14E-050 0.0010.0040.016 2.71 3.841 5.024 6.6357.879 20.010.020.0510.1030.211 4.61 5.9917.3789.21 10.6 30.0720.120.2160.3520.584 6.257.8159.34811.3512.84 40.2070.3 0.4840.711 1.0647.789.48811.1413.2814.86 50.4120.550.831 1.145 1.619.2411.0712.8315.0916.7560.6760.87 1.237 1.635 2.20410.612.5914.4516.8118.55 70.989 1.24 1.69 2.167 2.83312 14.0716.0118.4820.28 8 1.344 1.65 2.18 2.733 3.4913.415.5117.5420.0921.969 1.735 2.09 2.7 3.325 4.16814.716.9219.0221.6723.59 10 2.156 2.56 3.247 3.94 4.865 16 18.3120.4823.2125.19 11 2.603 3.05 3.816 4.575 5.57817.319.6821.9224.7326.7612 3.074 3.57 4.404 5.226 6.30418.521.0323.3426.2228.3 13 3.565 4.11 5.009 5.8927.04219.822.3624.7427.6929.82 14 4.075 4.66 5.629 6.5717.79 21.123.6926.1229.1431.32 15 4.601 5.23 6.2627.2618.54722.32527.4930.5832.816 5.142 5.81 6.908 7.9629.31223.5 26.3 28.85 32 34.27 0.9950.990.9750.950.010.005 0.90.10.050.025

卡方检验

第十二章假设测定I V:卡方测定 (The Chi Square Test) 壹、本单元目标 1、举例说明卡方测定适用的情况。 2、解释双变项交叉表(bivariate table)的结构,以及如何将独立性 (independence)的概念应用到交叉表的期待次数(expected frequencies)与观察次数(observed frequencies)之间的关系上。 3、说明如何将假设测定的逻辑运用在交叉表的分析上。 4、以五个假设测定的步骤说明卡方测定,以及正确的解释测定的结 果。 5、说明卡方测定的限制,以及统计显著性与实质重要性的差异。 贰、简介 本章要介绍的Chi Square (χ2) test(卡方测定)大概是社会科学研究中,最常看到的一种假设测定方法。这是因为此测定方法相当容易符合假设测定第一个步骤─基本假定设定─的要求。此测定方法是两个名目尺度变项间之假设测定的方法。因此在level of measurement 的要求方面是最基本的nominal level of measurement。这名目尺度变项不限于是二分的,也可适用在其它尺度测量的变项上。而χ2test 也是一种无参数的测定,因此在基本假定部分,我们无须知道母群体之分配特性(distribution-free)。χ2之抽样分配是一种已知之理论分配,就叫χ2分配。(所谓Chi Square是χ这个希腊字母的发音加上「平方(square)」的英文)。 这种可以相当容易符合基本假定要求的无参数测定方法,可以让我们在做拒绝虚无假设的决策时,比较有信心。这是因为做假设测定时,如果在基本假定设定(测定的第一个步骤)中的任一要求或虚无假设(测定的第二个步骤)是错误时,我们就可拒绝虚无假设。但在无参数测定方法的情况下,我们比较容易符合基本假定的要求,因此可专注在判断虚无假设是否为错误,决策的结果也比较有信心。 参、双变项交叉表 卡方测定的进行要用到双变项交叉表。此交叉表同时呈现出两个不同变项间次数分配的情况。因此,双变项交叉表可用来探索这两个变项间是否有明显的关系存在。例如,以下是表示性别与教育程度间关系的一个双变项的交叉表:

卡方分布

卡方分布 (重定向自卡方分布(Chi-square Distribution)) 卡方分布(Chi-square Distribution) [编辑] 什么是卡方分布 卡方分布(χ2分布)是概率论与统计学中常用的一种概率分布。k 个独立的标准正态分布变量的平方和服从自由度为k 的卡方分布。卡方分布常用于假设检验和置信区间的计算。 [编辑] 卡方分布的数学定义 若k 个随机变量Z1、……、Zk 相互独立,且数学期望为0、方差为1(即服从标准正态分布),则随机变量X 被称为服从自由度为k 的卡方分布,记作 [编辑] 卡方分布的特征 卡方分布的概率密度函数为: 其中x≥0, 当x≤0时fk(x) = 0。这里Γ代表Gamma 函数。

卡方分布的累积分布函数为: 其中γ(k,z)为不完全Gamma函数 在大多数涉及卡方分布的书中都会提供它的累积分布函数的对照表。此外许多表格计算软件如https://www.wendangku.net/doc/5814698609.html, Calc和Microsoft Excel中都包括卡方分布函数。 卡方分布可以用来测试随机变量之间是否相互独立,也可用来检测统计模型是否符合实际要求。 自由度为k 的卡方变量的平均值是k,方差是2k。卡方分布是伽玛分布的一个特例,它的熵为: 其中ψ(x) 是Digamma function。

[编辑] 卡方变数与Gamma变数的关系 当Gamma变数频率(λ)为1/2 时,α 的2倍为卡方变数之自由度(Degree of freedom) 即: 卡方变数之期望值=自由度卡方变数之方差=两倍自由度 卡方分布 , , ,

k-2, if, , , , 定义:N个服从正态分布(均值为0,方差为1)的独立随机变量的平方和X服从自由度为N的卡方分布。 问题:证明D(X)=2N 二、 定义:假设X服从均值为0方差为1的正态分布,Z服从自由度为N的卡方分布,如果X和Z独立,那么T=[X/根号(Z/N)]服从自由度为N的t分布。 问题:证明D(T)=N/(N-2) 要求:1.只要有一题证明正确者追加分数! 2.请各位兄弟证明不到的不要乱回答,但可以说说自己的想法。 辛苦各位了~ 问题补充:

spss总体分布卡方检验作业

浙江大学城市学院实验报告 课程名称实用统计软件 实验项目名称总体分布卡方检验 实验成绩指导老师(签名)日期2011-10-14 一.实验目的 1,掌握卡方检验的基本原理和算法; 2,能够用SPSS软件解决卡方检验的问题。 二. 实验内容与要求 1.根据摇奖号码中出现的数字值检验摇奖的球是否均匀,即0~9每个数字出现的概率是否均为1/10。下面是100个摇奖摇出来的数据。本例数据是实际收集的样本原始数据,所以不需要加权处理。 3 2 2 8 5 4 2 8 0 4 9 4 8 7 7 4 2 2 1 6 4 7 2 9 8 4 6 7 6 2 0 7 5 9 7 4 4 4 7 5 6 8 1 7 2 0 3 3 4 8 0 7 1 1 6 0 7 2 2 1 2 5 8 1 7 8 6 4 2 8 6 4 9 6 0 4 3 4 3 8 1 7 2 8 4 2 0 1 8 3 7 3 7 8 6 1 3 6 4 3 要求:在期望值选项中,我们选择“All categories equal”选项。 2.某门户网站为了了解网站的流量,在6小时内,记录每分钟内访问该网站的用户数,得 根据数据检验每分钟访问该网站的用户数是否服从泊松分布? 要求: a.此数据首先需要用“频数”对“被访问数”变量进行加权 b.其次要计算在原假设被访问数服从泊松分布的下,变量个取值的期望频数。 计算方法:用变量取值的平均值(加权平均)作为泊松分布参数的估计值。 各取值期望频率计算方法: N* p x= N*(Fλ(x)- Fλ(x-1))

SPSS中,变量计算公式: (CDF.POISSON(被访问数,泊松参数估计值) - CDF.POISSON(被访问数-1,泊松参数估计值))*300 c.最后就是要检验观测频数与泊松分布假设下期望频数之间是否有显著性差异。 三.实验步骤 具体操作参见课件总体分布卡方检验.PPT(ftp://10.66.28.22:22) 四. 实验结果(数据与图形)与分析 从结果表格可以看出,总共100个数据中,0到9实际被抽到的次数分别为:7,9,14,9,16,4,10,14,13,4,。按照给定的理论分布,每个数字被抽到的期望频数应为10,10,10,10,10,10,10,10,10,10.实际观察频数和期望频数的差分别为-3,-1,4,-1,6,-6,0,4,3,-6.

利用Excel的CHIINV函数编制卡方分布表

利用Excel的CHIINV函数编制卡方分布表 董大钧 卡方分布(Chi-square Distribution)是常用的一种概率分布。若n个独立的随机变量均服从标准正态分布,则这n个随机变量的平方和构成一新的随机变量,其分布规律称为服从自由度为ν的χ2分布。卡方分布常用于假设检验和置信区间的计算。 χ2分布具有可加性:若有K个服从χ2分布且相互独立的随机变量,则它们之和仍是χ2分布,新的χ2分布的自由度为原来K个χ2分布自由度之和。 卡方分布可以用来测试随机变量之间是否相互独立,也可用来检测统计模型是否符合实际要求。 卡方分布的概率密度曲线如图1所示: 图1 卡方分布的概率密度曲线 在对实验数据进行卡方分析时,需要查找卡方分布表,在大多数涉及卡方分布的书中都会提供它的累积分布的概率值表。然而查表很不方便,使用Excel的CHIINV函数可以获得卡方分布的概率值。 函数格式: CHIINV(概率,自由度) 在Excel中,可以利用CHIINV函数生成卡方分布表。在下面的Excel表格中,第3行为显著性水平α,如B3、C3、D3、E3分别为0.1、0.05、0.025、0.01;A列为自由度,A4为1,A5为2,选定A4、A5,向下拉动填充柄,得到连续的整数。B4单元格中公式为 = CHIINV(B$3, $A4 ) 这里,B4单元格公式中地址引用使用了混合地址,B$3锚定了第3行,以保证不管公式复制到那一行的单元格,都使用该列第3行的值;$A4锚定了A列相应的行(自由度)。回车后显示为2.705544。 选中B3单元格,向右拖动填充柄,复制公式至E列,再向下拖动填充柄,到需要的行。 选中B4:E18整块区域,设定小数位为6位小数。以保证所有的函数值都为6位小数,结果如图2所示。这样就可得到卡方分布表。 实际应用中,可根据α与ν,使用CHIINV(α,ν)得到需要的卡方值,不必再查表,方便了数据处理分析。

相关文档