文档库 最新最全的文档下载
当前位置:文档库 › 均值众数中位数的区别联系

均值众数中位数的区别联系

1 众数
 众数是一组数据中出现次数最多的标志值,用M0表示。虽说平均数是用来说明现象的一般水平的,但在有些情况下用众数说明现象的一般水平也有很好的效果。例如,为了掌握集市上某种商品的价格水平,不必登记全部的成交量和成交额,只用该日市场上最普遍的成交价格即可。又如在确定某种商品的生产量、进货量时,要考虑哪一种规格的商品消费量最大。显然,用众数来表现给定总体的一般水平或变量数列的集中趋势具有非常直观的代表意义。并且,众数不仅可以对真正的数量标志来加以计算,还可以对品质标志来加以确定,也就是说,它既适应于变量数列,也适应急于品质数列。例如,销售量最多的服装款式或色彩,也即通常所谓的“流行款式”,就属于这种意义的众数。
对于由变量数列来确定众数,根据所掌握的资料不同,应采用不同的方法。具体方法如下:
(一)如果各标志值分布很均匀,无明显的变化,则数列无众数。

(二)如果是单项式数列或未分组的数据,则看哪一个标志值出现的次数最多便可。此时,出现次数最多的那一个标志值就是众数。

(三)由组距式数列确定众数,先根据次数的多少确定众数组,然后按公式计算

2 中位数
中位数是指将总体各单位标志值按照大小顺序排列后,处于中间位置的那个标志值,用Me表示。
中位数将变量数列分为相等的两部分,一部分的标志值小于中位数,另一部分的标志值大于中位数。用这样一个中等水平的标志值来表现数据的集中趋势,显然也具有非常直观的代表性义。在许多情况下,不易计算数值平均数时,可用中位数代表总体的一般水平,尤其是在总体标志值差异很大的情况下,中位数更加具有较强的代表性。例如,人口年龄中位数,可表示人口年龄的一般水平;集贸市场上某种商品的价格中位数,可代表该种商品价格的一般水平;在收入水平差异较大的社会,用居民收入的中位数作为收入水平的代表值更为恰当,因为它排除了极端变量值的影响。
对于中位数的确定,根据具体资料不同,采用的方法也就不同,这里分以下三种情况:
1.由未分组的数据确定中位数
根据未分组的数据确定中位数时,首先将总体各单位的标志值资料按大小顺序排列,然后按照 (n表示资料的项数)来确定中位数的位次,再根据中位数的位次找出对应的标志值即可。

3、众数、中位数、均值的关系
作为集中趋势测定值主要是众数、中位数、均值,三者之间存在着一定的数量关系,数量关系的体现取决于资料的次数分布



 1、若资料是对称分布,则众数、中位数、均值相等。


根据经验,若数据足够多,而且次数分布适度偏斜情况下,均值、中位数和众数三者间有较固定的关系。不论是在右偏还是左偏,中位数始终居于均值与众数之间。如果将均值和众数之间的距离视为1,则中位数与均值之间的距离为,中位数与众数之间的距离约占。根据这一关系,当已知其中两个代表值时,可用公式求出第三个代表值:



由对均值、中位数和众数三者关系的分析,可得出如下启示:

当数据呈现对称分布或近似对称分布时,以均值作为集中趋势的代表值最好;当分布的偏斜程度较大时,均值容易受到极端值的影响,不能很好地反映数据集中趋势,就有必要考虑使用中位数或众数。


4众数、中位数和均值的特点和应用场合
1.众数、中位数和均值的特点
(1)众数是一组数据分布的峰值,是一种位置代表值。其优点是易于理解,不受极端值的影响。当数据的分布具有明显的集中趋势时,尤其是对于偏态分布,众数的代表性比均值要好。其缺点是具有不唯一性,对于一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。
(2)中位数是一组数据中间位置上的代表值。其特点是不受数据极端值的影响。对于具有偏态分布的数据,中位数的代表性要比均值好。
(3)均值是就全部数据计算的,它具有优良的数学性质,是实际中应用最广泛的集中趋势测度值。其主要缺点是易受数据极端值的影响,对于偏态分布的数据,均值的代表性较差。作为均值变形的调和平均数和几何平均数,是适用于特殊数据的代表值,调和平均数主要用于不能直接计算均值的数据,几何平均数则主要用于计算比率数据的平均数,这两个测度值与均值一样易受极端值的影响。
2. 各种代表值应用的场合
(1)当数据呈对称分布或接近对称分布时,三个代表值相等或接近相等,这时应选择均值作为集中趋势的代表值,因为均值包含了全部数据的信息,而且易被大多数人所理解和接受;
(2)当数据为偏态分布,特别是当偏斜的程度较大时,我们应选择众数或中位数等位置代表值,这时它们的代表性要比均值好。
此外,应注意当一组数据中出现0或负数时,无法计算调和平均数或几何平均数。

相关文档
相关文档 最新文档