文档库 最新最全的文档下载
当前位置:文档库 › 土壤属性空间预测精度与不确定性分析——有限最大似然法和高程辅助变量的应用

土壤属性空间预测精度与不确定性分析——有限最大似然法和高程辅助变量的应用

摘要

土壤属性空间变化的准确预测是土壤学及环境科学等相关学科的一个共同主题。在全球变化、资源与环境、生态多样性、食品安全以及人口与耕地等一系列问题的相关研究过程中,对土壤属性空间分布信息,不论在信息的数量方面还是在准确性方面,都提出了越来越高的要求。本文从准确性和不确定性两个方面,对有限最大似然法(REML)和高程辅助变量在土壤属性空间预测中的应用进行了探讨和研究,主要内容与结论如下:

(1)以北京市大兴研究样区作为研究样区,以土壤有机质、土壤含水量、土壤速效钾和土壤有效锰四个土壤属性作为目标变量,通过选择不同的样本点数,对比分析REML法和传统的矩量法(MoM)在计算变异函数准确性方面的表现。结果表明:在样本点数从150个逐渐减少到50个过程中,当样本点数小于70个后,所有目标变量的预测精度都开始明显的下降。在样本点数比较少的情况下,REML法估计的变异函数比MoM法估计的变异函数更准确一些。

(2)以土壤有机质和土壤有效锰作为目标变量,通过选择不同的空间尺度,分析空间尺度对土壤属性变异函数准确性的影响。结果表明:空间尺度对于认识土壤目标变量的空间变异特征具有明显的影响;REML法在提高空间预测精度方面效果是否明显与研究区的空间尺度也紧紧相关,本文中,REML法估计的变异函数在20km和30km两个尺度范围内比MoM法变异函数的预测精度高。

(3)以平谷区为研究样区,以高程作为辅助变量,以土壤有机质、土壤速效钾、土壤有效磷、土壤有效铁等为目标变量,通过利用普通克里格法(OK)、协克里格法(CK)和回归克里格法(RK)三种方法,对比分析高程数据是否可以用来提高上述土壤属性的空间预测精度。结果表明:高程作为辅助变量,可以用来提高土壤属性的空间预测精度,但这种方法并不适合所有土壤属性,本文中土壤有效铜、土壤有效铁和土壤有效锰三种微量元素的预测精度没能够被提高;利用高程对土壤属性进行空间预测时,在选用最适宜的方法之前,应该对土壤变量的空间结构、土壤属性的全局趋势、土壤属性与高程之间的线性相关关系、结构相关关系等进行仔细分析。

(4)利用高程、坡度和地形湿度指数等地形指标组合成不同的外部趋势模型,通过RK法和有限最大似然法为基础的线性无偏最优估计法(BLUP-REML)对平谷区土壤有机质的空间分布进行预测。结果表明:地形指标高程、坡度和地形湿度指数等可以作为辅助变量用来提高土壤有机质的空间预测精度,尤其是通过不同地形指标之间的组合,能进一步的提高预测精度;在样本点数较少的前提下,在外部趋势模型对土壤有机质空间变化解释程度偏低的情况下,BLUP-REML法在预测的稳定性方面比RK法表现得更好。

(5)将高程辅助数据与序贯高斯协模拟方法相结合,对密云样区和平谷样区的土壤有机质的空间分布进行模拟,通过对模拟结果的准确性、局部不确定性和空间不确定性进行评价。结果表明,在条件高斯模拟的计算环境下,可以利用高程作为辅助变量来提高土壤有机质空间预测精度和空间不确定性模拟的准确性,但没能提高局部不确定性模拟的准确性。

关键词:土壤属性,空间预测精度,不确定性,地统计方法,高程,有限最大残差法

I

Abstract

Spatial prediction of soil properties has become a common topic in soil science research. There are increasing demands for the information of spatial distribution of soil characteristics, both in the amount of information and in terms of accuracy, for the study of the issues related to changes in the global resources and the environment, biodiversity, food security and population and arable land. In this paper, we discussed the issues of enhancing the accuracy of spatial prediction of soil from the use of geostatistics methods and auxiliary variables. Main contents and conclusions are as follows: Soil organic matter, soil water content, soil available potassium and manganese have been examined here from Beijing Daxing district with different sample sizes to compare the performance of the MoM and REML. The results shows the size of data set have a marked impact on the accuracy of variogram. When the sample is less than 70 points, the prediction accuracy of target variables are beginning to decline significantly. The REML variograms are more precise than the MoM variograms in the cases of small size of sample.

To assess the impact of spatial scale on variogram, the performance of MoM variogram and REML variogram were examined with the data of soil organic matter and soil available manganese from different scale plots. The results showed that the spatial scale had a obvious effect on the accuracy of variogram computed by both MoM and REML. In this paper, with soil organic matter and soil manganese as the target variable, REML variograms are more accurate than MoM variograms with the 20km scale and 30km scale plots.

This paper compares the accuracy of predictions of the soil organic matter, soil available potassium, phosphorus, iron and other soil variables in Pinggu District from ordinary kriging, cokriging and regression kriging. For the last two, intensive elevation data were used as auxiliary variable. The results showed that elevation can be used to improve the accuracy of spatial prediction of soil properties, but this method is not suitable for all soil variables. The results of factor analysis suggested that linear relationship, structure relationship between elevation and soil properties and the global trend of soil properties should be carefully checked before the selection of the most appropriate method.

The performance of the empirical best linear unbiased predictor with residual maximum likelihood (BLUP-REML) with that of regression kriging (RK) were compared for predicting soil organic matter (SOM) with the presence of different external drifts. Terrain attributes (elevation, slope and topographic wetness index) calculated from DEM was used as external drift variable. The results suggest that topographical data can further improve the accuracy of the spatial predictions of SOM by using RK and REML. Although the improvement with REML-EBLUP is not noticeable compared with RK, the prediction capability of REML-EBLUP is more stable than RK especially when a smaller proportion of the variation in target variable is accounted for by a trend model.

The sequential Gaussian simulation (SGS) and sequential Gaussian co-simulation (SGCS) algorithms were compared with respect to the accuracy of predictions as well as to the uncertainty inherent in the spatial prediction of soil organic matter. The SGS algorithm accounted for only the SOM data. The SGCS accounted for both SOM data and intensive elevation data. The root mean square errors

II

revealed that the more accurate simulations were those accounting for intensive elevation information by the SGCS method for the two areas compared with SGS. As regards modeling local uncertainty, SGCS performed better at modeling prediction uncertainty than SGS. In addition, the results of assessing the standard deviation confirmed that the exhaustive elevation data could be used to reduce the spatial uncertainty of SOM by SGCS compared with the SGS algorithm.

Keywords: soil properties, accuracy, uncertainty, geostatistics, residual maximum likelihood, elevation

III

目录

第一章绪论 (1)

1.1选题背景与研究意义 (1)

1.2 研究现状综述 (1)

1.3主要研究内容 (6)

1.4 技术路线 (7)

第二章样本点数对变异函数准确性的影响 (9)

2.1 引言 (9)

2.2 研究目的 (9)

2.3 理论与方法 (9)

2.4 研究区概况与数据获取 (11)

2.5 结果分析 (13)

2.6本章小结 (30)

第三章空间尺度对变异函数的影响 (31)

3.1 前言 (31)

3.2 研究目的 (31)

3.3 研究区介绍与数据获取 (31)

3.4 结果分析 (33)

3.5 本章小结 (40)

第四章利用高程辅助提高土壤属性空间预测精度 (41)

4.1 引言 (41)

4.2 研究目的 (41)

4.3 理论与方法 (42)

4.4 研究区概况与数据获取 (44)

V

4.5 结果分析 (46)

4.6 本章小结 (55)

第五章利用不同外部趋势变量预测土壤有机质空间分布 (56)

5.1 引言 (56)

5.2 研究目的 (56)

5.3 理论与方法 (56)

5.4 研究区概况与数据获取 (58)

5.5 结果分析 (60)

5.6 本章小结 (69)

第六章高程辅助变量在不确定性分析中的应用 (71)

6.1 引言 (71)

6.2 研究目的 (71)

6.3 理论与方法 (71)

6.4 研究区概况与数据获取 (74)

6.5结果分析 (75)

6.6 本章小结 (81)

第七章主要结论与研究展望 (82)

7.1 主要结论 (82)

7.2 研究展望 (83)

参考文献 (84)

致谢 (89)

个人简历 (90)

VI

第一章绪论

1.1选题背景与研究意义

土壤作为地球表层系统自然地理环境的重要组成部分,在全球气候变化、资源与环境、生态多样性、食品安全以及人口与耕地等一系列问题中起着十分重要的作用。例如,土壤产生与排放CO2、CH4和N2O等温室气体的过程,是陆地生态系统碳氮循环的一个重要过程,是土壤碳氮库的主要输出途径,对全球气候变化,尤其是全球变暖起着重要的影响作用。

随着上述热点问题的逐步深入研究,对相关的土壤物理、化学和生物过程的理解和认识显得越来越重要,因此对土壤属性空间变化的信息,不论在信息量方面还是在信息的准确性方面,都提出了越来越高的要求。例如,在区域土壤水分和溶质运移动力学模拟研究中,需要区域内每个具体点位的土壤饱和与非饱和导水率和土壤水分特征曲线等土壤水力学参数作为模型运算的基础;在现代精准农业中,为了实现田间的点位管理,就必须对田间具体点位的土壤养分信息有一个清楚的认识。然而,土壤作为母质、地貌、气候、生物和时间等成土因素相互作用的产物,土壤属性在空间和时间尺度上表现出复杂的差异性。由于土壤的空间变异特性,在目前相关土壤研究工作中经常面临的一个主要问题是缺少必要的、准确的和足够的土壤属性空间分布信息。

田间调查采样及随后的室内分析是目前唯一能够获取土壤准确信息的方法。土壤的田间调查一方面需要大量的人力、物力和时间,另一方面获取的土壤信息却十分有限,不能满足各方面对土壤信息的需求。为了有效的解决土壤信息的供求矛盾,同时也为了客观真实的反映区域内总的土壤变化特征,就需要通过一定的方法利用田间调查的准确土壤信息对未采样点的土壤属性值进行预测。

在提高土壤属性空间预测精度方面,目前地统计学中备受关注的两条主要途径是:(1)利用有限最大似然法估计变异函数;(2)利用在空间上与土壤相关的变量来辅助预测。本文将从样本点数、空间尺度以及外部趋势度等方面对上述两条途径的应用进行探讨。研究结果将有有助于对土壤属性空间预测精度的预测方法体系有更全面的认识,对正确认识土壤空间变化提供更完善的理论基础。这对于当前我国开展的测土施肥和耕地质量动态监测工作具有重要的实践意义。

1.2 研究现状综述

为了获取更准确的土壤属性预测值,土壤学家在土壤空间预测方面一直努力寻求更好的预测方法,一些先进的预测方法不断地被引进到土壤学中。例如,Burgess and Webster (1980)将普通克里格方法应用到土壤属性的空间预测;Lark and Webster(1999)将小波分析方法应用到土壤学中进行尺度相关的分析;Christakos(1998)首先用贝叶斯最大熵方法解决土壤属性时空变化问题。在这些方法中,地统计法方法得到了广泛地关注和研究。

1

地统计学起源于20 世纪60 年代,早期主要应用于采矿业和石油勘探中。地统计学的研究对象是空间变量(也叫区域化变量)。空间变量的特点是变量在空间上不一定是完全随机的或完全独立的,即在空间上可能是相互联系的。地统计学将空间变量在空间某一位置的测量值看作是满足固有假设条件的随机函数在这个位置上的一次实现值。由于不同位置的样本值之间可能是相互联系的,就需要分析样本的空间位置是否含有必要的信息,来揭示变量性质随距离的相关关系,即变量的空间变异结构(张仁铎, 2005)。有关地统计学的基本理论在此不再累述,具体内容参考相关文献(Goovaerts,1997;Stein,1999;王政权,1999;Webseter and Oliver,2001;Wachernagel,2003;张仁铎,2005;)。如今,越来越多涉及到空间分析的学科求助于地统计学的研究工具,地统计学已经被广泛用于土壤学、生态学、环境科学、地理学等诸多领域的研究中。

自从Burgess and Webster(1980)将地统计学引入土壤学后,地统计学已经在土壤学的各个领域得到广泛地研究与应用。例如,土壤养分方面(胡克林等,1999;张世熔等,2003;许文强等,2006;王淑英等,2008)、土壤有机质方面(张世熔等,2002;黄元仿等,2004)、土壤质地方面(高峻等,2003)、土壤污染方面(杨劲松等,2006;张红艳等,2006;钟晓兰等,2007)、土壤盐分方面(胡克林,2000;杨劲松等, 2006)、土壤水分方面(李笑吟等, 2006; 杨劲松等, 2006)等。上述文献的侧重点都是利用克里格方法对各土壤属性的空间分布进行插值预测,然后对土壤属性的预测结果进行评价。

在应用克里格法对土壤属性进行预测的过程中,还需要对克里格方法的适用范围、克里格法预测能力表现以及克里格法预测结果存在的误差等问题有所了解和认识。相关文献对这些问题进行了探讨和研究。下面从变异函数准确性、地统计混合模型(geostatistics hybrid method)结合辅助变量的应用、预测结果不确定性分析三个方面进行阐述。

1.2.1关于变异函数准确性的研究

地统计方法以区域化变量理论为基础,将土壤特性的空间变化作为一个随机函数的实现。用来表征随机变量空间结构的变异函数是地统计学的核心。传统的估计变异函数的方法是Matheron (1965)提出的矩量法(method of moment, MoM)。MoM法估计变异函数包括两个阶段:第一,利用样本数据对不同分离距离计算样本变异函数;第二,对样本变异函数进行拟合得到一个连续的变异函数。为了准确地估计变异函数,用来计算样本变异函数值的数据量应足够大。Webster and Oliver(1992)根据Monte Carlo方法决定的置信限显示至少需要100~150个样本数据,利用MoM 法估计的变异函数才具有可靠性。但是,在实际应用中,经常出现样本数据比较少的情况。因此,需要一种方法能够利用比较少的样本数据估计出比较可靠的变异函数。

Pardo-Igu?zquiza(1998)提出用最大似然法(maximum likelihood, ML)估计变异函数是另外一种可以用于土壤学的方法。ML是一种估计空间变量协方差参数的方法。Mardia(1984)首先在回归分析中用ML估计随机变量的空间协方差模型。随后,Kitanidis(1987)将ML法明确地用于地统计分析。Lark(2000)分别通过模拟数据和田间实测数据对MoM法和ML法进行了比较,模拟数据的结果显示ML法在采样点数为60的时候的结果与MoM法在采样点数为90到120点的结果一样,但是田间实测数据的结果却显示两种方法之间没有明显区别。相关文献(Cressie, 1993; Kitanidis and Lane, 1985) 指出由于ML法是同时估计趋势参数和协方差参数,导致2

了ML法估计的方差参数是存在偏差的。

Patterson and Thompson(1971)提出的REML法克服了ML法的缺点。REML首先对原始数据进行线性合并为广义增量(generalized increments),将趋势去除,然后再通过最大似然函数估计协方差参数。REML在统计理论上是最合理的一种方法,最近已经在计量土壤学中引起了关注。Lark and Cullis(2004)详细的描述了如何利用REML法估计土壤属性的协方差参数,并建议在土壤属性空间预测过程中使用REML法。Kerry and Oliver(2007a)通过四个不同研究区域评价了样本点数量对REML法在估计变异函数方面的影响,结果显示,当样本点数小于100时,利用REML法变异函数的预测结果比利用MoM法变异函数的预测结果要准确。Minasny and McBratney(2007)根据他们的研究结果指出,当样本点个数小于200时,就可以考虑使用REML 法分析变异函数分析。

1.2.2地统计混合模型方法结合辅助变量在土壤属性空间预测中的应用

在地统计学中,土壤属性变量被作为一种区域化变量来分析,土壤属性的空间变异性可由两部分来代表,即空间确定性部分和随机部分,也称趋势成分和随机成分(张仁铎, 2005)。在普通克里金法中,假定确定性部分在空间上常量,主要是估计随机部分,在实际应用中,这些假定可能会限制克里金法的应用。例如,由于地形地貌的影响,土壤特征可能在研究区内表现出明显的趋势,在这种情况下,确定性部分在空间上不再是常量,也就不能满足普通克里格法对数据的要求。

泛克里格法(universal kriging:UK)是一种用来分析具有空间趋势变量的最佳线性估值方法。这种方法通常假定土壤变量的空间确定性部分(称为空间趋势)能够用空间坐标的多项式函数来表示。这样就可以首先通过空间坐标预测未采样点的土壤趋势部分,再利用普通克里格法预测未采样点上的随机部分,最后将空间趋势部分和随机部分进行叠加得到未采样点的土壤预测值。但是,用空间坐标来预测土壤变量的空间趋势也存在一定的局限性。

外部趋势克里格法(kriging with external drift:KED)和回归克里格(regression kriging:RK)作为泛克里格法的有效的推广形式,可以利用另外一种辅助变量的函数来表示土壤变量的空间趋势部分,弥补了UK法的缺陷。通常要求辅助变量具有以下特点,(1)获取比较容易或者测量费用相当廉价;(2)在研究区内信息量特别丰富;(3)与目标土壤变量存在一定的相关关系。RK 法和KED法在数学推导公式上是相同的,两者的区别在于:在KED法中用来描述趋势的线性函数的系数在局部搜寻邻域内被看作常数,他们在克里格预测过程中被隐含地估计;而在RK法中,估计趋势线性函数的系数是独立与克里格法过程的。另外一种可以利用辅助变量的方法是多元克里格方法中的协克里格法(cokriging:CK),CK法是普通克里格的拓展,考虑了空间两个或多个变量的空间交叉相关关系。有关UK法、KED法、RK法和CK法的基础理论在此不再详述,具体参考相关文献(Odeh et al., 1995;Hengl et al., 2004,2007;Goovaerts,1997;Webseter and Oliver,2001;Wachernagel,2003)。

关于上述几种地统计混合模型方法的预测能力和适用范围,许多文献通过不同的土壤变量和辅助变量对这几种方法进行了比较。例如,Meul and Van Meirvenne(2003)通过不同类型的非平稳土壤质地数据和辅助变量高程,对OK、CK、UK和RK法进行了比较,结果显示CK法和UK 法可以很好的解释局部非平稳性。Simbahan et al(2006)利用表面反射率、土壤电导率和相对高

3

程等多个外部辅助变量,通过CK、KED和RK三种方法,对土壤有机碳进行空间预测,结果表明,在这几种地统计混合方法,RK法是一种应用灵活且预测精度较高的方法。Baxter and Oliver (2005)以高程为辅助变量,通过CK、RK和KED三种方法,对两个研究区的土壤矿物氮和潜在有效氮进行分析,结果表明KED法和CK法都具有比较好的预测结果。从上述文献的结果可以看出,对于不同的土壤变量,不同的研究区域和不同的研究尺度,没有一种最好的预测方法,每种方法都有一定特点和适用范围。下面简要论述了每种方法的应用条件及其不足之处。

CK法在理论上是一种比较完善的多元克里格法。CK法要求的条件为:(1)目标变量与辅助变量都满足固有假定条件;(2)目标变量与辅助变量在空间上是相联系的,即在同一位置上,目标变量的取值与辅助变量的取值是相关的(Frogbrook and Oliver, 2001);(3)目标变量的样本点比较少,而辅助变量的采样点则比较多。CK法在实际应用中存在两个方面的不足:(1)CK法要求目标变量的变异函数、辅助变量的变异函数以及二者之间的协变异函数是由共同的基本变异函数模型线性组合而成(即:协区域化线性模型),在协区域化线性模型的拟合过程中受到的限制条件比较多(Wachernagel, 2003);(2)CK法在预测过程中还存在计算量大、计算时间长的问题(Goovaerts, 1997)。因此,在应用中CK法并不是一种实用的方法。

KED法的应用条件是:(1)辅助变量的空间趋势与目标变量的空间趋势是相关的;(2)目标变量去除趋势后的残差能够用地统计方法模拟;(3)目标变量与辅助变量是线性相关的,辅助变量必须在所有目标变量的采样点上是已知的,并且在预测格网的所有点上也是已知的。KED法的缺陷是:由于趋势系数的估计是在克里格法估值过程中同时进行的,当辅助变量与目标变量的关系不是简单的线性关系时,KED法的应用受到限制(Deutsch and Journel, 1998)。

RK法的应用条件与KED法相同,但是RK法明确地把趋势估计与残差插值分离,这样就可以利用任意复杂的回归形式,比较简单实用,因此RK法是一种应用最广泛的方法(Baxter and Oliver, 2005; Finke et al., 2004; Herbst et al., 2006; Simbahan et al., 2006),而且许多文献(Hong et al., 2005; Odeh et al., 1995; Simbahan et al., 2006)也报道了RK法的预测精度要高于OK法、CK法和RK法等方法的预测精度。

但是,Cressie(1993)和Lark et al.(2006)指出,RK法也存在两方面的缺陷:(1)趋势一般通过普通最小二乘法(OLS)来估计,虽然这个估计是无偏差的,但是这个估计没有产生最小方差估计;(2)利用回归残差估计的变异函数在理论上是有偏差的,而且偏差随着分离距离的加长而逐渐变大。RK法的缺陷导致两方面的结果,一方面是这种偏差将导致随机变量总的变化被低估,另一方面是拟合的变异函数不能正确的表达随机变量的空间相关性。

鉴于RK法存在上述的缺陷,Lark et al.(2006)建议采用统计上更稳健的一种方法,即以有限最大似然法为基础的线性无偏最优估计方法(BLUP-REML),来预测具有空间趋势的土壤变量。Lark (2006)指出BLUP-REML法能够无偏的估计残差的变异函数,能够得到最小方差的趋势估计,还能够得到未采样点上估计的趋势成分和随机成分的和,而且还知道预测方差。Minasny and McBratney(2007)利用了不同研究区的不同土壤属性数据对该方法进行了检验,结果显示当样本点个数小于200时,BLUP-REML法是一种有效的方法。然而,目前有关BLUP-REML法在土壤属性的空间预测方面的具体案例还比较少,对BLUP-REML法的预测能力及影响因素还需要进一步检验与评价。

随着科学技术的发展,在空间上与土壤相关的辅助变量越来越容易获取,这些辅助变量主要4

包括数值高程模型(DEM)、遥感影像数据和电磁波(EMI)扫描数据等。利用这些信息量丰富的数据来辅助提高土壤变量的空间预测精度,在计量土壤学土壤学中已经引起极大的关注和研究。例如,Odeh et al.(1995)利用高程数据通过RK法提高了上层土壤沙粒和下层土壤粘粒的空间预测精度。许红卫等(2007)研究了土壤养分(土壤全N、全P、有机质、速效N、速效K) 与水稻各生长期水稻冠层光谱的关系, 并将光谱指数作为协因子, 进行土壤养分的Cokriging 插值研究,结果显示,利用光谱指数作为协因子可以提高土壤养分的空间预测精度。Huang et al.(2007)利用近红外波谱测量数据和LandSat ETM影像数据,结合地形信息对土壤有机碳的空间预测进行了分析,结果证实用近红外波谱测量数据或LandSat ETM影像数据结合地形数据对提高土壤有机碳预测精度是一种有效的方法。Liu et al.(2008)利用电导率(ECa)、遥感高光谱反射率和DEM 数据对土壤渗透力(soil drainage)的空间分布进行了预测,结果表明,单独利用地形指标作为辅助变量不能提高土壤渗透力的预测精度,但将地形指标与电导率或遥感数据结合后,就可以有效的提高土壤渗透力的预测精度。从上述可以看出,利用信息量丰富的辅助变量,可以有效地提高土壤属性的空间预测精度。

在与土壤相关的辅助变量中,地形指标变量是一类主要的辅助变量,相关文献也证实了地形指标与土壤属性之间明显的相关关系。More(1993)通过用地形指标作为解释变量,发现坡度的倾角、地形湿度指数可以解释土壤有机质、pH值、有效磷和粘粒含量等土壤变量空间变化的50%;Iqbal et al.(2005)通过在逐步线性回归分析,地形变量之间的组合能够介绍土壤空间变化的10%~62%。可以看出,地形在土壤空间分布起着重要的影响作用。

1.2.3土壤属性空间预测结果不确定性分析

利用土壤采样点数据,采用克里格等方法对未采样点的土壤属性值进行预测,已经被深入研究和应用。然而,克里格估计值是有误差的,预测结果具有一定的平滑效应,即在土壤属性实际值比较低的点却有一个高的估计值,或者在真实值高的地方又低估了。土壤管理者如果以克里格预测结果作为施肥决策依据,就可能导致错误的施肥决策。例如,在土壤养分含量缺乏的地点应该增加施肥却没有进行,在不需要施肥的地方却又增加施肥,导致资源浪费和其他环境问题。上述这种决策风险是不可避免的。如果这些风险能够被量化,管理者将能够对这些风险进行更有效地管理。这就需要我们对未采样点土壤属性值进行不确定性分析,估计未采样点土壤属性值超过或低于某一预设阈值的概率。目前,这种不确定性分析在决策过程和模型评价方面等方面受到越来越多的关注。

地统计学中指示克里格法在解决这些问题方面比较突出,经常被用于土壤重金属污染、土壤养分分布等的相关研究中。对于某一具体位置,指示克里格法用条件累计分布函数估计某一土壤变量取值大于给定阈值的概率。李笑吟等(2006)以普通克里格法和指示克立格法为基本方法,研究土壤水分空间分布及土壤水分有效性水平在空间上的概率分布。徐英等(2006)运用非参数地质统计学的多元指示克立格法, 结合单变量指示克立格法, 对黄河河套灌区的盐渍化土地上两个比较关键时期的土壤水分和盐分进行空间分布的分析, 给出了同一时期土壤水盐和不同时期土壤盐分满足一定标准的综合概率图。

然而,指示克里格法以克里格估值作为基础,使这种方法不可避免的表现出克里格插值方法

5

的缺点。克里格法估计预测结果的不确定性主要是通过计算预测值和相应的误差方差,然后对二者进行计算构造高斯置信区间(Cinnirella et al., 2005)。这一过程存在三方面的不足,(1)克里格法的预测结果存在平滑效应,把目标变量空间变化的局部细节给平滑掉了,通常表现为把应该为高值的地方给估低了,把应该为低值的地方估高了;(2)克里格预测误差方差与实际预测值没有关系,它只依赖于采样数据的空间分布和变异函数模型;(3)计算置信区间时,需要假设预测误差为正态分布,然而土壤变量和其它环境变量经常呈偏态分布,这一假设通常很难满足(Bourennane et al., 2007)。由此可以看出,克里格法用估计值和估计误差构造置信区间并不是一个满意的解决方案。

条件模拟方法可以克服克里格法在估计不确定性方面的缺陷。条件模拟的主要思想是通过产生一组等概率的土壤属性空间分布图,然后根据所模拟的这些结果图间的差别来评价预测值的不确定性,而且这种方法还可以很好地再现原始变量的空间结构。条件模拟还可以同时考虑几个位置的空间不确定性。这一点也是指示克里格法的缺陷。所以条件随机模拟方法在土壤及其他学科中的应用受到越来越多的关注。例如,李保国(2002)等利用序贯高斯模拟对农田土壤表层饱和导水率进行了模拟,结果表明条件模拟与实测数据具有相同的统计分布特征及相同的空间结构。Zhao et al.(2005)利用条件随机指示模拟方法对河北省土壤有机质碳密度的空间预测结果的不确定性进行了定量地评价。史舟(2007)以杭嘉湖平原为样区,利用普通克立格法和序贯高斯模拟方法对土壤Cu 的空间分布进行估值和模拟,并利用序贯指示模拟进行不确定性评价。结果表明由普通克里格法得到的土壤Cu的空间分布整体比较连续,具有明显的平滑效应,估值结果数据的分布频率趋于平缓;序贯高斯模拟结果整体分布相对离散,突出了原始数据分布的波动性,其模拟结果数据的分布频率相对集中。

总的来看,在进行空间预测和不确定性分析时随机模拟方法比克里格方法显示出更多的优点,因此在土壤学科中得到越来越广泛地应用,尤其是对于研究那些具有空间不确定性且会对环境带来不良影响的风险性变量,更具有实际意义。

1.3主要研究内容

从上述研究现状可以看出,目前提高土壤属性空间预测精度的基本途径主要有两方面:利用更完善的预测方法和利用信息量更丰富的辅助变量。在预测方法方面,将REML法估计变异函数与地统计方法结合引入到土壤属性空间预测领域时间并不长,相关研究还比较少。还有许多问题需要进一步的探讨与研究。同样,在利用辅助变量提高土壤空间预测方面也存在一些问题需要回答。为此,本文从预测方法和利用辅助变量两个方面对以下主要内容进行研究和阐述。

(1)评价样本点数对变异函数准确性的影响。

变异函数是对目标土壤变量空间变异结构的一种表现形式。一方面不同的样本点数影响变异函数的估计结果,另一方面,目标变量本身的内在特性应该对变异函数具有更重要的影响作用。本文将以同一研究区的土壤有机质、土壤含水量、土壤速效钾和土壤有效锰四个土壤属性作为研究目标变量,通过选择不同的样本点数,对比分析MoM法和REML法在计算变异函数准确性方面的表现。

6

(2)评价空间尺度对计算变异函数的影响。

土壤的空间变化存在于不同的空间尺度上,而不同空间尺度上具有不同的主要控制因素和过程。当我们用变异函数来描述土壤变量空间变异结构的时候,同样需要考虑土壤变化所处的空间尺度。本文以土壤有机质和土壤有效锰为目标变量,在保持样本点个数不变的情况下,通过选择不同的空间尺度样区,对比分析MoM法和REML法在计算变异函数准确性方面的表现。

(3)利用高程作为辅助变量提高土壤属性空间预测精度。

本文将以高程数据作为辅助变量,以土壤有机质、土壤速效钾、土壤有效磷、土壤有效铁等为目标变量,通过利用OK法、CK法和RK法三种方法,对比分析高程数据是否可以用来提高上述土壤目标变量的空间预测精度。探讨土壤养分变量与高程数据之间应该满足哪些条件,就可以明确地利用高程数据来辅助提高土壤变量的空间预测精度。

(4)评价RK法和BLUP-REML法在不同外部趋势度下的表现。

地形在土壤的空间分布中起着重要的作用,本文将利用高程、坡度和地形湿度指数等地形指标作为辅助变量,通过组合成不同的外部趋势模型,利用RK法和BLUP-REML法来预测土壤有机质的空间分布。比较RK法和BLUP-REML法在不同程度的外部趋势情况下预测能力的表现,评价高程、坡度和地形湿度指数等地形指标作为辅助变量在土壤有机质空间预测中的作用。

(5)高程辅助变量在模拟不确定性方面的应用。

本文将高程辅助数据与序贯高斯协模拟方法相结合,对土壤有机质的空间分布进行模拟,对预测结果的准确性、局部不确定性模拟的准确性和空间不确定性模拟的准确性进行评价。探讨在条件模拟计算环境下高程是否有助于提高土壤有机质的空间预测精度,是否有助于提高预测结果不确定性模拟的准确性。

1.4 技术路线

本文将按照图1-1所示的技术路线对上述主要内容进行研究:

7

土壤属性空间预测精度分析

图1-1 本研究技术路线总体框图

Fig. 1-1 Global framework for the research 8

第二章样本点数对变异函数准确性的影响

2.1 引言

土壤属性的变异函数作为其空间变异结构的一种表现形式,一方面受土壤属性本身的内在特征决定,另一方面受样本点数和变异函数估计方法的影响。关于对样本点数最小需求这一问题,不同的文献有不同的结论。Journel and Huijbregts (1980)指出一般必须大于30个样本点,而Webster and Oliver(1992)则建议至少需要100~150个样本数据MoM法估计的变异函数才具有可靠性。REML法在理论上是一种更合理的计算变异函数的方法,Kerry and Oliver(2007a)的研究结果表明,当样本点数小于100时利用REML法变异函数的预测结果比利用MoM法变异函数的预测结果要准确,而Minasny and McBratney(2007)指出当样本点个数小于200时,就可以考虑使用REML法来代替MoM法分析变异函数分析。然而,对于REML法来说,至少需要多少个样本点数其变异函数才具有可靠性,上述文献也没有明确结论。由于在土壤学中REML法还是一种比较新的方法,相关研究还比较少,仍然需要更多的土壤属性研究实例对REML法的适用范围和预测能力进行评价和研究。

2.2 研究目的

本章将以同一研究区的土壤有机质、土壤含水量、土壤速效钾和土壤有效锰四个土壤属性作为研究目标变量,通过选择不同的样本点数,对比分析MoM法和REML法在计算变异函数准确性方面的表现。本章的目的主要有以下三个方面:(1)进一步评价土壤样本点数对变异函数准确性的影响;(2)比较不同土壤变量随样本点数变化其变异函数准确性的变化方式;(3)比较MoM 法和REML法计算的变异函数的准确性随着样本点数变化的具体区别。

2.3 理论与方法

地统计分析的核心工具是变异函数。变异函数用来表征随机变量的空间变异结构。用来计算变异函数的方法有多种。目前最常用的估计变量函数的方法是MoM法。另外一种最新引进地统计的参数化估计方法是REML法。下面分别介绍两种方法的主要步骤及相关数学推导公式,有关这两种方法的详细理论参考相关文献(Pardo-Iguzquiza, 1997; Webster and Oliver, 2001)。

2.3.1 MoM法估计变异函数

变异函数与一定分离距离的两个随机变量取值的平方差相关。实际应用中,通过一定范围分

9

10 离距离(例如10—20km )内所有数据对的平方差的平均值与各对样本数之间的距离的平均值来计算样本变异函数。MoM 法首先根据样本数据计算样本变异函数值。设)(,),(),(21n x z x z x z 是土壤变量z 在n 个位置x 的样本数据值系列,在固有假设条件下,即:

)

(2})]()({[0

)]()([2h x z h x z E x z h x z E γ=-+=-+ (2-1)

样本的变异函数通过下式来计算: ∑=-+='h N i i i h x z h x z N h 1

2)]()([21)(γ (2-2) 式中)(h γ'代表样本变异函数,)(h γ代表变异函数模型,h 是分离距离,h N 是在),(i i x h x +之间用来计算样本变异函数值的样本的对数。

根据目标变量的采样点数据利用公式(2-2)计算不同分离距离的样本变异函数值)(h γ',然后利用不同分离距离的样本变异函数值,通过加权最小二乘法来拟合适当的变异函数模型)(h γ。最常用的变异函数理论模型有球状模型(spherical )、指数模型(exponentail )和高斯模型(gaussian )等。有关这些模型详细介绍参考相关文献(Goovaerts, 1997; 张仁铎, 2005) 。变异函数模型的参数就可以直接参与到克里格计算中。在选择分离距离是有两种情况:(1)对于不规则的空间数据,需要以实际分离距离为中心定义一个分离距离等级,这个等级包括一定范围内的距离和方向。分离距离等级的选择对样本变异函数的影响至关重要,如果分离距离等级太短,变异函数比较嘈杂,如果分离距离太长,变异函数太光滑;(2)对于格网数据,格网间距通常被用来作为分离距离等级。

2.3.2 REML 法估计变异函数

Patterson and Thompson (1971)提出的有限最大似然法是一种参数化法,在估计变异函数参数方面是一个比较稳健的方法,这个方法不依赖于趋势参数估计的正确与否。首先,对目标变量采样点原始数据进行特殊的线性合并,目的是过滤掉原始数据中的趋势成分,线性合并的结果通常被称为广义增量(generalized increment ),其数学表达式为:

TZ y = (2-3)

式中,y 表示线性合并后的增量(increment ),Z 表示目标变量的样本数据组成的)1(?n 维向量,T 为投影矩阵,它是设计矩阵M 的函数:

T T M M M M I T 1)(--= (2-4)

式中I 是单位矩阵。转换后的增量y 的对数似然函数为:

Qy K y W K p n y L T 121log 21log 21)2log(2),(------

=πθ (2-5) 其中M K M W T 1-=,11---=K M MW I Q T ,θ表示协方差参数向量,包括了块金方差、基台

方差和变程参数。通过最小化负的对数似然函数(2-5),我们就可以估计方差函数参数θ。最小化的方法主要有单纯形法(simplex method )、直接搜索法(direct search method )、模拟退火法(simulated annealing )和Fisher 积分法(Fisher scoring )。具体每种方法的详细介绍及优缺点请参

11

考相关文献(Pardo-Iguzquiza, 1997)。本文选择单纯形法(simplex method )作为最小化负的对数似然函数的方法。

对于REML 法来说,没有样本变异函数,变异函数模型参数通过原始数据协方差矩阵的广义增量得到。这个过程不需要特别的定义一个分离距离等级,结果没有对空间结构进行平滑。因此REML 法特别适用于空间不规则格网数据(Kerry and Oliver, 2007a)。

2.3.3 验证指标

为了评价不同方法变异函数的准确性,本文选用均方根误差(RMSE )作为评价标准:

∑=-=n i i i x z x z n RMSE 1

2)}(?)({1 (2-6) 式中n 为验证点的个数,)(i x z 代表验证点的实测值,)(?i x z

代表验证点的预测值。RMSE 值越接近零,说明预测方法越准确。

2.4 研究区概况与数据获取

2.4.1 研究区概况

研究区位于北京市大兴区中部(如图2-1所示)。经度116°20′49″E — 116°33′52″E,纬度39°35′53″N — 39°42′36″N 。研究区总面积231平方公里,是北京市重要的粮、菜、瓜、果生产基地。研究区内地势为自西向东南倾斜,海拔高程在22~35米之间,坡度在0.8~1.0‰,地貌单元类型主要包括洪积冲积扇和冲积平原两种,地形因素在空间上差异性不显著。研究区属暖温带半湿润季风气候,年均温为11.5℃,年降雨量568.9mm ,雨热同季。研究区土壤形成受永定河石灰性冲积母质和近河沙性沉积的影响,土壤质地构成复杂多样,60%以上为砂性和砂性二合土,综合肥力较低。

2.4.2 土壤数据获取

本研究采用大兴区2007年土壤调查数据(北京市土肥站提供)。土壤采样时间为2007年5月。土壤采样层次为0~25cm 。主要调查项目包括土壤pH 值(pH )、有机质(SOM )、速效钾(K )、Oslen-P (P )、有效铜(Cu )、有效铁(Fe )、有效锰(Mn )、有效锌(Zn )和土壤含水量。各项目测定方法依次为:pH 用酸度计法测定;有机质采用重铬酸钾氧化容量法——外加热法测定;交换性钾采用1mol·L -1NH 4OAc 提取,火焰光度计法测定;Olsen-P 采用0.5mol·L -1NaHCO 3浸提,钼锑抗比色法测定;有效铜、有效锌、有效铁和有效锰采用DTPA 浸提,原子吸收分光光度计法测定;土壤含水量用烘干法测定。

12 本研究选择其中的土壤有机质、速效钾、土壤含水量和土壤有效锰四个土壤属性作为研究目标变量。研究区内土壤采样点共有362个,为了验证方法的需要,将这些采样点随机分成264个

训练点和98个验证点(如图2-1所示)。为了评价不同样本点数的对变异函数的影响,本文又从264个训练点中依次随机选取出

50、70、90、110、130、150个训练点进行具体分析。不同点数的训练点具体分布如图2-2所示。

图2-1 研究区位置和采样点分布图

Fig. 2-1 Study area and sampling locations

图2-2 不同点数的训练点分布图

Fig. 2-2 Different sized sampling locations

2.5 结果分析

2.5.1 土壤有机质的空间分析、预测及验证结果

2.5.1.1基本统计结果分析

表2-1给出了不同样本点数土壤有机质的基本统计结果。从均值看,除50个样本点数的均值较大外,其余各样本点数的均值相差不明显,均反映了研究区土壤有机质含量处在中等偏下水平。从取值范围看,50个样本点数的最大值与最小值相差为18.16g kg-1,为取值范围最大值;90个样本点数的最大值与最小值相差为15.53k kg-1,为取值范围最小值。由此可见,不同样本点数的取值范围变化并不大。从变异系数可以看出,不同样本点数所反映的研究区土壤有机质含量的变异程度基本相同,都处在中等变异水平范围内。

偏态系数用来指示数据分布偏离对称性的程度,通常用来指示数据是否满足变异函数计算对数据分布的要求。如果偏态系数处于-1与1之间则表示数据满足克里格法对数据分布的要求。Kerry and Oliver(2007b)指出,对数据进行正态分布检验的常规方法,例如Kolmogorov– Smirnov test和Shapiro–Wilkes tests,在地统计学并不是特别有用。原因是这些检验方法假设数据之间是相互独立的,只依赖数据的数量,而且指示不出如何偏离正态分布。因此,本文也选用偏态系数作为标准。

表2-1土壤有机质(g kg-1)含量基本统计结果

Table 2-1 Summary statistics of soil organic matter (g kg-1)

样本点数Sample size 均值

Mean

最小值

Minimum

最大值

Maximum

标准差

Standard

deviation

变异系数(%)

Coefficient of

variation

偏态系数

Skewness

50 13.35 5.50 23.66 4.01 29.94 0.16

70 12.70 4.27 19.56 2.94 23.18 -0.18

90 12.79 4.76 19.29 3.09 24.22 -0.38

110 12.68 4.27 21.15 3.08 24.34 -0.33

130 12.78 4.95 23.66 3.52 27.51 0.05

150 12.63 3.18 21.91 3.48 27.59 -0.02

2.5.1.2 变异函数结果分析

(1)MoM法估计变异函数。首先利用样本点数据计算样本变异函数,然后对其拟合变异函数模型。因为拟合过程有一定主观性,本文在拟合过程遵循以下基本原则:(1)在每个分离距离上用来计算样本变异函数值数据数据对数不应太小,一般大于80;(2)只用分离距离小于研究区最大尺度一半的样本变异函数来拟合模型。考虑到研究区内最大尺度为20km的实际情况,本文在计算样本变异函数时选择最大分离为10km,单位步长为1km。得到不同分离距离的样本变异函数值后,利用加权最小二乘法对样本变异函数进行变异函数模型拟合。上述计算和拟合过程

13

在地统计软件Genstat9(Payne, 2006)环境下实现。不同样本点数的土壤有机质的样本变异函数及其拟合模型如图2-3所示,图中的实点代表计算得到的样本变异函数,虚线表示所拟合的变异函数模型。表2-2给出了对应的各变异函数模型参数。

图2-3 不同样本点数土壤有机质的变异函数图。图中实点表示MoM法样本变异函数,虚线代表对其拟合的变

异函数;实线表示REML法估计的变异函数

Fig. 2-3 Variograms computed on soil organic matter from different sized sampling. Dots are the experimental MoM variograms, dashed line are the fitted variogram model, and the solid line are REML variograms

(2)REML法估计变异函数。REML法是一种参数化法,它直接通过样本数据来计算变异函数模拟参数。由于REML法在计算变异函数前要去除空间趋势成分,根据研究区的具体情况,本文在用REML法估计有机质变异函数参数时,假设研究区有机质的空间趋势为常数。本文选择单纯形法作为最小化负的对数似然函数的方法。具体REML法估计变异函数过程在Matlab软件(MathWorks, 2004)环境下利用REML法计算程序包(Minasny and McBratney, 2007)实现。REML 法计算得到的不同样本点数的有机质变异函数如图2-3中实线所示,变异函数模型参数见表2-2。

(3)关于具体变异函数模型的选择。MoM法在拟合变异函数模型的过程中,选择具有最小残差平方和(Residual Sum of Squares)的变异函数模型作为最佳模型。REML法在选择最佳变异函数模型的依据是具有最小的负的对数似然函数的模型。对于同一组样本数据,两种方法得到的最佳模型可能不同。本文的目的是为了评价不同的计算变异函数方法,为了避免因不同函数模型对评价结果影响,本文统一选择指数模型。因为指数模型在非线性最小二乘法拟合过程中比较稳定,而且指数模型被认为可以代表大部分土壤变量的空间结构(Minasny and McBratney, 2005)。

从图2-3中可以看出,对于150个样点数和70个样点数,REML法变异函数和MoM法变异

函数比较相似;但对于130、110、90和50个样本点数,REML法变异函数和MoM法变异函数

14

随机变量独立性的判断方法探究

1 引言 概率与统计是研究随机现象统计规律的一门数学学科,是对随机现象的统计规律进行演绎和归纳的科学.随着社会的不断发展,概率与统计的知识越来越重要,运用抽样数据进行推断已经成为现代社会一种普遍适用且强有力的思考方式.独立性[5]是随机变量非常重要的性质,其应用也很广泛.在解决很多问题时都有随机变量独立这样的前提,只有这样问题才能得以解决或解决起来比较简单.众所周知,随机变量独立性的判定无论从理论还是在实践中都有着重要意义,因此寻找独立性判断方法显得尤为重要.不少的文献对此进行了深入的研究,给出了一些很好的判断方法[3],但到目前为止人们还没找到简便有效的方法,从而对其深入研究很有必要. 2 相关定义 定义1离散型随机变量 定义在样本空间Ω上,取值于实数域R ,且只取有限个或可列个值的变量()ξξω=,称做是一维(实值)离散型随机变量,简称离散型随机变量. 定义2 n 维离散型随机变量 设12,,,n ξξξ???是样本空间Ω上的n 个离散型随机变量,则称n 维向量(12,,,n ξξξ???)是Ω上的一个n 维离散型随机变量. 定义3 联合分布型 设(,)ξη是一个二维离散型随机变量,它们一切可能取值为(,),,1,2,i j a b i j =???,令 (,),,1 ,2,ij i j P P a b i j ξη====??? 称(,1 ,2,)ij P i j =???是二维离散型随机变量(,)ξη的联合分布列. 我们容易证明()(1,2,i i P a P i ξ?===???是ξ的分布列,同理有()(1 ,2,)j j P b P j η?===???是η的分布列,称,ξη的分布列是(,ξη)的联合分布列的边际分布列. 定义 4 离散型随机变量独立性 设离散型随机变量ξ的可能取值为(1,2,)i a i =???,η的可能取值为(1,2,)j b j =???,如果对任意的,i j a b ,有

不确定性分析常用的不确定性分析方法有盈亏平衡分析

【基本知识点五】不确定性分析 常用的不确定性分析方法有盈亏平衡分析、敏感性分析、概率分析。 一、盈亏平衡分析 盈亏平衡分析是在一定市场、生产能力及经营管理条件下,通过产品产量、成本、利润相互关系的分析,判断企业对市场需求变化适应能力的一种不确定性分析方法,亦称量本利分析。 在工程经济评价中,这种方法的作用是找出投资项目的盈亏临界点,以判断不确定因素对方案经济效果的影响程度,说明方案实施的风险大小及投资承担风险的能力。 00:0 (一)基本的损益方程式 利润=销售收入-总成本-销售税金及附加 假设产量等于销售量,并且项目的销售收入与总成本均是产量的线性函数,则式中: 销售收入=单位售价×销量 总成本=变动成本+固定成本=单位变动成本×产量+固定成本 销售税金及附加=销售收入×销售税金及附加费率 则:B=PQ-C V Q-C F-tQ 式中: B——利润 P——单位产品售价 Q——销售量或生产量 t ——单位产品营业税金及附加 C V——单位产品变动成本 C F——固定成本 00:0 (二)盈亏平衡分析 1、线性盈亏平衡分析的前提条件: (1)生产量等于销售量; (2)生产量变化,单位可变成本不变,从而使总生产成本成为生产量的线性函数; (3)生产量变化,销售单价不变,从而使销售收入成为销售量的线性函数; (4)只生产单一产品;或者生产多种产品,但可以换算为单一产品计算。 00:0 2、项目盈亏平衡点(BEP)的表达形式 (1)用产销量表示的盈亏平衡点BEP(Q) 产量盈亏平衡点= (2)用生产能力利用率表示的盈亏平衡点BEP(%) 生产能力利用率表示的盈亏平衡点,是指盈亏平衡点产销量占企业正常产销量的比重。所谓正常产销量,是指达到设计生产能力的产销数量,也可以用销售金额来表示。 BEP(%)=(盈亏平衡点销售量/正常产销量)*100% 换算关系为: BEP(Q)=BEP(%)×设计生产能力 盈亏平衡点应按项目的正常年份计算,不能按计算期内的平均值计算。 00:0 (3)用销售额表示的盈亏平衡点BEP(S) BEP(S)=单位产品销售价格*年固定总成本/(单位产品销售价格-单位产品可变成本-单位产品销售税金及附加–单位产品增值税)

独立随机变量期望和方差的性质

第七周多维随机变量,独立性 7.4独立随机变量期望和方差的性质 独立随机变量乘积的期望的性质: Y X ,独立,则()()() Y E X E XY E =以离散型随机变量为例,设二元随机变量(),X Y 的联合分布列() ,i j P X x Y y ==已知,则()()(),i j i j P X x Y y P X x P Y y ====?=, () 1,2,,; 1,2,,i m j n == ()() 11,m n i j i j i j E XY x y P X x Y y =====∑∑()() 11 m n i j i j i j x y P X x P Y y =====∑∑()() 1 1 m n i i j j i j x P X x y P Y y =====∑∑()() E X E Y =***********************************************************************独立随机变量和的方差的性质: Y X ,独立,则()()() Y Var X Var Y X Var +=+()()() 2 2 Var X Y E X Y E X Y ??+=+-+?? ()222E X XY Y =++()()()()22 2E X E X E Y E Y ??-++? ? ()()()()2 2 22E X E X E Y E Y =-+-()()()22E XY E X E Y +-()()()() 2 2 22E X E X E Y E Y =-+-()() Var X Var Y =+若12,,,n X X X 相互独立,且都存在方差,则()() 121 n m k k Var X X X Var X =+++=∑ ***********************************************************************利用独立的0-1分布求和计算二项分布随机变量()~,X b n p 期望和方差 我们在推导二项分布随机变量的方差时,已经利用了独立随机变量和的方差等于方差

随机变量独立性的性质

议随机变量独立性及其应用 作者:张利荣 指导老师:桂春燕 摘要 随机变量的独立性是概率论中的一个重要概念.本文首先介绍了随机变量独立性的定义, 随机变量独立性的性质,然后对离散型随机变量和连续型随机变量的独立性分别给出了不同的判别方法,从而针对不同的问题运用相应的判别方法进行判定,除此还通过随机变量独立性的性质及其判别方法得出了一些相关的推论,并对其应用进行了举例说明. 关键词 离散型随机变量 连续型随机变量 独立性 联合分布 1 引言 概率统计是研究随机现象中数量规律的一门数学学科,它是近代数学的重要分支,理论严谨、应用广泛,并且与其他学科互相渗透结合.概率论是对随机现象统计规律演绎的研究,由于随机现象的普遍性,使得其具有极其广泛的应用,特别是在科学技术、工农业生产等方面.独立性是概率统计中最基本的概念之一,无论在理论研究还是在实际应用中都具有特别重要的意义.概率论和数理统计已有的成果大部分都是在某种独立性的前提下才得到的.因而随机变量独立性的研究倍受重视. 随机变量独立性的研究一直经历着缓慢的发展过程.进入二十世纪九十年代后,随机变量独立性判定的研究进入了一个新的阶段.关于这方面的著作、文献逐渐多了起来,如文献[2]中毛纲源对随机变量独立性的判定进行了分析并举例说明;文献[7]中明杰秀等对二维随机变量独立性的判定及其应用等相关内容进行了论述.本文将在此基础上对随机变量独立性做一下详细、全面的论述,重点介绍离散型随机变量和连续型随机变量独立性的判定方法,并对随机变量的独立性的应用进行举例说明. 2 随机变量独立性的定义 定义]1[ 设),(Y X 为二维随机变量,若对于任意的实数y x ,,事件{}x X ≤与{}y Y ≤相互独立,即 ()()() y Y P x X P y Y x X P ≤?≤=≤≤, , )1( 则称X 与Y 相互独立. 若()y x F ,为X 与Y 的联合分布函数,()x F X 、()y F Y 分别是X 与Y 的边缘分布函数,则 )1(式等价于 ()()()y F x F y x F Y X ?=,. 3 随机变量独立性的性质及其判别方法

(完整版)随机变量及其分布列与独立性检验练习题附答案

数学学科自习卷(二) 一、选择题 1.将三颗骰子各掷一次,记事件A =“三个点数都不同”,B =“至少出现一个6点”,则条件概率()P A B ,()P B A 分别是( ) A.6091,12 B.12,6091 C.518,6091 D.91216,12 2.设随机变量ξ服从正态分布()3,4N ,若()()232P a P a ξξ<-=>+,则a 的值为 A .73 B .53 C .5 D .3 3.已知随机变量ξ~)2,3(2N ,若23ξη=+,则D η= A . 0 B . 1 C . 2 D . 4 4.同时拋掷5枚均匀的硬币80次,设5枚硬币正好出现2枚正面向上,3枚反面向上的次数为ξ,则ξ的数学期望是( ) A .20 B .25 C. 30 D .40 5. 甲乙两人进行乒乓球比赛, 约定每局胜者得1分, 负者得0分, 比赛进行到有一人比对方多2分或打满6局时停止, 设甲在每局中获胜的概率为 23,乙在每局中获胜的概率为13 ,且各局胜负相互独立, 则比赛停止时已打局数ξ的期望()E ξ为( ) A .24181 B .26681 C .27481 D .670243 6.现在有10张奖券,8张2元的,2张5元的,某人从中随机无放回地抽取3张奖券,则此人得奖金额的数学期望为( ) A .6 B .395 C .415 D .9 7.一个篮球运动员投篮一次得3分的概率为a ,得2分的概率为b ,不得分的概率为c ,,,(0,1)a b c ∈,且无其它得分情况,已知他投篮一次得分的数学期望为1,则ab 的最大值为 ( ) A .148 B .124 C .112 D .16 8.位于数轴原点的一只电子兔沿着数轴按下列规则移动:电子兔每次移动一个单位,移动的方向向左或向右,并且向左移动的概率为 23,向右移动的概率为13,则电子兔移动五次后位于点(1,0)-的概率是 ( ) A .4243 B .8243 C .40243 D .80243

二维随机变量及独立性--教学设计

概率论与数理统计教学设计 课程名称概率论与数理 统计 课时100分钟 任课教师刘涛专业与班级财务管理B1601---B1606课型新授课课题二维随机变量及其分布 教材分析 “二维随机变量及其分布”属于教材第三章内容,位于教材的第75页至第93页.是在前一章“一维随机变量及其分布”的概念提出的基础上,对两个及两个以上的随机变量进行描述。可以说,二维随机变量及其分布是对前一章一维随机变量内容的总结以及综合应用。 学习目标 知识与技能 了解二维随机变量的背景来源; 了解二维随机变量的基本思想; 掌握二维随机变量的适用范围、基本步骤及其具体运 用。 过程与方法 通过日常生活中常常出现的实例的引入,引导学生分 析、解决问题,培养学生将实际问题转化为数学问题的 能力,培养学生提出、分析、理解问题的能力,进而发 展整合所学知识解决实际问题的能力。 情感态度与价 值观 通过介绍概率论与数理统计在实际生活中的运用,激发 学生自主学习的兴趣,也培养了学生的创新意识和探索 精神。 教学分析教学内容1.二维随机变量及联合分布函数定义 2.二维离散型随机变量及联合概率函数 3.二维连续型随机变量及联合概率密度 4.二维随机变量的边缘分布

5.随机变量的相互独立性 教学重点二维离散型、连续随机变量及其分布,相互独立性教学难点二维连续型随机变量及其分布 教学方法与策略 板书设计 前50分: 1.引例 3.二维离散变量 2.联合分布函数定义 4.二维连续变量 后50分: 5.边缘分布 6.相互独立性 教学时间设计 1.引导课题…………2分钟 2.学生活动…………3分钟 3.二维随机变量及联合分布函数定义……15分钟 4.二维离散型随机变量及联合概率函数……10分钟 5.二维连续型随机变量及联合概率密度……20分钟 6.二维随机变量的边缘分布……20分钟 7.随机变量的相互独立性……25分钟 8.课堂小结…………5分钟 教学手段多媒体播放教学视频、PPT演示与板书演练书写相结合。 教学进程 教学意图教学内容教学理念

随机变量的独立性判别

分类号:密级: 毕业论文 (本科生) 论文题目(中文)随机变量的独立性判别 论文题目(外文)The discrimination of the independence of random variables 学生姓名 导师姓名、职称 学生所属学院 专业 年级

诚信责任书 本人郑重声明:本人所呈交的毕业论文(设计),是在导师的指导下独立进行研究所取得的成果。毕业论文(设计)中凡引用他人已经发表或未发表的成果、数据、观点等,均已明确注明出处。除文中已经注明引用的内容外,不包含任何其他个人或集体已经发表或在网上发表的论文。 本声明的法律责任由本人承担。 论文作者签名:日期: 关于毕业论文(设计)使用授权的声明本人在导师指导下所完成的论文及相关的职务作品,知识产权归属兰州大学。本人完全了解兰州大学有关保存、使用毕业论文的规定,同意学校保存或向国家有关部门或机构送交论文的纸质版和电子版,允许论文被查阅和借阅;本人授权兰州大学可以将本毕业论文的全部或部分内容编入有关数据库进行检索,可以采用任何复制手段保存和汇编本毕业论文。本人离校后发表、使用毕业论文或与该论文直接相关的学术论文或成果时,第一署名单位仍然为兰州大学。 本毕业论文研究内容: √可以公开 □不易公开,已在学位办公室办理保密申请,解密后适用本授权书。 (请在以上选项内选择其中一项打“√”)

论文作者签名:导师签名:日期:日期:

随机变量的独立性判别 摘要 随机变量独立性的判别历来都是高等学校概率论与数理统计教学的一个课题, 通过研究文献资料,理解随机变量及其独立性的相关概念,对离散型和连续型随机变量综合列举的几种常见求法,讨论几种常见的随机变量独立性判别方法 并对其进行概括、总结,加深自己对随机变量及其分布的理解,争取有新的发现。 关键词:随机变量独立性连续型离散型判别方法

不确定性分析方法

基于数学的不确定理论方法 综述: 不确定性是人们认识世界的局限性导致的,它是人们根据现有知识的基础上对世界以及事物的看法、决定。由于认识的局限性,就会导致对事物的看法存在不可预知性。不确定性存在于生活的方方面面,大到人文系统,小到零件检测,如何更加准确的了解事物,不确定理论的发展起了重要的作用。不确定性理论就是为了能够在现有知识的基础上来找出其规律,以求得到更合适的方法解决问题的途径。不确定性理论用于数据融合中,有效的促进了信息融合理论的发展,相反,同样也促进了不确定性理论的发展。 自从上世纪统计力学的发展,不确定性理论随之出现并得到了学者重视。曾经较长一段时间认为概率论为处理不确定信息的唯一方法和理论,但是随着应用的加深和人们对不确定性信息处理的更高要求,概率论在很多方面表现出它的局限性和不可描述性。最近的几十年来,随着研究的深入,处理不确定信息方法也取得了较大的发展,主要有Zadeh的模糊集对经典集合论的推广,Choquet在容度理论中的单调测度论对经典测度论的推广等。研究的成果不仅涉及到数学、物理等基础性理论,还拓展到了信息学科、航天技术等高科技领域。基于不确定性智能芯片的开发是不确定性理论发展的见证,在工业领域已大量应用。 对于不确定性理论的研究,首先应该了解不确定测度(Uncertainty Measure)和不确定度(Measure of Uncertainty)的区别。不确定测度是对

事物本身不确定程度的描述,而不确定度是对不确定度的度量。比如:一杯水加糖的概率是1/2和有1/2的概率这杯水加了糖,这个性质是不一样的,它反映了不确定测度和不确定度的关系。不确定度的度量主要有熵的方法,如Information Shannon就提供了一个数量上的量度,即为一种典型的不确定度的度量。 为了能够很好地解释各种不确定性理论,对不确定性理论进行分类也是众多学者比较关注的问题。从理论基础上讲不确定性理论分两大类:一类是基于数学的,另一类是基于逻辑学的,本章只介绍基于数学的一类不确定性理论,包括Bayes概率论、可能性理论,Dempster-Shafer理论,以使更好的了解不确定性问题。 不确定性形式繁多,分类方法也多种多样。Klir认为不确定性由三种基本形式组成,即把不确定性分为模糊性(Fuzzy)和多义性(Ambiguity),而多义性又可以分为非特异性(Nonspecificity)和冲突(Conflict)。另外一些学者把多义性分成另两种类型:非特异性和随机性(Randomness),冲突和随机性是处理同一种类型的不确定性的两种解释。而多义性与模糊性的根本区别在于多义性是统计意义上的不确定性,而模糊性是针对集合的边界而言。对应这些类型的不确定性,不同的不确定性理论所能处理的不确定性的种类不一样。模糊集是处理模糊性的理论,概率论只涉及到事件之间的冲突;可能性理沦表示出事件的非特异性,而证据理论描述了非特异性和冲突。 1、Bayes概率 Bayes概率论的提出打破了原有不确定性理论的基础,从数学角

浅谈随机变量的独立性

摘要 随机变量的独立性是概率论中最基本的概念之一,通过对它的研究可使许多实际问题的具体计算得到简化.本文首先介绍了随机变量独立性的定义.然后对离散型随机变量和连续型随机变量的独立性分别给出了两种判别方法,同时得出了一些相关的推论,并对其应用进行了举例说明.最后文章对随机变量独立性在求随机变量特征数中的一些应用进行了整合. 关键词:离散型随机变量;连续型随机变量;独立性;数学期望;方差

The Research on the Independence of Random Variables 10204631SUN Jing-jing Mathematics and Applied Mathematics Tutor LI Jian-li Abstract The independence of the random variable is the most basic concept of probability. Through the study of it can simplify many specific calculations of the practical problems. Firstly, this paper introduces the definition of the independence of random variables. Secondly, for the independence of discrete random variables and continuous random variables, the article gives two judgmental methods to them, and obtains some inferences; this paper also illustrates some examples for these applications. Finally, this paper composes some applications of the independence of the random variable for the calculation of some random variable numeral characters. Key words: discrete random variable; continuous random variable; independence; mathematical expectation; variance

水文系统不确定性分析方法综述

《水资源系统优化规划与管理》 课程论文 学院: 专业: 姓名: 学号: 任课教师: 2017年1月3日

水文系统不确定性分析方法综述 杨金孟 (山东农业大学水利土木工程学院山东泰安271018 ) 摘要:水文系统是一个复杂的系统,包含了很多不确定性因素,增加了精确模拟和预测水文过程的困难。为了提高计算结果的可靠性,水文系统的不确定性分析已成为当前研究的热点。本文对水文系统不确定性分析方法及应用研究进展进行了分类综述,介绍了它们的基本概念、原理和应用现状,并对值得进一步研究的问题进行了展望。 关键词:水文系统;不确定性分析;方法综述 A Summary on Uncertainty Analysis Methods of Hydrological System Y ANG Jinmeng (College of W ater Conservancy and Civil Engineering,Shandong Agricultural University ,Taian 271018)Abstract: Hydrological system is a complex system with many uncertain factors. These factors are not conductive to the accurate simulation and prediction of hydrological processes. Thus more and more people focus on the uncertainty analysis methods for the hydrological systems to improve the reliability of calculations. In this paper, we summarized the researches and the applications of the uncertainty analysis methods for hydrological systems. Based on the review, we introduced their basic concepts, principles and status of applications and prospected the issues worthy of further research. Keywords: hydrological system; uncertainty analysis; methods summary 1 引言 水文系统研究的基本内容为水在自然界里的运动、变化过程和分布规律,通常以流域或区域作为研究对象,涉及到降雨、蒸散发、地表径流、地下水运动变化及连接地表水和地下水的土壤水的状况等。水文系统的复杂性使得不确定性分析贯穿水循环研究过程的始终,从水文过程监测数据的获取、分析和处理,水文模型的开发、应用等,都伴随自然或人为的不确定性因素。由于水文系统数据本身固有的模糊性和变异性,加之技术和人为因素,使得数据处理具有不确定性,主要表现在正确与错误并存、信息与“噪声”并存以及正常与异常并存,使得对数据分析产生的结论不精确或不可信。 模型是水文系统研究的重要手段,由于多数模型带有明显的主观假设,且参数只能通过实测资料和参数优选得到,在模型结构的选择、参数的率定、方法的优选、目标函数的确定等方面均存在不确定性。因而,不确定性分析在水文系统研究和应用中就显得尤为重要。第23届国际地球物理和大地测量大会上,国际水文科学协会(IAHS)明确提出应减少水文预报中的不确定性,探索水文模拟的新方法,实现水文理论的重大突破。1996年9月由联合国教科文组织开了第三届国际研讨会。会议的主题是:水资源系统的风险、可靠性、不确定性和稳健性;重心是研讨风险、可靠性、不确定性等问题的新途径和未来研究应用的展望。我国1994年在武汉召开了《全国首届水文水资源与水环境科学不确定性研究新理论、新方法学术讨论会》。会后出版了会议论文专著《现代水科学不确定性研究与进展》。近年来,水文系统不确定性研究取得丰硕的成果。本文就水文系统不确定性分析方法简要综述。 2 不确定性分析方法及应用分类

随机变量的独立性

第三章多元随机变量 3.1 二维随机向量及其分布函数 3.2 二维离散随机向量 3.3 二维连续随机向量 3.4 边缘分布 3.5 条件分布 3.6 随机变量的独立性 3.7 随机向量函数的分布 3.8 n维随机向量函数的分布(不讲)

§3.6 随机变量的独立性 事件A 与 B 独立的定义是: 若 P (AB ) = P (A )P (B ),则称事件A 与B 相互独立 。 设 X , Y 是两个随即变量, 对任意的 x , y , 若 , )( )() ,(y Y P x X P y Y x X P ≤≤=≤≤则称 X 与Y 相互独立。 用联合分布函数与边缘分布函数表示上式, 就是 . )( )(),(y F x F y x F Y X =,,x y ?

P70例3.6.2:P61例3.4.3:设(X ,Y )服从单位圆域 x 2+y 2≤1上的均匀分布。已求得X 和Y 的边缘概率密度如下, ?? ?? ??∈=.),( 0,),( 1 ),(D y x D y x y x f ,, π解:因2 21,[1,1], ()0,[1,1];X x x f x x π ??∈???=? ????? ?? ?? ????∈?=].1,1[,0],1,1[,12)(2y y y y f Y π ,)x y D ∈(时, 故,X 和Y 不相互独立。 问X 与Y 的独立性。 ()() X Y f x f y 222211x y π π???? ??=????????,,(,)()() X Y x y f x y f x f y ?=连续型X 与Y 相互独立 ?1π≠(,)f x y = ,[1,1]x y ∈?,

二维随机变量及独立性教学设计

二维随机变量及独立性--教学设计

————————————————————————————————作者:————————————————————————————————日期:

概率论与数理统计教学设计 课程名称概率论与数理 统计 课时100分钟 任课教师刘涛专业与班级财务管理B1601---B1606 课型新授课课题二维随机变量及其分布 教材分析 “二维随机变量及其分布”属于教材第三章内容,位于教材的第75页至第93页.是在前一章“一维随机变量及其分布”的概念提出的基础上,对两个及两个以上的随机变量进行描述。可以说,二维随机变量及其分布是对前一章一维随机变量内容的总结以及综合应用。 学习目标 知识与技能 了解二维随机变量的背景来源; 了解二维随机变量的基本思想; 掌握二维随机变量的适用范围、基本步骤及其具体运 用。 过程与方法 通过日常生活中常常出现的实例的引入,引导学生分 析、解决问题,培养学生将实际问题转化为数学问题的 能力,培养学生提出、分析、理解问题的能力,进而发 展整合所学知识解决实际问题的能力。 情感态度与价 值观 通过介绍概率论与数理统计在实际生活中的运用,激发 学生自主学习的兴趣,也培养了学生的创新意识和探索 精神。 教学分析教学内容1.二维随机变量及联合分布函数定义 2.二维离散型随机变量及联合概率函数 3.二维连续型随机变量及联合概率密度 4.二维随机变量的边缘分布

5.随机变量的相互独立性 教学重点二维离散型、连续随机变量及其分布,相互独立性教学难点二维连续型随机变量及其分布 教学方法与策略 板书设计 前50分: 1.引例 3.二维离散变量 2.联合分布函数定义 4.二维连续变量 后50分: 5.边缘分布 6.相互独立性 教学时间设计 1.引导课题…………2分钟 2.学生活动…………3分钟 3.二维随机变量及联合分布函数定义……15分钟 4.二维离散型随机变量及联合概率函数……10分钟 5.二维连续型随机变量及联合概率密度……20分钟 6.二维随机变量的边缘分布……20分钟 7.随机变量的相互独立性……25分钟 8.课堂小结…………5分钟 教学手段多媒体播放教学视频、PPT演示与板书演练书写相结合。 教学进程 教学意图教学内容教学理念

随机变量独立同分布的概念

1、随机变量独立同分布的概念 随机变量X1和X2独立,是指X1的取值不影响X2的取值,X2的取值也不影响X1的取值。随机变量X1和X2同分布,意味着X1和X2具有相同的分布形状和相同的分布参数,对离散型随机变量具有相同的概率函数,对连续型随机变量具有相同的概率密度函数,有着相同的分布函数,相同的均值、方差与标准差。 反之,若随机变量X1和X2是同类型分布,且分布参数全相同,则X1和X2一定同分布。 一般来说,在相同条件下,进行两次独立试验,则这两次实验结果所对应的随机变量是独立同分布的。 比如,将一枚质地均匀的硬币抛掷两次,设X1为第一次抛掷硬币的结果,X2为第二次抛掷硬币的结果。显然,第一次抛掷硬币的结果对第二次的结果没有影响,反之亦然,故X1和X2相互独立。 同时,X1和X2都只有两种试验结果:正面朝上和背面朝上,以0代表正面朝上,1代表背面朝上,则 P(X1=0)=P(X2=0)=0.5, P(X1=1)=P(X2=1)=0.5, 故X1和X2是独立同分布的随机变量。 随机变量独立同分布的特性可以推广到三个或更多个随机变量。 2、独立同正态分布(定理1) 3、独立同分布(定理2——中心极限定理) 当的分布对称时,只要n 5,那么,近似效果就比较理想;当的分布非对称时,要求n 值较大,一般n 30近似效果较理想。 这个定理表明:无论随机变量服从何种分布,可能是离散分布,也可能是连续分布,连续分布可能是正态分布,也可能是非正态分布,只要独立同分布随机变量的个数n较大,那么,随机变量之和的分布、随机变量均值X-的分布都可以近似为正态分布。这一结论意义深远。 4、标准误 统计学中把均值X-的标准差称为均值的标准误,记为,无论是正态还是非正态,均值X-的标准误都有 SEM随着n的增加而减少。 常常对一个零件的质量特性只观测一次,就用该观测结果去估计过程输出的质量特性。这里建议一种简单有效的减少测量系统误差的方法。对同一个零件的质量特性作两次或更多次重复测量,用其观测结果的平均值去估计过程输出的质量特性,就可以减少标准差。当然,这不是回避使用更精确量具的理由,而是一种提高现有量具精度的简易方法,多次测量值的平均值要比单次测量值更精确。

数学:人教版选修2-3第二章离散型随机变量教案(2.2.2事件的相互独立性)

2.2.2事件的相互独立性 教学目标: 知识与技能:理解两个事件相互独立的概念。 过程与方法:能进行一些与事件独立有关的概率的计算。 情感、态度与价值观:通过对实例的分析,会进行简单的应用。 教学重点:独立事件同时发生的概率 教学难点:有关独立事件发生的概率计算 授课类型:新授课 课时安排:2课时 教 具:多媒体、实物投影仪 教学过程: 一、复习引入: 1 事件的定义:随机事件:在一定条件下可能发生也可能不发生的事件; 必然事件:在一定条件下必然发生的事件; 不可能事件:在一定条件下不可能发生的事件 2.随机事件的概率:一般地,在大量重复进行同一试验时,事件A 发生的频率 m n 总是接近某个常数,在它附近摆动,这时就把这个常数叫做事件A 的概率,记作()P A . 3.概率的确定方法:通过进行大量的重复试验,用这个事件发生的频率近似地作为它的概率; 4.概率的性质:必然事件的概率为1,不可能事件的概率为0,随机事件的概率为0()1P A ≤≤,必然事件和不可能事件看作随机事件的两个极端情形 5基本事件:一次试验连同其中可能出现的每一个结果(事件A )称为一个基本事件 6.等可能性事件:如果一次试验中可能出现的结果有n 个,而且所有结果出现的可能性都相等,那么每个基本事件的概率都是1n ,这种事件叫等可能性事件 7.等可能性事件的概率:如果一次试验中可能出现的结果有n 个,而且所有结果都是等可能的, 如果事件A 包含m 个结果,那么事件A 的概率()m P A n = 8.等可能性事件的概率公式及一般求解方法 9.事件的和的意义:对于事件A 和事件B 是可以进行加法运算的 10 互斥事件:不可能同时发生的两个事件.()()()P A B P A P B +=+ 一般地:如果事件12,,,n A A A 中的任何两个都是互斥的,那么就说事件12,,,n A A A 彼此互斥 11.对立事件:必然有一个发生的互斥事件.()1()1()P A A P A P A +=?=- 12.互斥事件的概率的求法:如果事件12,,,n A A A 彼此互斥,那么 12()n P A A A +++ =12()()()n P A P A P A +++

北邮概率论与数理统计3.3随机变量的独立性

§3.3随机变量的独立性 随机变量的独立性 我们可利用事件间的独立性的定义给出随机变量间的独立性之概念。 随机变量X 和Y 相互独立,如果对于任意有关X 的事件和有关Y 的事件都相互独,换言之,对于任意两个实数集I 和J ,有 },{J Y I X P ∈∈}{}{J Y P I X P ∈∈= (1) 理论上可证明(其证明超出了我们的知识范围)(1)式成立当且仅当对),(,+∞-∞∈?y x ,有 },{y Y x X P ≤≤}(){y Y P x X P ≤≤=. 于是有以下定义。 定义 设二维随机变量),(Y X 的联合分布函数为),(y x F ,两个边际分布函数分别为)(x F X 和)(y F Y ,如果),(,+∞-∞∈?y x ,有 ),(y x F )()(y F x F Y X = (2) 则称Y X ,相互独立。 当),(Y X 为离散随机向量时,独立的条件(2)等价于等式 }{}{},{j i j i y Y P x X P y Y x X P ===== (3) 对所有的),(j i y x ),2,1,( =j i 成立。 当),(Y X 为连续随机向量时,独立的条件(2)等价于等式 )()(),(y f x f y x f Y X = (4) 几乎处处成立。 例3.3.1 设二维随机向量),(Y X 的联合分布函数为

???≥≥+--=λ-----其他 ,00,0,1),(y x e e e y x F xy y x y x , 则Y X ,相互独立的充要条件是0=λ。 例3.3.2 (续3.1.2)问X 与Y 是否相互独? 对于离散随机向量),(Y X ,若说明X 与Y 不相互独立,则只需找一个数对),(j i y x ,使得}{}{},{j i j i y Y P x X P y Y x X P ==≠==;若要说明X 与Y 相互独立,则需要验证,对),(Y X 所有可能取的数对),(j i y x ,都有}{}{},{j i j i y Y P x X P y Y x X P =====, 2,1,=j i 。 例3.3.3 设二维随机向量),(Y X 的联合密度函数为 ???<<<<=其他 ,010,10,4),(y x xy y x f 判断X 与Y 的独立性。 解:由联合密可得两个边缘密度分别为 ?? ?<<==?∞+∞-其他,010,2),()(x x dy y x f x f X , ???<<==?∞+∞-其他 ,010,2),()(y y dx y x f y f Y 故有)()(),(y p x p y x p Y X =,y x ,?,所以X 与Y 相互独立。 在上例子中,),(Y X 的联合密度函数可以分解成两部分,其中一部分仅与x 有关,而另一部分仅与y 有关。一般地若),(Y X 的联合密度函数可以分解为 )()(),(y g x h y x p = 则X 与Y 的相互独立。 例3.3.4 设二维随机向量),(Y X 的联合密度函数为

相互独立的随机变量

12.相互独立的随机变量 【教学内容】:高等教育出版社浙江大学盛骤,谢式千,潘承毅编的《概率论与数理统计》第三章第§4相互独立的随机变量 【教材分析】:在多维随机变量中,各分量的取值有时会相互影响,但有时会毫无影响,譬如一个人的身高X和体重Y救护相互影响,但与收入Z一般无影响,当两个随机变量的取值互不影响时,就称它们是相互独立的。本节将利用两个事件相互独立的概念引出两个随机变量相互独立的概念,这是一个十分重要的概念。 【学情分析】: 1、知识经验分析 学生已经学习了两个事件相互独立的概念,对独立性有了一定的认识。 2、学习能力分析 学生虽然具备一定的理论基础,但概念理解不透彻,解决问题的能力不高。 【教学目标】: 1、知识与技能 理解随机变量的独立性定义,掌握随机变量的独立性的判定方法。 2、过程与方法 在知识的教学过程中,用类比的方法培养学生的探索归纳能力及运算能力和应用新知的能力,渗透归纳、转化的数学思想方法. 3、情感态度与价值观 创设教学情境,培养学生学习数学的良好思维习惯和兴趣,加深学生对从特殊到一般的思想认知规律的认识,树立学生善于创新的思维品质. 【教学重点、难点】: 重点:二维随机变量独立性的判定方法。 难点:二维随机变量独立性的判定方法。 【教学方法】:讲授法启发式教学法 【教学课时】:1个课时 【教学过程】: 一、问题引入 若P(AB)=P(A)P(B),则称事件A ,B相互独立。 【设计意图】:两个事件相互独立的概念引出两个随机变量相互独立的概念。 二、随机变量的独立性

(,)(),() (,). ,{,}{}{},(,)()(),. X Y X Y F x y F x F y X Y x y P X x Y y P X x P Y y F x y F x F y X Y ≤≤=≤≤= 定义 设及分别是二维随机变量的分布函数及边缘分布函数若对于所有有即则称随机变量和是的相互独立 1、若(,)X Y 为离散型随机变量 X Y 和相互独立充分必要条件: ()()()(),,i j i j P X x Y y P X x y i j N Y P =====∈ ij i j p p p ??=? (|)(|),j i i j j i p p P X x Y y P Y y X x ????====== 2、若(,)X Y 为连续随机变量 X Y 和 相互独立充分必要条件:(,)()()(,)X Y f x y f x f y x y =?对任意实数 已知随机变量 例1已知(,)X Y 的联合分布律为 1 2 3 1 1/3 a b 2 1/6 1/9 1/18 试确定常数 a 与 b ,使X Y 与相互独立。 解:先求(,)X Y 关于X Y , 的边缘分布律: 1 2 3 {}Y j P Y y = 1 1/3 a b 1 +3a b + 2 1/6 1/9 1/18 13 {}X i P X x = 12 19a + 1+18 b 1 要使X Y 与 相互独立, ij i j p p p ??=? ()()(),2222P X Y P X Y P =====,(,)()()3232P X Y P X P Y ===== X Y X Y

相关文档
相关文档 最新文档