成都日降水量年极大值的渐近分布

SUMNo.59No.42001

成都信息工程学院学报

JOURNALOFCHENGDUUNIVERSITYOFINFORMATIONTECHNOLOGY

Vol.16No.4

Dec.2001

文章编号:()1671-1742200104-0243-06

成都日降水量年极大值的渐近分布

孟庆珍1,孙燕2

(成都信息工程学院,四川成都6;山西忻州地区气象局,山西忻州0)1.100412.34000

摘要:利用1通过统计推断,找出了成都日降水量年极大值遵循951~1999年成都日降水量年极大值的记录,的渐近分布。讨论了两种分布———皮尔逊Ⅲ型分布、对数正态分布,并比较了它们的拟合效果,最后得出成都日降水量年极大值较好地遵循对数正态分布,并讨论了它们的参数估计方法。

词:气候统计学;概率分布;参数估计;对数正态分布;皮尔逊Ⅲ型分布

文献标识码:A

中图分类号:P468.0

1引言

气候要素极值在气候统计学中,常用于说明天气气候学特征,这种极端值不仅有理论上的意义,而且在经济

[]1建设和国防建设中有重要应用。气候要素极值作为气候随机变量在数学意义上是不稳定的,但它们随时间变

化(气候随机变化)过程在概率意义上却可以是稳定的。因此,气候要素极值的分布有可能用概率模式(分布函数)去模拟。试验表明:某些气候要素极值,例如日降水量极值和风速极值的渐近分布,能很好地遵循皮尔逊Ⅲ型分布或对数正态分布,本文选用皮尔逊Ⅲ型分布和正态分布作为已知分布函数,利用成都1951~1999年的日降水量年极值资料,对拟合参数进行了估计,并通过表征参数估计优良性指标,得到成都日降水量年极大值的渐近分布函数。

2分布函数模式及参数估计方法

本文采用皮尔逊Ⅲ型分布和对数正态分布来拟合成都日降水量年极大值记录的渐近分布。2.1皮尔逊Ⅲ型分布及参数估计方法

[]2是气候统计学中最重要的偏态分布。Γ分布为正偏态,许多气候要素如降皮尔逊Ⅲ型分布也称Γ分布,

水量、风速、水气压也具有正偏趋势,因此可用Γ分布拟合。它的三参数概率密度函数和分布函数形式,分别为())α-1(x-a)exx≥ap-xEα()

()β2.1.1βΓα

x

ββΓα

其中,形状参数愈小,则愈正偏。。a为随机变量x可能取得最小值,a为形状参数,α,0β为尺度参数,β>

用皮尔逊Ⅲ型分布拟合气候要素极值,首先要估计参数α,a和β。2.1.1矩法

[]3皮尔逊Ⅲ型分布的数学期望值、方差和偏度系数分别为

(x)EEαβ+a

2)2222(xaαEEαβ+αβ+2β+a2)2(x)(x(x)VarEE-E2EαβCsE2

收稿日期:;修订日期:2000-06-272000-11-16

()2.1.3

184

由上式可解出a、α、β得

2/E4Cs

/C2sEσ

成都信息工程学院学报

第16卷

()2.1.4

n

/aEm-2σCs

((33

xxni-x)i-x)∑∑nn又C,,mE∑xσE

EEsE33sniE1isσ3

将C()得m、σ代入2.1.4s、

3

((23E4∑xxi-x)/i-x)∑niE1niE1

n

.[

n

][

n

n

2

(32/(xx2i-x)i-x)En∑∑ii11EE

n

n

()2.1.5

n

2

(2/3)(xaE∑x-2∑xi-xi-x)∑niE1inni1E

在分析最大日降水量,最大风速等不能取负值的气象变应当指出:由于分布曲线中的a值是变量的最小值,

[]

因此量时,a也不能为负值。

/(/aEm-2σC1-2CC≥0sEmvs)

()2.1.6

这里C/C2Cm为变差系数。sEσ・v。vEσ

在资料系列不很长时,往往实测系列的最小值xm不是总体中的最小值。而要比总体中的最小值a大一些,in即a≤xm。in

/,i称为模比系数,则有Km//即C/()。令KmCCC1-KminExminmKmnin≥amE1-2vs,s≤2vin结合()式,则有2/()。此式是考虑到实际情况而得到的结果,如果根据实际资2.1.7CC1-Kmv≤Cs≤2vin

料计算得到的样本值与它不符,则有两种情形:或是样本系列较短、抽样误差过大;或是所研究的气候极值变量根本不符合皮尔逊Ⅲ型分布。但如果样本系列很长时,则倾向于后一种情形。2.2对数正态分布

假定气候要素极值变量的对数服从正态分布,是气候极值统计中常用的分析最大日降水量,最大风速等气候极值的方法之一。设X为一极值变量,即x为它的取值。它的对数YEl

nX服从正态分布,

22

/()(y-my)2σy,它的参数和可由下式估计

(x)f

-∞

^lnxmyE∑i

iE1n

n

2(2^)σ∑lnxi-myEy

iE1n

n

3表征参数估计优良性的指标

3.1皮尔逊检验法

设X1,…,(x)的总体X的一个随机样本,(x)的形式是未知的,要根据样本检验它X2,XFn是取自分布为F

(x),即检验假设H0:(x)(x)。是否为某一已知的分布φFEφ00

设样本资料可分为k组,各组中的频数为m1,…,根据假设m2,mk,

k22(())()3.1.1E∑xE∑enpiii1i1EE

的总体分布φ(x)计算得各组相应的理论频数为e…,构造一个统计量。其中,eei组内的p01,2,k,i为X落在第

k

2

第4期

概率,组界为x。i和xi+1

孟庆珍等:成都日降水量年极大值的渐近分布

185

[]以用它来作为分布的假设检验。如果φ()中有l个估计参数,则自由度为k-l-12。0x

()表示观测样本中各组的频数与该组应有的理论频数的差异情形。如果由样本计算的值很小,说明样3.1.12值增大时,本分布与假设的分布偏离程度很小,当x说明样本分布与φ()的符合程度变盖。因此检验时,由实0x2分布表时,2值大的一侧的临界值2,22)给定的显著性水平a,按自由度查x仅考虑x(x≥xa也就是使得paEx[]2,222,2定出x否则,拒绝原假设。a,a若计算的x实满足x实

2的极限分布是自由度为2分布,(x)是什么分布,统计量x因此可皮尔逊证明,当n→∞时不论φk-1的x

中的频数应≥。5或至少≥1

4检验

我们选定皮尔逊Ⅲ型分布和正态分布作为已知的分布形式,但这两种分布形式的分布函数是个积分函数,计算困难,故无法计算拟合标准差,拟合相对偏差以及柯尔莫哥洛夫拟合适度,而用皮尔逊拟合适度作为检验

[]4量。

4.1采用皮尔逊适度检验

皮尔逊使用

2()()4.1.1xE∑npii1E

作为检验假设H0的统计量,并证明以下的定理。

若n充分大(n≥),则当H0为真时(不论H0属什么分布),统计量()总是近似的服从自由度为k-504.1.1

n

2

2分布,其中k为分组的个数,r-1的xr为被估计的参数的个数。

22()有x(),则在显著性水平α下拒绝H0,否则就接受H0。于是,若在假设H0下算得4.1.1≥xk-r-1α

对三参数估计拟合分布,若样本数n≤,可将置信度α适当取小,如αE,则500.02

222(()())k-r-1Exk-4Ex4αα0.02k-x

5计算结果

我们采用统计推断方法来确定气象要素———成都日降水量年极大值,遵循的渐近分布函数,由于总体分布函数是未知的,我们直接用某些已知的分布函数拟合成都日降水量年极大值的记录,通过比较,评定皮尔逊拟合适度,从而选出皮尔逊拟合适度相对较小的分布模式作为假设分布,然后通过统计检验,对分布进行适度检验,最后确定出成都日降水量极大值应遵循的渐进分布函数。5.1计算结果比较

我们选定了皮尔逊Ⅲ型分布和对数正态分布,作为已知的分布形式,利用成都1951~1999年日降水量年极大值的记录进行了拟合。用皮尔逊拟合适度作为检测量,并绘出了各自的概率密度图。

5.1.1皮尔逊Ⅲ型分布计算结果及分析由样本值我们可计算平均值x,方差σ和偏态系数C用矩法估计皮尔逊Ⅲ型分布3参数a,α,s,β。

xE97.3735σE37.7406C1.1526sEaE31.8855αE3.011021.7498βE对成都日降水量4,,这与皮尔逊Ⅲ型中当气象变量为最大日降9年极大值记录来看xmE45.8a小于xminin

水量、最大风速时,相符。α不能大于xmin

186

成都信息工程学院学报

第16卷

2检验法作拟合适度检验。将,,值代入用x()式中,作为成都日降水量年极大值的理论频率分布aαβ2.1.1

。函数,检验其与实际降水资料拟合的程度,具体计算见表1

22(2(2(2()))))(

E+++xE∑NP7.058712.383611.25537.9209ii1E

2(2(2(2())))++++

4.85952.73621.45280.73902.8793E122()3.277.018-3-1E10x实

8

2

所以,接受原假设,成都日降水量年极值可以用皮尔逊Ⅲ型分布来拟合。

上面的分组合并方法是根据马开玉等编的《气候统计原理与方法》中“要求分组不宜太细,每组中的频数不要太少,至少不能小于1,若小于1,则和邻组合并以满足要求。”

2检验分布函数时,不仅要求样本容量很大(n≥)而且分组时每组中的频数应≥用皮尔逊x505或至少≥l。

表1成都日降水量年极大值皮尔逊Ⅲ型曲线拟合的计算与结果

组限组中值xi

34.7~56.945.813.920.00495.32103

56.9~79.168.036.130.012013.046318

79.1~101.390.258.350.011312.315211

101.3~123.6112.480.560.00788.48498

123.6~145.8134.7102.770.00464.98643

145.8~168.0156.9124.980.00242.66172

168.0~190.2179.1147.20.00121.33191

190.2~212.4201.3169.410.00060.63643

tx31.89iEi-概率密度f(ti)

理论频数4(9*t*Δtfi)i实际观测频数

5.1.2对数正态分布计算及检验计算步骤如下:

()先将11951~1999年成都日降水量的年极大值取对数()再用求得的对数值计算对数正态分布的参数估计值得2^^myE4.5116σ0.3591yE

22

/()(y-my)2σ中,以它作为成都日降水量年极大值的y对数的理论频数与分布函数,检验拟合适度,具体计算见下表2。

^将^代入正态分布概率密度函数f(x)

σmy和y

表2成都日降水量年极大值对数正太曲线拟合的计算和结果

组限组中值yi

3.7185~3.94363.8313-1.89420.06632.03293

3.9436~4.16834.0559-1.26890.17845.46673

4.1683~4.39294.2806-0.64340.32449.941016

4.3929~4.61754.5052-0.01790.398912.224710

4.6175~4.84214.72980.60760.331710.16608

4.8421~5.06684.95441.23300.18655.71695

5.0668~5.29145.17911.85850.07092.17413

5.2914~5.51605.40372.48400.01820.55901

^()/tyiEi-myσy概率密度f(ti)理论频率4(9*t*Δtf1)1实测频数

根据上表结果,计算分歧度:

22(2(2(2()))))(

E+++xE∑NP2.03295.46679.941012.2247ii1E

2(2(2(2())))++++

10.16605.71692.17410.5590.8837E6

8

2

第4期

孟庆珍等:成都日降水量年极大值的渐近分布

187

2(2()).488.058-3-1Ex.054E900x

22()

0.054x实

所以,接受原假设,可以用对数正态曲线拟合成都最大日降水量分布。

5.1.3用皮尔逊拟合适度检验两种分布的结果比较

2值分别为:用皮尔逊拟合适度检验皮尔逊Ⅲ型分布和对数正态分布的x,。两者均通过检12.87936.8837实

2较小,验,两种分布中对数正态分布的x说明样本分布用对数正态分布拟合较好,皮尔逊Ⅲ型分布也可以。实

5.2概率密度图的比较

我们把估计得到的参数代入相应的概率密度函数,绘出皮尔逊Ⅲ型分布和对数正态分布的理论概率密度曲线,同时,我们利用实测值还绘出了实测值的概率密度曲线见图1、图2

图1皮尔逊Ⅲ

型分布的理论概率密度曲线与实测概率密度曲线的比较

图2对数正态分布的理论概率密度曲线与实测概率密度曲线的比较

首先,我们来比较两幅图中的理论概率密度曲线。图1中虚线所绘的曲线为皮尔逊Ⅲ型分布的概率密度曲线;图2中虚线所绘的曲线为对数正态分布的概率密度曲线。图1用皮尔逊Ⅲ型分布求得的最大概率密度约为,出现在7图2用对数正态分布求得的最大概率密度约为1,出现在7比皮尔1.2423.02mm处,.2809.10mm处,

逊Ⅲ型分布求得的略高。两幅图中峰值左侧曲线变化均比右侧的变化迅速,边缘区差别较小,但极值点的大小、所在位置略有差异。

再来比较实测值的概率密度曲线与理论值的概率密度曲线。

先看实测的概率密度曲线(两图中实线所绘的曲线),最大值为1,出现在7左侧变化迅速,而.680.16mm处,在其右侧变化稍有起伏。

比较皮尔逊Ⅲ型分布的理论概率密度曲线与实测值的概率密度曲线,见图1,峰值实测值处在7最0.16mm,大值为1;峰值理论值处在7最大值为1,峰值区日降水量相差2最大值相差0,在.683.02mm,.242.86mm,.438实测值大于理论值,在8理论值大于实测值,在1实测值49.5~82.8mm处,2.8~180.95mm处,80.95mm以后,高于理论值,即右端区拟合不太好,两曲线偏差稍大,但皮尔逊Ⅲ型分布基本上能拟合出实测值的主要峰值区和变化趋势。

最后我们来比较图2中对数正态分布的理论概率密度曲线与实测值的概率密度曲线,峰值理论值处在79.最大值为1;峰值实测值处在7最大值为1,峰值区日降水量相差8最大值相差10mm,.2800.16mm,.68.94mm,

,极值偏差稍小。两曲线最大偏差为0,处在7从4理论值高于实测值,0.40.480.16mm,8.6mm到83.54mm处,在8理论值大于实测值,在1实测值高于理论值,也是右端区拟会不太好,两曲3.54~179.1mm处,79.1mm以后,

188

成都信息工程学院学报

第16卷

线偏差稍大,但总体上变化趋势一致。从图上可以看出对数正态分布和皮尔逊Ⅲ型分布极为相似,都能很好地拟合出实测值的变化趋势,只是极值点的大小、所处位置略有不同。

由以上讨论可得:皮尔逊Ⅲ型分布概率密度和对数正态分布概率密度的拟合效果都可以,只是对峰值的估计及右端区拟合稍差。至于皮尔逊Ⅲ型分布和对数正态分布哪一个更好一些。从前面检验时用皮尔逊适度计算时,皮尔逊Ⅲ型分布为1,需要通过提高置信度才能通过检验,而对数正态分布的计算值为6,对数正2.8793.8837态分布的值要小。对数正态分布比皮尔逊Ⅲ型分布拟合效果好,因此我们选用对数正态分布作为成都日降水量年极大值的假设分布,皮尔逊Ⅲ型分布也可以,只是精度有待于提高。

6结论

我们选用对数正态分布作为成都日降水量年极大值的渐进分布。

参考文献:

[]幺枕生.气候统计学的研究展望[]气象科技,,():1J.19848461-8.[]马开玉等.气候统计原理与方法[M]北京:气象出版社,2.1993.[]复旦大学.概率论与数理统计[M]上海:上海科技出版社,3.1962.[]屠其璞.气候应用概率统计学[M]北京:气象出版社,4.1984.

AsLtoticdistributionofearlaxiLuLofypyyL

dailreciitationinChenduyppg

1,2

MENGQin-zhenSUNYang

(,,;1.ChenduUniversitfInformationTechnoloChendu610041Chinagyogyg

,,)2.XinzhouBureauofMeteoroloXinzhou034000Chinagy

:AbstractThePearsonⅢdistributionandtheloarithmicnormaldistributionareusedresectiveltofittheasm-gpyyptoticdistributionsofearlaximumofthedailreciitationinChendudurintheeriodbetween1951and1999.yymyppggpTheresultsshowthattheloarithmicnormaldistributionisbetterthanthePearsonⅢone.g

:;p;p;;Keordsclimaticstatisticsrobabilisticdistributionarameterestimationloarithmicnormaldistributiongyw

PearsonIIIdistribution


© 2024 实用范文网 | 联系我们: webmaster# 6400.net.cn