内容提要:众所周知统计推断有三种理论:普遍承认的Neyman理论(频率学派),Bayes推断和信仰推断(Fiducial)。Bayes推断基于后验分布,由先验分布和样本分布求得。信仰推断是基于信仰分布(Confidence Distribution,简称CD),直接利用样本求得。两者推断方式一致,都是用分布函数作推断,称为分布推断。从分析传统的参数估计、假设检验特性来看,经典统计推断也可以视为分布推断。通常将置信上限看做置信度的函数。其反函数,即置信度是置信上界的函数,恰是分布函数,该分布恰是近年来引起许多学者兴趣的CD。在本文中,基于随机化估计(其分布是一CD)的概率密度函数,提出VDR检验。常见正态分布期望或方差的检验,多元正态分布期望Hoteling检验等是其特例。VDR(vertical density representation)检验适合于多元分布参数检验,实现了非正态的多元线性变换分布族的参数检验。VDR构造的参数的置信域有最小Lebesgue测度。
关键词:随机推断 VDR检验 最小Lebesgue测度置信域
作者简介:程维虎,北京工业大学应用数理学院(北京100124);戴家佳,贵州大学理学院(贵州贵阳550025);杨振海,北京工业大学应用数理学院;张国志,哈尔滨理工大学(黑龙江哈尔滨150080)。
0引言
首先考虑一维参数的推断问题。所谓一维参数假设检验问题,是指假设涉及的参数是一维的,可以是分布参数的分量。为问题明确,将总体分布或密度函数写作
关于假设(1),λ是冗余参数。
关于参数η统计推断,众所周知有三种理论:频率学派,Fiducial推断和Bayes推断。现在普遍接受的Neyman理论,称为频率学派。认为未知参数是常数,用统计量推断参数,包括点估计、置信区间和假设检验。Fiducial推断和Bayes推断都是以概率分布推断参数。认为参数是随机变量,统计推断就依据参数的分布,分别称作Fiducial分布和后验分布。两者求法不同,而推断参数的方法一致,称为分布推断。通常认为他们的推断机制是不同于Neyman理论的。
随机估计源于Fisher的信仰推断,是经典统计的概念。Fisher提出的信仰推断(Fiducial inference)是用信仰分布推断参数。什么是信仰分布?Fisher于1930年,在他的“Inverse probability”一文中作为挑战Bayes的后验分布而提出信仰分布概念。设F(.,θ)是随机变量X的分布函数,概率密度函数是f(.,θ)。给定x,Fisher定义信仰分布密度函数为
该公式也适用于基于枢轴量计算参数的信仰分布密度函数。
h(x,η)是定义在×N上,取值于N上的函数。对给定η,h(X,η)的分布函数Q(·)与参数η,λ无关,对给定样本x,h(x,·)是N→N的单调函数,则称h(x,η)是参数η的枢轴量。Q(·)的概率密度函数记作q(·)。Fisher认为η是随机变量,其分布密度函数是
公式(2)或(3)的导出有两步:
1.确定枢轴量h(X,η)的分布时η是常数参数,X是随机变量;
2.求信仰分布密度函数时又认为η是随机变量,样本为x是常数。
参数η是常数还是随机变量?这就是所谓Fisher疑惑。若η是随机变量,h(x,η)=V~Q(·),公式(3)是正确的。只是导出随机变量V的分布时η是常数,导出信仰分布时又成了随机变量。既然存在逻辑上的不一致为什么信仰推断至今还是研究热点之一?除是大师Fisher提出的概念外,还因为在众多情形下信仰推断结果和经典结果一致;有些经典统计难题,容易用信仰推断来解决,如Behrens-Fisher问题。对正态总体经典推断和信仰推断结果是一致的。为消除逻辑上的疑惑,引进随机估计概念。用随机变量估计(常数)参数η,叫做参数η的随机化估计或就叫随机估计,它应满足
V=b(x,),V~q(·),(4)
的密度函数由(3)给出。随机估计是取值于参数空间的随机变量,其分布依赖于样本。它不同于统计量,统计量是样本的函数,其分布依赖于参数。当存在参数的充分统计量时样本可用充分统计量代替。
Neyman理论核心观点认为参数是未知常数,用统计量估计参数,无论点估计还是区间估计都是随机变量。是容易被人接受的符合常理的观点。而Fiducial推断和Bayes推断都将参数看作随机变量。无论哪种推断,都认为在观测样本时参数是不变的。初看起来,Neyman理论与Fiducial推断和Bayes推断完全不同。但是,三种理论是有内在联系的,换一个视点看Neyman理论,三种推断参数方式的一致性就出现了,Neyman理论参数推断也可视为分布推断,仅有看待参数观点上的差异。
参数的点估计、置信区间和假设检验是统计推断的基本内容,即使比简单样本更复杂的数据,不管多么复杂的统计模型的观测数据,都要研究这些内容。这些内容是相互关联的,相互确定的。点估计可以视为置信区间的特例。通常认为经典统计、信仰推断和Bayes推断是不同的。换一种观点看经典统计,亦看作分布推断。以下讨论经典推断的分布推断特性。通常将置信上界看做置信度的函数,如果将两者地位互换,就可发现三种推断方式的共性。对任意给定的x,设枢轴量h(x,η)是η的单增函数。η的置信度为γ的置信上界=(x,γ)由下式确定:
由它可导出μ的经典推断。Neyman提出CD概念,作为对1930年Fisher提出的信仰分布(Fiducial Distribution)的解释。尽管CD概念由来已久,近年来作为频率学派的概念重新研究,新瓶装旧酒,作为推断方法加以发展。如前所述,用它代替点估计和区间估计等统计推断。有影响的工作或学者有Efron(1993,1998),Fraser(1991,1996),Lehmann(1993),Schweder和Hjort(2002),认为CD是频率学派的后验分布,是以后统计研究的重点。研究成果清楚表明经典推断也是分布推断。K. Singh,Xie M. G.and W. E. Strawderman(2007)的文章,关于CD做了详尽全面论述,还试图将CD概念推广到多维。在这个意义上讲,经典统计,信仰推断和贝叶斯分析都是用分布函数做推断的。Bayes推断用后验分布,信仰推断用信仰分布(Fiducial Distribution),经典统计用经典推断分布或CD,分布推断是三者的共同点。可以说CD是信仰分布的扩展。设是样本空间,N是参数空间。H(x,·)是定义在×N上,取值于[0,1]上的函数,且满足条件:对给定样本X=x,H(x,·)是N上的分布函数;对给定η∈N,H(X,η)~,其中X~(·,η,λ),则称H(x,·)是一CD。
一般地讲,基于枢轴量的经典置信区间和假设检验规则和基于同一枢轴量产生的随机估计的置信区间和假设检验规则是一致的。能否将CD推广到多维参数?这是众多学者关心的问题。枢轴量推广到多维参数并不难,关键要有处理多维枢轴量的工具。VDR恰是处理多维枢轴量的有效工具。
本文基于随机估计的概率密度函数讨论参数假设检验,提出了VDR检验。第1节讨论枢轴量和VDR检验。第2节应用VDR检验得到一维参数检验,给出正态总体方差检验的最短置信区间。第3节讨论VDR检验在线性变换分布族中的应用,并给出正态总体下的一些结果。第4节展望发展前景。
1多维参数的随机估计和VDR检验
所谓多维参数假设检验问题,是指假设涉及的分布参数是多维的,可以是分布参数向量或其部分分量。设总体X是p维随机向量,p≥1是常整数。将总体密度函数写作
关于假设(9),λ是冗余参数。
1.1接受域和拒绝域
1.2枢轴量
仅当h(χ,η)是η各分量的增函数时才有,
一般情形下,或者可使枢轴量满足
1.3VDR检验
确定接受域的方法很多,如常用的似然比检验。这里提出一种通用方法,VDR检验。令
1.3.1分位点计算
(未完待续)