2.实验真实性
外部效度涉及不同实验类型的真实性,对经济学实验的“真实性”目前存在认识争议:Smith(1994,2003)、Plott(1986)等认为实验室实验和实地实验一样具有真实性;Levitt和List(2007,2009)认为实地实验比实验室实验更真实,更真实的实验与政策关系更紧密,结果也更容易外推到现实中去;Falk和Heckman(2009)认为不论什么形式的实验,当研究设计越反映问题本质,研究结果越容易外推(Bardsley,et al.,2009)。
为兼顾这些观点,在使用本方法时,可通过对标准二赋予不同权重:当倾向于Falk和Heckman(2009)观点时,标准二权重的大小由环境设计是否反映问题的本质决定,如果行为因素产生的研究环境能够反映问题本质就赋予标准二高权重;当倾向于Smith(1994,2003)观点时,不同实验类型下的标准二权重可设定为相同。
本文采取List(2007,2009)的观点⑦,认为不同实验类型的真实性不同,同时不同实验环境下,行为经济因素作用的突出程度通常不一样,两者综合考虑,从实验室实验到实地实验再到自然实验,在真实性增加的同时,环境中的干扰因素通常也在增加,此时行为经济因素赖以产生的心理环境条件被改变,行为经济因素作用效果递减或消失,因此本文在评价行为经济因素外部效度时,将实验类型放在优先位置上。
(二)NSD研究实验环境中的行为因素作用
将NSD实验研究文献分为不同实验类型后,运用标准二将那些用标准一无法区分开的实验研究进行再区分,重点分析实验设计中的处理差异,对行为因素作用M是否存在、作用方向、强弱大小进行判断比较。
M是否存在及M的方向。对NSD中M是否存在及作用方向比较容易做出判断,因为社会困境就是一个涉及到M的问题,而且这种M的方向对财富的影响从个体的角度来看是冲突的,所以其作用方向相反。
对NSD实验中M的分析主要集中在区分其大小上,这一分析过程的核心在于分析实验设计特点,根据文献分析所揭示的实验设计及结论特点对相关实验外部效度进行区分。
1.实验室实验
对实验室实验中M的大小判断具体步骤和结果如下:
首先将研究分为身份类属和环境变化两种实验设计,这样一来身份类属发生改变的研究有2个,环境变化的研究有3个。
其次分析两种实验设计下的更具体的实验处理差异。在身份类属都发生变化的情况下,禀赋的初始位置设计可以不同,根据这一禀赋初始位置差异可以区分相关研究。在环境变化的实验设计下,按照两个处理差异进行区分:一个是是否允许沟通,另一个是依据边际单位资本回报(marginal per capita return,MPCR)设计变化范围。
进行了以上区分后,再考虑行为因素,此时的主要工作是对已经区分开的研究进行两两比较,对实验的外部效度进行排序,以下以M(设计差异)表示由于特定“设计差异”产生的行为因素M的影响作用,具体地有以下比较判断结果,{}中的文字为依据理由:
(1)M(环境变化)<M(身份类属){外因的作用小于内因}
(2)M(禀赋位置在个体账户)<M(禀赋位置在非个体账户){框架效应}
(3)M(无沟通)<M(沟通){沟通的作用已被一般公共品研究所确认}
(4)M(MPCR变化范围小)<M(MPCR变化范围大){范围小的设计包含于大的设计中}
将以上判断综合起来得到表4所示结果。
2.实地实验
对实地实验中M的大小判断比较简单。因为框架实地实验(Rand,et al.,2009)的外部效度大于伪实地实验,所以主要的工作在于对两个伪实地实验的外部效度比较,这一比较仍基于两个实验设计的差异:一个是关注群体间差异,另一个是关注个体间禀赋差异,越关注个体的实验设计越会在社会困境环境下产生行为成本,因此有以下判断结果:M(关注群体间禀赋差异)<M(关注个体间差异),如表5所示。
(三)NSD研究实验结果外部效度排序结果
将表4和表5的结果结合在一起,可以得到全部NSD实验研究的外部效度排序结果,如表6所示。
(四)跨地区合作政策制定参考
以上排序在实验和实际应用参考之间建立起了一种联系,为决策制定者将NSD实验研究结果应用到现实问题的解决上提供了参考选择和取舍的依据,外部效度越高的实验研究结果越具有较高的实际参考价值和较高的采纳可能性,具体实验揭示的做法如表7所示(限于篇幅,本文不对解决NSD问题的具体政策制定参考做法进行展开)。
归纳NSD实验研究结果,得到一个有助于提高跨地区合作效果的政策制定思路:弱化群体身份类属,突出集体类属,促使个体认同集体目标。其主要依据是集体行动取决于个体的自我类属和意图(Wright,2009),及集体行动是社会环境与个体间的相互作用结果(Levitt and List,2007)。在这一思路下,有两类具体方法,一类是改变个体身份,另一类是改变环境。两类方法中改变身份比间接改变环境具有更高的外部效度,因此也更具有操作可行性和政策制定参考价值,如图4所示。
弱化自我类属认同集体目标
直接改变身份群体边界可以穿透改变初始禀赋
间接改变环境增加群体间的沟通增加集体公共品的边际收益
更高的政策制定参考价值
图4解决实际NSD问题的框架性思路
(五)对今后实验设计及研究方向的指引
以上实验结果对今后实验设计及研究方向分别有以下启示:
1.重视实地实验
将表7的外部效度排序结果绘制成趋势图,如图5所示,图中纵坐标表示外部效度大小,为符合效度高数字大的习惯,该值用表7第3列的排序数字减9取正获得,横坐标为年份,拟合曲线显示变化趋势,NSD实验研究外部效度变化趋势表明外部效度高的NSD研究愈来愈受重视,预示今后的实验设计应多采取实地实验形式。
图5NSD实验研究结果外部效度变化趋势
2.探寻更多增加个体在集体公共品上贡献的方法
根据以上分析及多公共品目前研究进展,以下三个研究方向上的NSD实验设计值得重视:
(1)相互监督和条件合作。相互监督和条件合作在单公共品环境下具有明显的作用,但尚未在NSD上进行研究。
(2)差异化不同群体从集体公共品上获得的MPCR。现有的NSD实验设计将集体公共品对每个群体产生的MPCR设定为相等,实际中更一般的情形是不同的群体从集体公共品上获得的MPCR存在差异。
(3)绑定处理。在多公共品环境下会出现一种特别的处理:参与者在多个公共品上或者都不贡献,或者贡献相同(也可以是固定比例关系),这种限制称为绑定(Cornes,2010),在实际中这种现象很常见,比如研究经费的配套关系等,但目前没有这类实验研究。
这些潜在的研究方向预示今后的研究需继续探寻更多增加个体在集体公共品上贡献的方法。
五、排序方法在新公共治理阶段的应用前景
公共管理理论经过行政管理(PA)和新公共管理(NPM)两个阶段后,目前进入到新公共治理(NPG)阶段(Osborne,2009)。
在新公共治理阶段,人们意识到宏观、中观和微观之间的交互动态共同决定公共管理效果,纯粹由政府机构提供公共服务难以实施甚至不合需要,公民参与下的共同生产才是确保公共价值和利益的治理机制(Calabrò,2011),研究者和实践者认识到国家、地方政府、利益相关者(包括私人、企业、第三方组织等)之间形成互动关系,公众不再是公共服务的被动接受对象,而是成为具有主动参与公共事务管理的现实主体,因此公共价值的共同创造受到重视(Williams and Shearer,2011),公民参与变成公共管理不可或缺的要素。
如果将个体的行为反应纳入公共管理研究中,传统的数据收集方式将面临难以反映其中互动关系的困难,经济学实验便成为一种很有用处的研究手段,通过对研究对象进行良好的控制,研究者可以对新公共治理框架下的个体行为、群体行为、社会准则、多个主体间的互动行为等因素进行系列实验研究,收集到难以在现实中获取的多方面有用数据,进而以实验设计和研究内容为基础分析其外部效度排序,为具体的政策设计提供综合性的理论参考基础和决策依据。
基于以上认识,本文提出的两标准实验结果外部效度排序方法在新公共治理阶段的公共管理研究与实践中具有一定的应用前景,它可以对现有实验结果从一个综合的角度进行再认识,同时也能够对下一步的实验研究提出有益的指引。
六、结论与讨论
通过提出实验研究结果外部效度排序标准及对NSD实验结果进行外部效度排序,本文得到以下结论:
(1)实验研究的实验设计类型和具体实验处理中包含的行为因素方向及强弱可作为两个判断相关研究外部效度大小排序的标准,分别起到实验类型外部效度排序和特定实验类型下外部效度进一步排序的作用,综合运用两个标准,能够得到实验研究结果外部效度的一个完整排序。
(2)对NSD实验研究结果进行的排序过程说明,这一两标准综合排序方法具有可操作性,两标准排序方法可推广到其他问题实验研究结果外部效度排序上。
(3)外部效度的排序结果在实验研究和实际应用之间建立起一种对应关系,通过这一排序结果向决策制定者提供了一个将实验研究结果外推到现实管理实践中去的参考选择依据。
(4)该排序方法在新公共治理这一新的公共管理研究和实践趋势上有潜在的应用前景,新公共治理下,公共问题的解决需将公民参与和不同层面主体间互动放在一起研究,数据收集困难使实验受到青睐,实验结果与实践之间的联结需求使该方法具有价值。
本文方法有一定的适用范围,该方法适用于把实验作为模型来应用的情形⑧,而在实验作为检测作用的场合,则应更注重内部效度。
注释:
①经济学实验的优点:较高程度的控制、可探索反事实、可复制、可预测、低成本等,这些优点使以实验为手段的研究在多个涉及公共政策的领域呈现不断增加的趋势(Alm,2011)。
②社会实验可在一定程度上对政策影响做出评价,但面临成本、时机、样本等组织实施问题,并难以在一次实验中针对性地探索多个因素的作用机理和实际影响。
③社会困境是指个体最优的行动与大部分参与者都采取个体最优行动反而损害每个参与者利益的两难冲突情形。
④社会困境包括囚徒困境、公共地、公共品等不同形式,见Polzer等(1999)。
⑤Wit和Kerr(1994)是Wit和Kerr(2002)的工作论文版本。
⑥字典式排序偏好(lexicographic preferences)的定义为:给定两个半序集A和B,如果在A×B笛卡尔积上,有(a,b)≤(a′,b′)当且仅当a<a′(或者a=a′且b≤b′)时成立,就称为字典式排序偏好。
⑦不采取Smith(1994,2003)观点主要考虑到迪昂-奎因整体论论点(Duhem-Quine thesis)(李醒民,1996)、不采取Falk和Heckman(2009)观点主要考虑到心理学中关于行为的跨情境一致性观点,“行为表现一方面要满足个体原发性的动机需要,即行为的一致性,或保持自我的统一性,但同时还要适应环境的要求,按照环境的要求调整自己的行为。在大多数情况下,行为的一致性往往会让位于适应环境的压力,至少在中国文化下如此。”(王登峰、崔红,2006)
⑧以下说明参考了Bardsley等(2009)第2、4、5章。近来研究认为经济学实验有两类作用:一类是检测(test),为已有理论服务,先有演绎理论结果,然后设计实验作为检测工具,最后那些通过严格检测的实验结果填补理论结果和经验证据之间的空隙,其思路是建构主义或笛卡尔主义,特点是理论先行、实验效度主要考虑内部效度;另一类作用是模型,产生的原因在于演绎理论发展不充分,导致实验超越现有理论发展限制,在这种情形下中心是实验而不是演绎理论,研究者通过实验归纳在实验中发现的规律,形成新知识,其特点是实验先行。实验的模型作用反映了近来一些科学哲学工作者的观点,如Guala(1998)、Mki(2005)、Morgan(2005)等,其中Mki(2005)甚至提出“实验是模型,模型是实验”,这种观点与历史上许多发展事实相一致,比如历史上的内燃机发明,是基于物理模型而不是数学演绎模型发展起来。作为模型起作用的社会科学实验,需重视外部效度问题。在社会科学领域中,变量间的关系常比较复杂,实验者不断地超越理论发展,扩展实验的模型作用,当采取相同或相近的模型设计时,可认为其内部效度相近,此时外部效度成为实验总效度要考虑的重要部分;同时,社会科学领域中的实验,通常其外部效度受到批评和质疑,特别是在对政策进行指导时(Guala,2005),这类质疑增加了研究外部效度的价值。
参考文献:
[1]陈瑞莲、谢宝剑,2009:《回顾与前瞻:改革开放30年中国主要区域政策》,《政治学研究》第1期。
[2]李醒民,1996:《迪昂》,台北三民书局。
[3]王登峰、崔红,2006:《行为的跨情境一致性及人格与行为的关系》,《心理学报》第4期。
[4]张紧跟,2010:《区域公共管理制度创新分析:以珠江三角洲为例》,《政治学研究》第3期。
[5]周业安、宋紫峰,2008:《公共品的自愿供给机制:一项实验研究》,《经济研究》第7期。
[6]Alm, James. 2011. "Testing Behavioral Public Economics Theories in the Laboratory." Working Papers from Tulane University, Department of Economics, No. 1102.
[7]Angner, E., and G. Loewenstein. 2010. "Behavioral Economics." In Handbook of the Philosophy of Science, Vol. 13: Philosophy of Economics, ed. Uskali Mki, 67-101. Amsterdam: Elsevier.
[8]Bardsley, Nicholas, Robin Cubitt, Graham Loomes, Peter Moffatt, Chris Starmer, and Robert Sugden. 2009. Experimental Economics: Rethinking the Rules. Princeton: Princeton University Press.
[9]Bernheim, B. D., and Antonio Rangel. 2007. "Behavioral Public Economics: Welfare and Policy Analysis with Non-standard Decision-Makers." In Behavioral Economics and Its Applications, ed. Diamond P. and H. Vartiainen. Princeton NJ: Princeton University Press.
[10]Blackwell, C., and M. Mckee. 2003. "Only for My Own Neighborhood?: Preferences and Voluntary Provision of Local and Global Public Goods." Journal of Economic Behavior & Organization, 52(1): 115-131.
[11]Buchan, N. R., G. Grimalda, R. Wilson, M. Brewer, E. Fatas, and M. Foddy. 2009. "Globalization and Human Cooperation." Proceedings of the National Academy of Sciences of the United States of America, 106(11): 4138-4143.
[12]Calabrò, Andrea. 2011. Governance Structures and Mechanisms in Public Service Organizations. Heidelberg: Physica-Verlag HD.
[13]Camerer, C. 2003. Behavioral Game Theory. Princeton NJ: Princeton University Press.
[14]Cornes, Richard, and Jun-Ichi Itaya. 2010. "On the Private Provision of Two or More Public Goods." Journal of Public Economic Theory, 12(2): 363-385.
[15]Dalton, Patricio S. 2010. "Income Aspirations and Cooperation: Experimental Evidence." Working Paper of Tilburg University and Center, the Netherlands.
[16]Falk, Armin and James J. Heckman. 2009. "Lab Experiments Are a Major Source of Knowledge in the Social Sciences." Science, 326(5952): 535-538.
[17]Fellner, G., and G. K. Lunser. 2008. "Cooperation in Local and Global Groups." Department of Economics, Vienna University of Economics & B. A., Working Paper Series No. 122.
[18]Guala, F. 1998. "Experiments as Mediators in Non-laboratory Sciences." Philosophica, 62(2): 57-75.
[19]Guala, F. 2005. The Methodology of Experimental Economics, 203-231. London: Cambridge University Press.
[20]Harrison, Glenn W., and John A. List. 2004. "Field Experiments." Journal of Economic Literature, 42(4): 1009-1055.
[21]Kagel, J. H., and A. E. Roth. 1995. The Handbook of Experimental Economics, 22. Princeton NJ: Princeton University Press.
[22]Ledyard, O. 1995. "Public Goods: Some Experimental Results." In Handbook of Experimental Economics, ed. J. Kagel and A. Roth, 111-194. Princeton NJ: Princeton University Press.
[23]Levitt, S.D., and J. A. List. 2007. "Viewpoint: On the Generalizability of Lab Behavior to the Field." Canadian Journal of Economics, 40(2): 347-370.
[24]Levitt, S.D., and J. A. List. 2009. "Field Experiments in Economics: The Past, the Present, and the Future." European Economic Review, 53(1): 1-18.
[25]Mki, Uskali. 2005. "Models Are Experiments, Experiments Are Models." Journal of Economic Methodology, 12(2): 303-315.
[26]Moore, Tim. 2011. "Wicked Problems, Rotten Outcomes and Clumsy Solutions: Children and Families in a Changing World." NIFTeY/CCCH Conference 2011, Children's Place on the Agenda: Past, Present and Future, Sydney.
[27]Morgan, M. S. 2005. "Experiments versus Models: New Phenomena, Inference and Surprise." Journal of Economic Methodology, 12(2): 317-329.
[28]Osborne, S. P. 2009. "Debate: Delivering Public Services: Are We Asking the Right Questions?" Public Money and Management, 29(1): 5-7.
[29]Plott, C. 1986. "Laboratory Experiments in Economics: The Implications of Posted-Price Institutions." Science, 232(4751):732-738.
[30]Polzer, J. T., K. J. Stewart, and J. L. Simmons. 1999. "A Social Categorization Explanation for Framing Effects in Nested Social Dilemmas." Organizational Behavior and Human Decision Processes, 79(2): 154-178.
[31]Rand, D. G., T. Pfeiffer, A. Dreber, R. W. Sheketoff, N. C. Wernerfelt, and Y. Benkler. 2009. "Dynamic Remodeling of In-group Bias during the 2008 Presidential Election." Proceedings of the National Academy of Sciences of the United States of America, 106(15): 6187-6191.
[32]Roth, A. 1988. "Laboratory Experiments in Economics: A Methodological Overview." The Economic Journal, 98(393): 974-1031.
[33]Smith, V. L. 2003. "Constructivist and Ecological Rationality in Economics." American Economic Review, 93(3): 465-508.
[34]Smith, V. L. 1994. "Economics in the Laboratory." Journal of Economic Perspectives, 8(1): 113-131.
[35]Wachsman, Y. 2002. "The Effects of Group Interaction in a Public Goods Experiment with Two Exchanges." Department of Economics, University of Hawaii at Manoa, Working Paper 02-5.
[36]Williams, I., and H. Shearer. 2011. "Appraising Public Value: Past, Present and Futures." Public Administration, 89(4): 1367-1384.
[37]Wit, P., and N. L. Kerr. 2002. "Me versus Just Us versus Us All: Categorization and Cooperation in Nested Social Dilemmas." Journal of Personality and Social Psychology, 83(3): 616-637.
[38]Wright, S. C. 2009. "The Next Generation of Collective Action Research." Journal of Social Issues, 65(4): 859-879.