显然,在使用NBER测定周期方法来识别周期转折点时,首先需要确定特定周期的测度。因为转折点不过是这些特定周期曲线上的波峰和波谷点。具体的定点方法则涉及某些特定的“审查准则”,例如转折点的跨度应是中期的而不是短期的,而且其波动的振幅应足够大,与拐点相关的因素应有经济判断的支持,等等(14)。宏观经济的总转折点可以定义在微观特定部门的转折点之某种加权之上(Mintz,1969),也可以定义在宏观总参考周期曲线之上(Bry和Boschan,1971)。NBER方法中很重要的一个步骤是对从微观特定部门的周期曲线得出的转折点与从宏观总参考周期曲线得出的转折点进行比较。这种比较不仅可有助研究者对微观特定部门分类,即根据它们周期曲线拐点的时间差异将它们分为前导、同步和滞后三类。这样,研究者不但可以利用前导部门或滞后部门的有关时序信息对经济周期的走势做事前预测,同时也可以通过对这些微观拐点的事后预测来确认其对宏观总周期转折点之测度的准确性。若验证失败,则需要对宏观总转折点的测度进行修正,这种修正无疑使整个经济周期的测定过程成为了一项重复迭代的复杂过程(参见Klein和Moore,1985,pp.7-8)。
然而,对这一复杂过程利用计量学时序方法进行规范化的研究,却过窄注重于对周期拐点自动识别之上。从数理统计学的角度来看,NBER的拐点识别法由于缺乏概率论基础而不具统计学上的严密性。例如,Wecker(1979)指出,NBER的拐点测定过程是无法由统计模型来表述和规范化的。为了利用统计模型来预测经济周期的转折点,Neftci(1982)提出在单一时序模型中采用离散状态Markov过程设定形式。他以失业率为例,采用这种模型对失业率时序中周期成分的转折点做了模拟和预测(15)。
但是,这种解释加深了定义在时序概念上的“结构”与传统计量经济学定义在经济理论上的结构模型之间的鸿沟,前者是从形如方程(3)中的单一时序分解式的参数之时变性表出的,而后者所体现的参数却表现了多元经济变量之间的相互依存关系。此外,Hamilton模型大都被用于增长率时序变量上,而不是据NBER传统定义测定的周期序列上。增长率类的时序变量,特别是那些频率高于年度的增长率,其主含的动态信息是短期信息,而原水平变量中的长期信息和测度经济周期所集中关注的中期信息大都已被差分掉了。
随着建筑在统计时序模型法之上的经济周期的新测度技术和方法的推出,一个新的问题产生了:我们应该如何评价这些新技术和方法?这些新技术和方法的发明者的通常做法是,取一已有由NBER传统方法得出的周期测度作其发明技术的应用案例,通过验证按其技术所得测度与传统测定的近似来证明其发明的可靠性和优越性。这种做法实质上把由NBER传统方法得出的周期测度设定为唯一公认的准确测度,并且把如何最佳地拟合NBER的测度作为其发明的目的。但是,并不存在一种唯一的由官方公布的经济周期测度。任何新技术要想获得更有力的认可,就需要证明它们具有能超出NBER的测度,更准确及时地预测出主要宏观经济变量的未来周期动态走向的能力。
五、时序建模方法对经济周期的预测
判断经济衰退即将到来的一个通用标准是实际GNP或GDP连续两个季度的下滑。上节介绍的Neftci-Hamilton模型方法,为预测这一事件的发生及其概率提供了一简明的手段。然而,从不少事前预测结果来看,Neftci-Hamilton模型在预测GNP连续下滑事件上并不一定显著优于简单的自回归时序模型(参见Goodwin,1995)。为了预测目的而发明的基于统计学时序法上的模型多种多样,复杂程度各异,例如通过前导指示变量以及为预测值设定贝叶斯损失函数来扩展的自回归系统模型(参见Zellner et al.,1990),但是它们对经济衰退的预警效果都欠佳。
不少应用建模者认为,单变量时序模型是无法捕获到经济变量之间相互依存的信息的。一旦将经济周期的预测建立在多变量时序模型基础上,VAR模型便成为显而易见的首用方法。在采用VAR模型做定期宏观预测方面,位于明尼阿波利斯市的美国联邦储备银行属于开拓先驱,他们利用Doan(1984)开发的时变参数(time-varying parameter)以及贝叶斯VAR(BVAR)技术,建立了一个含46-方程的美国月度预测模型(参见Qin,2011)。同时为研究需要,该模型的主要建模者Litterman还做了一个含6-变量的季度BVAR模型(参见Litterman,1986)。他后来将该模型扩展至9个变量(16),试图增加模型对通货膨胀的预测能力。该模型后由Sims接管并做后续研究。为了增强模型对经济衰退的预测能力,Sims决定为BVAR技术附加更多的概率假设,如对含趋势的时序变量参数引入了均值非平稳的先验设定(nonstationary mean priors),并大幅放宽对于残差的传统假设——允许残差是条件异方差且是非正态分布的(1993)(17)。尽管如此,他所修订的模型仍未能成功预测到1990-1991年美国GNP增长率衰退的拐点。从模型的整体预测结果来看,其预测路径与实际的数据序列十分接近,但稍稍滞后于实际序列的走向,对模型的事后预测检验也未发现模型有明显误设的迹象(18)。
在80年代末期,Stock和Watson为多变量经济模型预测做了一个更具探索性的方法研究。他们从Sargent和Sims(1977)的论文中重新拾起因子分析法,试图用以重新表述NBER的“参考周期”测度,以使NBER的测度建立在具有概率模型尺度的基础上。Stock和Watson主张通过一个动态因子模型(DFM),从NBER的变量列表中滤出一个单一同步指标,作为替代NBER同步指标测度的新型同步指标(1989)(19)。他们和Hamilton一样,为避免时序中可能存在的非平稳趋势,对趋势序列采用了一阶差分处理。一个简单的DFM模型为如下形式:
实际上,Watson对冲击因素的重要性已早有意识。他和Blanchard(1986)共同完成的一项早期研究的主题,就是专门剖析冲击因素的统计性质的。这项合作研究发现,经济周期的来源可能是若干大小冲击的混合,而不是像Slutsky-Frisch脉冲传播模型所设的纯粹由来于小冲击。此外,冲击因素可能来自于财政或货币方面,也可能来自于实际部门的需求及供给方面。这一经济周期来源多头的发现促使Watson和Stock联手开发DFM方法。然而,他们1989年采用DFM方法的预测实验结果的不尽如人意,使得很多建模者对DFM方法持怀疑态度,特别是那些坚信经济理论结构模型方法的建模者。因为动态因子模型缺乏任何经济理论支撑。与此同时,时序建模研究者却在继续扩展和拓深其建模技术手段,例如将DFM和体制转换模型合并,使用概率模型来对所关注的转折点进行概率预测。另外,那些由传统经济结构模型方法训练出来的建模者则努力试图开发动态性能更加强健的结构模型,力图使模型在现实经济呈现体制转换现象时仍保持良好功能。在这类研究中,最为著名的当属误差修正式模型了,该模型往往包含着长期协整关系,并扩展对经济衰退转折点的起源的解释,即其起源可能是由变量间的长期协整关系发生某种变动,而不仅仅是短期的冲击因素。但是,对于那些坚信理论的建模者,上述计量模型的理论说服力仍不够强。他们往往偏爱于更大规模的DSGE模型,认为这样的模型定能更好地描述来自于不同微观部门的冲击,并对整体经济系统的运作有理论清晰的概括,因此应能对经济周期做出较好的预测。于是,1990年代成为各种经济周期建模研究方法蓬勃发展的时代。尽管研究方法多种多样,且模型在内部一致性、技术复杂性以及尽量减少经验判断等方面取得了很大进展,然而,对经济衰退到来的及时预警目标仍显得遥不可及。
六、历史的反思
在两次世界大战后的40多年中,经济周期的计量经济研究经历了一个由Haavelmo-CC模式向其他模式扩展延伸的过程。建模者的注意力已从联立方程组结构模型转移到时序动态模型,从估计结构参数转移到研究动态模型模拟的冲击效应,以及发明更为严谨的统计测度来刻画经济周期现象,从关注理想经济中的长期动态均衡趋势转移到关注现实经济短期及中期非均衡的周期运动。另外,用于刻画周期的模型种类也扩展不少,既有传统的结构模型,又有以探索数据特征为主的动态因子模型,还有主体基于先验理论的实际经济周期模型。以Haavelmo-CC模式为主导模式的时代已经结束了。
然而仔细反思历史却不难发现,Haavelmo-CC模式从方法论的角度看并未过时,它在时序统计学方法的催化下,对NBER的传统研究方法进行了全面渗透,使NBER的经济周期测度与Haavelmo-CC计量法在技术上逐步融合。可以说,过去几十年的经济周期之计量经济研究主要集中在对NBER经验测度和步骤的不断模型化和规范化上,研究的主旨是对NBER经验测度和步骤的科学化,即按Haavelmo-CC计量法的原则,把这些测度和步骤建立在概率基础上,使内涵的一致严谨性最大化,外在的人为判断成分最小化。同时,这一科学化过程还伴随着一个研究课题的分割、细划和微缩的过程。例如,周期的测度是否应基于含趋势的时序指标还是经趋势滤波后的指标,周期的测度是否应呈现上下波动的非对称性,引发周期的冲击因素的规模应该是小还是大,应该是纯随机无常的还是具有自回归性的,是来自于实际经济部门还是货币部门,等等。当年Burns-Mitchell那种对经济周期各个方面做广泛和综合的考察分析方法早已被大多数学者遗弃。
计量经济研究对NBER经验测度和步骤的规范化无疑使经济周期的各种测度之科学性大大增强了,以往CC与NBER阵营的方法论之争也基本被遗忘。计量经济研究也从注重为先验理论模型附加数据方面的经验内容,扩展至探索数据特征和发明新的测度方法。这方面扩展程度之大以至于在学界引出了一轮计量经济模型法与DSGE阵营新的方法论之争,整个计量经济学方法在争论中被批判为“缺乏理论的测度”。
然而若从应用的角度来看,尤其是从事前对经济衰退到来的预警结果来看,计量经济研究对传统经验测度和步骤的规范化的意义便黯然失色了。最近的一次金融危机以及随后的经济衰退几乎未被任何计量模型的预警系统探测到。这意味着,学者们信奉和尽力追求的科学规范化所导致的研究效率显著偏离最佳的研究路径。其实,当一些计量经济学理论研究者执著追求将所有周期测度的估算模型化、自动化时,就不断有实证结果出现,表明不基于模型的人为判断在进行经济预测时扮演着不可或缺的角色,参见Turner(1990)和Clement(1995)。而且,把一组来自各方的预测做简单的平均,其预测精度往往会优于基于某种特定建模方法而得到的独立预测,参见Stock和Watson(1999)。这些事实提醒我们,任何模型,无论其数理统计基础如何严谨,在应用上都存在缺陷和不足;计量经济方法在用于分析和预测经济周期时表现出的局限性主要源于该方法受到的统计学局限。
具有讽刺意味的是,上述局限性在历史上不断有学者指出,而不断被主流学界忽略。对经济预测的可能性最早提出质疑的要数Morgenstern,他在1928年发表的《论经济预测方法论》一书要比Slutsky-Frisch模型体系的生成还早(20)。“二战”后,Wright发表了对CC方法和NBER方法的严重质疑,“我不相信任何一种计量模型或者任何数学公式,可以满足在任意时间段作出令人信服的经济预测。现实中总要出现新的社会元素”(1951;p.147)。在这之前不久,Gordon(1949)将CC和NBER两种方法归类于“统计方法”,把它与“历史方法”区分开来。他所指的历史方法是那些专注于使用所有类型的相关信息来解释特定的周期的研究。他认为,未来更有希望的研究方向是统计和历史两种方法融合的“数量-历史”方法,另请参见Roose(1952)。Burns在做了多年关于经济周期波动的统计研究后总结道,“无论是从理论上还是实践上,识别出经济组织的变化,以及那些使得每一个经济周期都成为独一无二事件的偶发随机因素都是至关重要的。对于经济变化的精湛理解往往来源于对历史和重大事件的熟知,而仅仅依靠统计数据和对数据的加工分析来的信息是远远不够的”(1969,p.85)。20年后,Zarnowitz对此问题再次重申,“不同时期的经济周期不可能是相同的,因为它们要受到历史变化以及经济结构和制度的影响。那么,试图将经济周期设定为单纯由某一类随机冲击生成的副产品的模型化企图,其失败也就不足为奇了”(1992,p.17)。
回顾历史,计量经济学对经济周期研究的规范化过程中,主要忽略掉的因素就是不同周期所具有的独特社会历史背景。Haavelmo-CC方法与NBER方法的融合使得“统计方法”更加远离“历史方法”。对科学方法优越性的广泛认同,使计量经济学界变为一个极力推崇数学严谨性和内部一致性的学界。通常,研究主题的选择以及研究的创新都以保证方法的严谨性为基本目标和准则,以至于对经济周期本身的研究已逐步退化为展示新技术和方法的应用案例了。从这个角度来看,概率模型化已使经济周期研究陷入盲目追求方法而忽略结果的境地(21)。这类研究在现实中对解释和预测经济周期没有做出任何突破也就不足为奇了。
另一方面,科学的历史告诉我们,只有当一个现有研究体系中的所有道路都难以为继,一种新的研究体系才可能会产生。当经济周期的模型化和规范化的研究已远远超出现实中对与经济周期有关的大量多元因素综合分析预测的需要时,研究者们才可能会调整他们对于历史方法的长期忽视,意识到经济周期研究所需要的“艺术”一面的重要性。
本文基于作者“The Reformation of Econometrics:A Historical Perspective”书中的一章,该书正在创作过程中。
注释:
①此经典研究对法国、德国、英国、美国四个国家的1277个不同样本区间的独立时间序列进行特定周期分析频率包括月度、季度、年度。他们的早期工作给出了从经济周期中分解先导指示器的方法。(Mitchell和Burns,1938)
②NBER的完整定义的原文为:"Business cycles are a type of fluctuation found in the aggregate activity of nations that organize their work mainly in business enterprises: a cycle consists of expansions occurring at about the same time in many economic activities, followed by similarly general recessions, contractions, and revivals which merge into the expansion phase of the next cycles; this sequence of changes is recurrent but not periodic; in duration business cycles vary from more than one year or twelve years; they are not divisible into shorter cycles of similar character with amplitudes approximating their own."(Burns and Mitchell,1946,p. 3)
③在若干历史考察文献中,谱分析方法是von Neumann向Morgenstern介绍的(参见Cargill,1974;Phillips,1997)。
④关于此类模型的说明详见Bodkin,et al.(1991;PartⅡ)。
⑤有关计量经济学中VAR学派的历史,参见Qin(2011)。
⑥他们也对一些可供使用的月度序列进行了检验。
⑦变量包括:货币、失业率、价格和工资,以及由用来近似需求压力的耐用商品货运未交付订单。
⑧进一步的研究还包括Sims(1981;1983)对于货币经济周期的探索性工作。
⑨关于参数校准的争论主要围绕模型结构参数的可识别性。当结构模型越来越微观细化,越来越多的参数就不可识别,参见Mitra-Kahn(2008)对于CGE模型历史的介绍。
⑩Kydland和Prescott利用此估计来确定他们模拟的实际产出值的大小。
(11)Mintz(1969)在定义周期测度时引用了R. A. Gordon在参加1967年伦敦的一次会议上时的发言,该发言中将经济周期描述为围绕产出和就业的增长率上下波动的曲线,并称此周期为“增长周期”。
(13)例如,Klein和Moore(1985)将Mintz 1969年所做的工作视为从古典周期转向增长周期在方法上的转折点,而未提及“离差周期”和“阶梯周期”。
(14)参见Harding和Pagan(2002)对NBER方法的摘要。
(15)Neftci(1984)还尝试了用同样的模型设定来识别单一宏观变量的周期波动之非对称性。
(16)最初的六个变量为:实际GNP,GNP价格平减指数,实际商业固定投资,3月期国库券利率,失业率,货币供给;后增加的三个变量为:汇率,SP500股票价格指数,大宗商品价格指标。
(17)本文在1991年5月举行的NBER会议上演示。
(18)值得注意的是,通用的模型之事后预测检验是基于建模误差平均之上的,这类预测检验是无法鉴别模型对预测拐点能力的优劣的,参见Fair(1984)。
(19)这里应用了四个变量:工业生产增长率,个人收入,就业,生产及贸易销售。
(20)对此书的评述请参见Marget(1929)。
(21)更多内容参见Swann(2006),该书批评了在应用经济学中将计量经济分析作为“万能工具”的倾向。
参考文献:
[1]Adelman, F. and I. Adelman(1959)The dynamic properties of the Klein-Goldberger model, Econometrica 27, 596-625.
[2]Beveridge, S. and Nelson, C. R.(1981)A new approach to decomposition of economic time series into permanent and transitory components with particular attention to measurement of the "business cycle", Journal of Monetary Economics 7, 151-174.
[3]Clement, M. P.(1995)Rationality and the role of judgement in macroeconomic forecasting, Economic Journal 105,10-20.
[4]Gordon, R. A. (1949) Business cycles in the interwar period: The "quantitative-historical" approach, The American Economic Review 39, Papers and Proceedings of the Sixty-first Annual Meeting, 47-63.
[5]Granger, C. W. J.(1969) Investigating causal relations by econometric models and cross-spectral methods, Econometrica 37,424-438.
[6]Gregory, A. W. and Smith, G. W.(1990)Calibration as estimation, Econometric Reviews 9, 57-89.
[7]Hamilton, J.D.(1989)A new approach to the economic analysis of nonstationary time series and the business cycle, Econometrica 57, 357-384.
[8]Jacobs, J.(1998) Econometric business cycle research, Boston/London: Kluwer Academic Publishers.
[9]King, R. G. and Plosser, C. I.(1984)Money, credit and prices in a real business cycle, American Economic Review 74, 363-380.
[10]Koopmans, T. C.(1947)Measurement without theory, Review of Economic Studies 29, 161-172.
[11]Kydland, F. and Prescott, E.(1982)Time to build and aggregate fluctuations, Econometrica 50, 1345-1370.
[12]Laidler, D.(1992)The cycle before new-classical economics, in Belongia, M. T. and Garfinkel, M. R. eds. The business cycle, theories and evidence: Proceedings of the sixteenth annual economic policy conference of the Federal Reserve Bank of St Louis, Kluwer: Boston, Chapter 2.
[13]Litterman(1986)Forecasting with Bayesian vector autoregressions-five years of experience, Journal of Business and Economic Statistics 4, 25-38.
[14]Long, J. B. and Plosser, C.I.(1983)Real business cycles, Journal of Political Economy 91, 39-69.
[15]Lucas, R. E. and T. J. Sargent(1978)After Keynesian macroeconomics, in After the Philips curve: Persistence of high inflation and high unemployment, Conference Series No. 19, Federal Reserve Bank of Boston, 44-72.
[16]Marget, A. W.(1929)Morgenstern on the methodology of economic forecasting, Journal of Political Economy 37,132-139.
[17]Morgan, M. S.(1990) The history of econometric ideas, Cambridge, Cambridge University Press.
[18]Morgenstern, O.(1928) Wirtschaftsprognose: Eine untersuhung ihrer Voraussetzungen und Moglichkeiten, Vienna, Verlag yon Julius Springer.
[19]Qin, D.(2011)Rise of VAR modelling approach, Journal of Economic Surveys 25, 156-174.
[20]Quah, D. T.(1995)Business cycle empirics: Calibration and estimation, Economic Journal 105, 1594-1596.
[21]Romer, C.D.(1994)Remeasuring business cycles, Journal of Economic History 54, 573-609.
[22]Roose, K. D.(1952)The empirical status of business-cycle theory, Journal of Political Economy 60, 412-421.
[23]Sargent, T. J. and C. A. Sims(1977)Business cycle modelling without pretending to have too much a priori economic theory, in New Methods in Business Cycle Research: Proceedings from a Conference, Federal Reserve Bank of Minneapolis, 45-109.
[24]Sims, C. A.(1993)A nine-variable probabilistic macro-economic forecasting model, in J. H. Stock and M. W. Watson eds. Business cycles, indicators, and forecasting, Chicago, University of Chicago Press, 179-204.
[25]Stock, J. H. and Watson, M. W.(1989)New indexes of coincident and leading economic indicators, NBER Macroeconomic Annual, 351-409.
[26]Stock, J. H. and Watson, M. W.(1999)A comparison of linear and nonlinear models for forecasting macroeconomic time series, in Engle, R. F. and White, H. eds., Cointegration, causality and forecasting, Oxford: Oxford University Press, 1-44.^