内容提要:金融高频数据和金融波动率是目前金融领域研究的热点问题。本文对基于金融高频数据的金融波动率估计量——“已实现”双幂次变差进行了建模和预测。“已实现”双幕次变差无模型、计算简便,在一定条件下是金融波动率的无偏估计量,并且具有稳健性和有效性。通过用上证综指对“已实现”双幂次变差进行ARFIMA建模,发现中国股票市场的上证综指“已实现”双幂次变差时间序列具有长记忆性。
关键词:金融高频数据 “已实现”双幂次变差 ARFIMA模型
作者简介:李胜歌张世英天津大学管理学院,天津300072
引言
金融高频数据是指以小时、分钟或秒为抽样频率的日内数据。一般而言,金融市场的信息是连续影响资产价格运动过程的,数据频率越低,则损失的信息越多;反之,数据频率越高,获得的市场信息就越多。因此,随着计算机及通信技术的发展,当获取金融高频数据成为可能后,金融高频数据的研究就成为了金融研究领域中的焦点。
金融波动率的研究一直以来就是人们研究的热点问题。准确的金融波动率估计、建模等问题具有重要的意义,它是进行资产定价、风险管理、投资组合等研究的基础。在金融高频数据中,Andersen和Bollerslev提出了一种全新的波动率度量方法——“已实现”波动(Realized Volatility, RV)来估计金融波动率,随后Bandorff-Nielsen和Neil Shephard提出了又一类似“已实现”波动的波动率估计量——“已实现”双幂次变差(Realized Bipower Variation, RBV),该估计量不但具有“已实现”波动的所有优点,如无模型、计算简便、具有无偏性等,而且具有稳健性,同时比“已实现”波动更有效。因此本文选取“已实现”双幂次变差来进行金融波动率建模。
一、“已实现”双幂次变差
当r=2,s=0或者r=0,s=2时,“已实现”双幂次变差即为“已实现”波动。同时Bandorff-Nielsen和Neil Shephard指出在不存在跳跃和存在有限次跳跃的条件下,当r+s=2并且r∈(0,2)时,有下式成立:
其中,,Г(p)表示伽玛函数。可以看出当r+s=2并且r∈(0,2)时,“已实现”双幂次变差在M→∞条件下的概率极限为积分波动(Integrated Volatility,IV),并且对偶尔出现的跳跃具有稳健性。在一定条件下,“已实现”双幂次变差是比“已实现”波动更有效的波动率估计量,并且当r=s=1时的“已实现”双幂次变差的有效性比r、s取其它值时的“已实现”双幂次变差以及“已实现”波动都更有效[8]。因此,“已实现”双幂次变差是比较理想的金融波动估计量。
二、“已实现”双幂次变差建模
(一)ARFIMA模型
“已实现”波动估计量具有显著的长记忆性,即分整(Fractionally Integrated)的性质,通常长记忆性可以用分整自回归移动平均模型(Autoregressive Fractionally Integrated Moving Average Model, ARFIMA)来进行刻画[9]。“已实现”双幂次变差类似于“已实现”波动估计量,因此也可以考虑对其进行ARFIMA建模,通过分维数d的估计值就可以得知“已实现”双幂次变差时间序列是否具有长记忆性。
分整自回归移动平均模型ARFIMA(p,d,q)用p+q个参数描述过程的短记忆特征,以参数d反映过程的长记忆特征。因此ARFIMA(p,d,q)模型综合考虑了过程的长记忆和短记忆过程,既优于单纯描述短记忆过程的自回归移动平均(Autoregressive Moving Average)ARMA(p,q)模型。又优于单独描述长记忆过程的分整差分噪声(Fractional Differenced Noise,FDN)模型。当ARFIMA(p,d,q)模型中的参数p=q=0时,即为FDN模型,而当参数d=0时,则为ARMA模型。
(二)分维数d的估计
ARFIMA模型中分维数d可以用聚合方基法来进行估计[10]。将时间序列,t=1,2,…,T分成样本容量为m的[T/m]个子样本,在每个子样本内求均值,对于固定的m值,可以得到一个聚合序列:
其中。利用最小二乘法可以得到H的估计值。H为Hurst值数,它是描述分数布朗运动的重要参数,它与ARFIMA模型中的分维数d有如下的确定关系:H=d+0.5。因此,借助于估计H的方法即可以估计出分维数d。
三、实证研究
本文实证研究采用的高频数据为2002.1.4~2005.12.30上证综指的1分钟间隔时段的收盘价,这期间共有963个交易日,共有241×963=232083个数据。对r=s=1时的“已实现”双幂次变差建立ARFIMA(p,d,q)模型:
从以上结果可以获知中国上证综指的“已实现”双幂次变差时间序列为长记忆时间序列,并且具有分维数特性,扰动项对波动序列的影响将会持续若干个时期才会消退。这一特性由分整自回归移动平均模型ARFIMA(p,d,q)得到了很好的刻画。
图1
四、结束语
金融高频数据比低频数据包含了更多的市场信息,因此基于金融高频时间序列的波动率估计也就比基于低频时间序列的波动率估计要准确,而且金融高频领域采用“已实现”波动作为金融波动率的度量方法,避免了低频领域中复杂的参数估计。本文选用“已实现”双幂次变差这一具有无偏性、稳健性和有效性等良好统计性质的波动率估计量进行建模,通过ARFIMA模型对“已实现”双幂次变差时间序列的长记忆性进行了很好的刻画。通过“已实现”双幂次变差的ARFIMA建模,发现中国上证综指的“已实现”双幂次变差的金融波动时间序列具有长记忆性,扰动项对波动率的冲击会维持若干个时期才会逐渐消退。对“已实现”双幂次变差进行ARFIMA建模后,还可以实现对金融波动率的准确预测,这对金融应用领域的研究具有重要意义。