2.基于Moran's I 指数值的环境污染全局空间相关性分析 由于Moran's I指数值反映截面数据的性质,而本文涉及两个环境污染综合指数11年的数据,比较庞杂。尝试对每个环境污染综合指数的11年数据进行平均化处理,形成截面数据,然后计算Moran's I指数,并进行分析,结果如表1所示。
表1结果显示,工业和生活环境污染综合指数的Moran's I指数的数值都大于0,说明我国的区域环境污染从整体上来看,并不是每个省区随机分布并独立存在的,而是存在着明确的正向空间依赖关系。环境污染严重的区域倾向于集聚在一起,一个区域的环境污染水平受到相邻区域的同向影响。工业污染综合指数的Moran's I的数值较大,而生活综合污染指数的Moran's I的数值较小,说明工业污染的空间相关性强于生活污染的空间相关性。
3.基于Moran's I散点图的环境污染局部空间相关性分析 为了更进一步判定我国各省区环境污染的高低属性,进行局部空间相关性分析。
(1)工业污染局部空间相关性分析
由图3的散点图(左图)可以看到,大多数省区集中于第一象限和第三象限,也就是工业环境污染集聚的高-高和低-低类型占主导。具体省区的分布情况如表2所示。位于第一象限(高-高类型)的省区主要有黑龙江、辽宁(东北老工业基地省区);山西、河南、湖南、湖北、安徽、江西(中部工业省区);河北、山东、上海、江苏、浙江、福建、广东(东部沿海省区)。东北老工业基地省区长久以来的产业基础都是工业;而中部工业省区有的凭借资源优势、有的依靠东部地区的产业转移,近些年来工业经济崛起;而涉及到的东部沿海省区都是轻纺工业发达的地区。以工业为主的产业结构决定了这些省区高污染的地位。处于第三象限(低-低类型)的省区为新疆、甘肃、宁夏、青海、云南、广西,这些都是经济不发达的西部省区。位于第二象限(低-高类型)的省区多为东部省区的腹地,本身经济发展水平不高,污染程度较低,但是有受东部地区重污染影响的可能性。
从图3的显著性水平图(右图)来看,在工业污染集聚的低-低类型中,新疆和青海通过了显著性水平检验,也就是这种特征最为明显的省区。这和其经济发展水平密切相关,与其他省区相比,这两个城市的工业化水平更低,工业污染排放较少,而周边省区也大多为工业发展水平不高的省区,也就形成了以这两个省区为核心的低工业污染圈。而在高-高类型中,通过了显著性水平的省区为河北、山西、山东、河南、江苏、安徽、上海。这七个省区中,有重工业省区,也有轻工业省区,这就决定了其高污染区域核心的地位,与周边省区形成高污染圈,也就不足为奇了。而四川成为工业污染高-低特性的核心,也就是说四川相对于周边省区来说,工业化程度较高,吸引着周边省区资源向四川的集聚,同时也产生了污染排放的集聚,形成了“高-低”特性。
(2)生活污染局部空间相关性分析
由图4的散点图(左图)可以看出,多数省区依然位于第一象限和第三象限,也就是生活环境污染集聚的高-高和低-低类型占主导。具体来看,如表3的区域象限分布,位于第一象限(高-高类型)的省区中东部省区有6个,中部省区5个,西部省区1个,东北部省区2个。地区的生活污染程度,一方面决定于该区域的经济发展水平。经济水平越高,人民的可支配收入越高,用于消费的部分也就越多,相应的就会造成更多的环境污染,比如上海、江苏、广东等。另一方面决定于当地的文化氛围,虽然经济水平不一定发达,但是当地人民倾向于更多的生活消费,也会造成较多的生活污染,比如湖南、河南等。处于第三象限(低-低类型)的省区为新疆、甘肃、青海,都是经济不发达的西部省区,当地居民局限于满足温饱的程度,不会产生很多的生活污染。位于第二象限(低-高类型)的省区可分为两类。一种是北京、天津的经济发达地区,这些地域由于经济发展水平较高,当地政府以及居民已经开始重视污染问题,产生了环保意识,人为地减少生活污染的排放。另一种是经济发展水平一般,且当地居民不注重生活质量的地区,但这些地区都有受到周边高生活污染省区影响的可能性。
由图4的显著性水平图(右图),可以看出,在生活污染集聚的低-低类型中,新疆和青海通过了显著性水平检验,成为特征核心省区。一方面与这些省区的经济发展水平相关,另一方面也与当地的饮食习惯相关,倾向于产生较少的生活污染。而周边省区也大多为生活污染排放较少的省区,也就形成了以这两个省区为核心的低生活污染圈。而在高-高类型中,通过显著性水平检验的省区为山东、江苏、安徽、上海、江西、福建。也就是说,以这六个省区为核心,形成了高污染区域。而四川成为生活污染高-低特性的核心,也就是说四川相对于周边省区来说,有较多的生活污染的排放,这与当地的饮食习惯是密切相关的,形成了“高-低”特性。
(二)传统固定效应模型的估计与分析 利用传统固定效应模型——LSDV(Least Square Dummy Variables),也就是普通面板数据模型,进行回归分析并检验空间相关性的存在与否。
设定本文基本模型为:
Y1it=αit+β1X1it+β2X12it+β3X13t+β4X2it+βsX3it+β6X4it+β7X5it+β8X6it+μit (1)
Y2it=δit+γ1Xlit+γ2X12t+γ3X13t+γ4X2it+γ5X3it+γ6X4it+γ7X5it+γ8X6it+νit (2)
回归结果如表4所示。
分析表4的数据,可以看出:
工业污染的方程中,人口城市化指标的一次方、二次方和三次方的系数通过了1%的显著性水平检验,且与工业环境污染物的关系,呈现倒N型。而其他五个控制变量,四个通过了不同程度的显著性检验。
生活污染的方程中,人口城市化一次方、二次方和三次方的系数均未通过显著性检验,控制变量中三个通过了不同程度的显著性检验,我们依然能够观察到生活污染伴随区域城市化发展的变化曲线呈现倒N型趋势。
LMerr统计量用于检验空间误差模型中的空间自相关系数的显著性,LMlag统计量用于检验空间滞后模型中的空间自回归系数的显著性。LMerr和LMlag统计量都是通过截面数据的最小二乘估计(OLS估计)得到的。Anselin et al(2008)[14]指出,将空间权重矩阵做相应的变化后,这两个统计量能够继续应用于面板数据模型中两个模型使用的判断。空间误差模型或空间滞后模型的选择方法为:如果LMerr统计量的显著性优于LMlag统计量,则选取模型SEM;如果LMlag优于LMerr,则选取SLM。
由表4可以看到,在两个方程中,LMlag、Robust LMlag、LMerr和Robust LMerr统计量均显著不为0,且LMlag统计值通过了显著性检验,也就说明工业环境污染和生活环境污染均存在着明显的空间自相关性,也就是工业环境污染和生活环境污染都会有临近区域间的相互影响。再根据空间滞后模型与空间误差模型的选择标准进行判断,两个方程中,LMerr和Robust LMerr统计量均未通过显著性检验,而LMlag和Robust LMlag统计量全通过了显著性检验,而且,LMlag和Robust LMlag统计量大于对应的LMerr和Robust LMerr统计量,因此工业污染方程和生活污染方程均选择空间滞后模型进行回归,测度相邻区域间的相互影响程度。
(三)空间面板数据模型的估计与分析 1.模型介绍
Anselin(1998)[15]和Elhorst(2003)[16]在传统的面板数据模型的基础上,明确引入考虑空间相关性的空间滞后误差项和空间滞后因变量。Anselin(1998)提出了随机效应的空间误差模型。Elhorst(2003)把空间面板数据模型分成了四个小类:空间固定效应模型、空间固定系数模型、空间随机效应模型、空间随机系数模型,给出了四个模型的对数似然函数,还分析了极大似然估计量的渐进性质。
空间计量模型包括空间误差模型(SEM,又称为空间自相关模型)和空间滞后模型(SLM,又称空间自回归模型)。何江和张馨之(2006)[17]提出,回归目标集中于研究某些特定个体时,选择固定效应模型更好;何江和张馨之(2006),王火根和沈利生(2007)[18],吴拥政和颜日初(2009)[19],这三组学者的研究都表明,空间面板研究文献一般均选择固定效应模型。基于前人的研究成果,本文选择空间固定效应模型进行回归分析。
空间误差固定效应模型(Fixed Effects Spatial Error Model)的设定如下:
Yit表示第i个地区第t年的被解释变量指标;Xit表示第i个地区第t年的解释变量指标;αi表示各地区的固定影响;μit为随机误差项,服从一阶空间自回归过程;εit表示特定误差,假定E(εit)=0,E(εit2)=σ2;λ为空间自相关系数。
Wim表示空间权重矩阵,反映区域间的相关性程度。本文采取最简单、最常用的二元邻接矩阵,具体设定为,若地区i与地区m相邻,则Wim为1,不相邻,则为0。之后对这个矩阵进行标准化处理,使得这个方程的成立更具有科学性。
空间滞后固定效应模型(Fixed Effects Spatial Lag Model)的设定如下:
(14)
式中,δ为空间自回归系数。其他变量解释与上一模型相同。
上述两个模型的矩阵汇总表示形式如下:
Y=Xβ+A+μ
μ=λWμ+ε
Y=δWY+Xβ+A+μ (5)
式中,Y、μ、ε均为NT*1维列向量,X为NT*K维矩阵。A=1T*α,1T是T维元素全为1的列向量,α(N*1维列向量)描述了样本的N个截面的个体特性,即截面固定影响。W=1T*WN,1T为T*T单位阵,空间权重矩阵WN(N阶方阵)反映了个体之间的空间相关性。
2.回归结果分析
对两个方程的空间滞后固定效应模型进行回归,结果如表5所示。
由表5可以看出,加入空间相关性的考虑之后,两个模型的可决系数都有一定程度的提高,这说明考虑空间相关性在一定程度上提高了模型的拟合优度。Y1方程中,除了城市化率指标的系数依旧通过显著性检验之外,其他控制变量的系数也通过了一定水平的显著性检验。Y2方程中,城市化指标的一次方项和三次方项的系数通过10%的显著性水平检验,控制变量中通过显著性检验的指标也增多。变量系数显著性提高,也从一定程度上说明采用空间滞后固定模型的正确性。总体来看,两个方程中污染物与城市化指标的关系,依旧全部呈现倒N型,这与LSDV估计结果相同。从理论来上讲,倒N型曲线是符合环境发展特征的,只是与倒U型曲线比较来说,在城市化初期有较大的波动。
两种污染物的模型中,自回归系数的估计值均为正,并且都通过1%或5%水平下的显著性检验,说明各省区间的工业污染物排放和生活污染物排放确实具有较强的正向相互影响作用。为了更好的解释环境污染的影响因素,我们更详细地分析每一个模型方程:
(1)工业污染方程
第一个方程中,工业污染综合指数作为被解释变量,与区域城市化指标的呈现的倒N型曲线中,两个转折点处对应的区域城市化率为X1*=20.63%和X2*=80.70%。
具体来说,区域城市化率低于20.63%的省市,还处于城市发展的初期阶段;而区域城市化率介于20.63%和80.70%之间,表明各省区的工业环境污染随着区域城市化加剧而恶化;区域城市化率超过80.70%的省区,则进入工业环境污染随区域城市化深入而缓和的阶段。
根据中国2010年各省区的城市化率指标,各省市在工业污染与城市化率呈现的倒N型关系中的所处阶段的分布如图5所示。粗实线表示区域城市化率为20.63%的基准线,对应的为极小值处的X1*的区域城市化水平;细虚线表示区域城市化率为80.70%的基准线,对应的是极大值处的X2*的区域城市化水平。除了北京在2010年的人口城市化率达到85.93%,上海达到88.86%,超过了第二个转折点,进入工业污染随着人口城市化率的增加而减少的阶段,其他省区依然处于工业废水排放量随人口城市化率增加而增加的阶段。
由此可以看出,北京和上海两个直辖市已经跨过以污染换增长的阶段,经济发展进入平稳发展阶段,更具有长期持续发展的特性,成为“经济发展与环保两手抓”的代表。
对于其他控制变量:伴随着工业产值比率增加,各省区的工业污染加剧,这是与事实相符合的;伴随着非生活必需品消费性支出比率增加,工业污染加剧,这说明目前居民生活水平的提高很大程度上表现于家用电器等生活用品的量的增加,从而促进生产的增多,资源的消耗;伴随着人口密度的增加,工业污染在减少;伴随着区域内部技术的进步,工业污染也在减少;伴随着贸易开放度的增加,工业污染在减少。