空间自回归模型变量选择的理论研究和实证分析
近几十年来,随着对经济问题研究的深入,人们发现空间因素对经济问题的影响越来越大,因此,空间统计研究领域应运而生,它不僅吸引了计量经济学模型有哪些家的目光,也引起了统计学家的关注.在大量的空间统计研究问题中,一类统计模型――空间自回归模型成为许哆统计学家研究的目标.随着计算机技术的飞速发展,使得人们更容易获取体量巨大的观测数据,它包含了两层含义:一是样本量的巨大,二是每一個样本中都能含有更多的信息.如何处理这些数据,从而获得最有价值的信息,使得变量选择问题成为现代统计分析的热点之一.在这样的背景下,夲文将这两部分内容结合在一起,研究了如下问题:一、在最小预测误差准则下,研究了线性空间自回归模型的压缩估计.首先,基于一个优良的初始估计,从预测的角度出发,构造新的损失函数,通过对其施加惩罚后,达到同时进行变量选择和参数估计的目的,并证明了在SCAD惩罚函数下,新的估计具有相合性与Oracle性质.其次,通过模拟结果,验证了本文提出的新的估计方法能够有效的识别出非零系数和零系数.最后,将此估计方法应用到经典的波士顿房价数据和城市空气质量数据中,进一步验证了新估计方法的实用性.二、在最小均方误差准则下,研究了部分线性空间自回归模型的变量选择.首先,对于模型中的非线性部分,采用B样条将其线性化,再将含有内生性的空间滞后项利用工具变量法进行处理.这样,就可以将复杂的部分線性空间自回归模型转化为经典的线性模型,然后进行变量选择.其次,比较不同惩罚函数LASSO,ALASSO,SCAD下的数值模拟.通过数值模拟,得出以下结论:1.本文提出的估计方法能有效的识别出非零系数和零系数;2.模拟结果显示出SCAD惩罚较其它惩罚下得到的估计有更好的结果;3.在SCAD惩罚下,选择不同初值,得到很好的估计效果.最后将所提方法应用到城市空气质量数据的分析中,得到了与环保部门一致的结论.
空间自回归模型变量选择的理论研究和实证分析
近几十年来,随着对经济问题研究的深入,人们发现空间因素对经济问题的影响越来越大,因此,空间统计研究领域应运而生,它不僅吸引了计量经济学模型有哪些家的目光,也引起了统计学家的关注.在大量的空间统计研究问题中,一类统计模型――空间自回归模型成为许哆统计学家研究的目标.随着计算机技术的飞速发展,使得人们更容易获取体量巨大的观测数据,它包含了两层含义:一是样本量的巨大,二是每一個样本中都能含有更多的信息.如何处理这些数据,从而获得最有价值的信息,使得变量选择问题成为现代统计分析的热点之一.在这样的背景下,夲文将这两部分内容结合在一起,研究了如下问题:一、在最小预测误差准则下,研究了线性空间自回归模型的压缩估计.首先,基于一个优良的初始估计,从预测的角度出发,构造新的损失函数,通过对其施加惩罚后,达到同时进行变量选择和参数估计的目的,并证明了在SCAD惩罚函数下,新的估计具有相合性与Oracle性质.其次,通过模拟结果,验证了本文提出的新的估计方法能够有效的识别出非零系数和零系数.最后,将此估计方法应用到经典的波士顿房价数据和城市空气质量数据中,进一步验证了新估计方法的实用性.二、在最小均方误差准则下,研究了部分线性空间自回归模型的变量选择.首先,对于模型中的非线性部分,采用B样条将其线性化,再将含有内生性的空间滞后项利用工具变量法进行处理.这样,就可以将复杂的部分線性空间自回归模型转化为经典的线性模型,然后进行变量选择.其次,比较不同惩罚函数LASSO,ALASSO,SCAD下的数值模拟.通过数值模拟,得出以下结论:1.本文提出的估计方法能有效的识别出非零系数和零系数;2.模拟结果显示出SCAD惩罚较其它惩罚下得到的估计有更好的结果;3.在SCAD惩罚下,选择不同初值,得到很好的估计效果.最后将所提方法应用到城市空气质量数据的分析中,得到了与环保部门一致的结论.