第四章练习题及参考解答
假设在模型
(1) 是否存在
(2)
(3) 是否有
【练习题参考解答】
(1) 存在
因为
当
有
同理有:
(2)会的。
(3) 存在
因为
当
同理,有
表给出了1995—2016年中国商品进口额Y、国内生产总值GDP、居民消费价格指数CPI的数据。
表 中国商品进口额、国内生产总值、居民消费价格指数
年 份 | 商品进口额 (亿元)Y | 国内生产总值 (亿元)GDP | 居民消费价格指数(1978=100)CPI |
1995 | |||
1996 | |||
1997 | |||
1998 | |||
1999 | |||
2000 | |||
2001 | |||
2002 | |||
2003 | |||
2004 | |||
2005 | |||
2006 | |||
2007 | |||
2008 | |||
2009 | |||
2010 | |||
2011 | |||
2012 | |||
2013 | |||
2014 | 643 | ||
2015 | 689 | ||
2016 | 744 | ||
资料来源:《中国统计年鉴2017》 考虑建立模型: (1)利用表中数据估计此模型的参数。 (2)你认为数据中有多重共线性吗 (3)进行以下回归: 根据这些回归你能对多重共线性的性质有什么认识 |
(4)假设经检验数据有多重共线性,但模型中
【练习题参考解答】
建立模型:
(1)利用表中数据估计此模型的参数。
(2)你认为数据中有多重共线性吗
其中居民消费价格指数CPI对商品进口额影响为负,与预期不符合,可能存在多重共线性。
(3)分别进行以下回归:
1)作回归
说明GDP的确对商品进口额有正的影响,是重要变量。
2)作回归
说明CPI的确对商品进口额有正的影响,是重要变量。
3)作回归
说明CPI与GDP也高度相关,这是引起多重共线性的原因所在。
在本章开始的“引子”提出的“工业增加值增长会减少财政收入吗”的例子中,如果所采用的数据如表所示,试分析:为什么会出现本章开始时所得出的异常结果你怎样解决所出现的问题
表 2000-2016年财政收入及其影响因素数据 ( 单位:亿元)
年 份 | 一般公共预算收入 CZSR | 国内生产总值 GDP | 税收总额 SSZE | 工业增加值 GYZJZ |
2000 | ||||
2001 | ||||
2002 | ||||
2003 | ||||
2004 | ||||
2005 | ||||
2006 | ||||
2007 | ||||
2008 | ||||
2009 | ||||
2010 | ||||
2011 | ||||
2012 | ||||
2013 | ||||
2014 | ||||
2015 | ||||
2016 | ||||
资料来源:《中国统计年鉴2017》
【练习题参考解答】
计算解释变量的相关系数:
解释变量的方差扩大因子VIF :
这说明由于严重的多重共线性导致工业增加值的参数为负。
工业增加值与国内生产总值、税收总额都高度相关,为分析工业增加值对一般公共预算收入是否有负的影响,可删除国内生产总值、税收总额作回归:
这说工业增加值对一般公共预算收入是有证的租金作用的。不过国内生产总值、税收总额都是对一般公共预算收入有重要影响的变量,删除后可能模型会有设定误差。
表是中国家电零售总额及国内生产总值、人均可支配收入、家电广告投放总额、居民消费价格指数等数据。
表 1997年—2015年中国家电零售总额及相关数据
年份 | 家电零售总额(亿元) | GDP(亿元) | 人均可支配收入(元) | 家电广告投放总额(亿元) | 居民消费价格指数(以1996年为100) |
1997 | |||||
1998 | |||||
1999 | |||||
2000 | |||||
2001 | |||||
2002 | |||||
2003 | |||||
2004 | |||||
2005 | |||||
2006 | |||||
2007 | 270844 | ||||
2008 |
|
| |||
2009 |
| ||||
2010 | |||||
2011 |
| ||||
2012 | |||||
2013 | |||||
2014 | |||||
2015 | |||||
数据来源:国家统计局(。
(1)如果请考虑建立模型:,利用表中数据估计此模型的参数。
(2)根据模型估计结果,你认为参数估计结果合理吗数据中有吗
(3)分别采用简单相关系数检验法和方差扩大因子法验证模型是否存在多重共线性。
(4)如果存在多重共线性,如何才能解决
【练习题参考解答】
OLS方法估计模型参数,得到的回归结果。
该模型
计算各解释变量的相关系数。
变量 | X2 | X3 | X4 | X5 |
X2 |
|
|
|
|
X3 |
|
|
|
|
X4 |
|
|
|
|
X5 |
|
|
|
|
由相关系数矩阵可以看出,所有解释变量之间的相关系数较高,证实确实存在一定的多重共线性。
解释变量的方差扩大因子VIF
被解释变量 | 方差扩大因子 |
X2 | |
X3 | |
X4 | |
X5 | |
所有解释变量的方差扩大因子都远大于10,表明存在严重多重共线性问题。
对多重共线性的处理:
将各变量进行对数变换(
该模型
采用逐步回归方法筛选并剔除引起多重共线性的变量,最后保留的解释变量为
t=()
该模型中
表中给出了四川省城镇人均消费支出Y和其相关影响因素城镇居民人均可支配收入X2、地区生产总值X3、零售商品价格指数X4以及人口自然增长率X5的数据。
表 2000-2015城镇居民人均消费支出及其影响因素数据
城镇人均 消费支出(元) Y | 城镇居民人均 可支配收入(元)X2 | 地区生产总 值(亿元) X3 | 零售商品 价格指数(%)X4 | 人口自然增长率(‰) X5 | |
2000 | 5315 | ||||
2001 | 5661 | ||||
2002 | 5932 | ||||
2003 | 6312 | ||||
2004 | 6970 | ||||
2005 | 7577 | 8386 | |||
2006 | 8305 |
| |||
2007 | 9559 | ||||
2008 | 10608 | ||||
2009 | 11701 | ||||
2010 | 13457 | 103 | |||
2011 | 15687 | ||||
2012 | 16649 | 20307 | |||
2013 | 17899 | 22368 | 3 | ||
2014 | 19318 | 24234 | |||
2015 | 20114 | 26205 | |||
(数据来源:四川统计局,国家统计局)
(1)利用以上数据建立回归模型,根据回归结果判断是否存在严重的多重共线性。
(2)若对所建立的模型中部分变量作对数变换(某些变量不需要进行对数变换),并对变换后的模型进行估计,根据回归结果判断是否还存在严重的多重共线性。
(3)若是还存在严重的多重共线性,选择更适合的模型进行修正,并对修正后的结果从经济意义上进行解读。
【练习题参考解答】
(1)回归模型估计结果为:
结果中的
计算解释变量的相关系数:
计算方差扩大因子:
(2)由于X4和X5已经是指数和比率,因此只对Y和X2, X3 做对数变换,估计结果为
虽然log(X2)的系数为正,但是依然不显著,说明严重的多重共线性依然存在。
计算变换后的解释变量的相关系数:
计算方差扩大因子:
(3)对(1)中回归模型的多重共线性进行修正,由于(2)的对数变换,依然存在严重的多重共线性,所以进一步对(1)的回归模型采用逐步回归方法进行修正:
分别作Y对X2、X3、X4、X5的回归,结果为:
变量 | X2 | X3 | X4 | X5 |
参数估计值 | ||||
t 统计量 | ||||
R2 | ||||
其中,加入
加入变量 | X2 | X3 | X4 | X5 | |
X3、X2 | |||||
X3、X4 | (946129) | ||||
X3、X5 | |||||
经比较,新加入
加入变量 | X2 | X3 | X4 | X5 | |
X3、X5、X2 | () | () | () | ||
X3、X5、X4 | () | () | () | ||
加入
t= ()
结果说明保持其它解释变量不变的情况下地区生产总值每增加1亿元,城镇人均消费支出增加元,人口自然增长率每增加1个百分点,城镇人均消费支出将减少元。
检验你在练习题中所建立的多元线性回归模型是否存在多重共线性。如果存在多重共线性,你能设法消除或减轻多重共线性的影响吗
【练习题参考解答】
此题无参考解答。