建立线性模型时,我们看变量之间的相关性。在寻找相关矩阵中的相关系数时,如果发现3对变量(Var1和Var2、Var2和Var3、Var3和Var1)之间的相关性分别为-0.98、0.45和1.23。我们能从中推断出什么呢()。
A.Var1和Var2具有很高的相关性
B.Var1和Var2存在多重共线性,模型可以去掉其中一个特征
C.Var3和Var1相关系数为1.23是不可能的
D.以上答案都不正确
A.Var1和Var2具有很高的相关性
B.Var1和Var2存在多重共线性,模型可以去掉其中一个特征
C.Var3和Var1相关系数为1.23是不可能的
D.以上答案都不正确
A.向前选择法是从模型中没有自变量开始,然后将所有自变量依次增加到模型中
B.向后剔除法是先对所有自变量拟合线性回归模型,然后依次将所有自变量剔除模型
C.逐步回归法是将向前选择法和向后剔除法结合起来,但不能保证得到的回归模型一定就显著
D.逐步回归法选择变量时,在前面步骤中增加的自变量在后面的步骤中有可能被剔除,而在前面步骤中剔除的自变量在后面的步骤中也可能重新进入到模型中
利用数据集401KSUBS.RAW。
(i)利用OLS估计e401k的一个线性概率模型,解释变量为inc,inc²,age,age²和male。求通常的OLS标准误和异方差-稳健的标准误。它们有重要差别吗?
(iii)对第(i)部分估计的模型求怀特检验,并分析系数估计值是否大致对应于第(ii)部分中描述的理论值。
(iv)在验证了第(i)部分的拟合值都介于0和1之间后,求这个线性概率模型的加权最小二乘估计值。它们与OLS估计值有重大差别吗?
本题利用TRAFFIC 2.RAW中的数据。前面的计算机习题C 10.11曾要求你分析这些数据。
(i)计算变量prc fat的一阶自相关系数。你认为prc fat包含单位根吗?失业率也一样吗?
(ii)估计一个将prc fal的一阶差分Aprcfat与计算机习题C10.11第(vi) 部分中同样变量相联系的多元回归模型,只是你还应该对失业率进行一阶差分。于是,模型中包含一个线性时间趋势、月度虚拟变量、周末变量和两个政策变量:不要将这些变量进行差分。你发现了什么有意思的结论吗?
(iii)评论如下命题:“在进行多元回归之前,我们总应该将怀疑具有单位根的时间序列进行一阶差分,因为这样做是一种安全策略,而且应该得到与使用水平值类似的结论。”[在回答这个问题时,最好先做(如果你还没有做过的话)计算机习题C10.11第(vi)部分中的回归。]
只用一个解释变量,求组间估计量的方程为其中上横线表示不同时期的平均。由于我们已经在这个方程中包含了一个截距, 所以我们可以假定E(ai)=0。假设对所有时期都成立(因为在横截面中随机抽样,所以对所有的;也都成立)。
(iii)如果不同时期的解释变量不是很相关,对于时期数越多,组间估计量之间的不一致性越小的观点,第(ii)部分有何结论?
(iii)由(ii)可知,xit是两两不相关的,大小是不一致的,且随着T线性增长。符号依赖于xit与ai的协方差。