本题利用NBASAL.RAW中的数据。
(i)估计一个线性回归模型,将单场得分与联赛中打球经历和位置(后卫、前锋或中锋)联系起来。包括打球经历的二次项形式,并将中锋作为基组。以通常的形式报告结果。
(ii)在第(i)部分中,你为什么不将所有三个位置虚拟变量包括进来?
(iii)保持经历不变,一个后卫的得分比一个中锋多吗?多多少?这个差异统计显著吗?
(iv)现在,将婚姻状况加入方程。保持位置和经历不变,已婚球员是否更高效(就单场得分来说)?
(v)加入婚姻状况和两个经历变量的交互项。在这个扩展的模型中,是否存在有力的证据表明婚姻状况影响单场得分?
(vi)使用单场助攻次数作为因变量估计(iv)中的模型。与(iv)的结果有明显的差异吗?请讨论。
本题利用TRAFFIC 2.RAW中的数据。前面的计算机习题C 10.11曾要求你分析这些数据。
(i)计算变量prc fat的一阶自相关系数。你认为prc fat包含单位根吗?失业率也一样吗?
(ii)估计一个将prc fal的一阶差分Aprcfat与计算机习题C10.11第(vi) 部分中同样变量相联系的多元回归模型,只是你还应该对失业率进行一阶差分。于是,模型中包含一个线性时间趋势、月度虚拟变量、周末变量和两个政策变量:不要将这些变量进行差分。你发现了什么有意思的结论吗?
(iii)评论如下命题:“在进行多元回归之前,我们总应该将怀疑具有单位根的时间序列进行一阶差分,因为这样做是一种安全策略,而且应该得到与使用水平值类似的结论。”[在回答这个问题时,最好先做(如果你还没有做过的话)计算机习题C10.11第(vi)部分中的回归。]
A.直线回归分析的两相关变量可区分为自变量和依变量
B.直线相关分析研究的变量呈平行关系
C.两相关变量间的决定系数等于其相关系数的平方
D.相关系数可用回归系数表示,反之则不然
A.对同一组数据来说,回归系数和相关系数的假设检验是不等价的
B.直线回归分析的两相关变量可区分为自变量和依变量
C.两相关变量间的决定系数等于其相关系数的平方
D.相关系数可用回归系数表示,反之则不然
E.相关变量x与y的直线回归分析中,回归系数显著表明x与y一定呈直线关系
利用CPS78_85.RAW中的数据。
(i)你怎样解释教材方程(13.2)中y85的系数?对它有没有一种令人感兴趣的解释?(这里你要小心;你必须说明交互项y85·educ和y85·female。)
(ii)保持其他因素不变,你估计一个接受了12年教育的男子的名义工资增加了多少个百分点?给出一种回归以得到这个估计值的一个置信区间。[提示:为了得到这个置信区间,要用y85-(educ-12)取代y85-educ;]
(iii)令所有的工资均以1978年美元计算,重新估计教材方程(13.2)。具体地说,定义1978年的真实工资为rwage=wage,而1985年的真实工资为rwage=wage/1.65。现在估计教材(13.2)时用log(rwage)代替log(wage)。哪些系数将不同于教材方程(13.2)中的系数?
(iv)解释为什么你在第(iii)部分中的回归给出的R²不同于教材方程(13.2)所给出的R。
(提示:两个回归的残差,从而残差平方和是相同的。)
(V)试描述从1978年到1985年参加工会的作用起了什么变化?
(vi)从教材方程(13.2)开始,检验会员工资差别是否随时间而变。(应使用简单的t检验。)
(vii)你在第(v)和(vi)两部分中的结论是否相互矛盾?试解释。