本题使用GPA2.RAW中的数据。
(i)考虑方程
其中,colgpa表示累积的大学GPA,hsize表示高中毕业年级以百人计的规模,hsperc表示在毕业年级中学术排名的百分位,sat表示SAT综合分数,female是一个二值变量,而athlete也是一个运动员取值1的二值变量。你对这个方程中的系数有何预期?哪些你没有把握?
(ii)估计第(i)部分中的方程,并以通常的形式报告结果。估计运动员和非运动员之间GPA的差异是多少?它是统计显著的吗?
(ii)从模型中去掉sat并重新估计这个方程。现在,作为运动员的估计影响是多大?讨论为什么这个估计值不同于第(ii)部分的结论。
(iv)在第(i)部分的模型中,容许作为运动员的影响会因性别不同而不同。检验如下原假设:在其他条件不变的情况下,女生是否是运动员没有差别。
(v)sat对colgpa的影响会因性别不同而不同吗?讲出你的根据。
IV),但分别在乙醇溶液中加热,则无论(I)还是(II)均得到(III)和(IV)的混合物。为什么?
利用CPS78_85.RAW中的数据。
(i)你怎样解释教材方程(13.2)中y85的系数?对它有没有一种令人感兴趣的解释?(这里你要小心;你必须说明交互项y85·educ和y85·female。)
(ii)保持其他因素不变,你估计一个接受了12年教育的男子的名义工资增加了多少个百分点?给出一种回归以得到这个估计值的一个置信区间。[提示:为了得到这个置信区间,要用y85-(educ-12)取代y85-educ;]
(iii)令所有的工资均以1978年美元计算,重新估计教材方程(13.2)。具体地说,定义1978年的真实工资为rwage=wage,而1985年的真实工资为rwage=wage/1.65。现在估计教材(13.2)时用log(rwage)代替log(wage)。哪些系数将不同于教材方程(13.2)中的系数?
(iv)解释为什么你在第(iii)部分中的回归给出的R²不同于教材方程(13.2)所给出的R。
(提示:两个回归的残差,从而残差平方和是相同的。)
(V)试描述从1978年到1985年参加工会的作用起了什么变化?
(vi)从教材方程(13.2)开始,检验会员工资差别是否随时间而变。(应使用简单的t检验。)
(vii)你在第(v)和(vi)两部分中的结论是否相互矛盾?试解释。
A.305份
B.335份
C.410份
D.450份