利用GPA2.RAW中的数据,可估计出如下方程:
变量sat是SAT的综合分数,hsize是以百人计的学生所在高中毕业年级的学生规模,female是一个性别虚拟变量,而black是一个种族虚拟变量(黑人取值1,其他人则取值0)。
(i)有很强的证据支持模型中应该包括hsize”吗?从这个方程来看,最优的高中规模是什么?
(ii)保持hsize不变,非黑人女性和非黑人男性之间SAT分数的估计差异是多少?这个估计差异的统计显著性如何?
(iii)非黑人男性和黑人男性之间SAT分数的估计差异是多少?检验其分数没有差异的原假设,备择假设是他们的分数存在差异。
(iv)黑人女性和非黑人女性之间SAT分数的估计差异是多少?为了检验这个差异的统计显著性,你需要怎么做?
为了检验工作培训项目对工人以后工资的有效性,我们设定了模型
其中,train表示的虚拟变量,在工人参与这个项目时取值1.想象误差项包括了无法观测的工人能力。如果能力越低的工人被选派去参加这个项目的机会就越大,而且你使用了一个OLS分析,那么你认为β1的OLS估计量可能有什么样的偏误?
对(许多美国工人可用的)401(k)养老金计划的出现是否提高了净储蓄,吸引了大量研究兴趣。数据集401KSUBS.RAW包含了有关净金融资产(nettfa)、家庭收入(ic)、是否有资格参与401(k)计划的二值变量(e401k)和其他几个变量的信息。
(i)样本中有资格参与一个401(k)计划的家庭比例是多少?
(ii)估计一个用收入、年龄和性别解释401(k)资格的线性概率模型。包括收入和年龄的二次项,并以通常形式报告结论。
(iii)你认为401(k)资格独立于收入和年龄吗?性别呢?请解释。
(iv)求第(ii)部分中估计的线性概率模型的拟合值。有小于0或大于1的拟合值吗?
(v)利用第(iv)部分中的拟合值e401k1,定义e401k1在e401k≥0.5时取值1,并在2e401k<0.5时取值0。在9275个家庭中,预计有多少家庭有资格参与401(k)计划?
(vi)对于没有资格参加401(k)的5638个家庭,利用预测值e401k1,预测其中有多大比例没有401(k)?对于有资格参加401(k)的3637个家庭,其中有多大比例的家庭有401(k)?(如果你的计量经济软件具有“制表”命令更好。)
(vii)总正确预测比约为64.9%。给定第(vi)部分的答案,你认为这是模型好坏的一个完备描述吗?
(viii)在线性概率模型中增加一个解释变量pira。其他条件不变,若一个家庭有某人拥有个人退休金账户,一个家庭有资格参与401(k)计划的估计概率会提高多少?在10%的显著性水平上,它统计显著异于0吗?
本题使用GPA2.RAW中的数据。
(i)考虑方程
其中,colgpa表示累积的大学GPA,hsize表示高中毕业年级以百人计的规模,hsperc表示在毕业年级中学术排名的百分位,sat表示SAT综合分数,female是一个二值变量,而athlete也是一个运动员取值1的二值变量。你对这个方程中的系数有何预期?哪些你没有把握?
(ii)估计第(i)部分中的方程,并以通常的形式报告结果。估计运动员和非运动员之间GPA的差异是多少?它是统计显著的吗?
(ii)从模型中去掉sat并重新估计这个方程。现在,作为运动员的估计影响是多大?讨论为什么这个估计值不同于第(ii)部分的结论。
(iv)在第(i)部分的模型中,容许作为运动员的影响会因性别不同而不同。检验如下原假设:在其他条件不变的情况下,女生是否是运动员没有差别。
(v)sat对colgpa的影响会因性别不同而不同吗?讲出你的根据。
在近来的一篇论文中,埃文斯和施瓦布(EvansandSchwab,1995)研究了就读于天主教高中对将来读大学的概率所产生的影响。为具体起见,令college为二值变量,如果读大学则等于1,否则为0。令CahHS也为二值变量,如果就读于天主教高中则等于1.一个线性概率模型是:
college=β0+β1CathHS+其他因素+u
其中其他因素包括性别、种族、家庭收入和父母的受教育程度。
(i)为什么CathHS可能与u相关?
(ii)埃文斯和施瓦布拥有关于每个学生在大二时进行的标准化测验成绩数据。我们用这些变量能做些什么,以改进就读于天主教高中在其余条件不变情况下的估计值?
(iii)令CathRel为二值变量,若学生是天主教徒则等于1。讨论它成为前面方程中CathHS的一个有效的ⅣV所需要的两个要求。其中哪个可加以检验?
(iv)不足为奇,作为天主教徒对是否就读于一所天主教高中有显著的影响。你认为CathRel作为CathHS的工具变量令人信服吗?
A.单变量求解是指,指出一个变量的可能取值来达到设定目标值的方法
B.选择“工具”菜单中的“单变量求解”即可打开单变量求解对话框
C.作单变量求解时必须指定一个含有公式的目标单元格
D.以上答案都正确
令math10表示密歇根州高中学生在一次标准化数学考试中的及格百分比(也可参见例4.2)。我们感兴趣的是估计每个学生的支出对其数学成绩的影响。一个简单的模型是
其中,poverty表示贫困生的比例。变量Inchprg表示学校有资格享受联邦政府午餐资助计划的学生比例。为什么它是povert的一个合适的代理变量?
(ii)下表包含了有和没有Inchprg作为解释变量时的OLS估计值。解释为什么支出对mathl0的影响在列(2)比在列(1)要低。列(2)中的这种影响在统计上仍大于1吗?
(iii)在其他条件相同的情况下,越大的学校通过率越低吗?请解释。
(iv)解释列(2)中Inchprg的系数。
(v)你如何理解R从列(1)到列(2)的显著提高?