本题使用GPA2.RAW中的数据。
(i)考虑方程
其中,colgpa表示累积的大学GPA,hsize表示高中毕业年级以百人计的规模,hsperc表示在毕业年级中学术排名的百分位,sat表示SAT综合分数,female是一个二值变量,而athlete也是一个运动员取值1的二值变量。你对这个方程中的系数有何预期?哪些你没有把握?
(ii)估计第(i)部分中的方程,并以通常的形式报告结果。估计运动员和非运动员之间GPA的差异是多少?它是统计显著的吗?
(ii)从模型中去掉sat并重新估计这个方程。现在,作为运动员的估计影响是多大?讨论为什么这个估计值不同于第(ii)部分的结论。
(iv)在第(i)部分的模型中,容许作为运动员的影响会因性别不同而不同。检验如下原假设:在其他条件不变的情况下,女生是否是运动员没有差别。
(v)sat对colgpa的影响会因性别不同而不同吗?讲出你的根据。
A.篮球比赛中双方各出场5名队员,但通常每支职业篮球队有12-15人
B.某公司每年都会招一批大学生,让他们在各个岗位实习,作为储备干部培养
C.某物业配电室配备了两个人,即使一人有事外出,也可以保证有人值班
D.设计部的一名员工辞职,公司立即从质检部抽人兼任,同时人力资源部开始紧急招人
A.根据水库最大水位变幅,在满足计算精度和便于查询的前提下,按水位由低到高,将水库划分为若干等步长或不等步长的计算段(一般应不少于5段或计算步长不大于1米)
B.蓄能计算水位中应包含常用特征水位、水库库容曲线中明显的拐点水位及机组工况发生显著变化的水位等
C.计算区段的耗水率取计算段上、下限水位对应的平均耗水率。尾水位可采用多年实际运行平均尾水位、设计尾水位或保证出力对应的尾水位
D.根据需要按有关插值办法补充一些必要的水位点及其蓄能值,编绘水位~蓄能值关系表格和曲线,经合理性检查和修正后使用
其中,因为滞后支出变量,第一个可用年份(基年)是1993年。
(i)用混合OLS估计模型, 并报告通常的标准误。为使得ai的期望值可以非零, 你应该与年度虚拟变量一起包含一个截距项。支出变量的估计效应是什么?求OLS残差。
(ii)lunchit系数的符号在意料之中吗?解释系数的大小。你认为学区的贫穷率对考试通过率有很大的影响吗?
(iii)利用的回归计算AR(1)序列相关的一个检验。你应该在回归中使用1994~1998年的数据。验证存在很强的正序列相关,并讨论为什么。
(iv)现在用固定效应法估计方程。滞后的支出变量仍显著吗?
(v)你为什么认为在固定效应估计中,注册学生人数和午餐项目变量不是联合显著的?
A.单克隆抗体技术
B.克隆技术
C.DNA指纹技术
D.都不对
本题利用NBASAL.RAW中的数据。
(i)估计一个线性回归模型,将单场得分与联赛中打球经历和位置(后卫、前锋或中锋)联系起来。包括打球经历的二次项形式,并将中锋作为基组。以通常的形式报告结果。
(ii)在第(i)部分中,你为什么不将所有三个位置虚拟变量包括进来?
(iii)保持经历不变,一个后卫的得分比一个中锋多吗?多多少?这个差异统计显著吗?
(iv)现在,将婚姻状况加入方程。保持位置和经历不变,已婚球员是否更高效(就单场得分来说)?
(v)加入婚姻状况和两个经历变量的交互项。在这个扩展的模型中,是否存在有力的证据表明婚姻状况影响单场得分?
(vi)使用单场助攻次数作为因变量估计(iv)中的模型。与(iv)的结果有明显的差异吗?请讨论。