![](https://static.youtibao.com/asksite/comm/h5/images/m_q_title.png)
如果你的数据有许多异常值,那么使用数据的均值与方差去做标准化就不行了,在preprocessing模块中定义了哪个方法可以解决这个问题()。
A.normalizer()
B.robustscale()
C.maxabsscale()
D.scale()
![](https://static.youtibao.com/asksite/comm/h5/images/solist_ts.png)
A.normalizer()
B.robustscale()
C.maxabsscale()
D.scale()
A.检查异常值是很重要的,因为线性回归对离群效应很敏感
B.线性回归分析要求所有变量特征都必须具有正态分布
C.线性回归假设数据中基本没有多重共线性
D.以上说法都不对
A.数据有误。数据有误可能是两种原因造成的,一是人为地使用有误数据,二是未真正地掌握统计方法
B.数据的采集方法不正确。如果抽样方法本身有误,则其后的分析方法再正确也是无用的
C.数据的记录、抄写有误
D.异常值的处理。通常在生产过程中取得的数据总是含有一些异常值的,它们会导致分析结果有误
本题利用JTRAIN3.RAW中的数据。
(i)估计简单回归模型并用常用格式报告结论。基于这个回归,1976年和1977年的工作培训看上去对1978年的真实劳动工资有正的影响吗?
(ii)现在使用真实劳动工资的变化cre=re 78-re 75作为因变量。(由于我们假定1975年之前没有工作培训,所以我们没有必要对train进行差分。也就是说,如果我们定义ctrain=train 78-train75, 那么,由于train75=0,所以ctran=train78。)现在,培训的估计影响有多大?讨论它与第(i)部分估计值的比较。
(iii)利用通常的OLS标准误和异方差-稳健标准误求培训效应的95%置信区间,并描述你的结论。
A.面对金融危机,某市政府为当地的出口企业制定了许多扶贫政策,大量企业在国际竞争中脱颖而出
B.如果你没亲身参加过蹦极运动,那么它给人带来的巨大刺激你是无法感同身受的
C.易中天《品三国》一书出版后,收到许多读者的热烈欢迎,一时洛阳纸贵
D.考虑问题时没有大局意识,目无全牛,顾此失彼,这就是他决策失误的重要原因
(i)你为什么会把这些数据归类为聚类样本?大致上,你预期能从一个典型学生得到大概多少次观测?
(ii)写出一个类似于教材方程(14.12)那样的模型,用到课率和其他特征去解释期终考试成绩。以s作为学生下标和c作为课程下标,对同一个学生哪个变量是不变的?
(iii)如果你把所有的数据混合起来并使用OLS,那么,对影响成绩和到课率的非观测学生特征,你正在做什么假定呢?SAT和学期前GPA在这方面扮演着什么角色呢?
(iv)如果你认为SAT和学期前GPA不足以刻画学生能力,你如何估计到课率对期终考试成绩的影响呢?
参考答案:
6.利用计量经济软件中的“聚类”选项,便得到教材表14-2中混合OLS估计值充分稳健[即对复合误差(vit:t=1,···,T)中的序列相关和异方差性保持稳健]的标准误为:
(i)这些标准误与非稳健标准误相比一般如何?为什么?
(ii)混合OLS的稳健标准误与RE的标准误相比如何?解释变量是否随时间变化有什么关系吗?