A.时序分析
B.分类
C.聚类
D.关联分析
A.k-means聚类
B.系统聚类
C.基于密度的聚类方法
D.基于网格的聚类方法
A.不预先设定数据归类类目,完全根据数据本身趋势与结构进行不同类别的分组
B.要求同类数据间内容相似度尽可能小
C.要求不同类数据间内容相似度尽可能小
D.与分类挖掘技术一样,都是需要对数据进行分类处理
(i)一个学区中学校的最多数量和最少数量是多少?每个学区的学校平均数量是多少?
(ii)利用混合OLS(即将所有1848个学校混合在一起),估计一个将lavgsal与bs,lenrol,lstaff和lunch相联系的模型:也参见第9章的计算机练习C11。bs的系数和标准误是多少?
(iii)求对学区内聚类相关(和异方差性)保持稳健的标准误。bs的t统计量有何变化?
(iv)去掉bs>0.5的四个观测,仍用混合OLS,求出βbs及其聚类稳健标准误。现在,薪水与福利之间的替代关系,有更多的证据吗?
(v)容许一个学区内的学校存在一个共同的学区效应,用固定效应法估计这个方程。再次去掉bs>0.5的四个观测,现在,你对薪水与福利之间的替代关系有何结论?
(vi)根据你在第(iv)部分和第(v)部分的估计值,讨论通过学区固定效应而容许教师的薪酬在不同学区系统变化的重要性。