A.信息增益选择特征偏向于纯度较好的特征作为优先项
B.信息熵是度量样本纯度最常用的一种指标
C.ID3算法不仅能处理离散型数据,还能处理连续型数据
D.ID3算法可能会导致模型的泛化能力下降的问题
A.常见的决策树算法包括ID3、C4.5和CART算法
B.C4.5算法中属性选择使用信息增益率,避免了对属性值多的属性过度敏感
C.CART算法的基尼指数与ID3算法的信息增益都是用于属性选择
D.信息增益、信息增益率、基尼指数的计算结果不会影响决策树结构
A.ID3算法要求特征必须离散化
B.信息增益可以用熵,而不是GINI系数来计算
C.选取信息增益最大的特征,作为树的根节点
D.ID3算法是一个二叉树模型,即每个节点最多有两个分支
下面关于ID3算法中说法错误的是()
A.ID3算法要求特征必须离散化
B.信息增益可以用熵,而不是GINI系数来计算
C.选取信息增益最大的特征,作为树的根节点
D.ID3算法是一个二叉树模型
A.样本集中分类的比例越平均,信息熵越小
B.信息熵与信息增益成正比
C.信息增益越大,则特征能够为分类系统带来信息量越大
D.信息熵与信息增益成反比