A.各基分类器之间有较强依赖,不可以进行并行训练
B.最著名的算法之一是基于决策树基分类器的随机森林
C.当训练样本数量较少时,子集之间可能有重叠
D.为了让基分类器之间互相独立,需要将训练集分为若干子集
A.无法被用来产生更易于解释的描述性模型
B.规则集的表达能力远不如决策树好
C.基于规则的分类器都对属性空间进行直线划分,并将类指派到每个划分
D.非常适合处理类分布不平衡的数据集
A.传统的基于规则的方法,其中的规律可以人工显性的明确出来
B.传统基于规则的方法使用显性编程来解决问题
C.机器学习所中模型的映射关系必须是隐性的
D.机器学习中模型的映射关系是自动学习的
A.属性融合,识别同一属性的不同描述,比如性别的值,Female&男性可以进行融合
B.知识融合是将数据进行压缩的一种方式,用以解决数据重复占用存储的问题
C.实体融合,基于规则将相似的实体进行融合,比如上海爱数信息技术股份有限公司&上海爱数可以进行融合
D.关系融合,可以是基于算法融合,比如适用地区和适用区域,可以基于文本相似度>95%,进行融合
A.条件独立性假设不成立时,朴素贝叶斯分类器仍有可能产生最优贝叶斯分类器
B.在估计概率值时使用的拉普拉斯修正避免了因训练集样本不充分而导致概率估值为零的问题
C.由于马尔可夫链通常很快就能趋于平稳分布,因此吉布斯采样算法的收敛速度很快
D.二分类任务中两类数据满足高斯分布且方差相同时,线性判别分析产生贝叶斯最优分类器
A.算法的组合过程能减小偏差
B.基分类器要选择方差小、泛化能力强的弱分类器
C.只能解决二分类问题
D.异常数据(离群点)影响大
E.精度高,参数少,自适应能力强
F.不易实现并行化训练