题目内容
(请给出正确答案)
[多选题]
在分类问题中,我们经常会遇到正负样本数据量不等的情况比如正样本为10w条数据,负样本只有1w条数据,以下最合适的处理方法是()。
A.将负样本重复10次生成10w样本量打乱顺序参与分类
B.直接进行分类可以最大限度利用数据
C.从10w正样本中随机抽取1w参与分类
D.将负样本每个权重设置为10,正样本权重为1,参与训练过程
查看答案
如果结果不匹配,请 联系老师 获取答案
A.将负样本重复10次生成10w样本量打乱顺序参与分类
B.直接进行分类可以最大限度利用数据
C.从10w正样本中随机抽取1w参与分类
D.将负样本每个权重设置为10,正样本权重为1,参与训练过程
A.随机梯度下降
B.设置Momentum
C.设置不同初始值
D.增大batchsize
A.可以处理高维度的属性,并且不用做特征选择
B.随机森林的预测能力不受多重共线性影响
C.也擅长处理小数据集和低维数据集的分类问题
D.能应对正负样本不平衡问题
A.我们需要在n类分类问题中适合n个模型
B.我们需要适合n-1个模型来分类为n个类
C.我们需要只适合1个模型来分类为n个类
D.以上答案都不正确
A.级别划分较多的属性不会影响模型效果
B.在某些噪音较大的分类或回归问题上不会过拟合
C.每次学习使用不同训练集,一定程度避免过拟合
D.能够处理高纬度的数据,并且不做特征选择
A.外交官在对外交往中遭遇的困境
B.古老文明走向世界需要突破的难关
C.我国在对外传播和交往中存在的误区
D.中西不同文化间客观上存在的隔膜
A.〇 位置约束
B.〇 固定设备和工具约束
C.〇 清洁约束
D.〇 疲劳约束