A.级别划分较多的属性不会影响模型效果
B.在某些噪音较大的分类或回归问题上不会过拟合
C.每次学习使用不同训练集,一定程度避免过拟合
D.能够处理高纬度的数据,并且不做特征选择
A.一个音位的不同变体
B.两个音位:i是一个音位、-i(前)、-i(后)是一个音位
C.两个音位:i和-i(前)是一个音位、-i(后)是一个音位
D.三个音位
A.对训练集随机采样,在随机采样的数据上建立模型
B.尝试使用在线机器学习算法
C.使用PCA算法减少特征维度
A.把NaN直接作为一个特征,假设用0表示
B.用均值填充
C.用随机森林等算法预测填充
D.以上答案都不正确
A.随机森林是减少模型的方差,而GBDT是减少模型的偏差
B.组成随机森林的树可以并行生成,而GBDT是串行生成
C.随机森林的结果是多数表决表决的,而GBDT则是多棵树累加之和