首页 > 公务员考试
题目内容 (请给出正确答案)
[单选题]

将数据集划分成训练集S和测试集T的常见方法有()。

A.以上均正确

B.交叉验证法

C.自助法

D.留出法

查看答案
答案
收藏
如果结果不匹配,请 联系老师 获取答案
您可能会需要:
您的账号:,可能还需要:
您的账号:
发送账号密码至手机
发送
安装优题宝APP,拍照搜题省时又省心!
更多“将数据集划分成训练集S和测试集T的常见方法有()。”相关的问题
第1题
Hive中“Groupby”指的是通过一定的规将每一个数据集划分成若干个小的数据集然后针对若干个小的数据集进行数据分组处理.()
点击查看答案
第2题
一个监督观测值集合会被划分为()。

A.训练集

B.验证集

C.测试集

D.预处理集

点击查看答案
第3题
在数据科学中,通常可以采用()方法有效避免数据加工和数据备份的偏见。

A.A/B测试

B.训练集和测试集的划分

C.测试集和验证集的划分

D.图灵测试

点击查看答案
第4题
Hive中“Group by”指的是通过一定的规则将每一个数据集划分成若干个小的数据集,然后针对若干个小的数据集进行数据分组处理。()
点击查看答案
第5题
在留出法、交叉验证法和自助法三种评估方法中,()更适用于数据集较小、难以划分训练集和测试集的情况。

A.留出法

B.交叉验证法

C.自助法

D.留一法

点击查看答案
第6题
训练模型过程中用到的数据,一般用来学习得到模型的权重的是()。

A.训练集

B.验证集

C.测试集

D.模拟集

点击查看答案
第7题
下列哪一种情况被称为过学习现象()

A.在训练集上A优于B,在测试集上A也优于B

B.在训练集上A优于B,在测试集上B优于A

C.相对于分类数据集,决策树过于简单

D.在训练集上决策树的误差很小

点击查看答案
第8题
随机森林利用随机的方式将许多决策树组合成一个森林,每个决策树在分类的时候决定测试样本的最终类别。它的优点是()。

A.级别划分较多的属性不会影响模型效果

B.在某些噪音较大的分类或回归问题上不会过拟合

C.每次学习使用不同训练集,一定程度避免过拟合

D.能够处理高纬度的数据,并且不做特征选择

点击查看答案
第9题
留出法直接将数据集划分为()个互斥的集合。

A.一

B.二

C.三

D.四

点击查看答案
第10题
我们想要减少数据集中的特征数,即降维.选择以下适合的方案:()。

A.使用前向特征选择方法

B.使用后向特征排除方法

C.我们先把所有特征都使用,去训练一个模型,得到测试集上的表现.然后我们去掉一个特征,再去训练,用交叉验证看看测试集上的表现.如果表现比原来还要好,我们可以去除这个特征

D.查看相关性表,去除相关性最高的一些特征

点击查看答案
退出 登录/注册
发送账号至手机
密码将被重置
获取验证码
发送
温馨提示
该问题答案仅针对搜题卡用户开放,请点击购买搜题卡。
马上购买搜题卡
我已购买搜题卡, 登录账号 继续查看答案
重置密码
确认修改