首页 > 其他

题目内容（请给出正确答案）

[单选题]

如果需要训练的特征维度成千上万，在高维情形下出现的数据样本稀疏、距离计算困难。我们通过什么方法可以缓解这个问题（）。

A.K均值算法

B.支持向量机

C.降维

D.以上答案都不正确

查看答案

如果结果不匹配，请联系老师获取答案

您可能会需要：

重置密码查看订单联系客服

安装优题宝APP，拍照搜题省时又省心！

更多“如果需要训练的特征维度成千上万，在高维情形下出现的数据样本稀…”相关的问题

第1题

当我们在分析一份数据的时候，如果发现这份数据的特征变量很多，成千上万，如果直接基于所有的特征变量进行分析，会浪费过多的时间成本及计算资源，为了应对这种情况，我们可以采用降维的方式对数据进行预处理，如下技术中，哪些属于降维技术？（）

A.主成分分析

B.因子分析

C.独立主成分分析

D.SVM

点击查看答案

第2题

得到特征后一定要进行特征降维吗（)

A.并不是一定要进行特征降维，可以自行分析生成结果，判断是否需要

B.必须要进行，否则会对分类结果造成巨大影响

C.没必要进行，特征的维度对分类结果没有影响

D.其余三个说法都不对

点击查看答案

第3题

以下关于随机森林算法的描述中错误的是（）。

A.可以处理高维度的属性，并且不用做特征选择

B.随机森林的预测能力不受多重共线性影响

C.也擅长处理小数据集和低维数据集的分类问题

D.能应对正负样本不平衡问题

点击查看答案

第4题

我们想要训练一个ML模型，样本数量有100万个，特征维度是5000，面对如此大数据，如何有效地训练模型（）。

A.对训练集随机采样，在随机采样的数据上建立模型

B.尝试使用在线机器学习算法

C.使用PCA算法减少特征维度

点击查看答案

第5题

我们想要减少数据集中的特征数，即降维.选择以下适合的方案：（）。

A.使用前向特征选择方法

B.使用后向特征排除方法

C.我们先把所有特征都使用，去训练一个模型，得到测试集上的表现.然后我们去掉一个特征，再去训练，用交叉验证看看测试集上的表现.如果表现比原来还要好，我们可以去除这个特征

D.查看相关性表，去除相关性最高的一些特征

点击查看答案

第6题

特征选择的必要性体现在？（)

A.减少训练的时间

B.提升模型泛化能力,避免过拟合

C.简化模型,使之容易被解释

D.避免维度爆炸问题

点击查看答案

第7题

关于降维说法正确的是（）。

A.PA是根据方差这一属性降维的

B.降维可以防止模型过拟合

C.降维降低了数据集特征的维度

D.降维方法有PLA等

点击查看答案

第8题

关于数据维度，以下选项中描述错误的是（)。

A.数据维度包括一二维、多维和高维数据

B.所有数据都能用维度方式表示

C.图像由于存在长宽，所以图像数据是二维数据

D.一维数据可能存在顺序，也可以没有顺序

点击查看答案

第9题

以下关于数据维度的描述，正确的是（）。

A.采用列表表示一维数据，不同数据类型的元素是可以的

B.JSON格式可以表示比二维数据还复杂的高维数据

C.二维数据可以看成是一维数据的组合形式

D.字典不可以表示二维以上的高维数据

点击查看答案

第10题

模式识别系统由模式采集，预处理与特征生成，特征降维，分类器训练构成。（)

点击查看答案

第11题

关于数据组织的维度，以下选项中描述正确的是（）。

A.数据组织存在维度，字典类型用于表示一维和二维数据

B.高维数据有键值对类型的数据构成，采用对象方式组织

C.二维数据采用表格方式组织，对应于数学中的矩阵

D.一维数据采用线性方式组织，对应于数学中的数组和集合等概念

点击查看答案

湘ICP备20011576号-2 营业执照

违法和不良信息举报电话：400-118-7898

举报/反馈/投诉邮箱：deng＃ujigu.com（请将＃替换成@）