首页 > 继续教育

题目内容（请给出正确答案）

[单选题]

假如我们使用Lasso回归来拟合数据集，该数据集输入特征有100个（X1，X2，...，X100）。现在，我们把其中一个特征值扩大10倍（例如是特征X1），然后用相同的正则化参数对Lasso回归进行修正。那么，下列说法正确的是（）。

A.特征X1很可能被排除在模型之外

B.特征X1很可能还包含在模型之中

C.无法确定特征X1是否被舍

D.以上答案都不正确

查看答案

如果结果不匹配，请联系老师获取答案

您可能会需要：

重置密码查看订单联系客服

安装优题宝APP，拍照搜题省时又省心！

更多“假如我们使用Lasso回归来拟合数据集，该数据集输入特征有1…”相关的问题

第1题

如果我使用数据集的全部特征并且能够达到100%的准确率，但在测试集上仅能达到70%左右，这说明模型欠拟合。（）

点击查看答案

第2题

利用数据集GPA1.RAW。（i)利用OLS估计一个将colGPA与hsGPA，ACT，skipped和PC相联系的模型。求OLS

利用数据集GPA1.RAW。

(i)利用OLS估计一个将colGPA与hsGPA，ACT，skipped和PC相联系的模型。求OLS残差。

(ii)计算异方差性的怀特检验特殊情形。在对colGPA，和colGPA，的回归中，求拟合值。

(iii)验证第(ii)部分得到的拟合值都严格为正。然后利用权数1/h求加权最小二乘估计值。根据对应的OLS估计值，将逃课和拥有计算机之影响的加权最小二乘估计值与对应OLS估计值相比较。它们的统计显著性如何？

(iv)在第(iii)部分的WLS估计中，求异方差-稳健的标准误。换言之，容许第(ii)部分中所估计的方差函数可能误设(参见问题8.4)。标准误与第(iii)部分相比有很大变化吗？

点击查看答案

第3题

随机森林利用随机的方式将许多决策树组合成一个森林，每个决策树在分类的时候决定测试样本的最终类别。它的优点是（)。

A.级别划分较多的属性不会影响模型效果

B.在某些噪音较大的分类或回归问题上不会过拟合

C.每次学习使用不同训练集，一定程度避免过拟合

D.能够处理高纬度的数据，并且不做特征选择

点击查看答案

第4题

关于降维说法正确的是（）。

A.PA是根据方差这一属性降维的

B.降维可以防止模型过拟合

C.降维降低了数据集特征的维度

D.降维方法有PLA等

点击查看答案

第5题

一个回归模型存在多重共线问题。在不损失过多信息的情况下，可如何处理（）。

A.剔除所有的共线性变量

B.剔除共线性变量中的一个

C.通过计算方差膨胀因子（VarianceInflationFactor，VIF）来检查共线性程度，并采取相应措施

D.删除相关变量可能会有信息损失，我们可以不删除相关变量，而使用一些正则化方法来解决多重共线性问题，例如Ridge或Lasso回归

点击查看答案

第6题

正则化在深度学习中经常会使用到,我们在深度学习常用正则化方法解决什么问题？（）

A.XOR问题

B.过拟合问题

C.数据不平衡问题

D.梯度消失问题

点击查看答案

第7题

我们想要训练一个ML模型，样本数量有100万个，特征维度是5000，面对如此大数据，如何有效地训练模型（）。

A.对训练集随机采样，在随机采样的数据上建立模型

B.尝试使用在线机器学习算法

C.使用PCA算法减少特征维度

点击查看答案

第8题

以下哪项容易导致机器学习中的过拟合问题？（）

A.增加训练集量

B.减少神经网络隐藏层节点数

C.删除稀疏的特征

D.SVM算法中使用高斯核/RBF核代替线性核

点击查看答案

第9题

我们想要减少数据集中的特征数，即降维.选择以下适合的方案：（）。

A.使用前向特征选择方法

B.使用后向特征排除方法

C.我们先把所有特征都使用，去训练一个模型，得到测试集上的表现.然后我们去掉一个特征，再去训练，用交叉验证看看测试集上的表现.如果表现比原来还要好，我们可以去除这个特征

D.查看相关性表，去除相关性最高的一些特征

点击查看答案

第10题

利用数据集401KSUBS.RAW。（i)利用OLS估计e401k的一个线性概率模型，解释变量为inc，inc²，age，a

利用数据集401KSUBS.RAW。

(i)利用OLS估计e401k的一个线性概率模型，解释变量为inc，inc²，age，age²和male。求通常的OLS标准误和异方差-稳健的标准误。它们有重要差别吗？

(iii)对第(i)部分估计的模型求怀特检验，并分析系数估计值是否大致对应于第(ii)部分中描述的理论值。

(iv)在验证了第(i)部分的拟合值都介于0和1之间后，求这个线性概率模型的加权最小二乘估计值。它们与OLS估计值有重大差别吗？

点击查看答案

第11题

假设我们拥有一个已完成训练的、用来解决车辆检测问题的深度神经网络模型，训练所用的数据集由汽车和卡车的照片构成，而训练目标是检测出每种车辆的名称（车辆共有10种类型）。现在想要使用这个模型来解决另外一个问题，问题数据集中仅包含一种车（福特野马）而目标变为定位车辆在照片中的位置（）。

A.除去神经网络中的最后一层，冻结所有层然后重新训练

B.对神经网络中的最后几层进行微调，同时将最后一层（分类层）更改为回归层

C.使用新的数据集重新训练模型

D.所有答案均不对

点击查看答案

湘ICP备20011576号-2 营业执照

违法和不良信息举报电话：400-118-7898

举报/反馈/投诉邮箱：deng＃ujigu.com（请将＃替换成@）