题目关于梯度下降算法和正规方程的比较,下列说法错误的是()
A.梯度下降算法需要选择学习率,正规方程则不需要
B.梯度下降算法需要迭代运算多次,正规方程只需要运算一次
C.梯度下降算法和正规方程都适用于各种类型的模型
D.梯度下降算法对特征量大时也能很好的适用,正规方程耗时太多不太适用
E.解析
F.所以选择C
C、梯度下降算法和正规方程都适用于各种类型的模型
A.梯度下降算法需要选择学习率,正规方程则不需要
B.梯度下降算法需要迭代运算多次,正规方程只需要运算一次
C.梯度下降算法和正规方程都适用于各种类型的模型
D.梯度下降算法对特征量大时也能很好的适用,正规方程耗时太多不太适用
E.解析
F.所以选择C
C、梯度下降算法和正规方程都适用于各种类型的模型
A.梯度方向是函数值下降最快方向
B.梯度下降算法是一种使得损失函数最小化的方法
C.梯度下降算法用来优化深度学习模型的参数
D.梯度反方向是函数值下降最快方向
A.随机梯度下降是梯度下降中常用的一种
B.梯度下降包括随机梯度下降和批量梯度下降
C.梯度下降算法速度快且可靠
D.随机梯度下降是深度学习算法当中常用的优化算法之一
A.反向传播只能在前馈神经网络中运用
B.反向传播会经过激活函数
C.反向传播可以结合梯度下降算法更新网络权重
D.反向传播指的是误差通过网络反向传播
A.如果学习率很小,则优化成本函数将花费大量时间
B.如果学习率非常高,则梯度下降可能永远不会收敛
C.学习率是使用损失函数导数和步长来计算的
D.学习率是梯度下降算法中的超参数
A.贝叶斯算法
B.支持向量机算法
C.神经网络算法
D.决策树算法
A.当目标函数是凸函数时,梯度下降算法的解一般就是全局最优解
B.进行PCA降维时,需要计算协方差矩
C.沿负梯度的方向一定是最优的方向
D.利用拉格朗日函数能解带约束的优化问题
A.先反向传播计算出误差,再正向传播计算梯度
B.只有反向传播计算梯度
C.只有反向传播计算输出结果
D.先正向传播计算出误差,再反向传播计算梯度
以下哪项是对早期停止(early stop)的最佳描述?()
A.训练网络直到达到误差函数中的局部最小值
B.在每次训练期后在测试数据集上模拟网络,当泛化误差开始增加时停止训练
C.在中心化权重更新中添加一个梯度下降加速算子,以便训练更快地收敛
D.更快的方法是反向传播算法