题目下面关于梯度下降的步长说法错误的是()
A.下降过程中的步长对于下降的速度没有影响
B.下降过程中如果步长较大,比较容易越过最低点
C.下降过程中如果步长较小,会增加计算量
D.下降过程中斜率对于逼近速度会有影响
A、下降过程中的步长对于下降的速度没有影响
A.下降过程中的步长对于下降的速度没有影响
B.下降过程中如果步长较大,比较容易越过最低点
C.下降过程中如果步长较小,会增加计算量
D.下降过程中斜率对于逼近速度会有影响
A、下降过程中的步长对于下降的速度没有影响
A.如何选择下降的方向
B.如何确定步长
C.何时停止运动
D.何时开始运动
A.如果学习率很小,则优化成本函数将花费大量时间
B.如果学习率非常高,则梯度下降可能永远不会收敛
C.学习率是使用损失函数导数和步长来计算的
D.学习率是梯度下降算法中的超参数
A.随机梯度下降是梯度下降中常用的一种
B.梯度下降包括随机梯度下降和批量梯度下降
C.梯度下降算法速度快且可靠
D.随机梯度下降是深度学习算法当中常用的优化算法之一
A.反向传播只能在前馈神经网络中运用
B.反向传播会经过激活函数
C.反向传播可以结合梯度下降算法更新网络权重
D.反向传播指的是误差通过网络反向传播
A.当优化问题的数值解接近局部最优值时,随着目标函数解的梯度接近或变为零,通过最终迭代获得的数值解可能仅使目标函数局部最优,而不是全局最优
B.在深度学习优化问题中,经常遇到的是梯度爆炸或梯度消失
C.优化问题中设置的学习率决定目标函数能否收敛到局部最小值,以及何时收敛到最小值
D.一般来说,小批量随机梯度下降比随机梯度下降和梯度下降的速度慢,收敛风险较大
A.梯度下降算法和特殊方程
B.梯度下降算法和正规方程
C.梯度下降算法和特殊矩阵
D.梯度下降算法和正规矩阵
A.当目标函数是凸函数时,梯度下降算法的解一般就是全局最优解
B.进行PCA降维时,需要计算协方差矩
C.沿负梯度的方向一定是最优的方向
D.利用拉格朗日函数能解带约束的优化问题
A.随机梯度下降
B.设置Momentum
C.设置不同初始值
D.增大batchsize