以在前向传播的过程中,以一定概率地让一些神经元停止工作,来降低模型的复杂度,类似于模型平均 Was this helpful? YesNo 0 / 0 上一篇: 说一下卷积神经网络 下一篇: 梯度消失问题和损失函数有关吗? 发表回复 取消回复0 Your email address will not be published. 在此浏览器中保存我的显示名称、邮箱地址和网站地址,以便下次评论时使用。