没有必然联系,不过不同的损失函数可能产生不同程度地梯度消失问题 Was this helpful? YesNo 0 / 0 上一篇: dropout原理? 下一篇: Sigmoid 与tanh的区别优劣? 发表回复 取消回复0 Your email address will not be published. 在此浏览器中保存我的显示名称、邮箱地址和网站地址,以便下次评论时使用。