“`” 特征A对训练数据集D的信息增益g(D,A) = H(D) – H(D|A) 由于特征A而使得对数据集D的分类的不确定性减少的程度。信息增益大的特征具有更强的分类能力。 <pre><code> "“` Was this helpful? YesNo 0 / 0 上一篇: L1、L2正则化 下一篇: 交叉熵 kl散度 发表回复 取消回复0 Your email address will not be published. 在此浏览器中保存我的显示名称、邮箱地址和网站地址,以便下次评论时使用。