“`” 语言模型的作用之一为消解多音字的问题,在声学模型给出发音序列之后,从候选的文字序列中找出概率最大的字符串序列。
目前使用kenlm(<a class=""url"" href=""https://github.com/kpu/kenlm"" target=""_blank"">https://github.com/kpu/kenlm</a>)训练bi-gram语言模型。bi-gram表示当前时刻的输出概率只与前一个时刻有关。即
P(X<em>{n} | X</em>{n-1},…,X<em>{1}) = P(X</em>{n} | X_{n-1}) 。
<pre><code> "“`
Was this helpful?
0 /
0