摘要:本发明公开了一种基于深度神经网络后验概率算法的口语发音评测方法,包括:步骤一:将语音按帧提取为音频特征向量序列;步骤二:将音频特征输入事先训练好的模型和口语评测文本、相应单词发音字典,确定音素状态的时间边界,该模型为DNN+HMM模型;步骤三:在确定时间边界后,提取时间边界内所有帧,按语音帧的帧长取平均值,作为该音素状态的后验概率,并得到基于音素状态后验的单词后验得分,单词的后验得分则为其所含的音素状态后验得分的平均值。
- 专利类型发明专利
- 申请人苏州驰声信息科技有限公司;
- 发明人惠寅华;王欢良;杨嵩;代大明;袁军峰;林远东;
- 地址215000 江苏省苏州市工业园区创意产业园9幢702室
- 申请号CN201410840991.4
- 申请时间2014年12月30日
- 申请公布号CN104575490A
- 申请公布时间2015年04月29日
- 分类号G10L15/00(2013.01)I;G10L15/06(2013.01)I;G10L15/14(2006.01)I;G10L25/69(2013.01)I;