摘要:本发明公开了一种基于深度学习的误发音检测方法和装置,方法包括:步骤1)通过朗读音频提取声学特征,通过朗读文本和相应的单词发音字典构建音素级解码网络;步骤2)结合声学特征和预先训练好的声学模型对音素级解码网络进行解码确定待检测音素的边界;基于由深度神经网络构成的深度自动编码器,根据音素的边界和边界内的声学特征提取音素级特征,所述深度神经网络为一深度贝叶斯置信网络;将待检测音素的音素级特征送入事先训练好的发音正误分类器,判断待检测音素的发音正误。
- 专利类型发明专利
- 申请人苏州驰声信息科技有限公司;
- 发明人惠寅华;王欢良;杨嵩;黄正伟;方敏;袁军峰;戚自力;
- 地址215000 江苏省苏州市工业园区星湖街328号创意产业园9-902单元
- 申请号CN201610662367.9
- 申请时间2016年08月12日
- 申请公布号CN106297828A
- 申请公布时间2017年01月04日
- 分类号G10L25/78(2013.01)I;