摘要:一种基于实时解码的语音端点检测方法,步骤为:输入语音识别相关文本,解析文本;根据文本解析结果构建解码网络;输入语音,提取语音中的声学特征,基于构建的解码网络对所述声学特征进行解码,得到解码后的语音单元序列;对解码后的语音单元序列进行语音端点判断,判断是否是语音端点,所述语音端点分为语音开始点和语音结束点;如果判断结果是语音结束点,则把语音结束点信息反馈给外部外部应用系统,否则继续第二步;在第三步中语音开始点判断是可选的,如果外部外部应用系统不关心语音开始点,则不判断语音开始点。本发明解决了在语音识别文本确定的情况下,传统端点检测技术表现出来的实时性不高,无法对用户关心的语音进行针对性检测问题。
- 专利类型发明专利
- 申请人安徽科大讯飞信息科技股份有限公司;
- 发明人吴玲;王兵;赵乾;潘颂声;何春江;朱群;
- 地址230088 安徽省合肥市高新开发区望江西路666号
- 申请号CN201210483046.4
- 申请时间2012年11月24日
- 申请公布号CN102982811A
- 申请公布时间2013年03月20日
- 分类号G10L25/87(2013.01)I;G10L13/08(2013.01)I;G10L15/02(2006.01)I;