摘要:本发明涉及基于声学统计模型的单元挑选语音合成方法,其方法包括提取训练语料库各声学特征;结合训练语料库中各句话的音段、韵律等标注信息,训练各种声学特征所对应的统计模型,在合成时通过对输入文本进行文本分析,得到待合成句子中各音素对应的各种声学特征的统计模型。以备选单元序列包含的声学参数相对于待合成句的声学统计模型具有最大的似然值为准则,搜索最优的备选单元;使用声学统计模型间的KLD来实现合成单元的快速预挑选;最终通过对各个音素的最优备选单元的波形进行平滑和拼接,得到该句话的合成语音。本发明提高合成语音音质;同时提高传统拼接合成方法的合成效果,并且可以实现系统的自动构建和语种的无关性。
- 专利类型发明专利
- 申请人安徽科大讯飞信息科技股份有限公司;
- 发明人凌震华;胡郁;胡国平;吴晓如;刘庆峰;王仁华;
- 地址230088 安徽省合肥市高新区黄山路616号信息产业基地
- 申请号CN200710191078.6
- 申请时间2007年12月06日
- 申请公布号CN101178896B
- 申请公布时间2012年03月28日
- 分类号G10L13/02(2006.01)I;G10L13/06(2006.01)I;G10L13/08(2006.01)I;