摘要:进行音频容噪断句处理方法及系统,包括:根据音频获取多个分帧段;根据各分帧段的能量值获取能量阈值,根据所述能量阈值,从所述各分帧段中获取其能量值超过能量阈值Et;的分帧段,则以该分帧段为句中间帧对该帧的前序帧或后序帧进行扫描,若前序帧或后序帧的能量阀值小于设定能量阈值Et,则将该帧与所述句中间帧按帧起始顺序合并成为独立句,之后对每个独立句进行谱熵分析,获取最后的分析句子。从而解决了现有字幕对应过程中,无法进行自动断句的问题。从而,本发明既可以处理已经录制好的音视频,也可以处理正在直播的音视频。对于网络直播流,能够自动的将网络直播语音切割,方便后续环节如听写环节并行处理,加快处理时间。
- 专利类型发明专利
- 申请人北京华科飞扬科技股份公司;
- 发明人胡飞;
- 地址100000 北京市朝阳区小营路13号1号楼5006室
- 申请号CN201610799384.7
- 申请时间2016年08月31日
- 申请公布号CN106373592A
- 申请公布时间2017年02月01日
- 分类号G10L25/48(2013.01)I;H04N5/278(2006.01)I;