• 首页
  • 装备资讯
  • 热点专题
  • 人物访谈
  • 政府采购
  • 产品库
  • 求购库
  • 企业库
  • 品牌排行
  • 院校库
  • 案例·技术
  • 会展信息
  • 教育装备采购网首页 > 知识产权 > 专利 > CN106373592A

    音频容噪断句处理方法及系统

      摘要:进行音频容噪断句处理方法及系统,包括:根据音频获取多个分帧段;根据各分帧段的能量值获取能量阈值,根据所述能量阈值,从所述各分帧段中获取其能量值超过能量阈值Et;的分帧段,则以该分帧段为句中间帧对该帧的前序帧或后序帧进行扫描,若前序帧或后序帧的能量阀值小于设定能量阈值Et,则将该帧与所述句中间帧按帧起始顺序合并成为独立句,之后对每个独立句进行谱熵分析,获取最后的分析句子。从而解决了现有字幕对应过程中,无法进行自动断句的问题。从而,本发明既可以处理已经录制好的音视频,也可以处理正在直播的音视频。对于网络直播流,能够自动的将网络直播语音切割,方便后续环节如听写环节并行处理,加快处理时间。
    • 专利类型发明专利
    • 申请人北京华科飞扬科技股份公司;
    • 发明人胡飞;
    • 地址100000 北京市朝阳区小营路13号1号楼5006室
    • 申请号CN201610799384.7
    • 申请时间2016年08月31日
    • 申请公布号CN106373592A
    • 申请公布时间2017年02月01日
    • 分类号G10L25/48(2013.01)I;H04N5/278(2006.01)I;