摘要:本发明公开了一种音视频字幕生成方法及装置,该方法包括:接收待生成字幕的语音数据及文本数据;根据发音人韵律对所述语音数据进行切分,得到符合说话人习惯的各语音数据段;根据所述语音数据段对所述文本数据进行切分,得到与所述语音数据段对应的文本数据段;根据各语音数据段的时间信息获取与所述语音数据段对应的文本数据段的开始时间和结束时间。本发明可以简单高效地实现文本数据的显示与语音数据的同步,使生成的字幕更完整。
- 专利类型发明专利
- 申请人科大讯飞股份有限公司;
- 发明人周明;江源;王影;胡国平;胡郁;刘庆峰;
- 地址230088 安徽省合肥市高新开发区望江西路666号
- 申请号CN201510629172.X
- 申请时间2015年09月28日
- 申请公布号CN105244022A
- 申请公布时间2016年01月13日
- 分类号G10L15/00(2013.01)I;G10L15/26(2006.01)I;