摘要:本发明提供一种多媒体转写方法,应用于多媒体转写系统中,包括以下步骤:S1、接收演示文稿,并构建所述演示文稿的关键信息树;S2、接收语音数据,并对所述语音数据进行语音识别,得到所述语音数据的转写文本;S3、通过所述关键信息树将所述语音数据和所述转写文本与所述演示文稿进行同步;S4、将同步后带有所述语音数据和所述转写文本的演示文稿显示给用户。用户在看演示文稿时可以同时听到演讲人的声音,看到演讲人声音转写的文本;进一步地,根据每页演示文稿包含的子主题对转写文本分段,同一个子主题的转写文本作为一段,不同子主题的转写文本作为不同的段,可以方便用户理解转写文本,进一步提高了用户体验。
- 专利类型发明专利
- 申请人科大讯飞股份有限公司;
- 发明人王金钖;胡尹;潘青华;胡国平;胡郁;刘庆峰;
- 地址230088 安徽省合肥市高新开发区望江西路666号
- 申请号CN201610200600.1
- 申请时间2016年03月30日
- 申请公布号CN105895085A
- 申请公布时间2016年08月24日
- 分类号G10L15/04(2013.01)I;G10L15/18(2013.01)I;G10L15/26(2006.01)I;