摘要:本发明涉及语音识别技术领域,特别涉及一种将语音数据转换为文本文件的方法和系统。所述方法包括:开始采集语音数据,将语音数据转换为文本文字;提取出第一份音色数据,标记所述音色数据并储存;将文本文字储存为对应所述已标记的音色数据的文本文件;从预设的信号采集时间间隔内采集的语音数据中提取出音色数据,并将所述音色数据与已标记的所有音色数据逐一进行对比;如果音色数据相同,则将转换成的文本文字储存至与所述已标记的音色数据对应的文本文件;如果音色数据不同,则标记所述音色数据并储存,将转换成的文本文字储存为对应所述音色数据的另一文本文件。本发明能区分不同发言人的发言内容,简化了录音后的人工整理工作,省时省力。
- 专利类型发明专利
- 申请人广东威创视讯科技股份有限公司;
- 发明人刘观发;
- 地址510663 广东省广州市广州高新技术产业开发区彩频路6号
- 申请号CN201110436096.2
- 申请时间2011年12月22日
- 申请公布号CN102522084A
- 申请公布时间2012年06月27日
- 分类号G10L15/26(2006.01)I;G10L15/08(2006.01)I;