摘要:本发明公开了一种具有语音控制和哼唱检索功能的多媒体播放方法及装置,方法步骤如下:用户选择工作模式,采集语音数据并预处理,语音控制模式下,将语音数据与语法规则上传至语音识别服务端进行语音识别,根据识别结果进行播放控制或者资源管理;哼唱检索模式下,将语音数据提取基音序列并转换为音符序列,通过匹配搜索服务端找到与匹配的多媒体资源身份信息,并下载对应的多媒体资源到本地;装置包括人机交互模块、语音输入模块、语音数据处理模块、中央处理器、媒体存储模块、播放解码模块、音频输出模块、网络接口模块、匹配搜索服务端等。本发明具有能够解放用户的双手、用户体验好、使用方便、哼唱检测精确、应用范围广的优点。
- 专利类型发明专利
- 申请人湖南大学;
- 发明人赵欢;
- 地址410082 湖南省长沙市河西岳麓山湖南大学信息科学与工程学院
- 申请号CN201310298771.9
- 申请时间2013年07月16日
- 申请公布号CN103366784A
- 申请公布时间2013年10月23日
- 分类号G11B27/10(2006.01)I;G10L15/30(2013.01)I;