摘要:本发明涉及句子层面的大规模快速匹配方法,本方法包括索引建立、模糊匹配和精确匹配三个阶段。索引建立阶段进行句子内容的标准化、编码转换;模糊匹配阶段的目的是从海量句子中挑选出可能与新句子匹配的候选句子,其数量控制在一个可行的范围内;精确匹配阶段采用了基于编辑距离的相似性衡量算法,再根据精确匹配的相似性对候选句子排序得到最终匹配的句子。本发明方法的优点是实际测试性能优异,搜索效率高、漏检率低,满足实用要求。
- 专利类型发明专利
- 申请人安徽科大讯飞信息科技股份有限公司;
- 发明人陈志刚;胡国平;胡郁;刘庆峰;王仁华;
- 地址230088安徽省合肥市高新区黄山路616号信息产业基地
- 申请号CN200810107117.4
- 申请时间2008年07月17日
- 申请公布号CN101329680A
- 申请公布时间2008年12月24日
- 分类号G06F17/30(2006.01);