摘要:本发明公开了一种英文文献关键短语自动抽取方法与系统,包括信息处理模块、英文文本解析模块、候选短语挖掘模块、候选短语过滤模块、候选短语排序模块、同义短语归一化模块及关键短语选取模块,英文文本解析模块主要对缩略语还原后的文本数据进行文本解析,候选短语挖掘模块主要对英文文本解析后的数据进行候选短语挖掘,候选短语排序模块主要对过滤后的候选短语进行权值计算,并根据权值按照大小进行排序,同义短语归一化模块主要对相同含义的短语进行归一化,关键短语选取模块,主要用于根据权值输出指定数目的关键短语。
- 专利类型发明专利
- 申请人同方知网(北京)技术有限公司;
- 发明人符文君;周海波;强成仓;马娟;张振海;
- 地址100084 北京市海淀区清华园清华大学36区1410、1412、1414
- 申请号CN201610363382.3
- 申请时间2016年05月26日
- 申请公布号CN106066866A
- 申请公布时间2016年11月02日
- 分类号G06F17/30(2006.01)I;