摘要:本发明公开了一种基于句法特征的学术定义自动抽取系统及方法,所述系统包括:所述系统包括预处理模块、定义句抽取模块、定义术语抽取模块和输出模块,所述预处理模块,用于对输入的学术文献抽取摘要和全文部分,并将抽取的摘要和全文分成单句;定义句抽取模块,采用规则和统计法判断所述单句是否为定义句;定义术语抽取模块,将判断为定义的单句进行预处理,并根据术语词抽取模板,抽取词串作为术语词,并通过前后邻的词串修正,得到定义术语;输出模块,用于输出定义术语。本发明将文献中表示定义的句子和对应的术语词抽取出来,并呈现给用户,方便用户快速、准确的理解检索出的内容。
- 专利类型发明专利
- 申请人《中国学术期刊(光盘版)》电子杂志社有限公司;同方知网(北京)技术有限公司;山西同方知网数字出版技术有限公司;
- 发明人赵纪元;罗霄;杜玉锋;
- 地址100084 北京市海淀区清华园清华大学36区1407、1408、1409
- 申请号CN201510059166.5
- 申请时间2015年02月05日
- 申请公布号CN104572628A
- 申请公布时间2015年04月29日
- 分类号G06F17/27(2006.01)I;