摘要:本发明公开了一种利用二次语义标注的文本信息提取方法,包括如下步骤:步骤1,根据待处理文本中的任务需求,建立任务语义词典;步骤2,利用预存的通用语义词典对待处理文本进行第一次语义标注;步骤3,利用任务语义词典对第一次语义标注后的文本进行第二次语义标注;步骤4,对经过第二次语义标注的文本利用基于语义的子语言语法进行解析以及信息提取,所述信息为任务所需的概念及概念所对应的关系。本发明方法克服了现有大规模语义词典覆盖性低,同时语义标记不能服务于特定子语言语法的问题,对于在中文环境下建立具有任务适应性的信息提取提供了更好的解决方案。
- 专利类型发明专利
- 申请人浙江大学;
- 发明人段会龙;李昊旻;张寅升;葛彩霞;
- 地址310027 浙江省杭州市西湖区浙大路38号
- 申请号CN201410021389.8
- 申请时间2014年01月17日
- 申请公布号CN103810156B
- 申请公布时间2017年01月18日
- 分类号G06F17/27(2006.01)I;