摘要:本发明公开了一种根据书籍目录提取书籍知识点的方法和系统,属于数字化处理技术领域。所述方法包括:获取待处理书籍的书籍目录,通过分词算法将所述书籍目录进行分切,将分切后的书籍目录作为关键词在知识点库中进行模糊查询,获取与所述分切后的书籍目录关联的知识点,最后通过计算书籍目录与所获取到的知识点的匹配度,将匹配度最高的知识点确认为所述待处理书籍的知识点,并将知识点与所述书籍目录对应的章节进行关联存储。通过本发明所述的方法及系统,能够实现批量电子书籍中的知识点的高效自动提取,且通过计算书籍目录与提取到的知识点的匹配度,使得最后匹配到的知识点与电子数据具有较高的匹配度,提高了知识点提取的准确率。
- 专利类型发明专利
- 申请人明博教育科技有限公司;
- 发明人符崇波;高飞;郭英涛;卢作伟;
- 地址100085 北京市海淀区上地三街9号嘉华大厦C座801-803
- 申请号CN201410573439.3
- 申请时间2014年10月23日
- 申请公布号CN104361028A
- 申请公布时间2015年02月18日
- 分类号G06F17/30(2006.01)I;G06F17/27(2006.01)I;