摘要:本发明适用于计算机检索技术领域,提供了一种关键字检索方法、装置及系统,所述方法包括:接收输入的关键字检索请求,请求中包括目标文件的ID和关键字检索语句;根据目标文件的ID读取文件信息;对目标文件进行分块;在各分块上运行Mapper程序,以由Mapper程序根据关键字检索语句以及文件信息查询得到各分块对应的SCKS、SLCA节点,并生成子树SCKS’;发送SLCA节点与SCKS’至Reduce设备,以由Reduce设备根据SLCA节点与SCKS’计算得到检索结果。本发明,通过MapReduce对海量XML文件进行分布式并行运算,从而可以支持大数据量的关键字检索。
- 专利类型发明专利
- 申请人中安消技术有限公司;
- 发明人徐光剑;
- 地址100190 北京市海淀区科学院南路2号融科资讯中心C座北楼17层12-13
- 申请号CN201310503091.6
- 申请时间2013年10月23日
- 申请公布号CN103544281A
- 申请公布时间2014年01月29日
- 分类号G06F17/30(2006.01)I;