摘要:本申请提供了一种基于Lucene的数据搜索方法及装置,包括:使用Lucene对文本形式结构化数据进行分词,其中,对文本形式结构化数据中的英文单词和数字以每个美国信息互换标准代码ASCII字符为分词单位进行分词,对文本形式结构化数据中的中文以每个中文文字为分词单位进行分词;为分词后的文本形式结构化数据创建索引;接收查询请求;获取查询请求对应的索引;根据索引和文本形式结构化数据之间的对应关系,获取与查询请求对应的索引相对应的文本形式结构化数据。
- 专利类型发明专利
- 申请人北京先进数通信息技术股份公司;
- 发明人李励同;滕一勤;朱大勇;唐江华;
- 地址100089 北京市海淀区车道沟1号滨河大厦D座六层
- 申请号CN201310671382.6
- 申请时间2013年12月10日
- 申请公布号CN104699724A
- 申请公布时间2015年06月10日
- 分类号G06F17/30(2006.01)I;