• 首页
  • 装备资讯
  • 热点专题
  • 人物访谈
  • 政府采购
  • 产品库
  • 求购库
  • 企业库
  • 品牌排行
  • 院校库
  • 案例·技术
  • 会展信息
  • 教育装备采购网首页 > 知识产权 > 专利 > CN103942190A

    文本分词方法及系统

      摘要:本发明公开了一种文本分词方法及系统,所述方法包括:预先建立与待处理文本相对应的绑定词典,并绑定所述文本和所述绑定词典,所述绑定词典中的词包括所述文本中未收录在通用词典中的未登录词;将所述文本与所述通用词典中的词进行匹配,得到准分词结果;根据所述绑定词典中的词对所述准分词结果进行修正。采用本发明所述的文本分词方法及系统,通过增加绑定词典,为实现给不同的文本定制相应的词典资源提供了很大的自由度,在不需要修改通用词典情况下,实现文本分析结果的优化。
    • 专利类型发明专利
    • 申请人安徽科大讯飞信息科技股份有限公司;
    • 发明人叶珲;王培养;郜静文;高毅;于振华;赵志伟;
    • 地址230088 安徽省合肥市高新开发区望江西路666号
    • 申请号CN201410153908.6
    • 申请时间2014年04月16日
    • 申请公布号CN103942190A
    • 申请公布时间2014年07月23日
    • 分类号G06F17/27(2006.01)I;