摘要:本发明公开了一种快速文本识别方法,属于OCR技术领域,用OCR识别引擎对两种语言的混排文字图像进行识别,首先切分文本行,接着根据每个所述文本行所包含的第一语言或第二语言的字符的多少对所述文本行进行排序;然后用中文OCR识别引擎进行识别,提取英文可疑区域,再用英文OCR识别引擎进行识别;若判断当前行识别结果为英文行,在下一行识别时OCR识别策略是首先用英文OCR识别引擎识别,提取中文可疑区域,再用中文OCR识别引擎进行识别;最后对识别结果融合。本发明提高了识别速度、降低了字符错误识别率,为嵌入式装置提供了高效版本。
- 专利类型发明专利
- 申请人汉王科技股份有限公司;
- 发明人万鑫;刘正珍;朱军民;
- 地址100094 北京市海淀区东北旺西路8号5号楼三层
- 申请号CN200810239540.X
- 申请时间2008年12月12日
- 申请公布号CN101751567B
- 申请公布时间2012年10月17日
- 分类号G06K9/20(2006.01)I;