摘要:本发明公开了一种西文单词中字符大小写的修正方法和装置,属于文字处理领域。方法包括以下步骤:获取目标文本的字符的识别结果和字符在图像中的位置;根据字符的识别结果和在图像中的位置判断字符的基线属性,经统计后确定单词的基线信息;根据单词的基线信息确定字符的基线属性,将字符的基线属性进行修正后输出识别结果。本方法有效地处理了不符合一般书写规范、或是无法简单统计得到基线的单词,对于单词行出现扭曲情况下得到字符的基线属性经统计后能够有效处理判断字符的大小写,具有良好的自适应性,使单词的识别率大大提高。
- 专利类型发明专利
- 申请人汉王科技股份有限公司;
- 发明人万鑫;刘正珍;
- 地址100193 北京市海淀区东北旺西路8号5号楼三层
- 申请号CN201010160729.7
- 申请时间2010年04月26日
- 申请公布号CN102236638B
- 申请公布时间2014年11月19日
- 分类号G06F17/27(2006.01)I;