教育装备采购网首页 > 知识产权 > 专利 > CN104732228A

一种PDF文档乱码的检测、校正的方法

　　摘要：本发明公开了一种PDF文档乱码的检测、校正的方法，包括：提取PDF文档内所有字体特征；根据字体特征将字体分为正常字体、乱码字体和待定字体；提取待定字体中字符的点阵图像，并基于图像统计特征的乱码检测算法计算点阵图像与对应编码的相似度，根据相似度判断待定字体中的正常字符或乱码字符；将所述待定字体中的乱码字符和乱码字体中的乱码字符进行纵向和横向编改校正；通过校正结果修正PDF文档，去除乱码字符。本发明采用字体特征和字符的图像特征相结合的方式实现了乱码的自动检测，纵向和横向编改相结合减少了乱码校正的人工耗时，有效地去除了乱码，排除了乱码对后续碎片化加工的干扰，提高了加工效率和质量，降低了加工成本。

专利类型发明专利
申请人同方知网数字出版技术股份有限公司;同方知网（北京）技术有限公司;
发明人邹季英;梁洵;袁仁慧;
地址100084 北京市海淀区清华大学华业大厦
申请号CN201510181385.0
申请时间2015年04月16日
申请公布号CN104732228A
申请公布时间2015年06月24日
分类号G06K9/32(2006.01)I;

该申请人其他专利（共54）

一种学术指数体系及其发布方法

一种英文文献关键短语自动抽取方法与系统

一种动态更新的网站内容制作方法

一种智能问答系统

一种PDF文档表格识别的方法

一种基于句法特征的学术定义自动抽取系统及方法

动态数据采集装置

一种参考文献审校的方法

应用于抄袭检测的信息指纹索引方法

一种基于专家坐诊与自助问答制的专家在线系统

该分类其它专利（共56）

车牌图像识别的处理方法及装置

图像识别方法及系统

全自动视觉印刷机光学校正系统以及构成方法

前端设备定位方法及装置

文稿页面方向检测方法和装置

基于颜色信息和随机圆检测的圆形交通标志定位方法

一种大范围车牌倾斜角度快速计算方法

一种版心定位方法和装置

遥感图像辐射校正方法

一种车牌左右边界精确定位的方法及系统

关于网站联系我们网络广告刊例会员服务项目新手入门会员协议网站地图我要投稿

校体购服务号

采购网服务号

采购网公众号

教育装备采购网在线客服
客服电话：010-50972181/50972182
E-mail：42113232@qq.com
地址：北京市海淀区永嘉南路9号院西院4层408A房间

公安备案号：

京公网安备11010802043465号　京ICP备2025106657号-1　营业执照

Copyright © 2004-2025 www.caigou.com.cn 云智采（北京）文化传媒有限责任公司版权所有