摘要:本发明公开了一种文本字符编码方式的识别方法及系统,属于字符编码技术领域。所述识别方法包括:将待识别文本按照已知的N种字符编码方式分别进行解码,得到解码后的每种字符编码方式所对应的字符串;N≥2;根据解码后的字符串中每个字符的出现概率计算每种字符编码方式所对应的字符串的出现概率,将出现概率最高的字符串所对应的字符编码方式确定为待识别文本的字符编码方式。本发明的文本字符编码方式的识别方法及系统,有效提高了字符编码方式识别的准确性,尤其适用于短文本的字符编码方式的识别。
- 专利类型发明专利
- 申请人明博教育科技有限公司;
- 发明人段垚;
- 地址100085 北京市海淀区上地三街9号嘉华大厦C座801-803
- 申请号CN201510107921.2
- 申请时间2015年03月12日
- 申请公布号CN104750666A
- 申请公布时间2015年07月01日
- 分类号G06F17/22(2006.01)I;