加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

基于基因字的文档处理方法及装置

发明专利有效专利
  • 申请号:
    CN201110400253.4
  • IPC分类号:G06F17/30;G06F17/22
  • 申请日期:
    2011-12-06
  • 申请人:
    方正国际软件有限公司;方正国际软件(北京)有限公司
著录项信息
专利名称基于基因字的文档处理方法及装置
申请号CN201110400253.4申请日期2011-12-06
法律状态授权申报国家中国
公开/公告日2012-06-13公开/公告号CN102495881A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0;;;G;0;6;F;1;7;/;2;2查看分类表>
申请人方正国际软件有限公司;方正国际软件(北京)有限公司申请人地址
江苏省苏州市苏州工业园区星湖街328号创意产业园方正国际大厦 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人方正国际软件有限公司,方正国际软件(北京)有限公司当前权利人方正国际软件有限公司,方正国际软件(北京)有限公司
发明人郝佳
代理机构北京康信知识产权代理有限责任公司代理人吴贵明;余刚
摘要
本发明公开了一种基于基因字的文档处理方法及装置。其中,该方法包括:根据基因字库从原始文件中提取一个或多个源字符,以获取源字符集合,其中,源字符集合中的源字符在基因字库中存在对应的基因字;计算源字符集合中每一个源字符的重复频率,并根据每一个源字符的重复频率和字符内码对源字符集合中的源字符进行排序;根据蛇形算法对排序后的源字符集合中的源字符按照预设的组数进行分组,以获取预定数目的字符组;将一组或多组字符组中的所有源字符替换为基因字库中与其对应的基因字,以获取嵌入基因字的文档。通过本发明,能够实现在识别嵌入基因字的文档时,读取文档中的字符信息更加准确且正确率更高。

专利服务由北京酷爱智慧知识产权代理公司提供