加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

双语语句对齐方法及装置

发明专利有效专利
  • 申请号:
    CN200810242112.2
  • IPC分类号:G06F17/28
  • 申请日期:
    2008-12-31
  • 申请人:
    深圳市点通数据有限公司
著录项信息
专利名称双语语句对齐方法及装置
申请号CN200810242112.2申请日期2008-12-31
法律状态暂无申报国家中国
公开/公告日2009-07-22公开/公告号CN101488126
优先权暂无优先权号暂无
主分类号G06F17/28IPC分类号G;0;6;F;1;7;/;2;8查看分类表>
申请人深圳市点通数据有限公司申请人地址
广东省深圳市福田区梅林阁小区001栋0302号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人深圳市点通数据有限公司当前权利人深圳市点通数据有限公司
发明人张玉志
代理机构深圳市维邦知识产权事务所代理人黄莉
摘要
本发明公开一种用于建设机器翻译语料库的双语语句对齐方法,包括以下步骤:分句步骤;分词步骤;对齐步骤;所述对齐步骤具体包括有:区域划分步骤,分别将待对齐的第一语种、第二语种按照预设的区域划分规则划分为多个包含所述第一语种语句、第二语种语句的比较区域;匹配步骤,计算每对对应的第一语种与第二语种比较区域内的每对语句的相互匹配率,并根据所述相互匹配率确定相互匹配的第一语种语句和第二语种语句组合;执行步骤,将所述相互匹配率最大的第一语种语句和第二语种语句组合执行对齐操作。本发明还公开了相应的用于建设机器翻译语料库的双语语句对齐装置。本发明可大大提高对齐的效率、加快语料库的建设速度。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供