加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种双语段落对齐算法

发明专利无效专利
  • 申请号:
    CN200810033961.7
  • IPC分类号:G06F17/28
  • 申请日期:
    2008-02-28
  • 申请人:
    刘建
著录项信息
专利名称一种双语段落对齐算法
申请号CN200810033961.7申请日期2008-02-28
法律状态撤回申报国家中国
公开/公告日2009-09-02公开/公告号CN101520776
优先权暂无优先权号暂无
主分类号G06F17/28IPC分类号G;0;6;F;1;7;/;2;8查看分类表>
申请人刘建申请人地址
上海市闵行区东川路800号南区15楼 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人刘建当前权利人刘建
发明人刘建
代理机构暂无代理人暂无
摘要
本发明申请以堆双语语料库进行语段级对齐是基于实例的机器翻译(EBMT)的基础,提出了基于锚词对的英汉双语语段对齐模型并给出了相应的对齐算法,解决了中、小规模语料库的数据稀疏问题。系统把语段切分的歧义推迟到语段对齐时排除,提高了语段切分的正确率。

专利服务由北京酷爱智慧知识产权代理公司提供