加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于关键词的中英双语平行语料库构建方法

发明专利无效专利
  • 申请号:
    CN201410618941.1
  • IPC分类号:G06F16/951;G06F16/9535;G06F17/27;G06F17/28
  • 申请日期:
    2014-11-07
  • 申请人:
    北京第二外国语学院
著录项信息
专利名称一种基于关键词的中英双语平行语料库构建方法
申请号CN201410618941.1申请日期2014-11-07
法律状态权利终止申报国家中国
公开/公告日2015-03-11公开/公告号CN104408078A
优先权暂无优先权号暂无
主分类号G06F16/951IPC分类号G;0;6;F;1;6;/;9;5;1;;;G;0;6;F;1;6;/;9;5;3;5;;;G;0;6;F;1;7;/;2;7;;;G;0;6;F;1;7;/;2;8查看分类表>
申请人北京第二外国语学院申请人地址
北京市朝阳区定福庄南路1号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人北京第二外国语学院当前权利人北京第二外国语学院
发明人程维
代理机构北京知本村知识产权代理事务所代理人周自清
摘要
本发明公开了一种基于关键词的中英双语平行语料库构建方法,该方法包括如下步骤1)建设双语平行语料库;2)自动对齐;3)抽取关键词;4)建成基于关键词的双语平行语料库。本发明从网络上获取传统的平行语料库,然后采用自动对齐的方法从传统平行语料库中自动的获取对齐的词组对,同时采用各种相似度的计算方法,把提取出来的关键词对进行过滤,最终得到质量较好的基于关键词的平行语料库。实验证明,基于关键词的平行语料库要比传统的平行语料库能提高机器翻译的质量,从实验的BLEU值来看,在英到中的翻译中,能提高大约6.2%,而在中英翻译中能提高2.52%。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供