加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种以泰语为枢轴的老-汉双语语料库构建方法及装置

发明专利有效专利
  • 申请号:
    CN201910856645.8
  • IPC分类号:G06F40/58;G06F40/289;G06F40/30;G06F16/33;G06F16/35
  • 申请日期:
    2019-09-11
  • 申请人:
    昆明理工大学
著录项信息
专利名称一种以泰语为枢轴的老-汉双语语料库构建方法及装置
申请号CN201910856645.8申请日期2019-09-11
法律状态授权申报国家中国
公开/公告日2020-01-21公开/公告号CN110717341A
优先权暂无优先权号暂无
主分类号G06F40/58IPC分类号G;0;6;F;4;0;/;5;8;;;G;0;6;F;4;0;/;2;8;9;;;G;0;6;F;4;0;/;3;0;;;G;0;6;F;1;6;/;3;3;;;G;0;6;F;1;6;/;3;5查看分类表>
申请人昆明理工大学申请人地址
云南省昆明市五华区学府路253号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人昆明理工大学当前权利人昆明理工大学
发明人毛存礼;高旭;余正涛;高盛祥;王振晗;聂男
代理机构昆明人从众知识产权代理有限公司代理人代转嫚
摘要
本发明涉及以泰语为枢轴的老‑汉双语语料库构建方法及装置,属自然语言处理领域。本发明先对汉语‑泰语平行语料数据进行泰语分词处理;构建老挝语‑泰语双语词典,并利用其将泰语句子逐词翻译成老挝语句子序列,得到候选的老挝语‑泰语平行句对;构建基于双向LSTM的老挝语‑泰语平行句对分类模型,对候选的老挝语‑泰语平行句对进行分类,获取老挝语‑泰语双语平行句对;以泰语为枢轴语言对老挝语和汉语进行匹配,构建老挝语‑汉语双语平行语料库。并根据上述步骤功能模块化制成以泰语为枢轴语言的老‑汉双语平行语料库构建装置,本发明解决了老挝语‑汉语语料稀缺的问题,对老‑汉双语语料库的构建具有一定的理论意义和实际应用价值。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供