著录项信息
专利名称 | 信息匹配方法、装置及终端 |
申请号 | CN201610507811.X | 申请日期 | 2016-06-28 |
法律状态 | 驳回 | 申报国家 | 暂无 |
公开/公告日 | 2016-10-12 | 公开/公告号 | CN106021238A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/27 | IPC分类号 | G;0;6;F;1;7;/;2;7;;;G;0;6;F;1;7;/;2;8查看分类表>
|
申请人 | 广州华多网络科技有限公司 | 申请人地址 | 广东省广州市番禺区南村镇万博二路79号万博商务区万达商业广场北区B-1栋24层
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 广州华多网络科技有限公司 | 当前权利人 | 广州华多网络科技有限公司 |
发明人 | 覃炜 |
代理机构 | 北京博思佳知识产权代理有限公司 | 代理人 | 王茹 |
摘要
本申请公开了信息匹配方法、装置及终端,所述方法包括:获取原文的各组原文语句;获取每组原文语句对应的每组特征信息;将每组特征信息分别与所述原文的译文匹配,获取每组特征信息所匹配的译文语句;将每组特征信息所匹配的译文语句和所对应的原文语句,作为彼此的相邻语句输出。实施本申请,可将每组原文语句与其译文语句相邻输出,便于用户对照学习原文和译文进而提高相关应用的智能化程度和用户体验度。
1.一种信息匹配方法,其特征在于,包括:
获取原文的各组原文语句,其中,一组原文语句为所述原文的一个片段;
获取每组原文语句对应的每组特征信息;
将每组特征信息分别与所述原文的译文匹配,获取每组特征信息所匹配的译文语句;
将每组特征信息所匹配的译文语句和所对应的原文语句,作为彼此的相邻语句输出。
2.根据权利要求1所述的方法,其特征在于,所述获取每组原文语句对应的特征信息,包括:
获取构成每组原文语句的各个文字信息,生成每组原文语句对应的每组特征信息,其中,每个文字信息为标点符号、或单个文字、或多个文字组成的词组;或,获取构成每组原文语句的各个文字信息的译文信息,生成每组原文语句对应的每组特征信息。
3.根据权利要求1所述的方法,其特征在于,所述将每组特征信息分别与所述原文的译文匹配,获取每组特征信息所匹配的译文语句,包括:
从所述译文中查询每组特征信息;
根据查询结果,将含有同一组特征信息的译文语句,确定为与所述同一组特征信息匹配的译文语句。
4.根据权利要求3所述的方法,其特征在于,所述从所述译文中查询每组特征信息,包括:
根据每个特征信息所对应的原文语句在所述原文中的位置次序,按从前到后的次序从所述译文中查询每组特征信息;
查询到一个特征信息,则记录含有该特征信息的译文语句,并终止对该特征信息的查询。
5.根据权利要求4所述的方法,其特征在于,所述根据查询结果,将含有同一组特征信息的译文语句,确定为与所述同一组特征信息匹配的译文语句,包括:
查询完M组特征信息,则根据查询结果,将含有同一组特征信息的译文语句,确定为与所述同一组特征信息匹配的译文语句,M为大于0且小于原文语句总组数的整数;
所述方法还包括:
将其他组的特征信息与所确定的译文语句之外的其他译文匹配,获取每组特征信息所匹配的译文语句,所述其他组的特征信息为已匹配译文语句的各组特征信息之外的特征信息。
6.根据权利要求3至5中任一项所述的方法,其特征在于,所述根据查询结果,将含有同一组特征信息的译文语句,确定为与所述同一组特征信息匹配的译文语句,包括:
若任一译文语句同时含有K组特征信息,则计算所述任一译文语句所含的每组特征信息的信息数目与该组特征信息的信息总数的比例,其中,K为大于1且小于原文语句总组数的整数;
将所述任一译文语句确定为比例最高的一组特征信息所匹配的译文语句。
7.根据权利要求6所述的方法,其特征在于,所述计算所述任一译文语句所含的每组特征信息的信息数目与该组特征信息的信息总数的比例前,所述方法还包括:
若所述特征信息为单个文字或多个文字组成的词组,则将所述特征信息的信息数目值设置为1;
若所述特征信息为单个标点符号,则将所述特征信息的信息数目值设置为J,其中,J大于0且小于1。
8.一种信息匹配装置,其特征在于,包括:
原文语句获取模块,用于获取原文的各组原文语句,其中,一组原文语句为所述原文的一个片段;
特征信息获取模块,用于获取每组原文语句对应的每组特征信息;
译文语句匹配模块,用于将每组特征信息分别与所述原文的译文匹配,获取每组特征信息所匹配的译文语句;
语句输出模块,用于将每组特征信息所匹配的译文语句和所对应的原文语句,作为彼此的相邻语句输出。
9.根据权利要求8所述的装置,其特征在于,所述特征信息获取模块包括:
第一信息获取子模块,用于获取构成每组原文语句的各个文字信息,生成每组原文语句对应的每组特征信息,其中,每个文字信息为标点符号、或单个文字、或多个文字组成的词组;或,
第二信息获取子模块,用于获取构成每组原文语句的各个文字信息的译文信息,生成每组原文语句对应的每组特征信息。
10.根据权利要求8所述的装置,其特征在于,所述译文语句匹配模块包括:
特征信息查询模块,用于从所述译文中查询每组特征信息;
译文语句确定模块,用于根据查询结果,将含有同一组特征信息的译文语句,确定为与所述同一组特征信息匹配的译文语句。
11.根据权利要求10所述的装置,其特征在于,所述特征信息查询模块包括:
第一特征信息查询子模块,用于根据每个特征信息所对应的原文语句在所述原文中的位置次序,按从前到后的次序从所述译文中查询每组特征信息;
结果记录模块,用于在查询到一个特征信息时,记录含有该特征信息的译文语句,并通知所述第一特征信息查询子模块终止对该特征信息的查询。
12.根据权利要求11所述的装置,其特征在于,所述译文语句确定模块包括:
第一译文语句确定子模块,用于在查询完M组特征信息时,根据查询结果,将含有同一组特征信息的译文语句,确定为与所述同一组特征信息匹配的译文语句,M为大于0且小于原文语句总组数的整数;
所述装置还包括:
译文语句获取模块,用于将其他组的特征信息与所确定译文语句之外的其他译文匹配,获取每组特征信息所匹配的译文语句,所述其他组的特征信息为已匹配译文语句的各组特征信息之外的特征信息。
13.根据权利要求10至12中任一项所述的装置,其特征在于,所述译文语句确定模块,包括:
比例计算模块,用于在任一译文语句同时含有K组特征信息时,计算所述任一译文语句所含的每组特征信息的信息数目与该组特征信息的信息总数的比例,K大于1且小于原文语句总组数的整数;
第二译文语句确定子模块,用于将所述任一译文语句确定为比例最高的一组特征信息所匹配的译文语句。
14.根据权利要求13所述的装置,其特征在于,所述装置还包括:
第一数目值设置模块,用于在所述特征信息为单个文字或多个文字组成的词组时,将所述特征信息的信息数目值设置为1;
第二数目值设置模块,用于在所述特征信息为单个标点符号时,将所述特征信息的信息数目值设置为J,其中,J大于0且小于1。
15.一种终端,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取原文的各组原文语句,其中,一组原文语句为所述原文的一个片段;
获取每组原文语句对应的每组特征信息;
将每组特征信息分别与所述原文的译文匹配,获取每组特征信息所匹配的译文语句;
将每组特征信息所匹配的译文语句和所对应的原文语句,作为彼此的相邻语句输出。
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2009-09-16
|
2008-03-11
| | |
2
| |
2014-05-28
|
2014-02-25
| | |
3
| |
2007-09-12
|
2007-03-30
| | |
4
| |
2009-07-22
|
2008-12-31
| | |
5
| |
2016-03-30
|
2015-12-30
| | |
6
| |
2005-08-31
|
2004-02-24
| | |
7
| |
2008-03-26
|
2007-03-30
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |