著录项信息
专利名称 | 一种基于语料库的双语检索统计翻译系统 |
申请号 | CN201510411553.0 | 申请日期 | 2015-07-07 |
法律状态 | 权利终止 | 申报国家 | 中国 |
公开/公告日 | 2015-10-28 | 公开/公告号 | CN105005561A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/28 | IPC分类号 | G;0;6;F;1;7;/;2;8;;;G;0;6;F;1;7;/;3;0查看分类表>
|
申请人 | 刘改琳 | 申请人地址 | 陕西省西安市未央区学府中路2号
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 刘改琳 | 当前权利人 | 刘改琳 |
发明人 | 刘改琳;李定顺;张永强;王瑛;张静华;潘婉莹;杨薇;高业艳 |
代理机构 | 暂无 | 代理人 | 暂无 |
摘要
本发明公开了一种基于语料库的双语检索统计翻译系统,包括数据库,用于储存各类相关词表、语句、单词以及每个单词、语句对应的解释和应用案例数据;数据库更新模块、人机操作模块,包括键盘输入模块、手写输入模块以及语音输入模块,用于输入需要查询的英语数据或汉语数据,并将数据发送到数据识别单元;同时还用于输入信息调用命令;数据识别单元,数据分割单元,数据翻译模块,检索功能模块,词表功能模块,搭配词功能模块,词簇功能模块,主题性功能模块,词汇分类功能模块和自学功能模块。本发明可以选择不同的输入模式,检索过程简单快速,在得到检索结果时,可以得到该文本数据的分类、词句以及应用案例等数据,减省了用户的时间,使用方便。
1.一种基于语料库的双语检索统计翻译系统,其特征在于,包括
数据库,用于储存各类相关词表、语句、单词以及每个单词、语句对应的解释和应用案例数据;
数据库更新模块,用于通过3G网络、Wi-Fi网络方式更新数据库;
人机操作模块,包括键盘输入模块、手写输入模块以及语音输入模块,用于输入需要查询的英语数据或汉语数据,并将数据发送到数据识别单元;同时还用于输入信息调用命令;
数据识别单元,用于接收人机操作模块发送来的数据,并判断数据属于英语还是汉语,并将汉语数据发送到数据分割单元,将英语数据发送到检索处理模块;
数据分割单元,用于将接收的汉语数据进行分割,识别所述汉语数据中的标点,以句号为分割位置,得到以句子为单位的文本信息并将该文本信息发送到数据翻译模块;
数据翻译模块,用于将获取的文本信息进行数据库搜索,查找是否有对应或类似的翻译目标语句,并将翻译结果通过电子显示屏显示,若未查询到,文本信息会传送到联网模块,通过联网模块进行翻译结果查询,并将翻译结果储存在数据库内,且通过电子显示屏显示;
检索处理模块,包括
检索功能模块,用于接收数据识别单元以及数据翻译模块发来的文本数据,将文本数据与公式数据库中的公式数据进行类似度对比,并将比对结果按照相似度进行升序或降序排序后,通过电子显示屏显示;
词表功能模块,对导入文件进行词表统计与显示;
搭配词功能模块,用于实现对某一词的搭配信息的统计与显示功能;
词簇功能模块,用于实现多词词表的统计与显示;
主题性功能模块,用于通过词表对比,统计出导入文本的主题性信息;
词汇分类功能模块,用于实现对导入文本的词性、水平级别的统计与分类;
中央处理器,用于根据信息调用命令,从数据库中调用人们所需的数据信息,并用于添加用户、删除用户、密码修改、权限管理;
液晶显示屏,用于显示检索功能模块的检索结果以及输入的文本数据;
语音单元,用于语音播放检索功能模块的检索结果;
自学功能模块,用于就某一文件,自动生成具有交互性的测试内容,供学生练习。
2.根据权利要求1所述的一种基于语料库的双语检索统计翻译系统,其特征在于,还包括资源共享模块,用于下载检索结果。
3.根据权利要求1所述的一种基于语料库的双语检索统计翻译系统,其特征在于,所述语音输入模块采用麦克风。
4.根据权利要求1所述的一种基于语料库的双语检索统计翻译系统,其特征在于,所述联网模块包括一网络爬虫进程,用于在网络中查找与输入文本相关的网页或文档。
5.根据权利要求1所述的一种基于语料库的双语检索统计翻译系统,其特征在于,所述电子显示屏为触摸屏。
一种基于语料库的双语检索统计翻译系统\n技术领域\n[0001] 本发明涉及搜索引擎领域,具体涉及一种基于语料库的双语检索统计翻译系统。\n背景技术\n[0002] 随着互联网应用的发展、以及各种类型的数字化内容(文本、图片、音频和视频等)以指数级的形式呈现出爆炸性的增长,如何根据用户的输入在海量信息中准确地查找相关内容,是一个非常基础而又具有重大意义的技术挑战。目前,以Google、百度等为代表的通用搜索引擎在一定程度上已经较好地解决了这一难题。\n[0003] 然而以通用搜索引擎为代表及其他基于传统的文本检索系统的软件、网络应用等,在针对各类双语搜索上仍然具有很大的局限性,一方面其单单存在翻译功能,而不具备检索功能,另一方面,相关词句的介绍以及应用案例等,都需要重新去查询,这无疑增加了用户的工作量。\n[0004] 且,在具体使用过程中,由于单词由均为多个字母构成,很容易导致使用者在检索时,拼写错误,或者无法拼写的情况的发生,而导致无法进行检索。\n发明内容\n[0005] 为解决上述问题,本发明提供了一种基于语料库的双语检索统计翻译系统,命名为Word Smart语料库教学与研究系统。\n[0006] 为实现上述目的,本发明采取的技术方案为:\n[0007] 一种基于语料库的双语检索统计翻译系统,包括\n[0008] 数据库,用于储存各类相关词表、语句、单词以及每个单词、语句对应的解释和应用案例数据;\n[0009] 数据库更新模块,用于通过3G网络、Wi-Fi网络方式更新数据库;\n[0010] 人机操作模块,包括键盘输入模块、手写输入模块以及语音输入模块,用于输入需要查询的英语数据或汉语数据,并将数据发送到数据识别单元;同时还用于输入信息调用命令;\n[0011] 数据识别单元,用于接收人机操作模块发送来的数据,并判断数据属于英语还是汉语,并将汉语数据发送到数据分割单元,将英语数据发送到检索处理模块;\n[0012] 数据分割单元,用于将接收的汉语数据进行分割,识别所述汉语数据中的标点,以句号为分割位置,得到以句子为单位的文本信息并将该文本信息发送到数据翻译模块;\n[0013] 数据翻译模块,用于将获取的文本信息进行数据库搜索,查找是否有对应或类似的翻译目标语句,并将翻译结果通过电子显示屏显示,若未查询到,文本信息会传送到联网模块,通过联网模块进行翻译结果查询,并将翻译结果储存在数据库内,且通过电子显示屏显示;\n[0014] 检索处理模块,包括\n[0015] 检索功能模块,用于接收数据识别单元以及数据翻译模块发来的文本数据,将文本数据与公式数据库中的公式数据进行类似度对比,并将比对结果按照相似度进行升序或降序排序后,通过电子显示屏显示;\n[0016] 词表功能模块,对导入文件进行词表统计与显示;\n[0017] 搭配词功能模块,用于实现对某一词的搭配信息的统计与显示功能;\n[0018] 词簇功能模块,用于实现多词词表的统计与显示;\n[0019] 主题性功能模块,用于通过词表对比,统计出导入文本的主题性信息;\n[0020] 词汇分类功能模块,用于实现对导入文本的词性、水平级别的统计与分类;\n[0021] 中央处理器,用于根据信息调用命令,从数据库中调用人们所需的数据信息,并用于添加用户、删除用户、密码修改、权限管理;\n[0022] 液晶显示屏,用于显示检索功能模块的检索结果以及输入的文本数据;\n[0023] 语音单元,用于语音播放检索功能模块的检索结果;\n[0024] 自学功能模块,用于就某一文件,自动生成具有交互性的测试内容,供学生练习。\n[0025] 其中,还包括资源共享模块,用于下载检索结果。\n[0026] 其中,所述语音输入模块采用麦克风。\n[0027] 其中,所述联网模块包括一网络爬虫进程,用于在网络中查找与输入文本相关的网页或文档。\n[0028] 其中,所述电子显示屏为触摸屏。\n[0029] 本发明具有以下有益效果:\n[0030] 可以选择不同的输入模式,检索过程简单快速,在得到检索结果时,可以得到该文本数据的分类、词句以及应用案例等数据,减省了用户的时间,使用方便。\n附图说明\n[0031] 图1为本发明实施例一种基于语料库的双语检索统计翻译系统的结构示意图。\n具体实施方式\n[0032] 为了使本发明的目的及优点更加清楚明白,以下结合实施例对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。\n[0033] 如图1所示,本发明实施例提供了一种基于语料库的双语检索统计翻译系统,包括[0034] 数据库,用于储存各类相关词表、语句、单词以及每个单词、语句对应的解释和应用案例数据;\n[0035] 数据库更新模块,用于通过3G网络、Wi-Fi网络方式更新数据库;\n[0036] 人机操作模块,包括键盘输入模块、手写输入模块以及语音输入模块,用于输入需要查询的英语数据或汉语数据,并将数据发送到数据识别单元;同时还用于输入信息调用命令;\n[0037] 数据识别单元,用于接收人机操作模块发送来的数据,并判断数据属于英语还是汉语,并将汉语数据发送到数据分割单元,将英语数据发送到检索处理模块;\n[0038] 数据分割单元,用于将接收的汉语数据进行分割,识别所述汉语数据中的标点,以句号为分割位置,得到以句子为单位的文本信息并将该文本信息发送到数据翻译模块;\n[0039] 数据翻译模块,用于将获取的文本信息进行数据库搜索,查找是否有对应或类似的翻译目标语句,并将翻译结果通过电子显示屏显示,若未查询到,文本信息会传送到联网模块,通过联网模块进行翻译结果查询,并将翻译结果储存在数据库内,且通过电子显示屏显示;\n[0040] 检索处理模块,包括\n[0041] 检索功能模块,用于接收数据识别单元以及数据翻译模块发来的文本数据,将文本数据与公式数据库中的公式数据进行类似度对比,并将比对结果按照相似度进行升序或降序排序后,通过电子显示屏显示;\n[0042] 词表功能模块,对导入文件进行词表统计与显示;\n[0043] 搭配词功能模块,用于实现对某一词的搭配信息的统计与显示功能;\n[0044] 词簇功能模块,用于实现多词词表的统计与显示;\n[0045] 主题性功能模块,用于通过词表对比,统计出导入文本的主题性信息;\n[0046] 词汇分类功能模块,用于实现对导入文本的词性、水平级别的统计与分类;\n[0047] 中央处理器,用于根据信息调用命令,从数据库中调用人们所需的数据信息,并用于添加用户、删除用户、密码修改、权限管理;\n[0048] 液晶显示屏,用于显示检索功能模块的检索结果以及输入的文本数据;\n[0049] 语音单元,用于语音播放检索功能模块的检索结果;\n[0050] 自学功能模块,用于就某一文件,自动生成具有交互性的测试内容,供学生练习。\n[0051] 还包括资源共享模块,用于下载检索结果。\n[0052] 所述语音输入模块采用麦克风。\n[0053] 所述联网模块包括一网络爬虫进程,用于在网络中查找与输入文本相关的网页或文档。\n[0054] 所述电子显示屏为触摸屏。\n[0055] 本发明具有以下有益效果:\n[0056] 可以选择不同的输入模式,检索过程简单快速,在得到检索结果时,可以得到该文本数据的分类、词句以及应用案例等数据,减省了用户的时间,使用方便[0057] 以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
法律信息
- 2020-07-31
未缴年费专利权终止
IPC(主分类): G06F 17/28
专利号: ZL 201510411553.0
申请日: 2015.07.07
授权公告日: 2018.11.16
- 2018-11-16
- 2015-11-25
实质审查的生效
IPC(主分类): G06F 17/28
专利申请号: 201510411553.0
申请日: 2015.07.07
- 2015-10-28
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2011-12-07
|
2011-08-16
| | |
2
| |
2005-12-14
|
2005-05-06
| | |
3
| |
2006-01-04
|
2005-07-04
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |