著录项信息
专利名称 | 一种构建多语言网站实时翻译的方法 |
申请号 | CN201510475481.6 | 申请日期 | 2015-08-05 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2015-12-16 | 公开/公告号 | CN105159891A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/28 | IPC分类号 | G;0;6;F;1;7;/;2;8查看分类表>
|
申请人 | 焦点科技股份有限公司 | 申请人地址 | 江苏省南京市高新技术产业开发区星火路软件大厦A座8-12F
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 焦点科技股份有限公司 | 当前权利人 | 焦点科技股份有限公司 |
发明人 | 张丽;杨晨;贺鹏;褚一帆;王炜 |
代理机构 | 南京瑞弘专利商标事务所(普通合伙) | 代理人 | 陈建和 |
摘要
一种多语言网站实时翻译的方法,1)组建翻译集群方法,所有集群内的翻译机按名称排序,便于监测其状态及出现问题时的排查;按照一定规则,抽取一定数量的翻译机,形成调度翻译集群;剩余的翻译机,按待翻译的语言种类平均分配,形成多个有语言种类特色的独立翻译集群;2)划分待翻译数据块方法,将所有待翻译数据按待翻译的语言种类划分,形成不同语言种类的待翻译数据集合;3)数据块翻译方法,将待翻译数据块发送到对应的独立翻译集群中的翻译机翻译;调度翻译集群判断后协助翻译速度最慢的那个独立翻译集群一起翻译,待调度翻译集群翻译完成后,寻找下一个需要帮助的翻译集群。
1.一种多语言网站实时翻译的方法,其特征在于通过组建翻译集群、划分待翻译数据块和数据块翻译进行高并发、数据量大情况下的多语言网站实时翻译;
1)组建翻译集群方法,具体步骤如下:
步骤一、所有集群内的翻译机按名称排序,便于监测其状态及出现问题时的排查;
步骤二、按照一定规则,抽取一定数量的翻译机,形成调度翻译集群;
步骤三、剩余的翻译机,按待翻译的语言种类平均分配,形成多个有语言种类特色的独立翻译集群,若为各个独立翻译集群平均分配整数台翻译机后有剩下的余数,再逐个分配,各个语言种类的独立翻译集群的翻译机数量差不超过一台;
2)划分待翻译数据块方法,具体步骤如下:
步骤一、将所有待翻译数据按待翻译的语言种类划分,形成不同语言种类的待翻译数据集合;
步骤二、将各类语言种类的待翻译数据集合,按对应语言种类独立翻译集群的翻译机数量动态平均分配,形成多个待翻译数据块;
3)数据块翻译方法,具体步骤如下:
步骤一、将待翻译数据块发送到对应的独立翻译集群中的翻译机翻译;
步骤二、由于每个独立翻译集群的翻译速度不尽相同,对待翻译数据的处理速度不一样,调度翻译集群会协助翻译速度最慢的那个独立翻译集群一起翻译,待调度翻译集群翻译完成后,寻找下一个需要帮助的翻译集群;
2)中步骤二的翻译机数量动态平均分配,具体如下,首先将各类语言的待翻译数据量,按对应语言独立翻译集群的翻译机数量平均分配,若为各个翻译机平均分配整数条数据后有剩下的余数,再逐条分配各个翻译机,各个翻译机的翻译数据量差不超过一条;下一次翻译数据分配前,统计独立翻译集群内各翻译机未翻译完的数据量,再分配,使得每一次分配后,一个独立翻译集群内的各个翻译机的数据量差不超过一条,如此保证所有翻译机的平均翻译速度,提升独立翻译集群的整体翻译速度;
数据块翻译方法中,调度翻译集群会协助翻译速度最慢的那个独立翻译集群一起翻译,调度翻译集群在翻译时采用翻译机数量动态平均分配的方法,如此提升各个独立翻译集群的翻译速度,使得在数据量大、高并发的情况下,各类语言网站的实时翻译不阻塞;
所述的组建翻译集群方法中,将翻译机按待翻译的语言种类形成独立翻译集群,减少翻译机切换语言的频率,有效地减少翻译机卡机、死机,翻译错位问题。
一种构建多语言网站实时翻译的方法\n技术领域\n[0001] 本发明涉及互联网信息技术领域,具体涉及一种构建多语言网站实时翻译的方法。\n背景技术\n[0002] 随着国际化进程的不断加快,机器翻译或机器辅助在线翻译已经公开了极多技术,多语言网站在互联网中的地位日渐突出,伴随而来的是海量数据实时翻译的问题,当前多语言网站实时翻译大多采用将数据均分到不同的翻译机进行翻译的方法。此方法在高并发、数据量大的情况下,翻译延迟现象比较严重,原因主要有两方面:一是数据方面,由于多语言混杂,翻译机需要频繁切换语言接口;二是翻译机本身翻译速度不同,易发生木桶短板效应。\n发明内容\n[0003] 为了解决现有的问题,本发明目的是,提出一种多语言网站实时翻译的方法,旨在实现高并发、数据量大的情况下的多语言网站实时翻译。\n[0004] 本发明技术方案是:一种多语言网站实时翻译的方法,通过组建翻译集群、划分待翻译数据块和数据块翻译进行高并发、数据量大情况下的多语言网站实时翻译;\n[0005] 1)组建翻译集群方法,具体步骤如下:\n[0006] 步骤一、所有集群内的翻译机按名称排序,便于监测其状态及出现问题时的排查;\n[0007] 步骤二、按照一定规则,抽取一定数量的翻译机,形成调度翻译集群;\n[0008] 步骤三、剩余的翻译机,按待翻译的语言种类平均分配,形成多个有语言种类特色的独立翻译集群,若为各个独立翻译集群平均分配整数台翻译机后有剩下的余数,再逐个分配,各个语言种类的独立翻译集群的翻译机数量差不超过一台;\n[0009] 2)划分待翻译数据块方法,具体步骤如下:\n[0010] 步骤一、将所有待翻译数据按待翻译的语言种类划分,形成不同语言种类的待翻译数据集合;\n[0011] 步骤二、将各类语言种类的待翻译数据集合,按对应语言种类独立翻译集群的翻译机数量动态平均分配,形成多个待翻译数据块;\n[0012] 3)数据块翻译方法,具体步骤如下:\n[0013] 步骤一、将待翻译数据块发送到对应的独立翻译集群中的翻译机翻译;\n[0014] 步骤二、由于每个独立翻译集群的翻译速度不尽相同,对待翻译数据的处理速度不一样,调度翻译集群会协助翻译速度最慢的那个独立翻译集群一起翻译,待调度翻译集群翻译完成后,寻找下一个需要帮助的翻译集群。\n[0015] 进一步,将翻译机按待翻译的语言种类形成独立翻译集群,大大减少翻译机切换语言的频率,有效地减少翻译机卡机、死机,翻译错位等问题。\n[0016] 2)中步骤二的翻译机数量动态平均分配,具体如下,首先将各类语言的待翻译数据量,按对应语言独立翻译集群的翻译机数量平均分配,若为各个翻译机平均分配整数条数据后有剩下的余数,再逐条分配各个翻译机,各个翻译机的翻译数据量差不超过一条;下一次翻译数据分配前,统计独立翻译集群内各翻译机未翻译完的数据量,再分配,使得每一次分配后,一个独立翻译集群内的各个翻译机的数据量差不超过一条,如此保证所有翻译机的平均翻译速度,提升独立翻译集群的整体翻译速度。\n[0017] 调度翻译集群判断后协助翻译速度最慢的那个独立翻译集群一起翻译,调度翻译集群在翻译时采用翻译机数量动态平均分配的方法,如此提升各个独立翻译集群的翻译速度,使得在数据量大、高并发的情况下,各类语言网站的实时翻译不阻塞。\n[0018] 本发明的有益效果,与现有技术相比,其显著优点为:\n[0019] (1)将翻译机按待翻译的语言种类形成独立翻译集群,不需频繁切换语言接口,有效地减少翻译机卡机、死机,翻译错位等问题。\n[0020] (2)按一个独立翻译集群内的各翻译机的翻译速度,动态平均分配翻译数据量,如此保证所有翻译机的平均翻译速度,提升独立翻译集群的整体翻译速度。\n[0021] (3)设有调度翻译集群,会协助翻译速度最慢的那个独立翻译集群一起翻译,如此提升各个独立翻译集群的翻译速度,使得在数据量大、高并发的情况下,不易发生木桶短板效应。\n附图说明\n[0022] 图1为本发明实施例组建翻译集群的示意图。\n[0023] 图2为本发明实施例划分待翻译数据块的示意图。\n[0024] 图3为本发明实施例数据块翻译的示意图。\n具体实施方式\n[0025] 为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。\n[0026] 如图1所示,为本发明实施例组建翻译集群的示意图,具体为:\n[0027] 步骤一、所有翻译机按名称排序,便于监测其状态及出现问题时的排查。本实施例假设名称为翻译机的IP。\n[0028] 步骤二、按照一定规则,抽取一定数量的翻译机,形成调度翻译集群。本实施例假设数量为X台翻译机。X可为语言种类的数量的1-3倍。\n[0029] 步骤三、剩余的翻译机,按待翻译的语言种类平均分配,形成多个有语言特色的独立翻译集群,若为各个独立翻译集群平均分配整数台翻译机后有剩下的余数,再逐个分配,各个独立翻译集群的翻译机数量差不超过一台。本实施例假设待翻译的语言种类为N类,各个独立翻译集群分配到的翻译机数量为Y台或Z 台,则Y=Z或Y–Z=1。\n[0030] 如图2所示,为本发明实施例划分待翻译数据块的示意图,具体为:\n[0031] 步骤一、将所有待翻译数据按待翻译的语言种类划分,形成不同种类语言的待翻译数据集合。本实施例假设待翻译的语言种类为N类。\n[0032] 步骤二、将各类语言的待翻译数据集合,按对应语言独立翻译集群的翻译机数量动态平均分配,形成多个待翻译数据块;\n[0033] 步骤二的动态平均分配具体为首先将各类语言的待翻译数据量,按对应语言独立翻译集群的翻译机数量平均分配,若为各个翻译机平均分配整数条数据量后有剩下的余数,再逐条分配,各个翻译机的数据量差不超过一条;下一次分配前,统计独立翻译集群内各翻译机未翻译完的数据量,再分配,使得每一次分配后,一个独立翻译集群内的各个翻译机的数据量差不超过一条。本实施例将各类语言的待翻译数据集合,按对应语言独立翻译集群的翻译机数量(Y台或Z台,且Y =Z或Y–Z=1)动态平均分配,使得每一次分配后,一个独立翻译集群内的各个翻译机的数据量差不超过一条。\n[0034] 如图3所示,为本发明实施例数据块翻译的示意图,具体为:\n[0035] 步骤一、将待翻译数据块发送到对应的独立翻译集群中的翻译机翻译。\n[0036] 步骤二、由于每个独立翻译集群的翻译速度不尽相同,对待翻译数据的处理速度不一样,调度翻译集群会协助翻译速度最慢的那个独立翻译集群一起翻译,待翻译完成后,寻找下一个需要帮助的翻译集群。本实例假设当前翻译 速度最慢的独立翻译集群为法语翻译集群。调度翻译集群在翻译时亦参照翻译机数量动态平均分配的方法。如此保证所有翻译机的平均翻译速度,提升独立翻译集群的整体翻译速度。\n[0037] 以上所述仅为本发明专利的实施例而已,并不用以限制本发明专利,凡在本发明专利的精神和原则之内所做的任何修改、等同替换和改进等,均以包含在本发明专利的保护范围之内。
法律信息
- 2018-05-04
- 2016-01-13
实质审查的生效
IPC(主分类): G06F 17/28
专利申请号: 201510475481.6
申请日: 2015.08.05
- 2015-12-16
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2014-04-16
|
2012-10-16
| | |
2
| |
2009-12-09
|
2009-04-27
| | |
3
| |
2012-10-10
|
2011-03-30
| | |
4
| |
2012-07-11
|
2011-12-30
| | |
5
| |
2011-10-05
|
2011-03-29
| | |
6
| | 暂无 |
2000-12-22
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |