著录项信息
专利名称 | 一种机群跨平台并行系统镜像备份的方法 |
申请号 | CN03148518.9 | 申请日期 | 2003-06-30 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2005-01-19 | 公开/公告号 | CN1567198 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F9/445 | IPC分类号 | G;0;6;F;9;/;4;4;5查看分类表>
|
申请人 | 联想(北京)有限公司 | 申请人地址 | 北京市海淀区上地信息产业基地创业路6号
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 联想(北京)有限公司 | 当前权利人 | 联想(北京)有限公司 |
发明人 | 刘晓光;赵玉萍;周隆跃;李电森;柳书广;肖利民 |
代理机构 | 北京同立钧成知识产权代理有限公司 | 代理人 | 刘芳;刘国伟 |
摘要
本发明公开了一种机群跨平台并行系统镜像备份的方法,至少包括:首先初始化设置后,启动待备份的多个结点机,发送定时备份命令;接着判断定时时间是否到来,如果没有到,则继续等待,如果定时时间到,进行下一步;生成远程备份用的文件,远程启动多个结点机;然后这些结点机按照启动镜像中的系统备份脚本里的程序自动进行系统备份,把系统程序完整地并行复制到远程的结点机中;备份完成后,结点机重启,自动返回到备份前的系统。本发明有效解决了大规模机群中并行镜像备份的难题,在一次备份操作中,对多个结点机的硬盘同时进行了系统级备份;对可能是海量的硬盘数据按照指定的压缩方式进行了压缩。
1、一种机群跨平台并行系统镜像备份的方法,其特征在于,包括如下 步骤:
步骤一、初始化设置后,启动待备份的多个结点机,发送定时备份命令;
步骤二、判断定时时间是否到来,如果没有到,则继续等待,如果定时 时间到,进行下一步;
步骤三、生成远程备份用的启动镜像,远程重新启动多个结点机, 该启动镜像中包含系统备份脚本;
步骤四、这些结点机按照启动镜像中的系统备份脚本里的程序自动进行 系统备份,把系统程序完整地并行复制到远程的结点机中;
步骤五、备份完成后,结点机重启,自动返回到备份前的系统。
2、根据权利要求1所述的机群跨平台并行系统镜像备份的方法,其特 征在于,所述步骤三,进一步包括:
打开结点1-N定时执行命令的后台服务;
打开备份服务器的远程终端服务,并把结点1-N的IP地址放入远程终 端配置文件中,允许结点1-N通过远程终端访问备份服务器;
打开备份服务器的简单文件传输协议服务,允许其他结点通过简单文件 传输协议下传文件。
3、根据权利要求2所述的机群跨平台并行系统镜像备份的方法,其特 征在于,控制台给结点1-N并行发送带有定时时间的系统备份命令,结点 1-N在各自接收到备份服务器发送来的定时的系统备份命令后,把时间和命 令分别提取出来,按照定时执行命令的格式把时间和命令写到定时执行命令 的配置文件中,并重新启动相关服务。
4、根据权利要求3所述的机群跨平台并行系统镜像备份的方法,其特 征在于,通过远程调用,在备份服务器上执行以下操作:
把一个共用的文件initrd装载到一个临时目录,生成一个临时文件系 统;
把相应的模块插入命令、激活网卡并配有该结点IP地址的命令、通过 RSH备份该结点硬盘并压缩备份的命令插入到临时目录下的bin/init文件 中,定制精简操作系统执行文件init;
把相应的板卡驱动模块复制到临时目录下的某一级目录中;
卸载临时文件系统,压缩定制后的文件initrd,并把压缩后的文件改 名为以结点名命名的启动镜像文件,放在简单文件传输协议首目录下;
按预处理环境规则生成预处理环境启动引导文件,在引导文件中要含有 以结点名命名的启动镜像文件名内容;
生成含有结点1-N的IP地址信息、MAC信息的动态主机配置协议配置 文件;
等待结点1-N的所有结点完成以上步骤,判断有没有其他的动态主机配 置协议服务器正在运行并有可能发生冲突,如果没有,则启动备份服务器的 动态主机配置协议服务;
向结点1-N并行发送重新启动命令。
5、根据权利要求4所述的机群跨平台并行系统镜像备份的方法,其特 征在于,结点机接收到重启指令后,正常关闭操作系统并重新启动,结点机 首先进入到预处理环境,向外发出含有网络接口设备MAC信息的报文,作为 备份服务器的动态主机配置协议服务器在接收到这个MAC地址信息后,查看 在动态主机配置协议配置文件里有没有匹配的项,如果有,则查找到该MAC 匹配的IP地址,给结点机返回该机的IP地址、启动文件以及其他信息;结 点机则以该地址作一个映射,在动态主机配置协议服务器的首目录查找对应 的文件;找到文件后,再在简单文件传输协议服务首目录中查找该MAC地址 对应的启动镜像文件并进行相应操作。
6、根据权利要求5所述的机群跨平台并行系统镜像备份的方法,其特 征在于,动态主机配置协议服务器通过简单文件传输协议向结点机下传操作 系统内核和启动镜像文件;脚本程序首先给网络接口配置原来的IP地址并 激活,建立本地路由;接着,开始执行备份任务;
当所有数据都读取完以后,向远程结点发送信息,通知系统备份完毕, 删除动态主机配置协议服务器中本结点机的MAC、IP地址等内容,重新启动 动态主机配置协议服务;
最后脚本程序执行经过改造的重启命令。
技术领域\n本发明涉及计算机系统管理技术,特别是涉及在由计算机机群构成的 跨平台并行系统中进行镜像备份的方法。\n背景技术\n机群是一组相互独立的、通过高速网络互联的计算机(又称为结点)的 集合,机群系统是以单一系统的模式对机群加以管理,即充分利用机群中的 每一台计算机的资源,又实现复杂运算的并行处理系统。\n机群系统的备份一直是机群管理系统的一个重要课题。它与单计算机结 点(以下简称结点)备份的不同之处有:(1)机群系统的备份是多结点的 备份,它要对多个结点的数据内容进行备份。(2)机群备份是网络远程备 份,通过网络进行备份。(3)机群备份要求是并发的。即多个结点同时进 行备份,就好像对一个结点进行备份一样。\n机群系统的备份可简单地分为文件级备份和系统级备份。文件级备份包 括一般的文件或目录备份。系统级备份包括文件系统备份、硬盘分区备份、 硬盘备份。其中硬盘备份也可称为“硬盘镜像”、“硬盘映像”或“硬盘克 隆”。按数据备份的实时程度也可分为同步备份和异步备份。同步备份所使 用的技术一般有RAID(redundant array of inexpensive disks)、高可 用(HA)等。同步系统备份要求在系统运行的同时对整个软件系统进行实时 的完全备份,容灾备份技术就属于这一范畴,目前只有具备很强技术实力的 大公司才拥有成熟的容灾备份技术。\n异步备份对备份的实时程度要求不高,可以延迟一段时间后,对目标系 统一段时间前的数据内容进行备份,也可以使系统暂时停下来对系统进行备 份。\n目前对机群进行异步方式备份的方法主要还是基于客户端结点备份到 备份服务器结点的“在线”备份方式。即结点机之间在网络联通状态下进行 网络复制。这种备份方法对文件级备份比较有效,但是对系统级的镜像备份 几乎是无效的。因为系统级备份需要保存系统引导区的内容,普通的复制命 令不能正确复制系统引导文件;而且系统在运行中有些系统文件是禁止访问 的。所以系统级镜像备份需要采取特殊的方法。例如用系统启动盘重新启动 系统后进行“离线”(相对于“在线”,不是真正的离线)方式的镜像备份, 其典型代表是Ghost。它的缺点也是显而易见的,它必须先用外部设备(软 磁盘)生成一个系统启动盘。\n现在,在大多数支持SCSI设备的主板BIOS里,都配备了PXE (Pre-Execution Environment,预处理环境),简化了动态主机地址分配 过程。而且Linux系统本身是微内核结构,可以以很小的内核及少量的支撑 文件构建起一个精简操作系统,在此操作系统基础上利用系统常用命令就可 以完成较复杂的操作,如压缩、远程调用、备份和恢复。\n如果能够设计出这样一种“离线”备份技术,使得系统的备份能很好地 利用新的硬件技术和Linux软件的长处,既可以用于系统级的镜像备份,支 持定时自动备份,支持一种以上的压缩方式,体现并行技术,又不需要人为 干预;将是对现有技术作出的一大贡献。\n发明内容\n本发明要解决的技术问题是提出一种机群跨平台并行系统镜像备份的 方法,使用本发明可大大降低备份和恢复过程操作复杂度,并行进行系统备 份,提高备份的速度,从而提高工作效率。\n本发明所述机群跨平台并行系统镜像备份的方法,主要包括如下步骤:\n一、初始化设置后,启动待备份的多个结点机,发送定时备份命令;\n二、判断定时时间是否到来,如果没有到,则继续等待,如果定时时 间到,进行下一步;\n三、生成远程备份用的启动镜像,远程重新启动多个结点机,该启动 镜像中包含系统备份脚本;\n四、这些结点机按照启动镜像中的系统备份脚本里的程序自动进行系 统备份,把系统程序完整地并行复制到远程的结点机中;\n五、备份完成后,结点机重启,自动返回到备份前的系统。\n本发明实现了对大规模机群结点的并行系统备份,既利用了PXE的优势, 又利用了Linux系统的特点,其主要的优点和创新点有:\n它有效解决了大规模机群中并行镜像备份的难题,在一次备份操作中, 对多个结点机的硬盘同时进行了系统级备份。\n对可能是海量的硬盘数据按照指定的压缩方式进行了压缩。\n无论硬盘中装的是Linux系统,还是Windows系统,经过备份以后,再 进行恢复,系统能恢复到备份前的状态,全部正常工作。\n加入了定时备份功能,在指定的时间(如周末或节假日),自动进行多 结点的并发系统备份,完全不用人工干预就可以完成多个结点的系统备份。\n附图说明\n图1是本发明所述方法的总流程图;\n图2是本发明所述方法中进行远程备份的流程图;\n图3是本发明所述方法中备份后结点重启的流程图。\n具体实施方式\n对于系统管理员来说,备份是经常需要考虑的问题,面对大量的服务器, 如果采用Ghost或其他常规的方法进行备份,工作量非常大,而且只能一个 个结点进行备份,工作效率非常低,而且备份和恢复操作的十分复杂。\n本发明主要解决大型机群中多结点的并行系统备份、跨平台备份、自动 备份和压缩备份的问题。\n如图1所示,在控制台对多个结点并行发出系统备份的命令后,多个结 点机几乎同时于指定时间自动生成每个结点机的启动镜像,启动镜像里包含 系统备份脚本程序,接着这些结点机几乎同时立刻重新启动,进入一个精简 的Linux操作系统环境,并能与备份服务器进行远程通讯,然后这些结点按 系统备份脚本里的程序自动进行系统备份,把系统完整地并行复制到远程的 备份服务器,复制的同时还可以按指定的压缩方式压缩备份文件,备份完成 后,这些结点自动返回到备份前的系统,整个过程无须人为干预。\n当硬盘发生物理损坏或硬盘分区出现软件故障导致系统无法正常启动 时,利用本发明进行恢复,可以快速地恢复原系统,而不用重新装操作系统、 再接着装各种应用软件系统最后进行复杂的配置。\n图2给出了本发明所述方法中进行远程备份的具体实施过程。\n首先,重新启动结点1-N,在系统自检完毕后,进入各结点的CMOS设 置界面,调整结点1-N的开机启动顺序(Boot Sequence),把从“PXE”启 动放在所有其他设备之前,确保“PXE”是第一启动设备。然后,下载 pxelinux.0文件放在备份服务器的TFTP(简单文件传输协议)的首目录下。\n接着,设置备份服务器的相关服务,包括:\n打开结点1-N定时执行命令的后台服务。对于Linux结点,如果需要启 动定时服务,只需要运行“/etc/rc.d/init.d/crond restart”即可。如果 需要一开机就运行定时服务,以超级用户身份在命令行上运行 “/sbin/chkconfig crond on”即可。对于Windows 2000 Server系统的结 点,如果允许程序在指定时间运行,操作步骤是:在“管理工具”的“服务” 里启动“Task Scheduler”服务。\n打开备份服务器的RSH(远程终端)服务,并把结点1-N的IP地址放入 RSH配置文件/root/.rhosts中,允许结点1-N通过RSH访问备份服务器。\n打开备份服务器的TFTP服务,允许其他结点通过TFTP协议下传文件。 以超级用户身份在命令行上在备份服务器上运行“/sbin/chkconfig tftp on”和“/etc/rc.d/init.d/xinetd restart”即可。\n在执行完以上步骤后,就可以按照以下步骤进行实质操作了。\n控制台给结点1-N并行发送带有定时时间的系统备份命令。结点1-N 在各自接收到备份服务器发送来的定时的系统备份命令后,把时间和命令分 别提取出来,按照定时执行命令的格式把时间和命令写到定时执行命令的配 置文件中,并重新启动Crond服务(Windows结点直接执行定时命令)。等 到定时时间一到,结点1-N同时把本机的MAC地址、IP地址等信息作为执 行参数,通过远程调用,在备份服务器上执行以下操作。\n把一个共用的文件initrd装载(mount)到一个临时目录,生成一个临 时文件系统,这个文件系统有共用的启动模块、通讯模块和必备的备份和压 缩命令。如果临时目录已被装载,则等待1秒后,再尝试装载。这个文件 initrd用一个特制的脚本文件生成,里面包含共用的模块、命令和库文件。\n把相应的模块插入命令、激活网卡并配有该结点IP地址的命令、通过 RSH备份该结点硬盘并压缩备份的命令插入到临时目录下的bin/init文件 中,定制精简操作系统执行文件init,该文件最后一条指令是执行特制的 重启(reboot)命令。\n把相应的板卡驱动模块复制到临时目录下的某一级目录中。\n卸载临时文件系统,压缩定制后的文件initrd,并把压缩后的文件改 名为以结点名命名的启动镜像文件,放在TFTP首目录下。\n按PXE规则生成PXE启动引导文件,在引导文件中要含有以结点名命名 的启动镜像文件名内容。\n生成含有结点1-N的IP地址信息、MAC信息的DHCP(动态主机配置协 议)配置文件“/etc/dhcpd.conf”。\n等待结点1-N的所有结点完成以上步骤,如果有某些结点机因故不能完 成以上步骤,则等待一段时间后强迫往下执行。\n判断有没有其他的DHCP服务器正在运行并有可能发生冲突,如果没有, 则启动备份服务器的DHCP服务。\n向结点1-N并行发送重新启动命令。\n图3是是本发明所述方法中备份后结点重启的流程图。\n结点机接收到重启指令后,正常关闭操作系统并重新启动,由于第一启 动项是PXE,结点机首先进入到PXE环境,向外发出含有网络接口设备MAC 信息的报文,DHCP服务器(备份服务器)在接收到这个MAC地址信息后, 查看在DHCP配置文件里有没有匹配的项,如果有,则查找到该MAC匹配的 IP地址,给结点机返回该机的IP地址、启动文件以及其他信息;结点机则 以该地址作一个映射,在DHCP服务器的首目录查找对应的文件;找到文件 后,再在TFTP服务首目录中查找该MAC地址对应的启动镜像文件。\n找到启动镜像文件后,DHCP服务器通过TFTP向结点机下传操作系统内 核和启动镜像文件。结点机开始导入操作系统内核,在内存中建立一个简易 文件系统,之后,操作系统首先执行init文件,当装载完必要的模块后, 开始按照镜像文件里定义的脚本程序顺序执行命令。\n脚本程序首先给网络接口配置原来的IP地址并激活,建立本地路由, 经过几秒钟试探后,操作系统建立起对外通讯的路由表;接着,开始执行备 份任务:先用系统复制命令读取本地硬盘数据,然后用RSH命令建立起远程 过程调用,通过远程调用建立起一个到达备份服务器的数据通道(也称管 道),数据通过该通道前被压缩,在通道的末端存储压缩过的数据。\n当所有数据都读取完以后,向远程结点发送信息,通知系统备份完毕, 删除DHCP服务器中本结点机的MAC、IP地址等内容,重新启动DHCP服务。 接着脚本程序执行经过改造过的重启(reboot)命令。\n结点重启时,虽然在PXE中将继续寻求动态IP地址,但是由于没有相 应的DHCP配置项,所以该结点将得不到本机的动态地址。一般PXE都设有 超时控制,超时时限一到,结点机将正常进行硬盘启动,读取硬盘上的BOOT 信息,然后进入到正常的操作系统中。\n恢复过程与上面介绍的备份过程十分类似,除了恢复过程要使用对应的 恢复命令和参数之外,与备份过程不同之处还主要有:\n备份命令的参数包含有要备份的硬盘或分区名,而恢复命令相应的参数 是对应的镜像文件名(或磁带机设备名);\n备份如果应用了压缩,则恢复要用对应的解压缩命令;\n恢复步骤进行到重启结点之后,进入到开始执行恢复任务的时刻,先通 过RSH命令建立起远程过程调用,并建立起一个到达备份服务器的数据通道 (管道),通道的开始部分用系统复制命令读取远程数据,数据通过该通道 时被解压缩,在通道的末端把解压缩的数据写到本地硬盘或分区上。\n总之,本发明大大方便了机群中多结点系统备份,可以完整地备份多种 操作系统,也就是说可以对多个硬盘分区或整个硬盘进行彻底的镜像备份, 而不管硬盘分区和硬盘上安装的是什么操作系统。本发明是一种适合于机群 中跨平台的、异步方式的、系统级镜像备份方法。\n最后所应说明的是:以上实施例仅用以说明而非限制本发明的技术方 案,尽管参照上述实施例对本发明进行了详细说明,本领域的普通技术人员 应当理解:依然可以对本发明进行修改或者等同替换,而不脱离本发明的精 神和范围的任何修改或局部替换,其均应涵盖在本发明的权利要求范围当 中。
法律信息
- 2006-09-20
- 2005-03-16
- 2005-01-19
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |