一个典型的市级电力系统数据备份方案研究由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“数据备份安全设计方案”。
一个典型的市级电力系统数据备份方案研究
摘 要 本文针对电力系统的数据备份提出了一个有效的总体解决方案;分析了电力系统的数据备份需求,并在总体设计上对采用备份软件+SCSI磁盘阵列柜模式与ISCSI+ISCSI磁盘阵列模式的两种设计方案进行比较;设计了市县一级的电力系统典型备份原则与方法,最后对备份管理,策略,演练制度等进行论述并在实际实施过程当中得到了效好的应用。
关键词 电力系统;数据备份;备份策略引言
近几年随着计算机技术和网络技术的不断发展,越来越多的传统应用被陆续转移至计算机信息系统上;信息化进程正逐步地改变着人们的生活,电子化办公、电子商务与我们的联系越来越紧密,人们对系统的持续运行能力的要求越来越高。在我们继续进行信息化建设的同时如何保障系统的高可用性,维持系统的不间断运行成为我们必须面对的问题。
在对电力系统的数据备份的实践中了解到,不管是电力营销数据还是系统中心数据,对于数据的安全是极其重要的,每天都有大量的业务数据信息资料产生,保证系统的不中断运行对保证电力系统的信息服务具有重要意义,所以系统对可靠性有很高的要求。我们建议采用高可用技术来保证电力数据中心的可靠性[1][2]。
高可用性是指系统无论是硬件或是软件失效,保证客户应用服务不间断的能力。要设计高可用性的系统,我们应先清楚导致系统停顿的原因。如下图所示:
图 1 系统停顿的原因分析
从上图分析我们可以得出导致系统停顿的前5个原因都跟系统的硬件和软件有关;而在现在的信息中心由于都配有UPS不间断电源,对于第6个问题我们一般不需要做考虑;至于最后一个原因自然灾害,要在其发生时仍保证系统运行的不停顿,需要投入的成本太高,在一般信息中心也不需要考虑;所以我们需要考虑的是当以上5个问题发生时如何维持系统的继续运行。
为此我们推荐采用磁盘阵列+双服务器+双机软件组成的双机容错系统来解决以上的绝大部分问题,提高医院HIS系统的可用性。高可用性软件简单的说是两种功能的综合:监控功能、切换功能,其基本工作原理是服务器间通过软件监控服务器,当某服务器硬件或是软件失效,软件的切换功能发生作用将中断服务器的工作在指定服务器上启动起来使服务器的工作得以继续[3]。2 备份需求 假定核心的电力营销系统采用双机热备模式,数据库为oracle,由于各个下属电力企业或者是电力局的信息化建设水平不一,服务器的配置从PC-SERVER到小型机(如,HP ALPHA DS20E)每个县局数据量在20G左右。办公自动化系统即OA系统,一般的县市级都采用PC 服务器,Windows系统,Lotus,Domino数据库,每个县局一般的数据量在20G左右。桌面级的PC机数据备份,假定每个县100个点。
那么一个典型的市级电力系统数据备份需实现哪些功能呢? 首先在各县局本地实现系统的数据自动备份;其次是实现各县局的电力营销系统、办公自动化系统的数据在市局有定期的备份;第三,系统还要能实现在市局查看、管理、控制各县局的备份系统,设置数据备份策略[4]。数据备份系统总体设计 3.1 中心局数据备份
对于中心局数据备份我们推荐两套方案:方案一是采用备份软件+SCSI磁盘阵列柜的方式实现;方案二是采用两台ISCSI磁盘阵列的方式解决数据安全的问题,下边分别进行阐述:
方案一:采用一台PC服务器做为整个网络的备份服务器,在这台服务器上安装CA BAB备份软件的服务器端和桌面级备份软件的服务器端,在服务器上安装相应的客户端选件,在PC上安装桌面级代理选件。把磁盘阵列前期配置2TB的存储空间,划分为两个分区,一个分区用来存储服务器的数据备份,另外一个作为桌面级数据的备份存储空间。
本方案中对磁盘阵列的选型上有两个选择:Nstor4110S(采用SCSI硬盘接口);NexStor4710 SATA(内部磁盘采用SATA接口,主机接口还是SCSI接口)。
通过一台备份服务器来管理两套备份系统,对两套系统制定不同的备份策略。由于信息中心与下属单位的网络带宽只有2M,所以制定备放策略时结合完全备份、差别备份、合成备份等备份方式灵活设置,建议每周进行一次全备份,其余时间进行差异备份。另外在备份时间上也可以考虑分时间段进行备份,例如可以选择每10个客户端一组进行备份,这样可以减少由于备份产生的数据流对网络的影响。
方案特点:
(1)完全中文的管理界面,操作简单;
(2)备份策略和方式设置灵活,支持完全备份、增量备份、差异备份、合成备份等,可以由客户端发起备份,也可以由服务器端发起备份。
(3)可以实现整个网络环境数据的统一管理。
(4)容量大,磁盘阵列可以实现28TB(采用146GB SCSI硬盘)的轻松扩容。
图2 略去份软件+SCSI磁盘阵列模式
方案二:采用两台ISCSI磁盘阵列,在信息中心的服务器以及下属单位的客户机上安装ISCSI的协议套件,为每个客户端分配一定的磁盘空间,考虑到网络负载以及ISCSI设备负载的实际情况,我们把客户端平均分配到两台磁盘阵列上,通过ISCSI设备自带的数据复制功能实现两台设备之间的数据复制,达到同样的数据有两个相同的副本保存,提高了数据的安全性。
此方案在管理和使用上都比较适合数据分散的环境,但是唯一的缺点就是受网络带宽的影响比较大,可能在实际应用中数据的读取和保存的延迟比较长。
图3 ISCSI+ISCSI模式
3.2 下属局典型数据备份
(1)所需设备和软件
PC服务器1台,配置要求:单CPU,1G内存,双73G SCSI硬盘做镜像,千兆网卡,有外部SCSI接口与磁盘阵列连接;
一台SCSI磁盘阵列作为备份设备,可用磁盘空间在1TB左右;Veritas NetBackup备份软件,根据各县局的系统具体情况配置相应的软件模块。
(2)县局本地数据备份
在每个县局配置相应的备份软件和硬件设备后,就可以通过内部局域网实现电力营销系统、OA系统、桌面系统的本地备份。桌面系统的数据备份可由服务器端设置,也可由客户端发起备份。
(3)县局核心业务数据的异地备份 结合市局原有Veritas备份软件和STK带库,可实现各县局的核心系统的数据异地备份,但要求备份软件版本一样。具体实现方法有两种,这两种方式各有优缺点,分别如下: A、备份县局的备份服务器数据:
在市局新建备份作业,把县局备份服务器作为客户端,备份县局备份服务上的备份数据,对备份数据再进行一次备份。主要优点有备份县局备份服务器上的数据时对前台业务系统没有影响。可设置灵活的备份策略,可有多个数据恢复点,是数据丢失降到最低,如周六做全备,周一至周五做增量备份。缺点是不能把备份数据直接从市局恢复到县局的业务系统上。当县局有数据需要恢复时,而县局备份服务器又出现问题时,数据恢复必须先从市局把备份数据恢复到县局的备份服务器上,再从备份服务器上把数据恢复到业务系统上,在这种情况下,数据恢复的时间大大增加。B、直接备份县局业务系统的数据:
在市局设置相应的备份策略,直接备份县局的业务系统。主要优点是因为采用直接备份的方式,所以当需要从市局恢复数据时,可直接从市局备份系统中恢复到县局。缺点是在市局针对县局的异地数据备份只能采用全备的方式,不能采用增量的方式,这是由数据备份原理决定的。这就会影响市局备份县局数据的备份频率(不适合每天全备),并决定数据恢复点。在市局做县局业务系统做数据备份时,会对县局业务系统的性能有影响[5][6]。4 数据备份的管理
4.1 备份系统管理员的职责
如同系统管理需要设置系统管理员、数据库管理需要数据库管理员、网络管理需要网络管理员一样,管理备份系统也需要有相应的人员来负责。备份系统虽然不如这些系统那么复杂,但也需要相当的学习才能对备份系统进行有效、安全地管理。备份系统管理员可以是专职的也可以由系统管理员、数据库管理员或网络管理员兼职。或许这些角色都集中在一个管理人员身上。至少应安排一个备份系统的管理人员,如果条件允许,也可以安排另一个管理人员以防止主要管理员不在的时候有人负责对备份系统进行管理。
尽管备份系统管理员可以对整个备份系统进行任何操作,但实际上备份系统管理员的主要职责应该是协助其它管理者使用备份系统。
4.2 备份策略制定的角色
无论是在制定新或改变已有的备份策略时,备份系统管理员应与系统管理员和数据库管理员进行沟通,由他们决定备份策略的内容,也就是说备份策略的制定者应该是系统管理员和数据库管理员而不是备份系统管理员。备份系统管理员只是负责协助他们使用备份系统。由系统管理员和数据库管理员决定对哪些数据进行备份、备份在什么时候进行、备份是使用全备份或增量备份以及备份的保存周期等。
4.3 恢复的管理
恢复的操作直接影响到实际的应用。如果进行了不正确的恢复操作可能会造成可怕的后果。因此,恢复操作应严格按一定的操作程序进行,而绝不能由备份系统管理员或某一个应用者进行恢复操作了事。
1)故障确认
在进行恢复之前首先应该确认造成故障的原因。故障的原因非常多,应该分清是操作系统的故障还是数据库的故障。如果是数据库的故障,不同的数据库应采用不同的故障分析方法,有时可以使用数据库提供的故障诊断工具进行故障分析。这些工作应由相应的管理者如系统管理员或数据库管理员负责进行,在完成故障分析后确认需要进行恢复操作时,由相应的管理者提交书面的故障分析报告。2)制定恢复计划
备份系统管理员在收到故障分析报告后应与相应管理者一起制定详细的恢复计划,包括恢复的内容、恢复的时间、恢复的操作步骤、恢复对应用造成的影响等,最后形成一个书面的恢复计划。备份系统管理者应将故障分析报告与恢复计划一起提交到相应的主管领导审批。主管领导应确认恢复对生产造成的影响,在批准执行恢复前应以相应方式与有关部门进行沟通和通知有关部门进行恢复前的准备工作。
3)恢复操作
在进行实际的恢复前,备份系统管理者与相应管理者应再次确认恢复计划的可行性及造成的后果。确认无误后进入到实际的恢复操作。
在进行恢复前,还应该做的一件事情是对现有的内容作相应的备份。以防止在恢复中心局数据备份。4)恢复后的操作
完成恢复后应测试恢复的结果。在完成恢复结果测试成功后,对恢复后的系统进行相应的备份。
最后,将执行恢复操作的管理者、恢复操作的时间、过程、完成的状况等形成书面报告,报有关领导进行审批。
有关领导确认恢复完成后,通知相应部门恢复有关的应用。审批后的恢复报告应与故障分析报告、恢复计划、恢复操作报告一起进行存档。
4.4 介质管理 1)介质的安全性
存放在备份磁带中的数据的重要性是不言而谕的。因此,防止因环境、人为等因素对磁带造成损坏,还要防止人为泄密等,需要对备份磁带进行有效安全的保护。备份系统管理者应随时将磁带库上锁,同时,在可能的情况下防止非有关人员接触备份系统。备份系统管理者还应该严密保存备份系统管理者的口令,以防止有人无意或恶意对备份系统及备份进行破坏[7]。
2)介质的存放
为了防止灾难的发生,备份的介质必须定期送往异地进行存放。方案建议对所有关键数据进行介质复制,备份完成后将复制的介质取出存放到异地,将所有备份数据的介质从备份磁带库中取出存放到异地。对于每天进行的增量备份可以每天完成备份后将备份数据介质从磁带库中取出进行异地存放。
取出数据备份介质的同时也应将备份系统数据库的备份介质一同取出进行异地存放,以便于在灾难恢复时能够快速重建原有备份系统。
3)对长期保存的备份进行校验
应该定期对长期保存的备份进行校验,以防止在需要时备份不可用的情况发生[8]。
4.5 数据恢复的周期性演练制度
要能够保证发生数据灾难后进行可靠的恢复,光进行备份是不够的,还要进行数据恢复的演练。
每过一段时间,应进行一次数据灾难演习。可以利用系统正常维护的停机时间内进行(演练前要做一次系统的全备份),也可以利用淘汰的机器或多余的硬盘进行数据灾难的模拟,以熟练数据恢复的操作过程,并检验所制定的备份策略的有效性和备份的可靠性。5 结束语
通过从总体上的备份方案设计与相应备份策略,备份管理制度的建立,可以使一个典型的市级电力机构的数据得到有效的保护,当然数据安全是一个综合性的系统工程,单从技术上是无法得到充分的保证的,这取决于建立一个系统的数据安全管理体制,包括对人员的管理。将来的工作是如何在不改变现有仪器设备的前提下,如何使各种数据得到有效的保护。本文在某地级市电力局数据中心的实际的方案实施过程中到了较好的应用。