演讲主题:VTL智能化灾备解决方案
演讲内容:SEPATON公司大中华区技术总监 王 震
尊敬的各位先生们、女士们,先自我介绍一下,我叫王震,名字很好记。我是美国
SEPATON公司北京代表处大中华区的技术总监,今天和各位电信运营商的朋友们一起探
讨一下,关于我们运营商的灾备解决方案,我们为此作了很长时间的努力。我们主要推
荐的这种解决方案是基于虚拟磁带库技术实现的。
我们知道运营商的灾备在整体的数据保护方面是一个非常重要的事情,但是面对这样的
解决方案,不代表说我们会把这个资金投入量一定要很大才能得到很好的效果,因为往
往不见得我们所有的投入都能兑现成生产力,所以我们认为在解决方案上面的设计和规
划以及实施方面,应该根据自己的需求量体裁衣。
所有的成本投入都是根据需求,需求越高,往往我们的投入越大,从先进的大环境,从
世界范围来看,不论是能源产业还是我们的IT产业,都推崇的是一种绿色环保型的产业
结构。我们在耗电量、散热、噪音、辐射等方面,以人为本的做很多额外的考虑。就中
国目前的政策来说,我们在IT发展战略上所推崇的是一种节约型的经济体制。大家知道
现在机房的占地面积都很贵,我们除了在IT建设、基础设施建设上面的投入非常大,如
果在单元面积上所带来的产值可以通过这种高性能、高集中的设备,实现更高的产值的
话,我们将大大节省我们的成本。从系统建设的长远规划,我们不仅要买设备、还要养
设备,那么包括耗材还有一些辅助设施的开销,都成为今天兑现需求的一个成本考虑。
我们的数据越来越多、增长地非常迅速,中国的运营商已经发展到了这种24小时不间断
地获取数据和处理数据的阶段。我们目前运营商对数据的追诉性,讲究一个历史数据的
追诉性比以前的需求要高了。从效率和系统的安全、稳定性来说,都要为这种不间断的
业务提供一个基本的支撑。公司扩大化了,越来越严密的法规制度,我们需求给法规遵
从提供一定的理论基础和材料的供应。
像一些突发情况下的应急紧急预案,这是我们不得不在容灾和灾备里面要考虑。甚至成
为了国家审计以及IPO的先决条件。包括一些对上市公司颁布的法案,都是对一个IPO公
司的容灾以及它的灾备有明确的需求。所以我们来自于社会的大环境,除了我们数据上
的增长、应用上的增长,还有一些社会环境的基本需求,都会使我们的成本为此在计划
上做一些改变,甚至追加一些成本。在这样的社会大环境下,要我们的决策者非常有冷
静的、并且多方面的去考虑自己的投资。所以我们另外一方面认为,这样的灾备方案解
决方案应该综合规划,实现多级的支撑。从目前来讲我们发现,从事历史数据追诉的过
程当中,不但说像主存储器需要多级支撑,同样现在我们也要在这个灾难备份、数据保
护这些方面实现多级支撑。
在以往来说,我们大部分的工作是建立了一个高速的数据存储以及处理的网络。我们实
现了SAN网络的架构,基于这种多并发的技术,在事业发展的第一步,我们实现了数据
的集中存储和管理。在这方面,我们采用的基本上是造价比较昂贵的磁盘阵列技术。很
快,我们会发现数据的贵重性,它的无形资产的贵重,已经超过了我们所有所投资的设
备本身的价值,是我们企业的核心,为了保护他们,我们采用了有效的容灾措施,用了
这种镜像或者是同步、异步复制的磁盘阵列技术来去存放我们的数据,在同一个链路或
者是同城异地等建立这种容灾的中心。
但是这种技术呢,从目前情况来说,它并不是非常成熟的,尽管我们现在大力倡导一些
灾备的包括容灾的切换演练,但是实际上有很多用户并不具备这样的演练环境。那么容
灾的解决方案体现出来的,它的实效性非常强,但是带来的是比较大,里面掺杂的硬件
和软件的内容比较复杂,实施起来难度也很大。甚至如果你不去通过演练,或者是不出
现这种数据,问题你都不知道建的容灾到底是不是有效,切换以后数据是不是真的可
靠。那么无可避免的,这种基于磁盘阵列和文件系统会受到很多问题的侵害,当我们的
主生产线出现问题的时候,我们往往以来副生产线,或者是灾备中心。但是很多像逻辑
上的错误、病毒等等,网络安全造成的数据残缺问题,他一脉相传的会从你的主存储器
把错误推向你的镜像存储器,最后我们依然还是要靠备份。
当然有很多运营商的朋友,尤其是省级中心,他们的磁盘阵列甚至可以达到一个1:1的
地步,在这种情况下,就真的安全了吗?如果你所有的主备系统都存在这种逻辑错误的
传递性,最后还是要靠灾难备份来恢复和修正这种错误。所以最后我们认为灾备它是最
后一道防线,甚至我们可以基于现在的机密和远程传输技术,把数据传载异地,做异地
的一个灾难备份中心,这样的灾备解决方案,它在数据的实效性和追诉性来说,要次于
我们的容灾,但是所带来的它的投资比较节省。而且这部分无论是第三方的软件还是目
前的硬件,可能用磁带库可能用镜像存储的磁盘,或者是像我们推崇的用虚拟磁带库,
但是相对于真正容灾的系统来说,它的造价都比较廉价,实施也非常大的简便。
灾备这个解决方案,我说它是最后一道防线,依据我们用户的等级和投资预算,比如我
们运营商朋友是省级中心还是地市。当然很多运营商地市的资源都被上归到省级中心
了,他所剩的数据资源、主机资源都相对比较少,但是还有一些反馈数据。比如月结性
的表单别分还是要进行保护的。相对于这种需求来说,根据投资和需求的级别,我们认
为容灾不一定说是每一个机构都需要采用的数据保护方式,但是灾难备份是一个行之有
效的必选方式。基本上从省级中心到地市我们都需要灾难备份或者是备份技术来保护数
据。
以往来说从60年代到现在,普遍用的都是磁带。现在我们有一些运营商会采用镜像,实
际上归根到底只有一个原因,就是在用磁带做现在的灾备的时候,没有信心,对这个设
备存在越来越多的置疑。这是为什么呢?其实普遍存在的问题,比如说我们的单一备份
模式,当我们建立一个备份或灾备系统,我们可以简单地实现这种本地的备份。当然通
过这种第三方的功能,我们可以实现到磁盘存储或者是磁带库,可能是不同建筑物、同
城异地的这总备份,这样对于一个运营商来说,是一个很常见的问题,这个之间,我们
面临的一个数据传递问题,就是要使用一个相同的备份软件平台,我的备份至少是一个
品牌的,在这个之间想实现这个数据的传递,就不是那么容易了。
所以呢,备份软件,以往我们会委托第三方的这种专业的磁带、传输厂家或者是服务
商,甚至自己来做这件事儿。有效的方式是把数据备到介质上面,然后将介质运到异
地,再由人进行编目、保存或者是实现对另外一地的备份系统里面去做恢复。实现这样
的迁移过程,往往也不局限于说灾备,比如我们的BI,或者是这种数据生命周期当中,
对数据的分析也需要把数据交割到异地,也存在这种需要。
这个环节当中,很多公司为这种形式都付出了代价,因为这些人为的逻辑错误,造成磁
带的损失,比如损坏、或者是编目出现问题,或者是丢失,或者是有针对性的恶意窃
取,历史上很多公司都为此付出了代价。总结一下目前这个数据迁移或者是灾备过程
中,我们以往的做法主要是依赖于介质,那么介质的载体安装比较复杂,占地面积大,
以及他养护方面都是一个问题,比如会频繁地出现这种机械故障,当然除此之外还会有
疲劳性故障。还有一个问题是我们倡导的是,在IT产业当中不要用单一技术解决所有的
问题,这样的话用户会像骑上一只老虎。你如果用磁带库来做这件事儿的话,就有这种
问题存在。我们会发现所有需要磁带库之间传递介质来迁移数据的,你必须要有相同品
牌的驱动器和相同规格的磁带,甚至是相同品牌的备份软件才能实现,这就是单一技术
解决全部问题。
因此带来的可能是面临在软件支持上、或者是硬件维护上,提供服务商的单一来源、备
件的垄断、居高不下的服务价格等等这些,都是后续产生的问题。从以往这个介质来
说,它也比较脆弱,它的复写能力比较差,恢复性能慢,备了从来都不敢验证,其实很
多系统管理人都面临这个问题,从来都不知道自己备的东西是不是真的可以恢复。过了
一段时间之后拿出来,一盘磁带有问题,可能所有的介质都会受到牵连,所以没法验
证。
这是后来用户转而要接受虚拟磁带库,接受这种以磁盘为技术的备份的一个原因。当然
有些运营商的朋友也同样在接受虚拟磁带库之前,就考虑用磁盘来进行镜像存储的备
份。但是虚拟磁带库实际上要比磁盘做备份更有很多突出的优点,后面我会和大家继续
地研讨,我们到底会比磁带库和磁盘做备份有什么好处?为什么虚拟磁带库在磁盘基础
上封装一层,变成磁带库。
目前,在我们现实中,对这种灾备解决方案遇到了挑战,主要的原因有三个方面:持续
增加的数据,相对持续增加的数据,窗口时间的要求,反而没有增长,甚至我们想增大
备份的幅度、频率。因为我们知道离自己时间越近的数据备份,恢复出来才越有价值,
时间越长,你备4个小时和备半个小时,哪个数据追诉起来更有意义。那么可用系统资
源是一个整体,我们的大力发展还是放在主生产线,甚至容灾,那么投资真正分到灾备
或备份上是非常有限的,毕竟很多场合备份还是一个后备力量,他属于养兵千日、用兵
一时。
我们现在面临的就是尽量用少的资源保护更多的数据,这是一个任何用户都具有的期
望,在这样日益复杂的系统结构之下,单一的解决方案,显然给我们选择的依据太狭窄
了。因此我们为了解决目前在灾备上面的这些突出的矛盾,提供了一个基于自己虚拟磁
带库的运营商的灾备解决方案,但我跟大家来讨论一下这个解决方案,这是咱们今天讲
演的一个主要部分。
首先这个解决方案的基准是接受我们所推崇的这种虚拟磁带,SEPATON作为一个虚拟磁
带库的专业厂商,为业内提供从低端用户到高端用户、从非核心业务系统到核心业务系
统的不同级别产品。这里面有一个很突出的特点,就是我们的产品会像你业务的兄弟一
样,随着它的成长而逐渐成长,产品在扩容的时候可以从最基准通过性能或者容量的升
级、扩建,一直扩到这个产品的终极模式,不会成为两套设备,不会成为你升级中说需
要另外购买的一套设备。
从磁带机和磁带库的方针能力来说,我们提供业界种类最多的磁带库设备方针功能,这
样可以去和用户从老版本到新版本各种备份软件去支持。就业界来说,我们所能够和备
份软件的最低版本的兼容能力是最强的。结合我们的副本删除技术,可以实现25:1的
压缩效应,性能呢,大家可以去阅读需要虚拟磁带库的运营厂家,SEPATON的指标,基
于它的独特架构,可以从300MB每秒平行扩展到19200MB每秒的并发写或恢复的能力。从
提供给用户的端口数以及方针的设备的数量,也是业内最高的,完全是站在领先的地
位。
从这个产品的背景来看,从2003年年初伊始进入中国市场,他在国内几乎已经达到了5
年的市场锤炼。值得夸耀的是,从2003年至今,SEPATON保住了每年中国市场单台配置
容量和性能最高的虚拟磁带库的赢家,到目前为止,每年最大的配置都是我们中标,在
用我们的设备。那么原因呢很简单,我们的架构是业内唯一的,不会有第二家相同,就
是我们是唯一一家把这个格瑞的网格计算技术用在这个虚拟磁带库领域的。这种技术使
得我们在性能和容量上的扩展完全成整数倍增长,因为每台我们的控制引擎是一个并行
计算系统,我们可以靠机器和独立总线的扩展方式来增加性能,可以线性的扩展,不是
小数点级别的增长,而是整数倍的增长。
结合我们的自主知识产权的产品,我们可以提供一整套的灾备解决方案,可以使用户在
单位面积上的存储能力,实现倍数级的增长。从未来的发展方向来看,我们最终不是一
个产品提供,而且作为一个解决方案提供商,甚至为超越备份再开发一些更有价值的软
件,比如说我们的归档数据可以直接查询,进行关键词、关键字查询到之后直接用于浏
览。这个虚拟磁带库产品,它从使用原来来说,前面这些专家也介绍过,其实和磁带库
它的结构以及它在整个运行环境由第三方软件的操纵方面,都是和磁带库无益的,从这
点来说,它除了外观、性能、容量有所改变之外,它从操作方式来说和以前没有任何区
别。任何一个做过磁带备份的管理员都非常好上手,不用强迫地接受一下新的事物。
从施工来说,它的实施能力完全是在结构上去替代一个磁带库的位置,所以结合性非常
简易,切换时间、上线时间都非常短。前面是我们来实现解决方案的基础,是虚拟磁带
库存设备,我们来提供运营商领域用来解决方案的途径,解决利用这个虚拟磁带库的基
础之上,结合我们独立开发的副本删除技术来实现。第一步我们是实现一种电子传送模
式,结合前面所介绍的内容,过去我们在数据传送方式是由人为做这件事儿,里面掺杂
了很多这种人为接触点,从成本来说是额外的开销,从安全性来说,是对数据的可能具
有的损害的隐患。其实使用的原理是很简单的,用这种基于TCP/IP的技术,加上这种加
密的技术来实现在网络上的电子传送。
我们知道这个传送数据它是需要有一定的带宽,数据量越大的话需要的带宽越强、越
高。作为运营商来说,自己的带宽肯定是非常富裕的,但是不是说我们的一个业务会把
所有的带宽一大部分都用掉,实际相对贮存来说,备份应该用的带宽要尽可能的少,不
影响这个正常的业务。这种情况下,SEPATON的解决方案把过去这些由人来完成的动
作,像取磁带、运输以及编目、导入都由电子过程来完成,这样的话消除了人为因素,
降低了成本,从而可靠性就增加了。因为一个电子传送的话,我们是可以由日志,甚至
是策略这种方式去规划和跟踪它的。
看看我们如何解决前面的问题,我们前面提出了疑问,我们不能够实现以来第三方软件
的这种自动传送,SEPATON是怎么去做的呢?这种电子传送行为实际上和用户的任何主
机、任何备份软件都没有关系,它是一种发生在备份之后的东西。我们按照既定的策略
可以在任何时间按照指定的对象,甚至规划的带宽和规划的并发数据流去做传送,它完
全是发生在几台虚拟磁带库之间的事情。它它在传送的时候表现出的一个很大特点,不
光通过电子节约了去除了人工的部分,还不会占您主机的资源。
在此还设计了一些注入断点续传、加密等等这些,包括对并发数据流的占用展宽的优化
等等。从传送模式来说,支持一对一、一对多、甚至多对一。对于我们运营商向下属单
位、向中心级别单位去收集数据,也可以采用这样的模式,甚至我们可以用这种灾备的
模式去实现数据上收。因为过去来讲用磁带库不太能做,现在有一个高性能的设备,如
果说花这些钱单纯用它去做备份的话,就有点儿太浪费了。平常的话甚至可以用它来做
这些数据上收,利用这种迁移功能去做不同系统之间的数据交割。比如说我们在河北网
通的ADSL计费里面,用的虚拟磁带库除了备份,他们可以从计费系统里面可以把数据交
割到查询系统里面去,实现这个数据的交割。
SEPATON在这个灾备解决方案当中是具有很高的运营价值的,首先它是结合VTL使用的。
它是一种基于磁盘的这种方式,能够更快速的向异地传送数据。同样,我们这个数据可
以在异地的时候,可以推动第三方的软件实现到机械磁带库的归档,这点和国家的审计
制度都是符合的。你依然可以把数据做离线保存。
通过这种方式,我们目的是引导用户逐渐进入一种,在这个数据迁移当中,不适用介
质、不依赖介质的这种无磁带的环境。特点是我们的主线备份我们所谓讲到的多级支
撑,当我们的住备份出现问题的时候,也可以通过网络从任何一个分支的远程站点,直
接进行数据恢复。我埋下一个伏笔,就是当时我说咱们运营商虽然带宽很富裕,任何一
个运营商都不会为这个数据传输带宽的问题,因为我们进行的就是管理这个带宽。对于
不同级别的应用带宽也不能浪费,当然可能尽量短的时间传更多的数据,这是一个期望
值很高的愿望。
我们第二把利器,就是网络优化和存储空间压缩的技术。面对这些带宽不富裕的用户或
者是我们想节省带宽,数据量多,这两件事儿是非常矛盾的。我们提出的理念也是副本
删除技术。SEPATON可以算得上是第一个提出副本删除概念,并且第一个拥有这样产品
的公司,并且我们很自豪地作为也第一个在卖、有成功案例的公司。我们有众多这样的
成功案例,在中国也有成功案例。尽管现在很多厂商在说,但是大家好像还是在一个技
术推广阶段,而我们在此已经做了甚至3年到4年的努力。这个软件主要面对的就是数据
量增加,而备份时间缩短的这种窘境之下,去通过逻辑上的重复数据删除去带来一种最
低25:1的压缩效应。它可以深化单元磁盘存储能力到25倍以上,从而节省磁盘,使磁
盘看上去比磁带更便宜。因为就目前市场价格来说,磁带好像更便宜,但是这样的话我
们发现磁盘比磁带更便宜,并且发现我们在空间便利、能耗、噪音对人的伤害,包括电
磁辐射方面,都要比以往的方法要突出的改良了。
这样的技术,目前在磁带库和镜像磁盘做备份的这种方式下是不存在的,只有在虚拟磁
带库上才可以满足。它的工作原理我想细致地向大家介绍一下,因为目前这个技术,实
际上是如火如荼。当第一次这个数据进入到虚拟磁带库数据里面的时候,我们的虚拟磁
带库软件会为这些数据建立特征库形成一个单独的指针数据库,对数据字节级别进行扫
描,这个工作完全是一个在备份之后发生的事情。大家看上去这个处理过程应该是很漫
长的,要很仔细地比对这个数据,但是SEPATON可以以很高的性能来做,得益于我们的
架构,我们可以把物理上隔开的多个引擎,并行计算技术,用多CPU并行来算这些数
据。其他的厂商,之所以它相对性能会比较慢,是因为他没有这种并行计算技术。
当第二次这个数据进入到系统之前,我们会在两次数据之中进行比对,发现它相同的部
分,然后用逻辑指针的对应关系去标志出哪些数据之间是完全相同的。在检查这种链结
关系完全没有错误,数据完整性没有问题的情况下,才会去做空间回收,也就是我们会
把重复的数据擦除掉。那么常来常往,当我们的备份累计进行,有这个软件会自动学习
你的备份模式、备份策略,去分析你是全备、增量还是差异备份,去对其他的这些备份
去做副本删除,针对策略,我们任何的一个备份模式,都可以得到这个副本删除的效
果。在副本删除之后,如果我们对一个逻辑上副本需要恢复的时候,它并不是说在虚拟
磁带库里面,先将这些数据按照指针提取出现合成,然后再进行恢复,而是直接通过这
些指针,抽取原数据,直接用于用户的恢复。
所以这种工作模式所体现出来的它的恢复和备份一样的快。我们可以发现,原来只能存
几个月的空间,可以通过这种技术实现甚至几年,因为它在单位磁盘上可以产生25:1
到1000:1的压缩比。大家要清楚这不是一种简单的数据压缩,而且通过比对产生的一
种压缩效应。当经过这些处理之后的数据,我们会发现不需要在网络上去传输真正的数
据,而只需要把从重复数据的指针和真正差异的部分,用于一次异地数据迁移,因此我
们在异地获得一个真正的全量备份,但是它的传输过程会从原来很长时间变成几分钟。
从它的特性来说,这种技术,他是针对文件内容和备份数据关系的内置智能软件,它是
按照字节级别比较全部文件的数据,对数据可以实现最大的保护,是校验完整性之后,
才去删除原数据的一个过程。它消除了很多杂乱无章的重复数据,在大幅度节约这个成
本的同时,它还提供了一个非常完美的基于磁盘的数据保护,费用上相当于比磁带还便
宜,我们得到了一个很高的压缩比。从数据的生命周期来看,我们可以用本来已经有限
的磁盘资源,通过加载功能,就变成新的这个逻辑上扩展出的磁盘资源,去满足一个数
据的完整生命展期。
我们仍然可以得到最快的备份和恢复性能,我们在备份之后做这件事儿,不是在一边备
份、一边做,它具有一个毫不影响生产线这个性能的优点。这点很突出的是就目前来
说,在开发这种副本删除技术,只有SEPATON是按比对方式进行的。
所以我们是用纯数据位的比对,我们所倡导的是引领用户到一个无磁带环境,首先我们
布置虚拟磁带库,这样呢我们用一个量化的指标来形容一下,假设一个用户一个备份周
期用304盘物理磁带,通过引用虚拟磁带库减少了一部分物理介质,我们还用68盘,我
们可以把数据传输到异地,减少在数据传送当中的物理介质,降低到34盘。从可靠性上
来说,我们避免了一些机械磁带库固有的故障。从安全性来说,我们将认为所造成的数
据损失几乎去除了,从效率来说,我们屏蔽了介质管理,以及持续的这种介质保存上面
的开销,简化了用户的管理流程。符合现在社会所推崇的一个绿色环保,基于这5方面
的整体特点,我们消除了人为错误,以及磁带数据丢失的可能性和数据恢复的瓶颈。
由于时间的原因,我非常简单地介绍一下我们的成功案例。SEPATON这个公司历史上蝉
联了2004、2006年度的硬件备份产品金奖,是美国高科技50强、北美排名第五。那么从
历史上来说,不光我们在国内每年最大单的虚拟磁带库是我们的产品,我们是全球唯一
拥有单套设备超过200TB的成功案例的厂商。而且唯一自己有过200TB以上的成功案例
的,只有我们一家,而且不只一个。像这个图表里面,众多全球电信公司,包括像北美
的威尔逊电信公司和韩国三星,都拥有我们公司200TB以上的产品。在国内来说,我们
在联通、网通里面都有很多省在使用我们的产品。
从未来来看,据第三方的评估机构来说,到2010年虚拟磁带库将成为代替磁带库进行数
据保护的一个主打。SEPATON在这个发展和演变过程当中,将不仅仅作为一家产品提供
商,而是一家出色的解决方案的供应商,最终按照我们的发展路线图,我们是从基本的
磁带方针到数据复制以及到副本删除,最终我们会把自己的设备成为一个移动的存储介
质,抛离开第三方固有的备份软件,因为目前来说我们备份的数据在磁带上或者是在磁
带上,还有需要恢复才能查询。但是我们将最终把自己的设备变成一个备份完了之后,
可以通过搜索引擎来定位数据,直接进行查询的设备。这样的话我可以完全验证自己的
备份是不是可用的,不用像以前那样。就目前来说,我们已经把前四个内容走完了,在
今年的年底我们就会把这种全文检索功能开发出来。
谢谢大家!
|