2007年通信行业
网络信息安全高峰论坛
时间:2007年11月22日至23日
地点
:北京京都信苑宾馆

主办单位
人民邮电报社

协办单位
中国电信、中国网通、中国联通
中国移动、中国卫通、中国铁通

承办单位:埃普威


美国飞康软件公司中国区技术总监 颜军
(2007-11-22  14:00)

演讲主题:电信运营商的新型数据保护和容灾技术IPStor CDP/VTL

演讲内容:美国飞康软件公司中国区技术总监 颜军

今天我给大家介绍一下,在电信运营商领域的新型数据保护技术,因为大家知道飞康在数据保护领域一直致力于独创一些新型的保护解决方案。

我今天的题目分这样几个部分,先对公司的情况做一个简单的介绍,后面我们会针对现在国际上主流的数据保护的发展趋势简单地进行一个阐述。然后我们再针对保护技术当中的几个核心技术,比如说容灾技术,对它的核心指标和决策要点进行一个分析。后面我们重点对飞康的CDP,也就是实时备份和连续数据保护技术,以及飞康的VTL,虚拟磁带库技术做一个介绍,最后我们会有一些案例的分析。

大家可能在很多场合也了解过飞康,飞康是国际上网络虚拟存储的代表性厂商,也是这个技术的一个创始者。早在2000年,大家对虚拟存储就应该有所耳闻,当时在智能存储软件之外,飞康开始致力于创造一种新型的存储技术--虚拟存储技术,它可以实现传统的各类保护技术和存储技术所不能实现的很多保护功能。飞康的公司的情况,大家从胶片当中可以看到,我就不再做过多的介绍了。

飞康在全球有三个研发中心,在中国大中华地区我们有七十多人的支持队伍。这是飞康软件的发展历程。大家从这个历程上可以看到,从2000年成立开始,存储技术的几个关键性的突破都有飞康的身影,比如说VTL虚拟磁带库技术,飞康最早开始研制这项技术,此后利用磁盘技术实现实时备份,CDP技术也是飞康在提倡的一种技术。
同时大家也可以看到,比较关键的厂商,比较大型一些的存储厂商和设备厂商都开始OEM飞康的技术,融合到他自己的产品之中,比如说EMC、IBM和SUN等等,大家都知道的一些比较大型的公司都有飞康的关键技术在他们的产品之中。

飞康的VTL虚拟磁带库产品在全球是最主流的产品,被众多的厂商集成到自己的产品之中,所以大家可以看到,一提到虚拟磁带库技术,飞康是最大的一家,也是最早提供这种技术的,也是被很多厂商所认可技术的。
现在我们回过头来看看我们电信行业数据保护技术的几个问题。大家都很熟悉,在电信领域,我们传统的有核心应用和各种核心的增值业务等,那么按照信息化平台来分,我们有各种各样的新型信息管理系统,比如说ERP、CRM和决策支持系统,我们还有其他的一些类似于移动办公的信息化平台。

谈到保护就要涉及到对所有这些信息化平台的一种分类和不同程度的保护。我们大家都知道谈到保护呢,很多人第一意识就是备份,也就是传统的磁带备份,那么我们现在可以肯定地讲这是一种很传统的方式,这种方式它已经使用了很多年,这种模式大家都已经耳熟能详,十分熟悉了。

那么异地灾备应用在电信行业的时间并不长,大多数系统往往都是采用智能存储的方式实现本地和异地的一个数据同步传输,大部分情况在同城的情况比较多一些。我们暂时把它定义为一种传统的异地灾备系统。

但是我们看到,在采用了备份和灾备技术之后,大家还有没有保护的问题?问题多多。成本不用说了,建一个系统就有一部分的投入,最关键的一点,你想要的数据丢失指标和业务系统的恢复指标,你认为这两种指标实现了吗?其实大家仔细想一想,没有实现。现在来讲如果我们出现系统宕机,数据库崩溃,你采用备份系统能保证一个小时内恢复起来吗?答案很可能是不行的。如果你采用容灾系统能不能实现呢?答案也很可能是不行的。这就是一个传统的异地复制系统。所以说在今天,大家主要是提出这样一个问题,真正有多少保护的需求?有没有技术能够实现?如果传统的技术可以全部解决,我们也没必要再研讨下一代的技术了。在今天,如果大家关注一下国际的存储和数据保护领域的趋势,你会发现数据保护领域的发展趋势已经走向了多元化的数据恢复技术。这些技术开始涵盖备份、复制、快照和连续数据保护等多种功能。以后再谈到数据保护,可能不仅仅是一个DR,它会是一种综合型的技术,它根本的目标就是按照你制订的灾难系统的恢复目标,并能达到这个恢复目标,这是由多种技术组合实现的。

我们有两个关键词,一个是我们有什么新技术还能提高备份和恢复吗?还有就是今后的发展方向在哪里?今后五年这个方向是怎么改变的?怎么发展的?这个也是很多客户在问我的问题,他们希望采用的是面向未来的一种技术。

这是国际上一个标准组织提供的一个趋势报告,我们可以由此看到一个发展趋势,就是传统的磁带备份它已经跃升到了磁盘,以磁盘为主载体的技术就是D2D和VTL的技术,那么从磁盘来进行类似磁带这种读写。当然这里面有一个质变,这个质变我们可以看到。现在国际上的保护技术,也就是说时间间隔,可能颗粒度越来越细,可能达到分钟级这样的时段进行备份,同时它可以用一分钟就把你的数据提取出来。

那么再到颗粒度更细的技术被称之为连续数据保护,那么这就是IO级,那这种技术CDP,是一种在数据保护领域的最高级别的技术,可以说它可以倒退回你的每一个IO,使你恢复到每一个你所需要恢复的时间点。

大家可以看到这样的一个清晰的曲线,这也是国际上很多行业专家所分析出来的一个趋势。这是IDC的一个报告,给我们做了一个总结。一个就是以磁盘技术为特征的保护技术开始占据主导,那么这些技术有很多新名词VTL等等,这全部都是这种技术的代表。

还有就是下一代的发展,恢复技术是很重要的一个环节,就是注重恢复。今后的恢复再也不会像我们传统的备份一样,我可能无法预计五个小时、六个小时等等,可能发生过灾难的企业都会遇到这各情况,会耗时特别别长的时间。那么今后的恢复技术,一定是采用瞬间恢复的方式,各种技术大家可以看到,它的区别。

那么集中控制、统一的保护系统,不论多少个点,我们可能是一个多结点的系统,采用集中的备份控制。还有就是重要的就是虚拟化技术,彻底影响了传统备份和恢复的模式。恢复是多个点,而且是高速恢复的方式。

我们现在还有理由采用传统的备份和恢复技术吗?在国际上也有很多的争论,有采用的理由,比如说磁带可以进行存档、可以进行离线的恢复等等;那么也有不采用的理由,就是磁带系统的薄弱环节,比如说可靠性低、备份性能低、恢复速度无法预测,完全失控等等。那么用磁带技术恢复这个,做无主机的备份十分困难,我不知道大家有多少个系统建立了无主机的备份?在今天我们可以说,采用了各种新型的备份技术,可以很轻松地解决我们以前所考虑的问题,比如说通过重复数据删除、复制、快照等等。容灾也是这样子,有一些用户一直在问,最常用的容灾技术是什么?我们还用不用以前的容灾方式?

当然有采用的理由,因为很多系统都采用了;也有不采用的理由,就是传统的容灾是不恢复本地的,当你发生任何一个小灾难的时候,你还需要到异地去做灾难恢复,对我们来讲,灾难恢复是一个工程,它是需要DRP,就是灾难恢复计划的,当我们在进行很小的灾难恢复时,是无法承受从异地进行恢复的浩大的成本,所以说传统的容灾技术当中,缺失一个本地恢复的手段。那么带宽,传统灾难备份的方式对带宽的要求是十分高的。运维成本、建设成本都是十分高昂的,还有就是不开放的架构。很多运营商过去多多少少都建立过一些灾难备份系统,也许有很多系统都遇到了这样、那样的问题。

我们再看一下,究竟应该怎么考虑容灾技术的新型灾备手段?其实容灾技术就两个核心思想,一个是数据复制,把数据复制到异地,一个是采用恢复技术,能在各种灾难情况下达到快速恢复,这里面各种灾难是容灾技术当中的一个关键词,因为过去建立灾备系统没有进行灾难定义,没有进行风险评估,所以我们通常会发现,以前的灾备系统往往抗击的是部分灾难,而不是各种灾难。这是容灾技术核心指标当中的RPO和RTO,大家都很清楚,其中这个RPO要关注一下,就是说它的数据丢失指标分为静态和动态两种:静态指的是设备的损坏,也就是说我的数据要恢复到灾难点,而动态呢就是我的数据要恢复到丢失掉的点,如果我昨天的数据丢失了,那我要恢复到昨天的那一个点。所以说动态是根据你的要求而指定的恢复点,而静态呢是以灾难发生点为单元。所以要考虑这两个指标才能涵盖一个完整的RPO,那么RTO大家就很清楚了,就是我能把业务启动的时间点。

这是传统的灾难备份的分类,有这样几个模式,一个是磁带运输,一个是基于主机复制,一个是基于存储复制等等的大家都很熟悉了。那么传统方式实际上各种方式都有自己的优势,也有自己的劣势,那么从这张表上可以看到,采用各种不同的技术的它都有不同的定位,其中像磁盘针列的复制技术当中,它的使用比较广,但是它的成本和管理运维的复杂度以及带宽都占用得比较大,相对来讲从各种功能和服务能力上要弱一些。

我们再看看为什么我们要采用新型的灾备技术呢?首先我们先要定义我们的决策过程,就是我们容灾到底要考虑什么东西?一般来讲在容灾过程当中、规划过程当中一个是先提出需求,也就是刚才讲的各个指标。另外就是通过技术能不能达到这个指标,如果说各种技术手段,它能够涵盖我们这个要求的各个环节的话呢,就是一个最佳的解决方案。

但是我们看到,我们做这个需求定义的时候,一定要定义灾难范围,这是特别重要的一点,现在很多用户慢慢也清楚这一点了,他们以前不是很理解,说这个灾难不就是断电了、火灾等等,不简单如此,你的数据库崩溃了,数据库的逻辑卷丢失,其实都在这个范围之内。

所以一般来讲如果建立灾备系统,先要拟一张风险评估表,根据你的风险评估和发生概率,然后决定采用什么样的、新的灾备技术实现抵御,如果我们建立的灾备系统具有抵御的能力的话,它就是一个完整的灾备体系。
这是在一个环境下,灾备技术的几个难点,比如说主中心和灾备中心的存储是否一致,如果是不一致,能不能提供开放性存储,比方说各种各样的数据库,它的灾备能不能对数据库实现一致性的恢复,大家知道传统的灾备对数据库是有些束手无策,把存储给复制过来,但是数据库能不能启动还真是一个问题。那么比如说只有2M的传输链路,很多的用户都是这样的条件,那么这么大的数据如何在这么窄的带宽上传输,它的延迟是多少?还有,灾备演练如何进行等等都有很多的难点。我们再看看各种各样的问题,比如说数据库一致性的问题,比如说误操作能不能够恢复,比如说具备不具备本地恢复机制等等。

我去年做的一个项目,也是电信行业,当时有一个地方发生了灾难,结果在灾备中心整个用了三个小时,也没有恢复正常的运行。可以说有很多灾难,你要是用异地来恢复的话,他的恢复过程是很复杂的。如果能够进行本地恢复,就能有效地克服很多快速恢复的问题。这就是容灾系统的烦恼。下面我们看看飞康的技术能不能解决这些问题呢?

刚才已经讲过,飞康是虚拟存储的代表,它利用一个虚拟存储的管理器,即CDP管理器,也就是连续备份管理器,把它放在系统的一个存储网络中间,或者是在存储网络的外延,也就是在你的IP网络当中都可以。它有几种的连接方式,它通过在主机上获取各种数据的技术,比如说飞康提供的一种技术,比如说LVM的镜像技术等等,那么从主机当中获取你的数据库和各种文件的块信息,抓取到飞康的保护器中间,同时这个保护器把你的数据进行远程再传递,使你的系统同时获得两份完整的数据,本地一份、异地一份。同时你还可以通过飞康的保护器,把你这个数据的历史点都保存下来,当你想恢复数据库的一个时间点,比如说一个小时前,两个小时前,或者丢失了各种表的时间,你只需要用五分钟就可以把它的历史点拿回来,这个和传统的备份技术是完全不同的。
这是通过飞康的保护器实现异地备份,保护器上设置一个选键就可以实现本地和异地保护器之间的通信,把你的数据完整地传递到异地等等。

家可以看出,既有本地的一份数据,又有异地的一份保护数据,它是多份的保护数据,同时又多点,实现多点的恢复。

这是飞康虚拟化技术的一览。它是利用自身的虚拟化管理的技术实现的,它对后端的物理存储,提供了各种服务功能。今后你这个生产存储中的任何数据想移植到其他的系统中间,想拿来做数据分析和挖掘,利用飞康的CDP管理器很容易地就能使这个数据流动出来。存储通过虚拟化,不再是僵化的了,它可以进行各种各样的移动。你在灾备中心使用的各种存储设备都可以建立到现有的灾备体系当中来,而且一个小时你就可以完成整个的灾备系统的实施,这就是利用飞康的虚拟平台,实现数据各种服务的功能,比如说不同磁盘阵列之间的镜像,比如说磁盘阵列的数据镜像完了再进行异地复制,本地一个镜像,异地一个复制等等,利用这个虚拟平台是很轻松就可以实现。

飞康的备份技术和灾备技术,就是这样几个环节,一个是利用CDP实现本地的实时备份和快速恢复,利用CDP之间的CDR传递技术,实现异地的复制和灾备技术等。同时还有一种恢复生命周期的技术,就是你在异地再可以放一个VTL,你可以很轻松地在不占用主机的情况下,把备份的数据提取出来,这是多层次的备份和恢复技术。这是本地的备份技术叫CDP。为什么叫实时备份?就是没有备份窗口,和咱们传统的备份是不一样的。就是说你插上网线,就能无时无刻地做这个事情,这叫实时备份,你感觉不到,你看不到它在发生着变化。那么以前的备份是窗口备份,要用多少个小时。与实时备份相对的词就是恢复的时候是瞬间恢复,它直接把飞康CDP里面的盘拿来用就可以了,所以你多大的数据量都可以在几分钟内进行恢复。

这是飞康里面采用的关键的快照技术,它的核心技术,主要的目的就是保护你的历史点,让你设定一个时间间隔,你可以打多个书签,你想恢复到昨天的几点钟,你可以很轻松地通过快照提取方式,在一分钟内就获得你的数据。

这是飞康CDP保护技术的几个要点,我刚才已经介绍了,一个是连续的数据镜像,一个是多点的自动快照,同时它在数据库上有一个代理程序,使你的数据库快照出来的任何点都可以在一分钟之内启动,不会出现数据库无法启动的这种情况,大家搞过数据库研究的都知道,你数据库光靠存储是需要很长时间恢复的。但是采用飞康的CDP技术这个问题就消失了。

那么同时有些用户问,CDP能把数据恢复到一秒或几秒钟前吗?飞康CDP有一个拉杆,你可以恢复到某一秒钟的数据,这就是这个拉杆。
比如说我们的邮件系统,我们的移动办公系统出现崩溃的时候,能不能在几分钟内恢复?以前你是很难想象的,那今天用飞康的这个技术很容易就能实现,它有一个专门针对邮件系统的一个提取工具,你的邮件出现大面积丢失的时候,你只需要启动这个工具,它有几个导航,经过几个页面,一个一个NEXT,马上就可以把张三、李四的邮箱完整地提取回来。
这是操作系统恢复的一个方式,以前我们如果是OA系统崩溃候,操作系统要花这么多的步骤来恢复,在今天还用吗?用了飞康的CDP以后,你直接从它上面启动就完了,你不用那么几十个步骤。所以说它可以让你在十几分钟内,把你的移动办公系统又重建起来。

另外,还可以通过恢复盘来恢复我们各种的桌面机,飞康有一张恢复盘,引导起来以后他就会找到飞康的CDP设备,把它之前影射出来的C盘、D盘完整地给你倒灌回来,无须去定时备份哪一个时间点,用这个方式,它可以自动去找你所备份的各种时间点,然后问你,你是需要现在的数据还是需要历史的数据?你只需要答一个YES和NO就可以很快地恢复过来。这是各种的界面,整个的这个数据倒灌完毕,这个页面就结束了。
恢复文件更简单,恢复文件只需提取一个快照几分钟就可以拿回来。所以刚才我们看到系统文件、数据库等等全在这个保护的体系范围之内。

那么有些人问作为异地复制,你有什么样的特殊的技术呢?在异地复制中,一个是我们是基于广域网的IP的复制技术,同时,我们又有基于光纤的镜像技术。在这个异地复制中,飞康采用了几个关键技术,一个叫小单元传输,这个是针对很多带宽很窄的用户,尤其是存储传输块是很大的用户,飞康它的传递单元给你压缩到512个字节,使得你有效的传输数据量大幅度减少。很多人挺奇怪,问怎么采用飞康的技术就是不吃带宽,比别人的带宽使用可能少了十倍左右,这是它关键的传递,这是飞康的一个专利。那么同时它有一个差异比对,你灾备中心和生产中心在任何情况下不一致你都不用担心,以前你是要担心的,因为你发现一个不一致你就得重新来一次工程,几个T的数据重来,从广域网上传,那是什么样的工作量。在今天你用差异比对,飞康就可以从本地到异地,比较每一个数据块的校验位,把不同的数据块再给你补发过去,在任何时候都可以让你保持数据的一致性。那么这是飞康容灾的几个关键技术,差异比对以及它的微单元传递技术。

为了解决历史数据的恢复,刚才讲了多点快照技术,在本地和异地都具有多点快照的技术,他这套容灾技术既实现了容灾,又实现了备份,但是大家发现没有备份窗口,因为你不需要定义备份窗口,它自动地来进行。当你进行各种的灾难的恢复的时候,其实你都是几分钟就可以完成的事情。灾备的演习用这种系统也是很简单的事情,管理员在本地或者异地中心提取出来一份数据,一分钟就提取出来,进行各种各样的演练,演练结果还可以倒传回生产中心,都是通过图形拖动的方式来完成。所以大家可以看到飞康的容灾和备份技术,既解决了各类的硬错误,又解决了各类的软错误,它是一个全面的灾难体系在覆盖。

同时,我们还提供了一种压缩的模式,使你可以在4:1到8:1的压缩模式下,可以减少更多传递的数据量,这是针对很多带宽有限的客户的一项非常重要的技术。这是各种传输策略的一个介绍,我就不再做详尽的介绍了,比如说你可以设成连续的异地传输,你可以设置成增量:时间增量、数据增量,每到1M就传递等等各种各样的模式。
这是为这种微单元传递技术能为我们节省多大的带宽做的一个示意图,因为你只需要传里面的几个512的数据,往往有的时候可以获得出奇的效果,可以使你的带宽节省80%几。

这是它的实际效果,一个是恢复时间,原来你几个小时的恢复,在今天是分钟级的恢复,而且是各种灾难的恢复。它不像备份系统,备份系统一个是恢复时间长,一个是你当天数据不易找回,因为备份系统是一天一次的备份,而飞康的技术,完全是依据用户自己的定义,可以是几分钟、可以是几小时,它完全不是传统的备份概念。
那么数据接近于零丢失,远程传递的带宽能节省80%几,以及这么多的复杂的高级功能,并不会使你的成本增加很多,反而比原来下降了不少,这就是飞康带来的好处。

下面,我们总结一下飞康的新型灾难备份技术。第一就是做一个数据的镜像,这一份镜像先镜像到我的CDP管理器;第二,在镜像中实现了多点的快照,你可以恢复任何的历史数据点;第三,你可以进行远程的容灾;第四,你还可以对这个数据进行存档,备份到磁带库里面,备份到VTL里面,完全不占用主机。
我们再看一下VTL技术,它是另外一种数据备份技术,它是替代传统备份设备的一种技术,利用磁盘技术仿真出一个磁带库的系统,那么VTL的系统是这样一个构成,一般来讲是由一个VTL的存储器和VTL的控制头来组成,飞康在这个控制头技术上有很多的专项技术在里面,你可以把你的磁盘阵列进行利旧,或者你可以利用任何的一种先进的磁盘阵列作为它的主存储,然后通过飞康的VTL控制器,将它仿真成各种磁带库的接口,你的备份软件可以不发生任何的改变。飞康的VTL在实现备份的同时,还可以实现数据向磁带库里面的自动迁移,比如说隔三天以后,就备份到真正的磁带库里面去等等,你不用备份软件做任何的事情,飞康的VTL控制器就可以实现这一点。它可以很轻松地把数据按照一个策略就导出到磁带库里面去。同时,它还结合了目前最先进的重复数据删除技术,使VTL存储可以用很小的数据量就完成过去要很大空间所完成的工作。

重复数据删除之后,由于它的数据量很节省,就可以通过异地的复制技术,很轻松地使用很小的带宽,就可以把这盘磁带复制到远端。以前大家把磁带复制到远端可不是一个容易的事儿,在今天则是一个很容易的事情。
重复数据删除技术是飞康VTL中的一项技术,这个技术大家在很多场合也听说过,主要是利用你备份块的重复数据块,它进行一个索引的识别,当它发现原来有人已经备份了这个块了,他就给你这个存储,只存放一个原先的指针,就是索引指针,使得你存放的数据块很节省。比如说张三备了一个,李四备了一个,这两个人差了一天,这两个块里大量的数据、大量的块是相同的。在以前你就是两份数据,这是两份全备份。在今天不是,第一个人是一个全备份,第二个人只是不同的部分他会独立地存放出来。那么相同的部分它存放的是索引指针,所以这个技术可以在很多场合为我们带来大量的空间的节省。
飞康VTL的优势作简单地回顾就是开放的存储,性能大家可以去了解一下,飞康的VTL的性能很高,在很多的实地测试中都力拔头筹,同时利用刚才我们讲的像磁带库的导送技术,形成信息生命周期。这是VTL的给我们带来的众多的益处。

我们看一下利用飞康的CDP和VTL还能为我们带来一个分层的备份体系。就是说我们可以把每周的信息,比如说我们想恢复一周内的任何故障,我们利用飞康的CDP就可以很轻松地实现,而且可以实现几分钟就可以恢复的这样的很高的效果。同时你可以利用一个VTL进行,比如说一个月以前的数据,我们进行备份到VTL之中,那么用VTL来恢复一个月以前的数据等等,通过近期数据和远期数据的恢复的完整体系,我们就可以构造一个很理想的恢复生命周期架构,这也是国际上一个新型的恢复体系结构。

那么从CDP传送VTL,这个工作复杂吗?特别地简单,你的备份服务器上,只需要从飞康的CDP里面,识别出来每一个快照点,我们有一个代理程序,他可以自动地,根本就跟你主机没有关系,就自动地把这个数据三天以后就传送到VTL里面,很简单,这是示意图。
这个叫RLM,就是恢复生命周期体系,这种体系是现在最高级别的一种分层备份和恢复的机制,这种体系最大的特点就是不占用你的任何主机,而且你的近期数据、远期数据都得到的良好的保存。

下面是飞康的几个际实应用案例,我简单地做一个介绍,有国内的有国际的。这是国内的某一家基金公司,飞康为他提供了完整的灾备体系,因为他的环境里有光纤,有IP的存储,有办公系统、有行情系统,有交易系统等等,这么多的系统,能不能用一种技术来实现呢?飞康可以很轻松地实现这样的容灾需求。

韩国第一银行;河北网通的磁带库异地复制,就是VTL异地复制,这是飞康完成的一个工程;这是ATNT的容灾系统,也是采用飞康的技术实现的;MCI公司的六点容灾体系,就是多点到一点的容灾体系,也是采用飞康的技术实现的。
这是一个在海外的海量备份体系,180TB的数据采用飞康的VTL实现异地的容灾;这是法国的标志汽车。


我今天的题目呢因为时间所限就到这里,也欢迎大家针对我刚才介绍的部分提一些建议和疑问。谢谢大家

 

 

  2007'通信行业网络信息安全高峰论坛组委会版权所有
联系我们:010—51299989;51281998;62070307;62077867