您的位置: 网界网 > 存储 > 正文

给主存储瘦身(上)

2011年10月28日 09:33:36 | 作者:Jacob Gsoedl | 来源:TechTarget中国  | 查看本文手机版

摘要:对比备份和归档系统所使用的数据缩减方法,主存储系统不能够容忍任何一点对于性能和可靠性的影响,这是主存储系统最相关的属性。本文一一探讨主存储数据减缩的方案。

标签
主存储
数据减缩
备份和归档

已经成为许多备份和归档产品标准的数据缩减功能,正在主存储上变得越来越流行了。产生这种现象的驱动力是可量化的成本节约,从不得不购买更少的磁盘来减少每年的支持费用,到减少存储管理相关的运营花费。数据缩减在存储性能方面还有一个令人高兴的影响:通过减少不活跃数据对于昂贵的高性能存储的占用,使整个存储和应用系统的性能可以获得可喜的提升。

在典型的企业里,按照存储网络工业协会(SNIA)的研究,存放在主存储上80%的文件在最近30天内没有被访问;同一份报告还指出,不活跃数据的增长是活跃数据的四倍。考虑到这些事实,数据缩减技术已经开始进入主存储领域就不觉得奇怪了。

然而,对比备份和归档系统所使用的数据缩减方法,主存储系统不能够容忍任何一点对于性能和可靠性的影响,这是主存储系统最相关的属性。因此,数据缩减技术发生了变化,并且在主存储上和用在备份和归档系统上采用了不同的方式。在备份和归档系统上,重复数据删除[注]和压缩是主要的数据缩减手段,而对于主存储系统,那些技术明显变得更加敏感,而且不会像重复数据删除和压缩一样影响性能。这些主要的数据缩减技术正在被应用到主存储系统中:

• 选择合适的RAID级别

• 自动精简配置

• 高效克隆

• 自动存储分层

• 重复数据删除

• 压缩

选择合适的RAID级别

把“选择合适的RAID级别”放在数据缩减技术列表的最前面首先看起来好像很奇怪,而且不像其它的数据缩减方法,这只是所有存储系统都可以使用的一个选项,但它对于磁盘的需求、性能和可靠性都有着很大的影响。如果不考虑可靠性缺陷,RAID 0(跨所有磁盘的块级别条带,无校验或镜像)会是最划算和最高性能的选择,但单个磁盘故障将会丢失整个RAID组数据的缺点使其难登数据中心的大雅之堂。另一方面,RAID 1(镜像,无校验或条带)和 RAID 10(条带化磁盘组镜像),结合了高性能和高可靠性,但需要两倍的磁盘容量,因此也是站在数据缩减的对立面的。RAID 5(块级别条带化,分布式校验)尽管需要一块额外的磁盘,但已成为近些年来最好的折衷方案了,但随着磁盘容量的增长,重建时间也越来越长,在单盘故障后,RAID组重建的时候,丢失两块磁盘的风险已经增加到一个不舒服却不得不接受的水平。因此,存储厂商们采用了RAID 6,通过对RAID 5增加一块额外的校验磁盘,使其能够经得起两次磁盘故障而不丢失数据——但随之而来的有不同程度的性能影响,这与实施情况有关。在购买一个新存储系统的时候,RAID 6和RAID 6的性能指标都会是要考虑的事情。

“与我们大多数的竞争者不同,我们可以采用只有5%额外开销的RAID-DP(NetApp公司的RAID 6技术)技术,”NetApp公司的高级存储技术专家Larry Freeman表示。

自动精简配置

直到最近,仍然没有一个真正替代现有按需供应的存储产品,因此,存储的利用率一直不高。对于在公司数据中心有几百个GB的已经分配但还没有使用过的存储,这种情况很常见。“在我们使用康贝公司的磁盘阵列和自动精简配置技术之前,我们依赖用户帮助我们估计存储的需求,我们给每个用户的估计再增加20%到100%(+微信关注网络世界),这取决于是什么样应用系统,” Brandon Jackson,北卡罗来纳州加斯顿郡的CIO[注],描述了这个被许多企业使用以保证足够的存储容量的不科学并且浪费的过程。

自动精简配置技术可以通过允许存储系统按照实际需要的物理容量进行分配的方式,来终结这种存储资源浪费式的管理。存储按需分配到精简卷。例如,自动精简配置可以分配一个100GB的卷,尽管它只有10GB的物理存储。自动精简配置对于用户是透明的,用户会看到一个100GB的卷。精简供应节约的成本可能会非常巨大,并且使存储的利用率超过90%。

支持自动精简配置的厂商正在快速增长,同时,这已经成为选择存储系统的关键标准之一。可是要记住,并不是所有的自动精简配置的实施都是相同的。一些系统需要为自动精简配置设置单独的区域,而其他所有的容量都可以用来做自动精简配置而不需要特别的保留。把“thick”卷转换为“thin”卷的功能,没有使用的存储如何恢复以及自动精简配置的许可方式,是另外一些不同的地方。随着自动精简配置存储的越来越多,物理存储的耗尽成为自动精简配置环境中经常出现的风险。因此,告警、通知和存储分析成为必要的功能,并且对比传统环境,在自动精简配置的环境中扮演了更大的角色。

高效克隆

克隆用于对现有的卷建立一个完全相同的复本,这更适用于服务器虚拟化,它可以经常用来克隆虚拟化操作系统卷。克隆最基本最主要的实施是建立源卷的完全拷贝,克隆卷会占用与源卷完全相同的物理存储。

进一步的升级功能是对于自动精简配置卷的克隆。而一些存储系统在克隆期间会把精简卷转换为传统卷,另外一些可以建立精简卷的克隆,精简源卷和克隆卷需要分配相同的物理存储。“我们的Virtual Storage Platform(VSP),能够通过一个精简卷建立一个精简的克隆卷,”日立数据系统公司企业平台部的高级产品市场经理,Mike Nalls如是说。

最有效的克隆是精简克隆,克隆卷完全不保留数据,而是根据原始影像。精简克隆只需要保存原始影像和克隆影像的差异即可,这样可以节约大量的磁盘空间。换句话,一份最新的克隆需要最少的物理磁盘空间,并且只有区别于源影像的克隆变化才会被保存。NetApp公司的FlexClone和Oracle公司的ZFS Storage Appliance(Sun公司ZFS Storage 7000系列)的克隆功能是当今支持精简克隆的存储系统。

参考资料

1.重复数据删除:是一种数据缩减技术,通常用于基于磁盘的备份系统,旨在减少存储系统中使用的存储容量。它的工作方式是在某个时间周期内查找不同文件中不同位置的重复可变大小数据块。重复...详情>>

2.CIO:(Chief Information Officer),首席信息官,亦可称之为信息主管、信息总监等,是企业中信息化建设“统筹”人,是企业中不可或缺的高级主管职位之一,主要负责企业内部信息...详情>>

[责任编辑:存储 chai_shasha@cnw.com.cn]